web-dev-qa-db-ja.com

どのOCRエンジンが優れていますか:TesseractまたはOCRopus?

私はiPhoneでTesseractを試してみましたが、その精度は画像の前処理なしで70%であると評価しました。また、数字の抽出が不十分な場合があることにも気付きました。 OCRopus OCRエンジンについて聞いたことがあります。数字抽出の点で、また画像の前処理が低い場合、TesseractまたはOCRopusのどちらが優れていますか?
通常のメトリックを使用して結果を比較する両方のエンジンを使用してテストを実行する人はいますか?

32
Ahmed Hussein

当初、OCRopusは実際には内部で認識エンジンとしてTesseractを使用していましたが、後で独自の新しいエンジンに変更しました。それはまだ新鮮で成熟していない。私たちは約1年前に精度の比較を行っており、OCRopusがTesseractに負けていたことは間違いありません。それ以来、私はOCRopusの進捗状況を追跡するのをやめましたが、OCRopusサポートフォーラムでのアクティビティがゼロに近いことを明確に知っています。つまり、誰もそれを使用していません。ほとんどの人は商用エンジンを使用していますが、価格が問題であり、精度の低下を許容できる場合は、Tesseractを使用します。オープンソースの中でも間違いなく最高です。

31
Tomato

「変更」リンクでプロジェクトのアクティビティを確認することもできます

https://code.google.com/p/ocropus/source/list?repo=ocropy

https://code.google.com/p/tesseract-ocr/source/list

テッセラクトはもっと忙しい

1
IvanM