web-dev-qa-db-ja.com

辞書トレーニングによるTesseract手書き

テキストファイルに改行で区切られた単語の辞書があります。そして、Tesseractを使用して手書きを認識し、テキストファイルに最も近い一致する行を出力したいと思います。

Tesseractを使用するのはこれが初めてで、すでにプロジェクトワークスペースにあるので、トレーニングデータが必要です。

これを行うようにTesseractをトレーニングすることは可能ですか?

16
Ruel

手書きを認識するようにtesseractをトレーニングすることが可能です。手順は次のとおりです。 https://tesseract-ocr.github.io/tessdoc/Training-Tesseract

しかし、非常に良い結果を期待しないでください。学者は通常、約90%を超える精度の結果を得ています。 wordsnumbers のいくつかのリファレンスを次に示します。したがって、ユースケースで少なくとも1/10のエラーを処理できる場合は、これでうまくいく可能性があります。

12
Leopd