web-dev-qa-db-ja.com

Pytesseract.TesseractError '使用法:python pytesseract.py [-l lang] input_file

簡単なテスト画像をテキストに印刷しようとすると、次のエラーが発生します。

Pillow(PIL 1.1.7)を使用していることを確認し、pytesseractをアンインストールして再インストールしました。ファイルパスが正しいのは、変更するとファイルが見つからないという別のエラーが表示されるためです。

私のコード:

    from PIL import Image
    import pytesseract

    pytesseract.pytesseract.tesseract_cmd= r'C:\Users\bbrown2\AppData\Local\
    Programs\Python\Python37\Scripts\pytesseract'

    img = r'C:\Users\bbrown2\Desktop\test.png'

    print(pytesseract.image_to_string(Image.open(img)))

私はそれが画像の単語を印刷することを期待していますが、代わりに常にこれを取得します:

    Traceback (most recent call last):
    File 
   "c:\Users\bbrown2\Desktop\PythonMaterials\python_test_tesseract.py", line 
    14, in <module>
   print(pytesseract.image_to_string(Image.open(image)))
   File "C:\Users\bbrown2\AppData\Local\Programs\Python\Python37\lib\site- 
   packages\pytesseract\pytesseract.py", line 309, in image_to_string
   }[output_type]()
    File "C:\Users\bbrown2\AppData\Local\Programs\Python\Python37\lib\site- 
   packages\pytesseract\pytesseract.py", line 308, in <lambda>
   Output.STRING: lambda: run_and_get_output(*args),
   File "C:\Users\bbrown2\AppData\Local\Programs\Python\Python37\lib\site- 
   packages\pytesseract\pytesseract.py", line 218, in run_and_get_output
   run_tesseract(**kwargs)
   File "C:\Users\bbrown2\AppData\Local\Programs\Python\Python37\lib\site- 
   packages\pytesseract\pytesseract.py", line 194, in run_tesseract
   raise TesseractError(status_code, get_errors(error_string))
   pytesseract.pytesseract.TesseractError: (2, 'Usage: python pytesseract.py 
   [-l lang] input_file')
8
Blair

問題はpytesseractが単なるPythonコマンドラインプログラムのラッパー Tesseract であるということです。実際のTesseractバイナリで_tesseract_cmd_をポイントする必要があります。 pytesseract CLIユーティリティではありません。

したがって、Tesseractをインストールする必要があります。 Windows builds が利用可能です。私はバージョン3.05インストーラーを選択し、デフォルトでC:\Program Files (x86)\Tesseract-OCR\tesseractにインストールされました。次に、私は以下を実行しましたが、うまくいきました:

_from PIL import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = (
    r"C:\Program Files (x86)\Tesseract-OCR\tesseract"
)

img = r"C:\Users\cody\Desktop\ocrtest.png"

print(pytesseract.image_to_string(Image.open(img)))
_

テスト入力:

enter image description here 結果:

_The (quick) [brown] {fox} jumps!
Over the $43,456.78 <lazy> #90 dog
& duck/goose, as 12.5% of E-mail
from [email protected] is spam.
Der ,,schnelle” braune Fuchs springt
fiber den faulen Hund. Le renard brun
«rapide» saute par-dessus le chien
paresseux. La volpe marrone rapida
salta sopra i] cane pigro. El zorro
marrén répido salta sobre el perro
perezoso. A raposa marrom répida
salta sobre 0 C50 preguicoso.
_
6
cody