web-dev-qa-db-ja.com

Python tesseractからimage_to_stringをインポートするときのエラー

最近、tesseractOCRをpythonで使用しましたが、tesseractからimage_to_stringをインポートしようとするとエラーが発生し続けました。

問題の原因となるコード:

# Perform OCR using tesseract-ocr library
from tesseract import image_to_string
image = Image.open('input-NEAREST.tif')
print image_to_string(image)

上記のコードが原因のエラー:

Traceback (most recent call last):  
file "./captcha.py", line 52, in <module>  
from tesseract import image_to_string  
ImportError: cannot import name image_to_string

Tesseractモジュールがインストールされていることを確認しました。

digital_alchemy@roaming-gnome /home $ pydoc modules | grep 'tesseract'
Hdf5StubImagePlugin _tesseract          gzip                sipconfig
ORBit               cairo               mako                tesseract

必要なパッケージをすべて手に入れたと思いますが、残念ながらこの時点で行き詰まっています。関数がモジュールにないようです。

どんな助けでも大歓迎です。

12
digital_alchemy

私にとってうまくいったと思われるもう1つの可能性は、PILインポートイメージからイメージをインポートする代わりに、pytesseractを変更することです。

Pytesseractを変更した後にPyCharmで機能するコード:

from pytesseract import image_to_string
from PIL import Image

im = Image.open(r'C:\Users\<user>\Downloads\dashboard-test.jpeg')
print(im)

print(image_to_string(im))

PyCharmに組み込まれたパッケージ管理を介してインストールしたPytesseract

6
Logan

インストールしたモジュールの構文は正しいですか?それ image_to_string関数は、このページの使用例によるとPyTesserからのもののように見えます: https://code.google.com/p/pytesser/

インポートは、より複雑な使用例がリストされているpython-tesseract用のように見えます: https://code.google.com/p/python-tesseract/

1
m.brindley

以下の手順に従ったウィンドウの場合

pip3 install pytesseract 
pip3 install pillow

Tessaract-ocrのインストールも必要です https://github.com/tesseract-ocr/tesseract/wiki そうしないと、エラーが発生しますTessractはパス上にありません

Pythonコード

from PIL import Image
from pytesseract import image_to_string

print ( image_to_string(Image.open('test.tif'),lang='eng')  )
0
Saurabh

私のために働くもの:

pytesseractフォームをインストールした後 tesseract-ocr-setup-3.05.02-20180621.exepytesseract.pytesseract.tesseract_cmd="C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe"を追加し、上記のコードフォームを使用します。これがすべてのコードです。

import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd="C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe"
im=Image.open("C:\\Users\\<user>\\Desktop\\ro\\capt.png")
print(pytesseract.image_to_string(im,lang='eng'))

PyCharm Community Edition 2018.2.3x64でWindows10を使用しています

0
Ahron Moshe