web-dev-qa-db-ja.com

Windowsにtextractをインストールできません

私は多くのことを試しましたが、pipコマンドを使用してtextractパッケージをWindowsにインストールしようとすると失敗します。

次のエラーが表示されます。

error

私は何をすべきかわからないので、アドバイスに本当に感謝します。ありがとうございました

7

ここ から盗まれた:

Conda(miniconda)からSwigを最初にインストールする必要がありました

conda install swig

次に、リリースからEbookLib 0.15 Zipをダウンロードしました

https://github.com/aerkalov/ebooklib/releases

解凍した後、README.mdファイルからUnicode文字を手動で削除しました(notepad ++を使用しました)。 (Unicode文字は44行目にあります)

そして、pipでモジュールをインストールしました。

cd to_unzipped_folder_path_here
pip install .

そして最後に

pip install textract
11
Marcus Mann

(Windows 10 Python 3.7)他よりも多くの問題がありましたが、これは以前の回答から構築されています:

  1. PythonのMicrosoft Visual Studio C++コンパイラがインストールされていることを確認してください

  2. python -m pip install --upgrade pip setuptools wheel

  3. pip install 6-アップグレード

  4. EbookLibバージョン0.15をダウンロードします。

    • .Zipファイルを解凍します。エンコードエラーを回避するには、「long_description」変数の割り当てを「long_description = open( 'README.md'、encoding = "utf-8")。read()」に編集します。
  5. Swigをダウンロード:

    • http://www.swig.org/download.html
    • .Zipファイルを解凍します
    • Swig.exeファイルをPythonパスにコピーします。例: "C:\ Users\username\AppData\Local\Programs\Python\Python37"
    • 「typemaps」フォルダーをpython「Lib」フォルダーにコピーします。例:「C:\ Program Files\swigwin-4.0.0\Lib\typemaps」->「C:\ Users\username\AppData\Local\Programs\Python\Python37\Lib\"
    • 「* .swg」ファイルをpython「Lib」フォルダーにコピーします。例:「C:\ Program Files\swigwin-4.0.0\Lib * .swg」->「C:\Users\username\AppData\Local\Programs\Python\Python37\Lib\"
    • すべてのswig pythonファイルをpython "Lib"フォルダにコピーします。例: "C:\ Program Files\swigwin-4.0.0\Lib\python * "->" C:\ Users\username\AppData\Local\Programs\Python\Python37\Lib\"
  6. プロンプトから解凍したEbooklibフォルダーにcdします。 C:> cd "C:\ Users\username\Desktop\ebooklib-0.15"

  7. ebookLibのインストールを実行します:pip install。

  8. textractインストールを実行します:pip install textract

出力は次のようになります。

C:\Users\username\Desktop\ebooklib-0.15>pip install textract
Collecting textract
Requirement already satisfied: docx2txt==0.6 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.6)
Requirement already satisfied: beautifulsoup4==4.5.3 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (4.5.3)
Requirement already satisfied: EbookLib==0.15 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.15)
Requirement already satisfied: xlrd==1.0.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.0.0)
Requirement already satisfied: SpeechRecognition==3.6.3 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (3.6.3)
Requirement already satisfied: six==1.10.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.10.0)
Collecting pocketsphinx==0.1.3 (from textract)
  Using cached https://files.pythonhosted.org/packages/93/5f/a968e5d53d25e32deb78c3e169fd8612ecf53cc76e32cb40e19be35696af/pocketsphinx-0.1.3.tar.bz2
Requirement already satisfied: chardet==2.3.0 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (2.3.0)
Requirement already satisfied: argcomplete==1.8.2 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (1.8.2)
Requirement already satisfied: python-pptx==0.6.5 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from textract) (0.6.5)
Requirement already satisfied: lxml in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from EbookLib==0.15->textract) (4.3.3)
Requirement already satisfied: XlsxWriter>=0.5.7 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from python-pptx==0.6.5->textract) (1.1.8)
Requirement already satisfied: Pillow>=2.6.1 in c:\users\username\appdata\local\programs\python\python37\lib\site-packages (from python-pptx==0.6.5->textract) (6.0.0)
Building wheels for collected packages: pocketsphinx
  Building wheel for pocketsphinx (setup.py) ... done
  Stored in directory: C:\Users\username\AppData\Local\pip\Cache\wheels\38\80\4f\ddc3e8c2b788f2c7f1d625ae870f6bafd3038ff04a3445a2f8
Successfully built pocketsphinx
Installing collected packages: pocketsphinx, textract
Successfully installed pocketsphinx-0.1.3 textract-1.6.1

C:\Users\username\Desktop\ebooklib-0.15>

この記事の執筆時点では、jsonschemaはtextractと競合する依存関係を持っています。適切なインストールを見つけようとすると、次のエラーも発生しました。

ERROR: requests 2.22.0 has requirement chardet<3.1.0,>=3.0.2, but you'll have chardet 2.3.0 which is incompatible.
ERROR: camelot-py 0.7.2 has requirement chardet>=3.0.4, but you'll have chardet 2.3.0 which is incompatible.

ERROR: Command "python setup.py Egg_info" failed with error code 1 in C:\Users\username\AppData\Local\Temp\pip-install-msmb9od3\EbookLib\
    UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 1671: character maps to <undefined>
error: command 'C:\\Users\\username\\AppData\\Local\\Programs\\Python\\Python37\\swig.exe' failed with exit status 1

ERROR: Failed building wheel for pocketsphinx
error: command 'swig.exe' failed: No such file or directory
  (1) : Error: Unable to find 'swig.swg'
  (3) : Error: Unable to find 'python.swg'
1
Joe H

最もエレガントなソリューションではありませんが、機能します!

pip install git+https://github.com/jpweytjens/textract

Jpweytjensに感謝

0
Marco Cerliani

プロジェクトが別の個人に引き継がれたように見えるので、解決策ははるかに簡単です(この回答を書いた3か月前にプロジェクトの更新を最近開始しました)。

これで https://github.com/deanmalmgren/textract/releases にアクセスしてv1.6.2 v1.6.1上の要件の更新のみを提供する(ユニコードデバッグエラーを修正する)またはv1.6.3これは最新です(これを書いている時点では。)

ダウンロードしたら、解凍し、cd [folder extracted to]およびpip install .

要件が更新されると、悪意のあるコードが依存関係に挿入され、自己の責任においてこれを更新できるという懸念が常にあることに留意してください。

0
Ryan Schaefer