解析PDF JavaScript画像としてのページ

Question

タイトルどおり、保護されていないPDFファイルからのページをjavascript Image（）オブジェクトとして解析する方法はありますか？

JavaScriptを実行する前にそれらを変換することもできますが、これは、インストールを必要とするライブラリーの支援なしに、自動的に行われるようにしたいと思います。

インターネット上の誰かがこのBashスクリプトを投稿しました。残念ながら、私はBashを知りませんが、実行は非常に簡単でした。

#!/bin/bash PDF='doc.pdf' NUMPAGES=`identify -format %n "$PDF"` for (( IDX=0; IDX<$NUMPAGES; IDX++ )) do PAGE=$(($IDX+1)) convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"` done echo "Done"

しかし、私はこれらのエラーを受け取りました：

line 3: identify: command not found line 5: ((: IDX<: syntax error: operand expected (error token is "<")

PDF Bashスクリプトを使用して事前変換することは良い解決策です。誰かが上記のスクリプトを修正したり、別の解決策を提供したりできますか？

よろしくお願いします！

Trevor Dixon · Accepted Answer

PDF.js は、PDFをキャンバスにレンダリングします。次に、次のようなことができます。

var img = new Image(); img.src = pdfCanvas.toDataURL();

私はPDF.jsに非常に感銘を受けました。クライアントのブラウザにできる限り多くの作業を任せることが好きです。

ここのデモ： http://jsbin.com/pdfjs-helloworld-v2/1/edit

Abdullah Jibaly · Answer

最初の問題は実行可能ファイルidentifyがないようです。これはImageMagickの一部です：

http://www.imagemagick.org/script/index.php

あなたのパスにもそれがあることを確認してください。