web-dev-qa-db-ja.com

解析PDF JavaScript画像としてのページ

タイトルどおり、保護されていないPDFファイルからのページをjavascript Image()オブジェクトとして解析する方法はありますか?

JavaScriptを実行する前にそれらを変換することもできますが、これは、インストールを必要とするライブラリーの支援なしに、自動的に行われるようにしたいと思います。

インターネット上の誰かがこのBashスクリプトを投稿しました。残念ながら、私はBashを知りませんが、実行は非常に簡単でした。

#!/bin/bash
PDF='doc.pdf'
NUMPAGES=`identify -format %n "$PDF"`

for (( IDX=0; IDX<$NUMPAGES; IDX++ ))
do
  PAGE=$(($IDX+1))
  convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"`
done

echo "Done"

しかし、私はこれらのエラーを受け取りました:

line 3: identify: command not found
line 5: ((: IDX<: syntax error: operand expected (error token is "<")

PDF Bashスクリプトを使用して事前変換することは良い解決策です。誰かが上記のスクリプトを修正したり、別の解決策を提供したりできますか?

よろしくお願いします!

14
Saturnix

PDF.js は、PDFをキャンバスにレンダリングします。次に、次のようなことができます。

var img = new Image();
img.src = pdfCanvas.toDataURL();

私はPDF.jsに非常に感銘を受けました。クライアントのブラウザにできる限り多くの作業を任せることが好きです。

ここのデモ: http://jsbin.com/pdfjs-helloworld-v2/1/edit

21
Trevor Dixon

最初の問題は実行可能ファイルidentifyがないようです。これはImageMagickの一部です:

http://www.imagemagick.org/script/index.php

あなたのパスにもそれがあることを確認してください。

1
Abdullah Jibaly