web-dev-qa-db-ja.com

PDFファイルをPHPとマージします

私のコンセプトは-ウェブサイトに10個のpdfファイルがあります。ユーザーはいくつかのpdfファイルを選択し、次にマージを選択して、選択したページを含む単一のpdfファイルを作成できます。 PHPでこれを行うにはどうすればよいですか?

70
Imrul.H

以前にこれをやったことがあります。 fpdfで生成したpdfがあり、それに可変量のPDFを追加する必要がありました。

そのため、私はすでにfpdfオブジェクトとページをセットアップしました(http://www.fpdf.org/)そして、fpdiを使用してファイルをインポートしました(http://www.setasign.de/products/pdf-php-solutions/ fpdi /)FDPIは、PDFクラスを拡張することにより追加されます。

class PDF extends FPDI
{

} 



    $pdffile = "Filename.pdf";
    $pagecount = $pdf->setSourceFile($pdffile);  
    for($i=0; $i<$pagecount; $i++){
        $pdf->AddPage();  
        $tplidx = $pdf->importPage($i+1, '/MediaBox');
        $pdf->useTemplate($tplidx, 10, 10, 200); 
    }

これにより、基本的に各pdfが画像になり、他のpdfに入れられます。それは私がそれを必要としていたものに対して驚くほどうまく機能しました。

22
Christa

以下はphp PDF mergeコマンドです。

$fileArray= array("name1.pdf","name2.pdf","name3.pdf","name4.pdf");

$datadir = "save_path/";
$outputName = $datadir."merged.pdf";

$cmd = "gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=$outputName ";
//Add each pdf file to the end of the command
foreach($fileArray as $file) {
    $cmd .= $file." ";
}
$result = Shell_exec($cmd);

リンクを見つけた場所を忘れましたが、うまくいきます。

104
Sanjeev Chauhan

私はPDFMergergithub.com から提案するので、次のように簡単です::

include 'PDFMerger.php';

$pdf = new PDFMerger;

$pdf->addPDF('samplepdfs/one.pdf', '1, 3, 4')
    ->addPDF('samplepdfs/two.pdf', '1-2')
    ->addPDF('samplepdfs/three.pdf', 'all')
    ->merge('file', 'samplepdfs/TEST2.pdf'); // REPLACE 'file' WITH 'browser', 'download', 'string', or 'file' for output options
33
AgelessEssence
$cmd = "gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=".$new." ".implode(" ", $files);
Shell_exec($cmd);

チャウハンの答えの簡略版

11
Svetoslav Genov

PDFMergerで使用するコードは、PHP5バージョンでは非推奨です。 PHP 5.で動作するようにコードを分岐して修正しました。githubアカウントで取得できます https://github.com/myokyawhtun/PDFMerger

9
myokyawhtun

受け入れられた答えとFDPIホームページの両方が、失敗した例や不完全な例を示しているようです。これが機能し、実装が簡単なものです。予想どおり、fpdfおよびfpdiライブラリが必要です。

require('fpdf.php');
require('fpdi.php');

$files = ['doc1.pdf', 'doc2.pdf', 'doc3.pdf'];

$pdf = new FPDI();

// iterate over array of files and merge
foreach ($files as $file) {
    $pageCount = $pdf->setSourceFile($file);
    for ($i = 0; $i < $pageCount; $i++) {
        $tpl = $pdf->importPage($i + 1, '/MediaBox');
        $pdf->addPage();
        $pdf->useTemplate($tpl);
    }
}

// output the pdf as a file (http://www.fpdf.org/en/doc/output.htm)
$pdf->Output('F','merged.pdf');
6
billynoah

私のソフトウェアにも同様の問題がありました。複数のPDFファイルを1つのPDFファイルにマージして、外部サービスに送信したいと考えました。 Christaのソリューションに示すように、FPDIソリューションを使用しています。

ただし、使用している入力PDFのバージョンは1.7よりも高い可能性があります。 FPDIの商用アドオンを評価することにしました。しかし、オフィスのコピー機でスキャンされたドキュメントの一部に不正なインデックスが含まれていたため、商用のFPDIアドオンがクラッシュしました。そこで、Chauhanの答えのようにGhostscriptソリューションを使用することにしました。

しかし、その後、出力PDFプロパティで奇妙なメタデータを取得しました。

最後に、GhostscriptによってPDFをマージおよびダウングレードするために2つのソリューションに参加することにしましたが、メタデータはFPDIによって設定されます。いくつかの高度なフォーマットのpdfでどのように機能するかはまだわかりませんが、スキャンの場合はうまく機能します。クラスの抜粋は次のとおりです。

class MergedPDF extends \FPDI
{
    private $documentsPaths = array();

    public function Render()
    {
        $outputFileName = tempnam(sys_get_temp_dir(), 'merged');

        // merge files and save resulting file as PDF version 1.4 for FPDI compatibility
        $cmd = "/usr/bin/gs -q -dNOPAUSE -dBATCH -dCompatibilityLevel=1.4 -sDEVICE=pdfwrite -sOutputFile=$outputFileName";
        foreach ($this->getDocumentsPaths() as $pdfpath) {
            $cmd .= " $pdfpath ";
        }
        $result = Shell_exec($cmd);
        $this->SetCreator('Your Software Name');
        $this->setPrintHeader(false);
        $numPages = $this->setSourceFile($outputFileName);
        for ($i = 1; $i <= $numPages; $i++) {
            $tplIdx = $this->importPage($i);
            $this->AddPage();
            $this->useTemplate($tplIdx);
        }

        unlink($outputFileName);

        $content = $this->Output(null, 'S');

        return $content;
    }

    public function getDocumentsPaths()
    {
        return $this->documentsPaths;
    }

    public function setDocumentsPaths($documentsPaths)
    {
        $this->documentsPaths = $documentsPaths;
    }

    public function addDocumentPath($documentPath)
    {
        $this->documentsPaths[] = $documentPath;
    }
}

このクラスの使用法は次のとおりです。

$pdf = new MergedPDF();
$pdf->setTitle($pdfTitle);
$pdf->addDocumentPath($absolutePath1);
$pdf->addDocumentPath($absolutePath2);
$pdf->addDocumentPath($absolutePath3);
$tempFileName = tempnam(sys_get_temp_dir(), 'merged');
$content = $pdf->Render();
file_put_contents($tempFileName, $content);
5

私は同様の問題を試してみましたが、うまく動作します、試してみてください。 PDF間の異なる方向を処理できます。

    // array to hold list of PDF files to be merged
    $files = array("a.pdf", "b.pdf", "c.pdf");
    $pageCount = 0;
    // initiate FPDI
    $pdf = new FPDI();

    // iterate through the files
    foreach ($files AS $file) {
        // get the page count
        $pageCount = $pdf->setSourceFile($file);
        // iterate through all pages
        for ($pageNo = 1; $pageNo <= $pageCount; $pageNo++) {
            // import a page
            $templateId = $pdf->importPage($pageNo);
            // get the size of the imported page
            $size = $pdf->getTemplateSize($templateId);

            // create a page (landscape or portrait depending on the imported page size)
            if ($size['w'] > $size['h']) {
                $pdf->AddPage('L', array($size['w'], $size['h']));
            } else {
                $pdf->AddPage('P', array($size['w'], $size['h']));
            }

            // use the imported page
            $pdf->useTemplate($templateId);

            $pdf->SetFont('Helvetica');
            $pdf->SetXY(5, 5);
            $pdf->Write(8, 'Generated by FPDI');
        }
    }
3
Kevin Chui

これはWindows上で私のために働いた

  1. https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/ からPDFtkを無料でダウンロード
  2. c:のフォルダーにフォルダー(PDFtk)をドロップします。
  3. 以下をphpコードに追加します。$ file1は最初のPDFファイルの場所と名前、$ file2は2番目のファイルの場所と名前、$ newfileは宛先ファイルの場所と名前です

    $file1 = ' c:\\\www\\\folder1\\\folder2\\\file1.pdf';  
    $file2 = ' c:\\\www\\\folder1\\\folder2\\\file2.pdf';  
    $file3 = ' c:\\\www\\\folder1\\\folder2\\\file3.pdf';   
    
    $command =  'cmd /c C:\\\pdftk\\\bin\\\pdftk.exe '.$file1.$file2.$newfile;
    $result = exec($command);
    
1

FPDI上に抽象化レイヤーを作成しました(他のエンジンに対応する場合があります)。ライブラリに応じてSymfony2バンドルとして、およびライブラリ自体として公開しました。

バンドル

ライブラリ

使用法:

public function handlePdfChanges(Document $document, array $formRawData)
{
    $oldPath = $document->getUploadRootDir($this->kernel) . $document->getOldPath();
    $newTmpPath = $document->getFile()->getRealPath();

    switch ($formRawData['insertOptions']['insertPosition']) {
        case PdfInsertType::POSITION_BEGINNING:
            // prepend 
            $newPdf = $this->pdfManager->insert($oldPath, $newTmpPath);
            break;
        case PdfInsertType::POSITION_END: 
            // Append
            $newPdf = $this->pdfManager->append($oldPath, $newTmpPath);
            break;
        case PdfInsertType::POSITION_PAGE: 
            // insert at page n: PdfA={p1; p2; p3}, PdfB={pA; pB; pC} 
            // insert(PdfA, PdfB, 2) will render {p1; pA; pB; pC; p2; p3} 
            $newPdf = $this->pdfManager->insert(
                    $oldPath, $newTmpPath, $formRawData['insertOptions']['pageNumber']
                );
            break;
        case PdfInsertType::POSITION_REPLACE: 
            // does nothing. overrides old file.
            return;
            break;
    }
    $pageCount = $newPdf->getPageCount();
    $newPdf->renderFile($mergedPdfPath = "$newTmpPath.merged");
    $document->setFile(new File($mergedPdfPath, true));
    return $pageCount;
}
0
juanmf

myokyawhtunのソリューションは私に最適です(PHP 5.4を使用)

それでもエラーが発生します-次を使用して解決しました:

Fpdf_tpl.phpの269行目-関数パラメーターを次のように変更しました:

function Image($file, $x=null, $y=null, $w=0, $h=0, $type='', $link='',$align='', $resize=false, $dpi=300, $palign='', $ismask=false, $imgmask=false, $border=0) { 

Fpdf.phpの898行目でも同じ変更を行いました。

0
Scott