web-dev-qa-db-ja.com

パンドックと外国人のキャラクター

Pandocを使用して、MarkdownをPDFファイルに変換しようとしています。これは、Pandocが変換しないサンプルです。

# Header!

## Sub Header

themselves derived respectively from the Greek ἀναρχία i.e. 'anarchy'

これは、ウィキペディアのデータベースダンプのトップから取得したものです。 Pandocはそれをまったく気に入らない。これは私に与えるエラーメッセージです:

pandoc: Error producing PDF from TeX source.
! Package inputenc Error: Unicode char \u8:ἀ not set up for use with LaTeX.

See the inputenc package documentation for explanation.
Type  H <return>  for immediate help.
 ...                                              

l.53 ...es derived respectively from the Greek ἀ

これを回避するために与えることができるコマンドスイッチはありますか?私はこのようなことをするためのアドバイスに従ってみましたが、失敗しました:

iconv -t utf-8 test.md | pandoc -o test.pdf

Update以下のジョンのアドバイスに従う前に、 こちらを参照

Update 2これが最終的に機能するコマンドです。うまくいけば、これは誰かを助ける:

pandoc test2.md -o test2.pdf --latex-engine=xelatex --template=my.latex --variable mainfont="DejaVu Serif" --variable sansfont=Arial

そして、これはmy.latexの内容です:

\documentclass[$if(fontsize)$$fontsize$,$endif$$if(lang)$$lang$,$endif$$if(papersize)$$papersize$,$endif$]{$documentclass$}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
\usepackage{amssymb,amsmath}
\usepackage{ifxetex,ifluatex}
\usepackage{fixltx2e} % provides \textsubscript
% use microtype if available
\IfFileExists{microtype.sty}{\usepackage{microtype}}{}
% use upquote if available, for straight quotes in verbatim environments
\IfFileExists{upquote.sty}{\usepackage{upquote}}{}
\ifnum 0\ifxetex 1\fi\ifluatex 1\fi=0 % if pdftex
  \usepackage[utf]{inputenc}
  \usepackage{ucs}
$if(euro)$
  \usepackage{eurosym}
$endif$
\else % if luatex or xelatex
  \usepackage{fontspec}
  \ifxetex
    \usepackage{xltxtra,xunicode}
  \fi
  \defaultfontfeatures{Mapping=tex-text,Scale=MatchLowercase}
  \setromanfont{TeX Gyre Pagella}
  \newcommand{\euro}{€}
$if(mainfont)$
    \setmainfont{$mainfont$}
$endif$
$if(sansfont)$
    \setsansfont{$sansfont$}
$endif$
$if(monofont)$
    \setmonofont{$monofont$}
$endif$
$if(mathfont)$
    \setmathfont{$mathfont$}
$endif$
\fi
$if(geometry)$
\usepackage[$for(geometry)$$geometry$$sep$,$endfor$]{geometry}
$endif$
$if(natbib)$
\usepackage{natbib}
\bibliographystyle{plainnat}
$endif$
$if(biblatex)$
\usepackage{biblatex}
$if(biblio-files)$
\bibliography{$biblio-files$}
$endif$
$endif$
$if(listings)$
\usepackage{listings}
$endif$
$if(lhs)$
\lstnewenvironment{code}{\lstset{language=Haskell,basicstyle=\small\ttfamily}}{}
$endif$
$if(highlighting-macros)$
$highlighting-macros$
$endif$
$if(verbatim-in-note)$
\usepackage{fancyvrb}
$endif$
$if(tables)$
\usepackage{longtable}
$endif$
$if(graphics)$
\usepackage{graphicx}
% We will generate all images so they have a width \maxwidth. This means
% that they will get their normal width if they fit onto the page, but
% are scaled down if they would overflow the margins.
\makeatletter
\def\maxwidth{\ifdim\Gin@nat@width>\linewidth\linewidth
\else\Gin@nat@width\fi}
\makeatother
\let\Oldincludegraphics\includegraphics
\renewcommand{\includegraphics}[1]{\Oldincludegraphics[width=\maxwidth]{#1}}
$endif$
\ifxetex
  \usepackage[setpagesize=false, % page size defined by xetex
              unicode=false, % unicode breaks when used with xetex
              xetex]{hyperref}
\else
  \usepackage[unicode=true]{hyperref}
\fi
\hypersetup{breaklinks=true,
            bookmarks=true,
            pdfauthor={$author-meta$},
            pdftitle={$title-meta$},
            colorlinks=true,
            urlcolor=$if(urlcolor)$$urlcolor$$else$blue$endif$,
            linkcolor=$if(linkcolor)$$linkcolor$$else$Magenta$endif$,
            pdfborder={0 0 0}}
\urlstyle{same}  % don't use monospace font for urls
$if(links-as-notes)$
% Make links footnotes instead of hotlinks:
\renewcommand{\href}[2]{#2\footnote{\url{#1}}}
$endif$
$if(strikeout)$
\usepackage[normalem]{ulem}
% avoid problems with \sout in headers with hyperref:
\pdfstringdefDisableCommands{\renewcommand{\sout}{}}
$endif$
\setlength{\parindent}{0pt}
\setlength{\parskip}{6pt plus 2pt minus 1pt}
\setlength{\emergencystretch}{3em}  % prevent overfull lines
$if(numbersections)$
$else$
\setcounter{secnumdepth}{0}
$endif$
$if(verbatim-in-note)$
\VerbatimFootnotes % allows verbatim text in footnotes
$endif$
$if(lang)$
\ifxetex
  \usepackage{polyglossia}
  \setmainlanguage{$mainlang$}
\else
  \usepackage[$lang$]{babel}
\fi
$endif$
$for(header-includes)$
$header-includes$
$endfor$

$if(title)$
\title{$title$}
$endif$
\author{$for(author)$$author$$sep$ \and $endfor$}
\date{$date$}

\begin{document}
$if(title)$
\maketitle
$endif$

$for(include-before)$
$include-before$

$endfor$
$if(toc)$
{
\hypersetup{linkcolor=black}
\setcounter{tocdepth}{$toc-depth$}
\tableofcontents
}
$endif$
$body$

$if(natbib)$
$if(biblio-files)$
$if(biblio-title)$
$if(book-class)$
\renewcommand\bibname{$biblio-title$}
$else$
\renewcommand\refname{$biblio-title$}
$endif$
$endif$
\bibliography{$biblio-files$}

$endif$
$endif$
$if(biblatex)$
\printbibliography$if(biblio-title)$[title=$biblio-title$]$endif$

$endif$
$for(include-after)$
$include-after$

$endfor$
\end{document}
55
Mike Thomsen

使用 --pdf-engine=xelatexオプション。

30
John MacFarlane

デフォルトでは、PandocはマークダウンファイルをPDFファイルに変換するときにpdflatexエンジンを使用します。 pdflatexは、xelatexとしてUnicode文字を非常にスムーズに処理できません。代わりにxelatexを試してください。 しかし、、単にxelatexコマンドを使用するだけでは十分ではありません。よくあることですが、タイプセットするUnicode文字のグリフを含む適切なフォントを選択する必要があります。

私は中国のユーザーですので、例えば中国語を取り上げます。次のコンテンツを含むtest.mdがある場合:

你好汉字

次のコマンドを使用して、このマークダウンファイルをコンパイルできます。

pandoc --pdf-engine=xelatex -V CJKmainfont="KaiTi" test.md -o test.pdf

上記のコマンドでは、--pdf-engine=xelatexを使用してLaTeXエンジンを選択します(新しいバージョンのPandocでは、 --latex-engineオプションは廃止されました )。 -V CJKmainfont="KaiTi"は、中国語をサポートする適切なフォントを選択するために使用されます。 他の言語では、フラグ-C mainfont="<FONT_NAME>"を使用できます。

あなたの言語をサポートするフォントを見つける方法

あなたの言語をサポートするフォントを見つけるには、 言語コード を知る必要があります。次に、Linuxシステムまたは TeX Live がインストールされたWindowsシステムを使用している場合。次のコマンドを使用して、言語に有効なフォントを見つけることができます。

fc-list :lang=zh #find the font which support Chinese (language code is `zh`)

Linuxシステムでの出力を以下に示します enter image description here

使用することを選択した場合、例えばフォントSource Han Serif CNを使用し、次のコマンドを使用してマークダウンファイルをコンパイルします。

 pandoc --pdf-engine=xelatex -V CJKmainfont="Source Han Serif CN" test.md -o test.pdf
9
jdhao

5年後にこの投稿に戻ってきましたが、問題はまだそこにあります。コマンド

pandoc -s test.md -t latex -o test.pdf

test.mdに非ラテン文字、ギリシャ語、キリル文字、CJK、ヘブライ語、アラビア語が含まれるテキストが含まれている場合、失敗します。

LaTeXはUnicodeよりも前に設計されており、さまざまな文字セットのサポートは一部の領域で堅牢ですが、包括的とはほど遠いため、XeLaTeXを使用するためのアドバイスは有効ですが、自動選択がないため、メインフォントを慎重に選択する必要があります。

以下は、考えられる問題といくつかの解決策の小さな分類です。 Pandoc 1.19ですべてテスト済み。

キリル

LaTeXのキリル文字アルファベットのサポートは、T2Aフォントエンコーディングを介して提供されます。

小さなサンプルを考えてみましょう:

# Header

## Subheader

Tetris (Russian: Тетрис) quoting Wikipedia is a tile-matching puzzle 
video game

Pandocでこの例を実行すると、次のように失敗します。

! Package inputenc Error: Unicode char Т (U+422)
(inputenc)                not set up for use with LaTeX.

See the inputenc package documentation for explanation.

fontencオプションはdefault.latexテンプレートの事前定義変数であるため、修正が可能です。

この例を実行するには

pandoc -t latex -o tetris.pdf -V fontenc=T2A cyrillic.md

正しいレンダリングを生成します

Text with cyrillic characters rendered correctly

ただし、これはハイフネーションなどの他の言語機能を正しく処理しません。より良い方法は、Babelを使用して、正しいフォントエンコーディングを選択させることです。

pandoc -t latex -o tetris.pdf -V lang -V babel-lang=russian cyrillic.md

または、Markdown内でBabelコマンドを使用して言語を切り替える

# Header

## Subheader

Tetris (Russian: \foreignlanguage{russian}{Тетрис}) quoting Wikipedia 
is a tile-matching puzzle video game

そして実行

pandoc -t latex -o tetris.pdf -V lang -V babel-lang=english \
       -V babel-otherlangs=russian cyrillic2.md

ギリシャ語

元の投稿の例には、メインおよび拡張ギリシャ語Unicodeコードページの両方の文字が含まれています。

とにかく、広く使用されているLGRギリシャ語フォントエンコーディングは、LaTeX 3プロジェクトでカバーされておらず、localエンコーディングとして分類されています。つまり、サイトによって、システムによって異なります。 LaTeX Encoding Guide へ。

TeX Liveでは、texlive-greek-inputenctexlive-greek-fontenc、およびtexlive-cbfontsのパッケージをインストールする必要があります。 Babel 3.9以降が必要なことに注意してください。しかし、の結果

pandoc -t latex -o anarchy.pdf -V fontenc=LGR greek.md

予想外に見えるかもしれません。

Text with both Greek and Latin characters typed as Greek

この問題を修正するには、LaTeX Babelパッケージを正しくセットアップする必要があります。そして、元のテキストの言語を切り替えるコマンドを挿入します。

# Header!

## Sub Header

themselves derived respectively from the Greek \textgreek{ἀναρχία} 
i.e. 'anarchy'

次のコマンドでこれをコンパイルします

pandoc -s greek2.md -t latex -V fontenc=T2A -V lang -V babel-lang=english \
    -V babel-otherlangs=greek -o greek.pdf

期待どおりに出力が生成されます。

Text with greek characters rendered correctly

XeLaTeX

XeLaTeXを使用している場合、これらすべては必要ありません。

元の例を次のように実行するだけです

pandoc -s greek.md --latex-engine=xelatex -t latex -o greek.pdf

生産するだろう

Text with Greek characters omitted

フォントにはギリシャ文字の位置に何も含まれていないため、出力には代わりに空白が含まれます。

人気のあるフォントの1つを新しいmainfontとして選択すると、少し役立ちます

pandoc -s greek.md --latex-engine=xelatex \
    -V mainfont="Liberation Serif" -t latex -o greek.pdf

Text with only basic Greek characters rendered correctly

ただし、psiliアクセント付きの小文字アルファベットなどの拡張ギリシャ語コードページの文字はレンダリングされません。

XeTeX/LuaTeXを使用したギリシャ語のフォント設定 ガイドでは、DejaVu、Libertine、またはFreeフォントファミリの使用を推奨しています。

実際、DejaVu SerifLinux Libertine O、およびTemporaおよびおそらくその他のフォントを使用すると、期待どおりの結果が得られます。 XeLaTeXおよびLinux Libertineフォントを使用したレンダリングを参照してください。

pandoc -s greek.md --latex-engine=xelatex -V mainfont="Linux Libertine O" \
      -t latex -o greek.pdf

Text with Greek characters rendered correctly with XeLaTeX and Libertine fonts

4
Dmitri Chubarov

LaTeX中間出力を使用している場合、インライン\mbox{t\'ext}を使用してアクセント付き文字を取得できます。 \mbox{}がないと、バックスラッシュは多くの場合Pandocパーサーによって正しく解釈されません。

1
mabraham

出力に数学記号を表示しようとすると、同様の問題が発生しました。

他の人が言及したように、最近のpandocバージョン(私の場合はv2.2.3.2)では、使用するオプションはpdf-engine=xelatex。この場合、フォントを指定する必要はありませんでした。

pandoc -o MyDoc.pdf --pdf-engine=xelatex  MyDoc.md

Latinmodern-mathフォントが見つからないというエラーが表示されました。私はそれを使用してインストールしました:

tlmgr install collection-fontsrecommended
0
Bampfer

前述のように_--latex-engine=xelatex_を使用できますが、私が見つけた最善の方法は、lang変数を使用して、ヘッダーでドキュメント言語を指定することです。例:_lang: ru-RU_。私のdebianワークステーションでの実例:

_---
title: Lady Macbeth de Mzensk (Chostakovitch, livret d'Alexandre Preis, 1934)
lang: ru-RU
---

# Acte I / Tableau 1

*[Народ ненадежный]*  
Ха, ха, ха, ха, ха, ха, ха. *[...]* Чуыствуем  
На кого ты нас покидаешь?  
Без хозяина будет скучно,  
скучно, тоскливо, безрадостно.

Не работа. Без тебя невеселье. Воз вращайся  
Как можно скорей, скорей !
_

次に起動できます:

_$ pandoc -o your-file-output.pdf your-source-file.md
_
0
Creasixtine

キリル文字に対応

pandoc myfile.md --pdf-engine=xelatex -V mainfont=Arial
0
itsnikolay