Linuxで自炊した本をPDFにする備忘録

PC&スマートフォンに関する記事

たまにスキャンした本をPDFにするのですが、手順や方法を忘れてしまうことがあります。
そのため、備忘録代わりに手順と方法を残しておきます。

ファイル名の編集

スキャンしたら、まずはファイル名の編集。

rename 's/image//' *.jpg

これでファイル名のいらないところを削る。
やらなくても問題はないのだが、なんとなく気になるので、削る。

いらないページを削除する

白紙ページを削除。
次に、タイトルや作者、発行日などがまとめてあるページ(奥付というらしい)も削除する。

XnConvertで余白を切る

「動作」タブからトリミングを選択。
「端から」を選択して、適宜余白を削っていく。

余白は削れば削るほど、文字が大きくなって見やすくなる。
だが、削りすぎると、文字が消えてしまったり、逆に圧迫感を感じてしまうので、ほどほどに。

convertコマンドでPDFにまとめる

出来上がった画像ファイルをconvertコマンドでPDFにまとめる。

convert *.jpg title.pdf

DistributedPixelCache ~ や convert-im6.q16: not authorized 等のエラーが出た場合はこの記事を参考に。
ImageMagickのconvertコマンドでエラーが出る場合の対処方法 : LINUX.JUST4FUN.BIZ

DistributedPixelCache ~ 云々はメモリ不足によるエラーらしい。
これは修正しても出てきてしまうことがあった。
画像ファイルの枚数が多いと、メモリが足りなくなってしまうようだ。

そのため、100 ~150 ページくらいで一旦まとめて、分割したPDFを後で結合する。

pdfuniteコマンドでPDFを結合

pdfunite book1.pdf book2.pdf book3.pdf title.pdf

book1~3:分割したPDF名
title:本のタイトル