2021|01|
2009-02-20 [長年日記]
_ [Linux] imagemagick 使い方
スキャンした画像が pdf にされていて、その pdf から画像を抽出して、見やすく加工して再び pdf にする。まず、画像を抽出するには
$ pdfimages aaa.pdf bbb
のようにする。pbm ファイルが出来る。作られた画像はなぜか白黒反転していたので、それを直し、同時に270度回転させ、png ファイルにする。
$ convert -nagate -rotate 270 bbb.pbm ccc.png
次に、画像の周囲の不要な部分を除く。
$ convert -crop 2620x1920+230+10 ccc.png ddd.png
などとする。スキャンしたときに、うまく密着できなかったところは黒くなっているので、その部分を白く塗る。どうしても gimp で手作業をしなければならない部分もあるが、すべての画像で白く塗りたい部分だけが白でほかの部分が透明の画像 bg.png を作り、重ね合わせると楽ができる。
$ composite bg.png ddd.png eee.png
最後に、2ページが一緒にスキャンされた画像なので左右で分割する。このとき、画像サイズを知らなければならないのだが、これは identify というコマンドを使う。
$ identify eee.png
画像サイズが 2600x1920 のときは次のようにして分割する。
$ convert -crop 1300x1920 eee.png fff.png
これでうまくいくと思ったのだが、identify の実行結果が
img-000.png PNG 2620x1920 2866x2026+230+10 DirectClass 16-bit 108.229kb
のようになっていると、うまく半分に分割できない。解消するうまい方法を探す前に、bmp に一度変換して、その画像を分割するという方法で問題は解決した。そして、できた画像を pdf に変えれば目的達成。
$ convert *.png ggg.pdf
[ツッコミを入れる]