pythonによりpdfを画像にする方法

pythonを使ってPDFを画像にする方法についてのメモ。

ただし元は英語記事

 

環境は以下の通り

windows10 64 bit

python 3.6 ( accompanying with Anaconda )

poppler 0.51

pdf2image 0.1.14

 

1) poppler のインストール

ここから、poppler-0.51_x86.7zをダウンロードする。これを解凍するとpoppler-0.51なるフォルダーが現れるはず。

 

pathをつなぐため、以下のコマンドを実行する。

set path=%path%;C:\Users\user_name\Desktop\poppler-0.51\bin 

 

インストールの確認のため、以下のコマンドを実行する。

 pdfinfo.exe

適切に情報が帰ってきたら、popplerのインストール完了。

 

2) pdf2imageのインストール

ここから、pdf2image-0.1.14.tar.gzをダウンロード。これを解凍したら、pdf2image-0.1.14なるフォルダーがデスクトップに現れるはず。

 

上記のフォルダー内に移動して、以下のコマンドでインストールする。

python setup.py install

 

3) PDFを画像に変換する

適当なpdfファイルを用意し(ここでは、"test.pdf"とする)、pdfファイルのある場所で以下のコマンドを実行する。

from pdf2image import convert_from_path, convert_from_bytes

images = convert_from_path('test.pdf')
images[0].save('test.png', 'png')

 

以下の記事を参考にした

PythonでPDFを画像に変換する | ぷろぐら×でざいん

 

関連  

haitenaipants.hatenablog.com

 

haitenaipants.hatenablog.com