pythonによりpdfを画像にする方法
pythonを使ってPDFを画像にする方法についてのメモ。
環境は以下の通り
windows10 64 bit
python 3.6 ( accompanying with Anaconda )
poppler 0.51
pdf2image 0.1.14
1) poppler のインストール
ここから、poppler-0.51_x86.7zをダウンロードする。これを解凍するとpoppler-0.51なるフォルダーが現れるはず。
pathをつなぐため、以下のコマンドを実行する。
set path=%path%;C:\Users\user_name\Desktop\poppler-0.51\bin
インストールの確認のため、以下のコマンドを実行する。
pdfinfo.exe
適切に情報が帰ってきたら、popplerのインストール完了。
2) pdf2imageのインストール
ここから、pdf2image-0.1.14.tar.gzをダウンロード。これを解凍したら、pdf2image-0.1.14なるフォルダーがデスクトップに現れるはず。
上記のフォルダー内に移動して、以下のコマンドでインストールする。
python setup.py install
3) PDFを画像に変換する
適当なpdfファイルを用意し(ここでは、"test.pdf"とする)、pdfファイルのある場所で以下のコマンドを実行する。
from pdf2image import convert_from_path, convert_from_bytes
images = convert_from_path('test.pdf')
images[0].save('test.png', 'png')
以下の記事を参考にした
PythonでPDFを画像に変換する | ぷろぐら×でざいん
関連