PDFから画像を抽出
PDFに埋め込まれた画像が必要なとき、このPDF画像抽出ツールがすべて見つけて取り出します。画質は元のまま。グラフィックの使い回し、写真のアーカイブ、受け取ったPDFからの画像回収、どんな用途でも数秒で完了します。
各画像は元のフォーマット(JPG・PNG、またはPDF作成時に使われたもの)で個別のファイルとして保存されます。スクリーンショットでも劣化コピーでもなく、PDFに入れたときのオリジナルそのものです。
出力形式
抽出されたすべての画像は1つのZIPファイルにまとめてダウンロードされます。
PDFから画像を抽出
PDFに入っている画像を、元の状態のまますべて取り出せます。写真、グラフ、ロゴ、図解――それぞれ個別のファイルとしてダウンロードできます。
PDF ファイルをここにドラッグ&ドロップ
またはクリックして参照(最大10MB)
変換を開始しています...
PDFからの画像抽出はどう動くのか
PDFの中では、画像はテキストやベクターグラフィックとは独立した埋め込みオブジェクトとして保存されています。抽出するというのは、その埋め込みオブジェクトをそのまま取り出す操作です。PDF作成時に配置されたファイルと基本的に同じもので、ドキュメントレベルで後からかけられたトリミングやマスクはつかないかたちで出てきます。
取り出した画像の品質は、元のPDFに完全に依存します。高解像度画像が埋め込まれていれば高解像度で、PDF作成時に圧縮・縮小されていればその状態で出てきます。ツールがどうにかできることはなく、保存されているものをそのまま取り出すだけです。
ツールは全ページを順番に見ていき、見つかった画像オブジェクトをすべて抽出します。ファイル名にはページ番号が入るので、どのページから来たかがすぐわかります。一般的なビジネス文書であれば、ロゴ、グラフ、製品写真、図解、装飾素材など、数十枚の画像が出てくることもよくあります。
手順:PDFから画像を取り出す
- PDFをアップロード — アップロードエリアにドラッグするか、クリックして選択。画像が埋め込まれたPDFなら何でも対応しています。
- 出力形式を選ぶ — 元の形式のまま抽出するか、JPGまたはPNGに一括変換するかを選択します。
- 抽出を実行 — ツールが全ページをスキャンし、画像オブジェクトを特定して取り出します。
- ZIPをダウンロード — 抽出されたすべての画像が1つのZIPにまとめられます。
抽出されるものとされないもの
抽出される
- • 写真・画像ファイル
- • ロゴ・ブランドグラフィック
- • 画像として埋め込まれたグラフ・図表
- • 文書内のスクリーンショット
- • 背景画像
- • 装飾素材
- • スキャンされたページ(ページ全体が1枚の画像として)
抽出されない
- • ベクターグラフィック(図形・アイコンなど)
- • テキスト(画像に見えても)
- • データから生成されたグラフ(画像ではない)
- • ページ背景の単色塗り
- • ベクターベースのパターン
- • ベクター形式のクリップアート
こんな場面で役に立つ
会社のロゴファイルを救出
オリジナルのロゴデータがなくなっていても、昔のパンフレットPDFに残っていれば取り出せます。そのPDFに入っている中で一番品質の高いものが得られます。
報告書の写真を流用したい
四半期報告書にプレゼンで使いたい製品写真がある。スクリーンショットで誤魔化すよりも、きちんと抽出した方がずっときれいです。
年次報告書のグラフを使いたい
報告書のグラフが画像として埋め込まれている場合、取り出してそのまま自分のスライドに使えます。作り直す必要なし。
画像ライブラリを整理する
複数のPDFから画像をまとめてメディアライブラリに追加したいとき。バッチ抽出してまとめてアーカイブできます。
学術論文の図を使う
研究論文には図や模式図がたくさん入っています。自分の論文や発表資料への引用・掲載のために取り出す(出典明記は必須です)。
印刷制作のソース素材
クライアントからPDFが来たけどソース画像が必要、というとき。そのPDF内で一番画質の高い状態のものを取り出せます。
出力形式の選択肢
元の形式(推奨)
各画像が保存されている形式のまま取り出します。通常、写真はJPG、透明度のあるグラフィックはPNG。形式変換がないので画質劣化もありません。
JPGに変換
すべてJPGで出力します。写真中心のPDFやファイルサイズを抑えたいときに便利。ただし透明度は失われます。
PNGに変換
すべてPNGで出力します。ロゴや透明度を保持したいグラフィックに向いています。ファイルサイズは大きくなりますが、ロスレス品質です。
画質について知っておくこと
取り出した画像の品質は元のPDFで決まります。Web向けに72 DPIで作られたPDFなら72 DPIの画像が出てきます。印刷用の300 DPI PDFなら300 DPIで取り出せます。抽出プロセス自体は画質に手を加えないので、PDFに入っている状態がそのまま得られます。
ファイルサイズを小さくするために最適化されたPDFは、画像を強めに圧縮していることがあります。そういう場合、取り出した画像にもPDFをズームしたときに見えるのと同じ圧縮の粗さが出ます。より高い品質が必要なら、もとの高品質PDFか元の画像ファイルを入手するしかありません。
技術仕様
- 処理: PyMuPDFによるサーバーサイド画像抽出
- 検出フォーマット: JPG、PNG、TIFF、BMP、GIF(PDF内に埋め込まれたもの)
- 出力: 抽出画像をまとめたZIPアーカイブ
- ファイル名: page1_img1.jpg、page1_img2.png など
- メタデータ: 元の画像サイズを保持
- PDFサイズ: 制限なし