PDFファイルからテキストを抽出する

PDFファイルまたはPortable Document Formatファイルを扱うときに、PDFファイルからすべてのテキスト抽出したいことがあります 。 このガイドでは、オンラインツールを使用して、または使用しないで、WindowsでPDFファイルからテキストを簡単に抽出したり、PDFファイルをテキストファイルに変換したりする方法を説明します。

PDFファイルからテキストを抽出する最も簡単で迅速な方法は、無料のオンラインサービスを使用することです。 これらのオンラインサービスには追加のソフトウェアは必要ありません。つまり、PCに追加のソフトウェアをインストールしなくても、仕事を終わらせることができます。

下記のオンラインサービスが望みの結果を与えていない場合、またはリモートサーバーにアップロードしたくない機密からテキストを抽出したい場合は、方法3から5に記載されている無料のWindowsソフトウェアをチェックアウトすることができます。 PDFファイルを圧縮するための6つの方法ガイド。

6の方法1

ExtractPDF

ExtractPDFは、PDFファイルからテキストや画像を一杯にする無料のオンラインサービスです。 このサービスは分かりやすいレイアウトを提供しています。 WebブラウザでExtractPDFページを開いた後、[参照]ボタンをクリックしてPDFファイルを選択し、[アップロード]ボタンをクリックして選択したファイルをExtractPDFのサーバーにアップロードして抽出を開始します。

仕事が終わったら、アップロードしたPDFファイルからテキストコンテキスト、フォント、画像をダウンロードするオプションが表示されます。 抽出したテキストを(メモ帳またはWordで開くために).txtファイルとしてダウンロードするには、[テキスト]タブに切り替えて、[結果をファイルとしてダウンロード]ボタンをクリックします。

上の写真でわかるように、このサービスは12 MBを超えるファイルをサポートしていません。 ほとんどのPDFファイルは12 MB未満になるため、この制限はプログラムではありません。

テスト中に、一部のPDFファイルでは、サービスが適切な出力を得られないことがわかりました。 このサービスに問題がある場合は、次のものをチェックしてください。

6の方法2

オンラインOCR

オンラインOCRは、5 MB未満のPDFファイルからテキストを抽出するのに役立つオンラインツールです。 このサービスは、PDFを編集可能なMicrosoft Word(.docx)またはText(.txt)ファイルに変換します。

6の方法3

STDUビューア

基本的に、STDU Viewerは複数のファイル形式を開いて表示するためのフリーソフトウェアです。 それに加えて、STDUビューアの無料版は、PDFファイルからのテキストコンテンツのエクスポートをサポートしています。

PDFファイルのテキストコンテンツをエクスポートするには、STDUビューアでPDFファイルを開き、[ファイル]メニュー、[エクスポート]、[テキストへ]の順にクリックし、新しいテキストファイルを保存する場所を選択して[OK]ボタンをクリックします。

エクスポートオプションを使用すると、単一、複数、またはすべてのページからテキストを抽出できます。 STDU Viewerのダウンロードサイズは3 MB以下です。 STDUビューアの無料版は個人的および非商業的使用のみを目的としています。

6の方法4

PDF2テキストパイロット

PDF2Text Pilotは、マウスをクリックするだけでWindowsからPDFファイルをテキストファイルに変換するための無料ソフトウェアです。 ソフトウェアをインストールして実行した後は、テキストファイルとして表示したいPDFファイルを選択して、[変換]ボタンをクリックするだけです。 変換されたファイルは数秒で完成するでしょう。

PDF2Text Pilotの強みは、そのシンプルなインターフェースと一度に複数のPDFファイルを変換できることです。

6の方法5

A-PDFテキスト抽出

A-PDF Text Extractorは、PDFファイルからテキストを抽出するように設計されたもう1つのWindowsソフトウェアです。 ソフトウェアは、個人的および商業的使用のために絶対に無料です。

A-PDF Text Extractorをインストールした後(インストーラのサイズは1 MB未満です)、A-PDF Text Extractorを起動します。 [開く]ボタンをクリックしてPDFファイルを開き、[テキストの抽出]ボタンをクリックしてPDFファイルからテキストの抽出を開始します。

6の方法6

Gaaiho PDFリーダー

Gaaiho PDF Readerは、PDFファイルを扱うように設計された優れたソフトウェアです。 このフリーソフトウェアはあなたが他のフリーのPDFリーダーソフトウェアを見つけることができないという機能の多くを提供します。 機能の1つは簡単にPDFファイルからテキストを抽出する機能です。

PDFファイルをテキストファイルとして保存するには、Gaaiho ReaderでPDFファイルを開いた後、[ファイル]メニューをクリックし、[名前を付けて保存]をクリックして、[ファイルの種類]の横にあるドロップダウンメニューから[PDF to Text]オプションを選択します。

あなたはこれらのツールについてどう思いますか? あなたは同じ仕事のためのより良い無料のツールを知っていますか? コメントで教えてください。