【裏ワザ】OCRがなくてもPDF画像ファイルから文字を抽出する方法!
皆さんは画像ファイルのPDF文字変換どのように行っていますか?
通常のPDFであれば文字の部分だけをコピー&ペースト、選択できるはずなのですが、排他制御ではなく、スキャニングした画像データ、つまり文字を画像として認識しているPDFは、文字の部分をコピー&ペーストできません。
OCRがあれば問題ないのですが、出前のPCでも文字を抽出する方法があります。
そんな時にキーボードによる入力をするのではなく、この裏技を試してみてください。
- 今回の目的
- ブラウザ上でグーグルドライブを開く
- PDFファイルをグーグルドライブ上に保存(アップロードから行う)する
- アップロードしたPDFファイルを右クリックし、『アプリで開く』→『Google ドキュメント』をクリック
- PDFファイル内の文字が認識され、選択したりコピーしたりできるようになる!
- Google翻訳にコピペする
- 適正日本語化
- まとめ
今回の目的
今回は下の排他制御ではなく、スキャニングした画像データPDF(文字の部分をコピー&ペーストできない)部分を、
- 文字の部分を抜き出す
- Google翻訳にかけて日本語訳
- 日本語適正化
といった作業を行っていきます。
ブラウザ上でグーグルドライブを開く
出前のPCでもGoogleドライブならインターネット環境が整っていれば使用できます。
最悪、スマホのテザリングでも行えてしまうという便利技です。
PDFファイルをグーグルドライブ上に保存(アップロードから行う)する
文字抽出を行いたいPDFファイルをGoogleドライブ上に保存します。
保存方法は「Googleドライブのアップロード」から行ってください。
アップロードしたPDFファイルを右クリックし、『アプリで開く』→『Google ドキュメント』をクリック
PDFファイル内の文字が認識され、選択したりコピーしたりできるようになる!
弱点があります。
文字だけに圧縮されてしまいので、
「どこからどこまでが該当箇所なのかわかりにくい!」
この方法でコピペ出来るようになったテキストの中から該当箇所を探す必要があります。
ただし、すべてを手入力で行うよりも早く解決できるはずです。
Google翻訳にコピペする
はじめにはじめにデジタル防水ハンチングカメラ(1920 * 1080P)をお買い上げいただきありがとうございます。これはすべて強力なカメラです、それは野生の狩猟、動物の監視とホームセキュリティに使用することができます、それはまた普通のカメラにすることができます。 WOSPORTSトレイルカメラを使用すると、防水、防塵、および偽装された外観の機能から、さまざまな状況で一日中動物を監視できます。狩猟用カメラは写真を撮り、動物を追跡するために自動的にビデオを作ります。このマニュアルから、あなたはインストール、操作、仕様を含む項目についてのすべての情報を知るでしょう。製品を使用する前にこの取扱説明書をよく読んでください。
今後の参考資料製品の説明2メガピクセルカラーCMOSセンサービデオ仕様 :1920x1080p @ 15fps 1280x720p @ 30fps 848x480p @ 30fps 640x480p @ 30fps 1,200万画素、JPEGフォーマット。2.36インチ 480 * 234ドットTFT-LCDディスプレイ夜間撮影用42個の赤外線LED(範囲20m)フルオートマチックIRフィルター :日中は自動的にカラー写真を撮るように切り替えます低消費電力設計 :約12ヶ月SD / SDHCメモリーカードをサポートPIRセンサーの角度を取る :40°システムの起動時間 :約0.6秒システム操作の便利な方法 :内蔵温度検出内蔵マイクスピーカーUSB2.0とTV-OUT機能主な機能 :写真、ビデオ、連続撮影撮影モードトリガー間隔設定、パスワード設定、シリアル番号設定、時間経過。環境温度測定、電源インジケータと低電気自動電源オフ。 IP54規格での防水
ある程度、わかる範囲の日本語にはなりましたね。
これをあなたのセンスで改行などの体裁を整えて日本語適正化していきます。
日本語力が試されますwww。
適正日本語化
-----はじめに-----
この度は、防水デジタルハンティングカメラ(1920 * 1080P) をお買い上げいただきありがとうございます。
このカメラは、野生の動物等の撮影や監視、ホームセキュリティーカメラとして使用することができます。
また、通常のカメラとしての使用も可能です。
WOSPORTSトレイルカメラは屋外での使用が可能な防水、防塵です。
自然環境になじみやすい外観デザインで動物などを監視します。
このカメラは動物等の写真や動画を自動的に撮影することとができます。
製品を使用する前に、この取扱説明書をよく読んでください。
-----製品仕様-----・2メガピクセルカラーCMOSセンサー :F=7.45mm
・ビデオ仕様 :1920x1080p @ 15fps 1280x720p @ 30fps 848x480p @ 30fps 640x480p @ 30fps 1,200万画素、JPEGフォーマット・TFT-LCDディスプレイ :2.36インチ(480 * 234ドット)
・赤外線LED :夜間撮影用42個搭載(範囲20m)
・フルオートマチックIRフィルター :日中は自動的にカラー写真を撮影・低消費電力設計 :約12ヶ月
・メモリーカード :SD / SDHC(4GBから32GB)
・PIRセンサー角度 :40°・システムの起動時間 :約0.6秒・その他 :内蔵温度検出、内蔵マイクスピーカー、USB2.0、TV-OUT機能
・主機能 :写真、ビデオ、連続撮影撮影モード、トリガー間隔設定、パスワード設定、シリアル番号設定、時間経過、環境温度測定、電源インジケータ、自動電源オフ。
・防水性能 :IP54規格
・言語 :英語、フランス語、ドイツ、スペイン語、オランダ語をサポート
いかがですが?
だいぶ、それらしくなりましたよね。
日本語力が最後は試される形にはなりますが。。。
まとめ
OCRがなくてもあきらめないでください。
時代は進化しました。
まさに、Googleさまです!!
オンラインのGoogleドライブとGoogleドキュメントを使用すれば
ある程度の解決はできる形です。
少々、人力的な部分が必要となって掃きますが、それはある程度仕方がないこととしてとらえるのがよいでしょう。