読書よくしている方は読めない漢字が出てくる時どうしますか。
漢字はローマ字とは全然違って、その書き方から読み方がわかりません。
こういう問題は漢字ORC(光学文字認識)ソフトで簡単に解決できます。今回の記事を書くため、我々はほとんどのORCソフトを使ってみました。ここでは無料・有料問わずにランキング8のソフトをみなさんにご紹介します。記事を読んで、好きなツールで読めない漢字を入力して調べましょう。
読めない漢字は簡単に入力できませんが、OCRソフトで認識したら、パソコンに入力できるようになれます。ただし、漢字はローマ字と違って、複雑で何万個もあります。もし漢字の認識データを引き続き取り入れていなかったら、漢字はローマ字として認識されるかもしれません。次は誤認になるいくつかの原因です。
字数の違い - 英語のアルファベットはただ26個ある一方、常用漢字は2000個あり、本の中でよく見られる字は3000個という高い数になります。
複雑な形 - 字数が多い他、漢字の形も複雑です。特に「主」・「王」・「玉」のような極似ている漢字も多くあることで、間違った字として読み取られることになります。
新字体 vs. 旧字体 - さらに、古い本なら、旧字体の感じもよく見られます。こうしたことで、同じ字でも二倍の訓練を受けなければ精度の高い結果を得ることが不可能です、
こんなに難しいことでも、それができる漢字OCRソフトがいくつかあります。
画像・PDFから漢字を認識して入力するなら、一番の解決策は専門的な漢字OCRソフトです。こういうソフトでは精度の高いを得られる他、モジュール・拡張機能で他のPDF編集・変換もできます。
使いやすさ・精度・出力形式数・一括認識機能という面の比較からみると、我々はCisdem PDF OCR Converter OCRが一番だと思います。このソフトではローカルのPDF・写真をWord、Excel、PPTX、ePub、Text、HTMLを含む15+の形式に変換することができます。
さらに、Cisdemは15+種類の言語をサポートします:日本語・韓国語・中国語など。それなので、漢字の認識にはとても専門的です。
漢字なら、文庫本・単行本・古籍・申込書・手紙、どこからも認識できます。Cisdemでは簡単に漢字を含むテキストを文字化できます。
今までのOCRソフトと違って、Cisdemは漢字の変体も認識できます。99%の精度はほとんどのOCRツールより優れています。
スキャンしたPDFファイルがあったら、このソフトでOCRして、検索できるようになります。嗣ごはsの手順です。
PDFの漢字を認識する手順
注意: 暗号化された漢字PDFを文字化する場合、ロックアイコンをクリックしてパスワードで解除したり内蔵のパスワード解除ツールを使ったりする必要があります。
精度と安全性を保証したいなら、専門的な漢字OCRソフトが一番ですが、もしテキストの少ない漢字ファイルやただ数回の認識のみなら、無料のツールでもよく役割を果たします。
Googleは周知の通り、生産性向上のオンラインサービスを数多く提供しています。その中で、クラウドディスクGoogle Driveに内蔵されているGoogle Docsはファイルに打開・変換・OCRができます。つまり、Google Docsでは漢字のあるPDF・写真を無料で認識できます。
Google漢字OCRの特徴:
Convertioもオンラインで漢字のPDF・写真を無料で文字化できます。もともとはオンライン変換サービスであるConvertioは高度なOCR技術で編集できる漢字ファイルの作成にも使えます。特にサポートする形式も数多くあります。ただし、主要な言語をほとんどサポートしていても、Google Docsより少ないです。
Convertio OCRのデメリット:
オンラインツールはとても便利ですが、安全・安定・安易の面ではデスクトップが一番かもしれません。次は二つの一番OCRソフトをみなさんにご紹介します。
PDF OCR X Community EditionはMac・Windowsで通用できる無料の漢字OCRソフトです。使いやすくて軽量な一方、このソフトではスキャンしたPDFを編集できるようにOCRできます。ちなみに、このソフトは60+種類の言語をサポートします。
オフラインツールを使って無料で漢字PDFを認識する手順
PDF OCR Xの問題:
複数のページを一括にOCRしたい場合、PDF OCR Xはできませんが、ここではもう一つのツールをご紹介します。Microsoft OneNoteは大勢の人に愛用されていますが、自動OCR機能が付いていることがよく知られていません。Microsoft OneNoteはPDF・写真・手書きから漢字を認識ことができます。
PDFから漢字を認識する方法How to OCR Chinese PDF to Text?
OneNoteの欠点:
Scan & Translateは漢字テキストを他の90種類の言語に翻訳でき、アプリストアにも高評価されていてる漢字OCRアプリです。.
Scan & Translateの特徴:
iPhoneで漢字をOCRして文字化する方法
Text FairyはGoogleストアで高評価されている漢字OCRアプリです。ただし、認識できる言語はScan & Translateより少なくて、自動で翻訳することもできません。
Text Scannerの主要な特徴
Androidスマホで漢字を認識する方法
では、上で述べた9つのツールの中で、一番のツールは一体どれでしょうか。
どのツールも異なった特徴が備えています。もし頻繁に漢字OCRが必要ではないなら、無料のオンラインツールでも済むことができます。でも、もし頻りに漢字を認識する必要があったら、Cisdem PDF Converter OCRがおすすめです。このソフトでは高精度で複数のファイルを一括に認識できます。
もし何かの問題があったら、次のリストを参考しましょう:
本を読み、自分の感想を記録するのは鈴木の趣味です。そのため、Cisdemの編集者になるのは彼女に向いています。PDFの編集・変換方法についての文章を書くことに没頭しています。