• 会員限定
  • 2019/05/13 掲載

5分でわかる自然言語処理:人工知能の「文字認識」の仕組みとは

手書き文字を認識するカギはディープラーニング

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
記事をお気に入りリストに登録することができます。
人工知能関連技術の中でも特に関心が高く応用範囲の広い技術が、文字認識や文章理解に関する「自然言語処理」に関する技術です。この技術は単に人間と機械がコミュニケーションを取る手助けをするだけにとどまらず、情報の収集や検索、書類のデータ化にも役立ちます。事務的な「データ入力」「コールセンター」といったサポート業務から「マーケティング」「経営戦略」にまで幅広く生かせる人工知能による文字認識や文章理解について数学的な用語は一切使わず、2回にわたってやさしく解説していきます。

執筆:フリーライター 三津村直貴

執筆:フリーライター 三津村直貴

合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・医療関連のトピックを扱っており、研究機関・大学における研究支援活動も行っている。著書『近未来のコア・テクノロジー(翔泳社)』『図解これだけは知っておきたいAIビジネス入門(成美堂)』、執筆協力『マンガでわかる人工知能(池田書店)』など。

photo
人工知能は「文字」をどのように認識しているのか?やさしく解説
(©Elnur - Fotolia)

人工知能はどうやって文字を認識している?

photo
マス目をルールにしたがって塗るだけで文字や図が現れる
 まず、人工知能はどうやって文字を認識しているのでしょうか。コンピューターはモニター上に文字を表示することができるので、「書けるなら読めるだろう」と思いたくなりますが、実際にはコンピューターの中では文字を数値に変換し、数値に合わせた「点の集合」に変え、モニタ上に光の情報として表現しているだけです。

 原理的にはマスを黒く塗って絵を作る「ピクロス」と同じで、コンピューターが「A」を「A」、もしくは「あ」は「あ」であると認識して表示しているわけではありません。この時点での文字は、コンピューターにとっては黒点の集まりに過ぎません。

連載一覧
 また、ここでいう「文字認識」はいわゆる「光学文字認識」(OCR:Optical Character Recognition)のことです。紙や印刷物に書かれた文字をスキャンしてテキスト化する技術といえばピンと来るのではないでしょうか。

 私たち人間が紙などに書かれた情報を理解できるのは、紙に反射した光の情報を見て「文字」「背景」「インクの染み」を認識しているわけで、実質的には光の情報です。それゆえに、光学文字認識が手書き文字を含めさまざまな文字認識技術の基礎になっています。

 この光学文字認識では、文字の持つ「直線」「曲線」「交点」などの特徴を数学的な比率で表して理想的な文字と比較したり、ディープラーニングを応用したり、さまざまな形で捉えていきます。

画像
コンピューターと文字認識技術の違い

 簡単そうに聞こえますが、同じ文字であっても「インクの色」「紙の色」「電灯の色」で受け取る光が違います。光から得られる情報というのは0と1で扱えるデジタルデータではありません。それぞれにわずかな違いの存在するアナログデータなのです。

 顔認証システムなどが明かりによって顔が認識できたりできなかったりするのはその典型です。さらにそれが、手書き文字ともなる厄介です。「文字の形」「文字の角度」はもちろんのこと、「インクの染み」「書き間違い」のほか、筆記体や行書体で見られる「線のつながり」が当たり前のように発生するため、簡単には行きません。

【次ページ】人工知能が文字の特徴を見つける方法

関連タグ

関連コンテンツ

オンライン

Slack AI Day

Slack AI の日本語ローンチを祝し、革新の軌跡を振り返り、未来への一歩を踏み出す特別なイベントを開催します。 「コミュニケーションの先の未来を再定義する」というテーマのもと、Slack はメッセージングツールから AI を活用した強力なプラットフォームへと進化しました。 私たちの働き方を根本から変えるこのプラットフォームでは、CRM やアプリケーションの複数同時活用が可能で、 あらゆるデジタル業務が Slack を通じて円滑に進行します。 また、AI の強化により、過去の会話や見落としていた情報を活用して、ワンクリックで最適なコミュニケーションを実現することができます。 この記念すべきイベントでは、「新しい働き方」と業務における生成 AI の活用に焦点を当てます。 Slack AI を通じて、私たちは日常の業務プロセスを根本から変革し、生産性の飛躍的な向上を目指します。 AI とオートメーションの融合が、時間を要する従来のプロセスを一新。 Salesforce の Customer 360 と連携した Slack で働き方が劇的に変わります。 Slack を愛用し続けてくださる皆さま、そしてこれから Slack をご利用してくださる皆さまと共に、AI による業務効率化の新時代を創ります。 進化を遂げた Slackと一緒に、未来の働き方を再定義し、その可能性を探求しませんか? 【このような方におすすめです】 ・業務における生成 AI の活用を模索している方 ・より効率的な働き方・チームコミュニケーションを模索している方 ・Slack でできることを知りたい方、Slack の利用を検討している方 ・Slack を使っているけど、"コミュニケーション" 以外の新しい利用価値を知りたい方 ・部門・プロジェクトごとの部分的な Slack 利用から組織全体へ広げていきたい方 ・Slack 無償版から有償版へ切り替えたい方

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます