0
会員になると、いいね!でマイページに保存できます。
人工知能(AI)は、ディープラーニングの登場以降に普及してきたイメージがあるかと思いますが、実は、それ以前から広く活用されてきた分野があります。それは、ネットショップや電子メールサービスでよく使われる「フィルタリング」の領域です。今回は、すでに当たり前のように使われているフィルタリング技術について、簡単に解説していきます。
「コンテンツフィルタリング」とは
電子メールやブラウザ、ネットワーク領域で広く使われているフィルタリング技術の1つが「コンテンツフィルタリング」です。
これはメールの文面や添付ファイル、ウェブページのURLやデータに含まれている特定のキーワードやプログラムをチェックし、不適切なものや危険なものを除去するための技術です。
シンプルなコンテンツフィルタリングでは、フィルタをかけるキーワードやジャンルを指定するだけで利用できるため、AIを活用するイメージはないでしょう。しかし、高度なコンテンツフィルタリングになると過去の事例やユーザーの利用状況を分析し、機械学習によってフィルタリングのキーワードやルールを調整するようなものも登場します。
グーグルのGmailなどでは、ユーザーがスパム判定をしたメールを学習し、自動的にスパムフィルタの精度を向上させる仕組みが古くから取り入れられていました。現代の基準からすると、GmailはAI的なふるまいをするコンテンツフィルタリングのように見えますが、当時はそれがAIであるという認識はあまりされていませんでした。
ところが、ディープラーニングの登場でコンテンツフィルタリングも大きく進歩します。今まではコンテンツフィルタリングによってフィルタリングをかけられる対象は「文字列」や「数値」のみでしたが、ディープラーニングによって映像や音声もフィルタリングにかけられるようになりました。
これによって不適切な画像や映像、特定の音声を含む動画を自動的にフィルタリングできるようになり、YoutubeやFacebookなどでは不適切なコンテンツがアップロードできないようになっています。また、不適切なコンテンツではなく、逆に欲しいコンテンツを見つける際にも利用できます。
Youtube MusicやSpotifyでは、ジャンルや曲名、アーティストに関わらず、曲調などをフィルタリングすることで、似たような曲を自動的に集められるようになりました。コンテンツフィルタリングの技術はまだまだ人間に匹敵するとは言えませんが、その適応分野は大きく広がり、より一般的な存在になっています。
「協調フィルタリング」とは
オンラインショッピングサイトなどで提供される、いわゆる「おすすめ機能」は「協調フィルタリング」と呼ばれます。
協調フィルタリングはコンテンツフィルタリングとは違い、データの中身は一切見ていません。見ているのは「誰がその情報を必要としたか」という点だけです。ユーザーの選択から共通点を見つけ出し、ユーザーの傾向や特性に応じてフィルタをかけるのです。
たとえば、「三毛猫の動画を見た人はシャム猫や柴犬の動画も好んで見る」と言われても違和感を抱くことはないでしょう。動物が好きな人は動物が出る動画を見る傾向にあります。
同様に野球のジャイアンツ戦を見る人は、野球をまったく見ない人に比べると阪神戦も見る傾向が強いですし、スポーツをまったく見ない人に比べると野球を見ている人はサッカーの動画も見る傾向にあります。スポーツ全般が好きな人は少なくありません。
こういったことは動画の中身を見なくても分かります。適当なラベルを振って、Aさんが1番と2番の動画を見ているなら、2番の動画を見ているBさんは1番の動画も見るかもしれないという推測が立てられます。
ユーザーの選択から嗜好を見出す協調フィルタリングの手法は、コンテンツを問わず使えるので汎用性が高く、動画以外にも商品・広告・SNSのマッチングに使われます。フィルタリングの参考にするデータには、視聴履歴や購入履歴の他に、評価・検索ワード・滞在時間・購入金額など、統計データとして蓄積されるあらゆるものが用いられます。
【次ページ】より進化した「おすすめ機能」の仕組み(図解あり)
関連タグ