生成AI・LLM・RAG…色々手を出す前に知っておきたい「本当に使える」データ管理の基本
- ありがとうございます!
- いいね!した記事一覧をみる
意外と理解されていない……そもそもの「データの種類」
データを適切に管理し、有効活用するためには、データに対する基本的な理解が必須となる。そもそもデータは、「構造化データ」「非構造化データ」「半構造化データ」の大きく3つに分けることができる。
構造化データとは、Excelなどに代表される明確な形式や規則に従って整理されたデータのことで、行や列で表現されるのが一般的だ。非構造化データとは、固定された形式がないデータので、SNS投稿・Chatメッセージ・文書ファイル・画像・動画・音声ファイル、さらにIoTデバイスから取得されるログ・Webデータなどが該当する。データのフォーマットが異なるため、管理や利用が難しいとされる。半構造化データは、構造化データと非構造化データのハイブリッド型のフォーマットで、XML・JSON・メールなどが該当する。
これまで、こうした性質が異なるデータを一括管理することは容易でなかった。だが、LLM(大規模言語モデル)や生成AIなどの最新テクノロジーの進展によって状況が変わってきた。以降では、最新のデータ管理・活用方法を詳しく解説していく。
この記事の続き >>
-
・取り扱いが難しい「非構造化データ」はどう管理するのが正解?
・ポイントは「LLM(大規模言語モデル)」と「RAG(検索拡張生成)」
・「構造化データ」を使うと何ができる? 有効活用を阻む「6つの課題」と解決法
今すぐビジネス+IT会員にご登録ください。
すべて無料!今日から使える、仕事に役立つ情報満載!
-
ここでしか見られない
2万本超のオリジナル記事・動画・資料が見放題!
-
完全無料
登録料・月額料なし、完全無料で使い放題!
-
トレンドを聞いて学ぶ
年間1000本超の厳選セミナーに参加し放題!
-
興味関心のみ厳選
トピック(タグ)をフォローして自動収集!