- 会員限定
- 2018/08/15 掲載
100秒でレスがつく データ分析で維持する「あたたかいママコミュニティ」の秘密
ママコミュニティ「ママリ」でどんなデータを使うのか
――今日はよろしくお願いします。まずは所属とお名前を教えてください。島田氏:コネヒト 取締役 CTOの島田です。ママリの共同創業者でもあり、現在の担当はITインフラと機械学習(による分析)を担っています。
仲田氏:サービス部でコミュニティサポートを担当している仲田です。ママリを使っていただくユーザーに「心のよりどころ」と感じてもらえるようなアプリを目指しています。
――ありがとうございます。今日はデータ活用だけでなく、機械学習に使う教師データの作り方や、ドメイン知識の活用方法などの定性面を主にお聞きしたいと思います。まずはコネヒトさんのデータ活用状況をお教えください。
島田氏:我々はOSSで提供されているダッシュボードツールのRe:dashを導入していて、全社で活用しています。職種に応じて、利用用途はさまざまです。
たとえば、ディレクターはメインでSQLを書いてプロダクト改善に生かしています。営業担当者も売上獲得につなげるためにSQLを書いてデータ集計をしています。
仲田のいるコミュニティチームももちろんRe:dashを活用しています。ユーザーからの問い合わせやアプリ内の投稿などをもとにSQLを書いて調査したりもしています。
なぜデータ分析を「ビジネスサイド」が担うのか
――顧客に関連するビジネス側の方々がデータ分析を担っているとのこと。コミュニティチームの方などはいきなりSQLを書くのが大変だと思いますが、どうやってそのような取り組みを始めたのでしょうか。仲田氏:最初はエンジニアが先生になり、基礎的なことを教えてました。わからないことがあっても丁寧に教えてくれるので、聞きながら覚えていきました。
また、Re:dashは他の人が書いてダッシュボードにしているクエリを見ることができるので、それを参考にしています。
――ユーザー投稿もSQLでチェックされているのですか?
仲田氏:いえ、それは別の管理画面上で確認できるようになっています。そこではユーザーからの違反報告などチェックしています。すべての投稿を確認するわけではなく、チェックすべき投稿をしたら、人が気づくことができるような仕組みになっています。
機械学習を利用して違反を発見
――分析に機械学習を導入しているとのこと。どのような取り組みかお教えください。島田氏:機械学習を使って違反を検知するようなツールも作りました。コミュニティサービスで大事なのは『空気感』です。実際、違反コンテンツが入ってしまうと楽しく使ってくださるユーザーが活動しにくくなってしまいます。
そうした状況ををいかに出さないようにするかを考えています。システムのルールを決めてマッチングしたものにアラートを出すというのは当初からやっていました。ただ、それだけでは対応しきれないケースも出てきて、投稿を判別するエンジンを作ろうとなりました。
仲田氏:島田は話しかけやすく、些細なこともすぐに相談できるので、投稿を判別するエンジンを作るのも自然な流れでした。「話しかけやすさ」はデータ・サイエンティストに必要な資質かもしれません。
――なるほど。機械学習というと教師データを作る必要があります。データの取得で工夫された点はありますか?
仲田氏:何か特別なことをしたわけではなくて、とにかくユーザーのコミュニケーションが起きている場を実際に見に行くことを繰り返しました。どういう質問や会話の流れが場を壊してしまうか、知見を集めることで、大体の雰囲気がわかってきました。
島田氏:そうした取り組みをモデル化するだけだったので、非常にやりやすかったです。実際に業務負荷も1/10程度になりました。一時期、大量の悪質なコンテンツが入ってきたことがあったのですが、このエンジンのおかげで事なきを得ました。
【次ページ】「投稿を止める」判断の基準
関連コンテンツ
関連コンテンツ
PR
PR
PR