2024.10.08タイムレスな子供の教育
【簡単解説】小学生が夢中になるYouTube!おすすめ機能の秘密とは?
こんにちは!タイムレスエデュケーションの鈴木です。以前に今の小学生、中学生が将来求められるスキルとして、プログラムの構造が理解できるようになることが重要だと記事を書かせて頂きました。まだ見ていない方はぜひこちらからご覧ください。そこで本日は、世の中にあるコンピュータを使ったサービスの仕組みを紹介しようと思います。プログラミングの学習だけにとどまらず、具体的にどのようにコンピュータの技術が使われているのか、なるべく簡単に分かるよう説明させて頂きますので、ぜひご覧ください。よろしくお願いします。
さて、今回のコンピュータシステムの仕組み解説はYouTubeの「おすすめ機能」です。YouTubeを使って動画を見ることが多いかもしれませんが、ついつい何時間も動画を見てしまったことはありませんか?小学生や中学生のお子様や大人まで、YouTubeに夢中になってしまうことには理由があるのです。その仕組みの一つとして、機械学習を使った「おすすめ機能」があります。この仕組みを知ることで、AIについて親子で一緒に学んでいきましょう!
機械学習とは
解説の前に少し説明します。「機械学習」というのは、AI(人工知能)の中の技術の一つです。簡単に言うと、コンピュータが自分で「学んで」、人間がいちいち指示をしなくても、自動で仕事をしてくれる技術です。YouTubeの「おすすめ機能」は、この「機械学習」を使って作られています。
YouTubeのおすすめ機能とは
YouTubeの「おすすめ機能」についても少し説明しますね。YouTubeのおすすめ機能は、ユーザー(YouTubeを使っている人)の興味がありそうな動画を、コンピュータ(AI)が見つけて、教えてくれる機能です。例えば料理の動画を見ている人には、他の料理の動画をおすすめし、ゲームの動画を見ている人には、他のゲームの動画や最新ゲームの動画などをおすすめします。一度動画を見始めると、興味のある動画がどんどん出てくるので、ついつい見続けてしまうのです。では、この仕組みがどのようにできているのかを見ていきましょう。
おすすめ機能の仕組みとは
従来のおすすめ機能
まず、従来のおすすめ機能では、他のユーザーの行動と比較する「協調フィルタリング」という方法を使っていました。例えば、AさんとBさんが数学の動画を見て勉強し、Bさんが他に物理や化学の動画も見ていた場合、Aさんにも同じような動画をおすすめするというものです。この「協調フィルタリング」という方法は1990年代に登場し、1990年代後半にAmazonなどのオンラインショッピングサイトやNetflix(当時はDVDレンタルサービス)が採用していました。しかし、ユーザーやコンテンツの数が増えるとおすすめを分析するのにかなりの時間がかかってしまいます。その後、発展して「Matrix Factorization(行列分解)」を使ったおすすめ機能が使われるようになりました。難しい用語なので、簡単に説明だけすると膨大な情報から特徴をうまく保持し、計算しやすいように情報を分解することを言います。ただ、この方法もユーザーやコンテンツ(動画や商品)の数が少ないと予測が難しくなるなど、様々な問題がありました。
現在のおすすめ機能
従来のおすすめ機能の問題を解決するため、現在のYouTubeの「おすすめ機能」では機械学習を使っています。機械学習はコンピュータが自分で学習するという技術です。ではコンピュータは何を学習しているのでしょうか。簡単にまとめると自分が見た「動画に関する様々な情報」を記録し、その情報をもとに「この人はこんな動画が好きだろう」と考えて、新しい動画をおすすめしているのです。また、おすすめされた動画を「見るか見ないか」をさらに学習して、もっと正確に興味のある動画を提案できるようになります。
「動画に関する様々な情報」ってどんな情報?
では、「動画に関する様々な情報」とは何のことか、もう少し詳しく見てみましょう。YouTubeで動画を見るとき、まず何の動画を見たいか言葉を入れて検索しますね。たとえば「音楽」と検索すると、たくさんの音楽に関連する動画が表示されます。この「検索した言葉」(検索履歴)をコンピュータが覚えます。そして、実際に再生した動画(再生履歴)も記録します。その動画を最後まで見たのか、途中でやめたのかなどの行動パターンもコンピュータは覚えます。また、その動画のチャンネルを登録したかどうかなども記録します。ユーザーの行動だけでなく、動画の情報(タイトル、説明文、タグ)についてもコンピュータは記録します。
集めた情報をどのように使う?
さて、ユーザーの検索履歴、再生履歴、行動パターン、動画の情報など「動画に関する様々な情報」を記録し、どのように活用したのか。この情報の種類だけでもたくさんありますが、ユーザーの数と動画の数が増えれば、その情報量は膨大なものになりますね。そこで登場するのがディープラーニング(深層学習)という方法です。また新しい言葉がでてきましたが、これも機械学習技術のうちの一つです。簡単に説明すると、「コンピュータ自身がたくさんのデータを見て、どうすれば正しい答えを見つけられるかを学ぶ方法」です。ディープラーニングはたくさんのデータを分析するのが得意なので、さきほどのたくさん集めた情報を使い、ユーザーの複雑な行動パターンを学習していきます。
そして、この作成したモデルを使って新しいユーザーに対してもおすすめ動画を出せるようになりました。しかし、この段階のモデルでは過去の視聴履歴や傾向だけに基づいているため、履歴の情報に顕著に反応して似た内容の動画がおすすめされてしまう問題がありました。
強化学習でさらに改善
この問題を改善するため、実際におすすめした動画のユーザーの評価を取り入れてさらに学習をしていきました。ここで言う評価とは、おすすめした動画を再生したかどうか、再生時間はどれくらいだったか、動画への高評価/低評価などです。このような方法を強化学習と言いますが、人間と同じようにうまくいったことや失敗したことの結果を踏まえて、少しずつ成長していくことと同じになります。この強化学習を通して、ユーザーへおすすめする動画の種類が増え、動画の視聴時間を伸ばすことができるようになりました。実際にあまり関心がなかった動画などがおすすめに表示されることはないでしょうか?今まで気が付かなかった新しい興味や関心を発見させることができるようになり、よりよいサービスへと進化していきました。このような仕組みができるのも、YouTubeが長い間たくさんのデータを集め、技術を進歩させてきたからですね。YouTubeは2005年2月にアメリカのベンチャー企業によって始まりました。20年近く経った今でも、技術がどんどん進化しているからこそ、私たちが便利に使えるサービスとなっているのですね。
まとめ
いかがだったでしょうか。普段何気なく使っているサービスの裏側を知ることで、学んだプログラミングの知識がより深まるきっかけになれば嬉しいです。小学校やプログラミング教室でプログラミングを学んだものの、「実際にどこで役に立つの?」と感じている方も多いかもしれません。プログラミングは、サービスを作るための「手段」に過ぎませんが、コンピュータを使ったサービスを作るには、プログラミングやコンピュータの知識が欠かせません。そして、より良いサービスを作り出すためには、何よりも「創造力」が大切になってきます。当教室では、子供たちが“タイムレスな陳腐化しないスキル”を身に付けられるよう、創造する活動に重点を置いたプログラミング授業を行っております。体験会をご希望の方はお気軽にお問い合わせください。また、当教室の受講生の作品もYouTubeに投稿していますので合わせてご覧ください。最後までご一読頂き、ありがとうございました。