TikTokの爆発的な拡散力はどこから?AIアルゴリズムと「階層型ユーザープール」で生み出した大ヒットの裏側

2022年1月13日

ITジャーナリスト

牧野 武文(まきの たけふみ)

生活とテクノロジー、ビジネスの関係を考えるITジャーナリスト、中国テックウォッチャー。著書に「Googleの正体」(マイコミ新書)、「任天堂ノスタルジー・横井軍平とその時代」(角川新書)など。

日本でもZ世代の心を鷲掴みしたショートムービープラットフォーム『TikTok』(ティックトック)。その中国版である「抖音(ドウイン)」2021年の最大日間アクティブユーザー数は5億を超えたという。ドウイン最大の特徴は、爆発的な拡散力だ。昨日までまったく無名だった投稿主が、たった1本の動画で国民的な有名人になったりもする。

この爆発的な拡散力は、従来のSNSのようなインフルエンサーを介する拡散モデルではなく、独自のAIアルゴリズムによってコントロールされているからこそ可能になったのだ。そのアルゴリズムの中心にあるのは、ターゲットユーザーを複数のプールにわけ、配信対象規模が少しずつ大きくなるようテスト配信を行っていく「階層型ユーザープール」という独自の配信モデルだ。 

人が拡散させるSNS、アルゴリズムが拡散させるTikTok

雑誌『日経トレンディ』2021年12月号の特集「2021年ヒット商品ベスト30」では、「TikTok売れ」が数々の大ヒット商品を押さえ、1位に選ばれた。さまざまな商品情報がTikTokの短尺動画に載せられて拡散され、あっという間にヒット商品になってしまう現象が起きている。

従来のSNSでは、インフルエンサーという「人」が拡散の鍵となっている。それに対してTikTokの場合、拡散に人は介在せず、すべてをアルゴリズムで決定しているのだ。

インフルエンサーという「人」が拡散をする従来のSNSでは、その影響範囲がどうしても「限定的」になってしまう。たとえば、あるコンテンツが女子高生の間で人気になったとしても、女子高生以外のユーザーのタイムラインに表示されることはほとんどない。ユーザーは皆興味のあるインフルエンサーのみフォローしているため、ユーザーがクラスター化され分断されているからだ。海外のツイッターで起きたブームを多くの日本人が知らないのも「インフルエンサー拡散」の限界性を示している。

一方でTikTokは、インフルエンサーの拡散力に頼らず、全ユーザーを対象にAIを活用した「おすすめ」アルゴリズムを使って拡散させているため、ユーザークラスターの壁を乗り越えて配信ができているのだ。このTikTokの「おすすめ」アルゴリズムは、マサチューセッツ工科大学が所有するメディア企業「Technology Review, Inc.」が刊行する科学技術誌『MITテクノロジーレビュー』が選ぶ2021年版の「世界を変える10大テクノロジー」にも選ばれている。

いったい、TikTokはどのようにAIを活用しているのだろうか。

一夜にして爆発的拡散が起きるTikTok

TikTokは、中国発のIT企業「バイトダンス」が開発したショートムービー投稿プラットフォーム。中国国内向けに提供されている同アプリの中国版「抖音(ドウイン/以下ドウイン)」は日間アクティブユーザー数(DAU)5億人超えの「国民的」アプリになっている。

「2020年抖音ユーザープロフィール報告」(2020年抖音用户画像报告/巨量算数)で公開されているユーザー年齢層分布によると、20代ユーザーは全体の半数近くを占めているものの、30代が29%、46歳以上は11%と、世代とわず高い影響力を持っている。

▲中国版TikTokの年齢別ユーザー分布。ニュース映像や商品映像も多く、若い世代から中高年までに使われるサービスになっている。(「2020年抖音ユーザープロフィール報告」より作成)

そんなドウインでしばしば起きているのが、まったく無名の人が一夜にして全国的な人気者になる現象だ。

今年の7月に「井川里予」というアイドルがドウインの世界に彗星のように現れて、たった2本のダンス映像で、1300万人のファンを獲得した。井川里予という名前は日本人風だが、れっきとした杭州市生まれの中国人の専門学校生だ。井川里予のダンスを真似た踊ってみた映像も多数投稿され、ドウインの中は一時「井川里予一色となり」、誰の目にも爆発的な流行現象が起きていることがわかるほどだった。

▲独創的なダンス、真似のしやすいシンプルな振り付けで一気に全国区に広がった

また10月には、「柳夜熙」というバーチャルキャラクターがたった一晩で130万人のファンを獲得し、1月現在530万人を超えるファンを擁している。この映像を制作した映像制作スタジオ「創壱テクノロジー(创一科技)」は、以前からドウイン上に映像を発表してきた。しかしここまで短時間で拡散されたのは初めてのことであり、創壱テクノロジーの知名度は一気に全国に広がった。

▲バーチャルキャラクター「柳夜熙」を、この世のものではない存在として位置づけ、中国の古典的な怪異譚のテイストで、リアルな映像と融合している。

ドウインでは、このような「爆発的な流行」が起こり続けている。それが多くの人を惹きつける大きな魅力になっている。従来型のSNSで無名の人が一気に拡散をさせようとすれば、メガインフルエンサーが取り上げてくれるという偶発的な幸運か、インフルエンサーマーケティングによるプロモーションが必要になるからだ。

では、ドウインのアルゴリズムによる配信はどのようにして行われているのだろうか。その核心的な考え方は「階層型ユーザープール」と呼ばれるものだ。

「階層型ユーザープール」をくぐり抜けた動画のみ拡散されていく

ユーザーがショートムービーを制作して、ドウインに投稿をすると、まず前処理が行われる。処理の目的は審査とタグ付けだ。投稿されたショートムービーに対して画像解析を行い、性的表現や暴力表現が含まれていないかをAIで判断する。AIがアラートを出すと、人間の審査員が目視審査をし、問題のある映像はその場でリジェクトされる。

また、AIによるタグづけも同時に行われる。タグづけの詳細方法は公開されていないが、動画一本に対して影像トラックでは写っている対象物、対象物の行動、背景の種類、使われているエフェクト、スタンプごとにタグ付けし、音声トラックでは音楽/ライブ音/ナレーションごとにタグ付けされていると言われている。さらに、自然言語解析によるキーワード抽出なども当時に行われるようだ。

審査とタグづけを終えると、いよいよユーザープールへのテスト配信が行われる。ユーザープールは原則8層になっていて、後になるにつれ配信対象となるユーザーの規模が大きくなる。一定の評価を得ないと、次のプールへの配信が行われない仕組みになっている。つまり、反響の悪い動画の拡散を止め、反響のいい動画のみをより大きなユーザープールで配信する「フィルター」の役割を担っているのだ。

最初のユーザープールは300名程度で、現在のアクティブユーザーから300人がランダムに選ばれる。ただし、地理的に近い場所にいる人(投稿者と同じ都市いるユーザー)、その投稿者をフローしているユーザーが優先される。

この300人にテスト配信をして反応を以下の4つの項目をもとに測定する。

  • 1)放送完了率:動画を最後まで見た人の割合
    2)いいね率:観覧者の中でいいねをした人の割合
    3)コメント率:コメントを書き込んだ人の割合
    4)共有率:他の人に共有をした人の割合

特に放送完了率は重要視されており、60%を超えないと、次のユーザープールに進むことはできない。投稿された動画のうち、10%程度が次のユーザープールに進むことができ、90%はここで配信が止まるという。つまり、90%の動画は300人に配信をされただけで終わってしまい、淘汰されてしまうのだ。

▲ユーザープールは8層になっている。動画ムービーはいちばん下の小さなユーザープールに配信され、好反応を得ると、次の大きさのユーザープールに進むことができる。これにより、反応のいい動画だけを広範囲に拡散することができる。

評価される動画はわずか12時間で全員に拡散

好反応を得て、次のユーザープールに進めた動画に対して、次は3000人規模のプールが用意されている。この3000人は、好反応をしたユーザーと属性が似ている(特徴量距離が短い)3000人が選ばれる。ここでも反応が測定され、その中の10%のみが次のプールに流される。

このような評価ループを繰り返していき、最後には3000万人規模のプールで配信され、そこでも好反応を得れば、全員配信にたどり着く(テスト配信の基準数値は固定ではなく、オンラインユーザー数、投稿数などによって動的に変化をしていく)。

このユーザープールの層をのぼっているプロセスは、平均して12時間ほどで全員配信までたどり着くという。これにより、一夜にして爆発的な拡散が起きることになり、「つまらない動画を自然消滅させ、おもしろい動画だけを爆発的に拡散させる」ということも可能になる。

さらに、ユーザー視点から見ると、この配信システムによって「見たい動画が無限に配信されてくる」ことが保証される。そのため、ドウインを見始めるとあっという間に時間が経ってしまう。高濃度のテレビ番組を高速ザッピングしている感覚になり、アドレナリンが止まらなくなるのだ。

この「おすすめ」アルゴリズムはすべての動画に適用されるということが大きなポイントだ。フォロワー数数千万人のメガインフルエンサーの動画も、フォロワー数一桁の無名の大学生の動画も、同じ条件でユーザープールによってフィルタリングされる。そのため、メガインフルエンサーであっても、動画の内容をしっかりと考える必要があり、これが抖音全体のコンテンツの質を担保することになっている。 

まとめ:最先端テクノロジーの導入に注力するバイトダンス

バイトダンスはドウインにAIテクノロジーを惜しげもなく使っている。動画制作に使われる特殊効果も、多くが画像処理系のAIテクノロジーが使われている。たとえば、映っている人の顔の年齢を変化させ、子どもの顔にしたり、年寄りの顔にするという「三屏人生」という特殊効果がある。

▲顔の年齢を幼くさせる、老けさせるという変換には、ディープラーニングモデルのサイクルGAN(Cycle Generative Adversarial Networks、サイクル敵対的生成ネットワーク)が使われている

サイクルGANそのものは、画像認識の世界ではすでに定番手法となっている。ただ、膨大な計算量を必要とするディープラーニングをユーザーのスマートフォンで行う必要があるため、バイトダンスは蒸留(Distillation)の手法で計算量を圧縮する技術開発を行なった。

あらかじめ精密なディープラーニングモデル(教師モデル)で計算をさせておき、その結果をシンプルなディープラーニングモデル(生徒モデル)に転移させることで、計算量を圧縮している。その成果は、「Online Multi-Granularity Distillation for GAN Compression」という論文にまとめられ、公開されている。

TikTokは「動画SNS」と呼ばれることもあるが、もはやSNSではなくなっている。ソーシャルネットワークを活かして拡散をするのではなく、アルゴリズムによって拡散をするその仕組みから、「アルゴリズムネットワークサービス」あるいは「マシンラーニングネットワークサービス」と呼ぶべきかもしれない。

TIkTokは「女子高生に人気のダンス映像投稿アプリ」ではなく、10年後にはテクノロジー応用の転換点となったアプリとして評価をされているだろう。

バックナンバー:
中国ライドシェア最大手DiDiが採用するマッチングアルゴリズム。利用者全員の平均待ち時間最小化を考える「ダイナミックVRP」とは?
28位と中位グループに下げ止まった日本。IMD国際デジタル競争力ランキングから見えてくる日本ITの弱みと希望は?

関連記事

人気記事

  • コピーしました

RSS
RSS