
アルゴリズムが生成したミーム動画が話題になりつつある。自動生成された動画の突然の増殖は、AIによる動画生成ツールの技術が発達して爆発的な進化を遂げる前兆かもしれない。
人工知能(AI)が生成した印象的なミーム動画を、すでにいくつか目にした人もいるかもしれない。ハリー・ポッターをモチーフにバレンシアガのコマーシャルをつくった動画や、ウィル・スミスがスパゲティを食べている悪夢のような動画などがインターネット上で話題になった。この現象は、動画を生成するAIの能力の急速な進化とともに、技術が悪用される可能性を示している。
こうした動画の登場は、2022年にAIによる画像生成ツールが広まったときの状況を想起させる。「Craiyon」(以前のサービス名は「DALL-E Mini」)などのプログラムが登場し、赤ちゃんがガソリンスタンドで強盗をする監視カメラ風の画像やダース・ベイダーの法廷画、イーロン・マスクがクレヨンを食べている画像など、画質は荒いものの、何が描かれているかわかるシュールな画像を誰でも簡単に作成できるようになったのだ。
Craiyonは、ChatGPTの開発元であるOpenAIが当時利用を慎重に制限していた画像生成ツール「DALL-E 2」をまねたオープンソースのサービスである。そしてこのツールは、AIが文章による指示から本物に見える写真や人間が描いたような画像を生成できる能力を初めて世界に示した。
その後「DALL-E」は誰でも利用できるようになった。そして、MidjourneyやDreamStudioなどの開発元は、キーボードで少し指示を出すだけで複雑でリアルな画像を簡単に作成できる同様のツールの開発や改良を進めたのである。
オンライン画像との付き合い方が問われる
こうした画像生成ツールの基盤となるアルゴリズムの変数を調整することに加え、学習用のデータを増やし、サービスを動かすグラフィックチップを増やすことで、こうしたツールは本物のように見える画像をつくることが非常にうまくなった。
ネット掲示板「Reddit」の奇妙なAI画像専用のカテゴリーからいくつか例を挙げよう。極右の司会者のアレックス・ジョーンズがLGBTQなどによるプライドパレードに参加している画像や、十戒の石板を収めた「契約の箱」がガレージセールで売られている画像を見てほしい。
このような洗練された技術が広く利用できるようなり、オンラインの画像との付き合い方を考え直す必要性に迫られている。これはAIが生成した米国の前大統領ドナルド・トランプの逮捕現場を描いた画像が3月に拡散されたことで強調された問題だ。
これを受けMidjourneyは、自社サービスにおける無料トライアルの提供を停止することを発表した。この変更でサービスを安易に悪用する人々を減らせるかもしれない。だが、より大きな問題は手付かずのままだ。
『WIRED』がUS版の別の記事でも記しているように、アルゴリズムはまだ文章の指示から説得力のある動画を生成することに苦戦している。たくさんある動画のコマを個別に生成することは計算処理上の負荷が重く、現時点でのAI動画の乱れや途切れの多さが示すように、すべてのコマを通して十分な一貫性を保ち、意味のある動画を作成することは困難なのである。
しかし、AIツールの動画編集の腕はどんどん向上している。ドラマ「フレンズ」や 「ブレイキング・バッド」に基づいてつくられたバレンシアガのミーム動画は、いくつかのAIツールを駆使してつくられたものだ。まずAIツールで静止画像を生成し、そこに別のAIツールで単純なアニメーション効果を付け足す。このようなつくり方でも、完成した動画は印象的なものになる。