先日開催されたGoogle I/Oでは、AI(人工知能)の進化とその応用に関する多くの発表がありました。
ソフトウェアからハードウェアまで。拡散モデルを使ったテキスト生成Gemini Diffusionや料金プランについても月額3万円を超える「AI Ultra」といった新たなAIサブスクリプションプランの発表もありました。
その中でも直近で利用できるようになったWhiskについて触れていきます。

Whiskとは何か

Google Whiskは、Google Labsから生まれた実験的なAIツールで、主に画像生成が可能ですが、「Whisk Animate」機能を通じて短い動画の作成を可能にします 。
Whiskの設計思想は、「ピクセルパーフェクトな編集」よりも、「迅速な視覚的探索」と「アイデア創出」に重点を置いています 。その根底には、プロンプトの書き方を学ぶ必要はないという考え方があり、「プロンプトを少なく、もっと遊ぼう (prompt less and play more)」というキャッチフレーズが示すように、創造的な表現をより身近なものにすることを目指しているようです。

Whisk ヘルプセンター
https://labs.google/fx/ja/tools/whisk/faq

利用できるプラン

以下に、Google Whiskの主な機能とAIプラン別の提供状況をまとめます。定価を記載しますが、Google AI Ultraは最初3か月間は半額近かったりなどしますので詳しくは公式ページを見るのをおすすめします。
無料でも回数制限はあるのでお試し的ですが利用することが可能です。

料金
https://one.google.com/about/google-ai-plans

実際につかってみた

Google Whiskの具体的な使用感を確かめるため、一連の操作を試してみました。Googleアカウントさえあれば可能です。
https://labs.google/fx/ja/tools/whisk

ちなみにアイディアが思いつかない場合もこの説明にある通りサイコロマークがあってそれを押すと自動でプロンプトが入るのでアイディアゼロでも画像生成を体験できます。これは冒頭であったプロンプトなしでもという設計思想にもとづいているのかもしれません。

せっかくならランダムで生成してみましょう。一回押して出てきたプロンプトは
「A grand monolith standing over mars, as seen from a space station window, ominous, sketchy ink illustration(宇宙ステーションの窓から見た、火星の上にそびえ立つ巨大な一枚岩。不吉な、スケッチ風のインクのイラスト)」

ちなみに使われているモデルを見るのは送信ボタンの左のマークをクリックするとPOWERD BY IMAGEN 4とでるので今回発表された最新モデルです。
ここから動画にしていきます。画像の上にアニメーションを作成というのがでるので従うだけです。
ちなみに動画ができると動画としてダウンロードだけでなくGIFアニメーションとしてもダウンロードできます。以下はGIFアニメーションです。もちろん動画でmp4でもダウンロードできます。

まとめ

Whiskは生成AIを身近に感じさせてくれるエンターテイメント性を備えています。
今回発表された「Flow」という近日利用開始予定の映像製作ツール(以下はFlowのデモ動画です)は、より本格的な映像制作を志向するツールと位置づけられ 、Googleの最新AIモデルであるVeo 3やImagen 4と連携し、高品質な映像や音声付き動画の生成も可能になるとされています 。

AIによる映像制作はまず数分程度の作品から始まるかもしれませんが、AI技術の急速な進化を考慮すると、将来的、下手したら今年度中により長尺のコンテンツ制作に対応する可能性は十分にあると思います。
数十分、あるいは数時間といった長さの映像制作がAIで手軽に行えるようになる日も、そう遠くないかもしれません。

この記事を書いた人

スムーズロゴ
enterprise-smooz

資料
ダウンロード

マスタデータのメンテナンスに関わる機能をまとめたSaaS「SMOOZ
SMOOZはリレーショナルデータベースの課題を解決するサービスです。
オンラインデモで気軽に試すことが可能です。