動画生成AIに革命が。「Luma AI」で高品質な動画を生成する方法
今回は、SNSで話題沸騰中の動画生成AI「Luma.ai」について、その特徴と使い方を詳しく解説していきます。
Luma.aiの最大の魅力は、プロンプトを駆使することで動画生成をコントロールできる点にあります。
今回はLumaAIの使い方からプロンプトの書き方までをお伝えします!
動画生成AI・Luma.AIとは?
Luma.AIは、OpenAI社のSoraと同様に、テキストプロンプトから動画を作成することができる画期的なツールです。
これまでにも画像から動画を生成するサービスはありましたが、Luma.aiはプロンプトを重視した生成AIであるところが大きな特徴となっています。
Luma.AIの特徴
Luma.AIの主な特徴は以下の通りです。
生成スピードが非常に速い(120フレームを120秒で生成可能)
リアルで滑らかな動きのアクション満載の動画が作成可能
キャラクターの一貫性が高く、正確な物理演算が可能
映画のようなカメラワークを無限に試すことが可能
無料ユーザーでも毎月30本まで動画作成可能
現在は5本/1日まで制限
一方で、モーフィングや複雑な動き、テキスト、多面的な表現などには現状課題があります。
とはいえ、実際に生成された動画を見ると、一眼見ただけでは本物と見分けがつかないレベルのクオリティです。
使い方
Luma.aiの使い方はとてもシンプルです。
公式サイトからアカウント登録
Words or Imageのボックスに画像またはテキストプロンプトを入力
Enterを押して動画生成開始
Enhance prompt
テキストを入力すると、自動的にEnhance promptがオンになり、プロンプトを自動的に改善するモードになります。
入力欄の説明
Luma.aiの限界
Luma.aiは高品質な動画生成が可能な反面、いくつかの限界も抱えています。公式サイトでも現状の制約について言及されています。
1.Morphing(モーフィング)
モーフィングとは、1つの画像から別の画像へと滑らかに変化させる技術です。AIにとって、2つの画像間の対応関係を正確に把握し、自然な変化を生成することは困難とされています。
特に、顔のモーフィングは、特徴の位置合わせや表情の変化を正確に捉える必要があるため、大きな課題となっているようです。
2.Movement(動き)
動きのある画像や映像の生成も、AIにとって複雑な問題とされています。物体の動きを自然に表現するには、時間的・空間的な連続性を理解し、物理法則に基づいた動きを生成する必要があります。
また、動きのあるシーンでは、オクルージョン(物体の一部が他の物体に隠れる現象)や照明の変化なども考慮しなければなりません。
3.Text(テキスト)
AIにとって、テキストの生成や理解は大きな課題です。自然言語処理の分野では、文法や意味の理解、文脈に応じた適切な言葉選びなどが求められます。
また、テキストから画像を生成する場合、テキストの内容を正確に理解し、それを視覚的に表現することが必要です。言語と視覚情報の関連付けは、AIにとって難しい問題だと考えられています。
4.Janus(ヤヌス)
ヤヌスとは、ローマ神話に登場する両面の顔を持つ神です。これは、AIにとって、多面的な解釈や表現を行うことの難しさを表しています。
例えば、同じ対象でも異なる視点から見ると全く別の印象を与えることがありますが、こういった多面的な理解や生成は、AIにとって大きな課題となっているようです。
プロンプトの書き方
ビデオ生成AI用のプロンプトを書く際は以下のようなポイントを意識するとよいと言われています。