ついに正式公開!OpenAIの動画生成AI『Sora』と新時代の映像クリエイション
OpenAIが開発する動画生成AI「Sora」が、ついに研究プレビューから一般公開へと移行しました。
今年初め、Soraがテキストからリアルな動画を生み出す実験的取り組みとして話題を呼びましたが、今回「Sora Turbo」という高速化モデルを搭載し、Sora.com(新たなインターフェース)上でChatGPT Plus/Proユーザー向けに本格的な利用が可能となりました。
Soraの特徴:
① Sora Turboによる高速な生成
2月のプレビュー版から大幅に改善された「Sora Turbo」は、従来よりも高速な動画生成を可能にしています。
テキスト入力から、1080p解像度、最長20秒、ワイドスクリーン・垂直・正方形といった多様なアスペクト比の動画を生成できます。
② 多面的な入力方法とストーリーボード機能
テキストだけでなく、画像や既存の動画素材を取り込むことで、シーンを容易に拡張、リミックス、ブレンドできます。
さらに、ストーリボード機能を用いて各フレームごとに細かな入力指定が可能となり、より正確な映像表現を実現します。
③ 多様なスタイル・テーマへの対応
テキスト入力によって、さまざまなコンセプトの動画を生成できます。
たとえば、「Googly-Eyed Jellyfish Encounter(目玉のついたクラゲとの遭遇)」「Whales Soaring Skyward(空へ舞い上がるクジラ)」「Mystical Swampland Serpent(神秘的な湿地帯の大蛇)」など、幅広いテーマに基づいた動画を生成できます。
また、「Cardboard & papercraft(段ボールや紙工作風)」や「Film noir(古典的なモノクロ映画風)」といったスタイルプリセットを利用して、質感や雰囲気を自在に調整することも可能です。スタイルプリセットを適用し、質感や雰囲気を調整できます。
利用プランと価格体系
(1) ChatGPT Plusユーザー向けの基本利用
月額20ドルのChatGPT Plusユーザーは、追加コストなしでSoraを利用可能。
最大480pまたは720p解像度の動画生成
月あたり最大50本程度(1,000クレジット)の優先生成が可能
(2) より本格的なChatGPT Proユーザー向け拡張機能
月額200ドルのChatGPT Proでは、
より高解像度(最大1080p)、
長めのクリップ(最大20秒)、
最大5つの同時生成、
ウォーターマークなしのダウンロード
10倍の利用枠
無制限リラックス生成
(3) 今後の展開:ユーザータイプ別の柔軟な価格設定
OpenAIは、今後さまざまなユーザー層に対応するための価格調整を行う予定。2024年以降、より幅広いニーズに合わせたプランが登場する見込みです。
Soraの基本的な使い方
Soraは、直感的なインターフェースで初心者でも簡単に操作できます。
動画の生成
Soraで動画を生成する方法は主に二つあります。一つはプロンプトの入力です。
プロンプトを入力 (英語推奨):
現時点では、日本語のプロンプトは意図した通りの結果にならない場合があります。そのため、より正確な動画生成のため、英語のプロンプトを使用することを推奨します。
画面下部のテキストボックスに、例えば、「A family of woolly mammoths walking in a tranquil desert」や「Jellyfish drifting through space」のように動画にしたい内容をテキストで入力します。
画像を入力:
動画生成には、テキストによるプロンプト入力に加え、画像を入力する方法もあります。入力した画像に基づいて、Soraが動画を生成します。
画像に加えてプロンプトも入力することができます。
設定を調整:
画面下部のアイコンから、動画のスタイル、アスペクト比、解像度、再生時間、バリエーション数など、様々な設定を調整できます。
スタイルプリセット: 用意されたプリセットから好みの雰囲気を選択できます。
アスペクト比: 9:16(縦長)、16:9(横長)、1:1(正方形)など、様々なアスペクト比を選択できます。
解像度: 480p、720p、1080pなど、解像度を選択できます。
再生時間: 動画の再生時間を指定できます。
バリエーション数: 同じプロンプトから異なる映像表現を生成する数を指定できます。
クレジットを確認: ヘルプアイコン(?)にカーソルを合わせると、現在の設定で動画を作成するのに必要なクレジット数が表示されます。
動画を生成: 「↑」ボタンをクリックすると動画生成が開始され、ライブラリに追加されます。
動画のプレビューと選択
バリエーションのプレビュー: 生成された動画のバリエーションにカーソルを合わせるとプレビュー再生されます。
詳細なプレビュー: 動画をクリックすると、ライトボックスで拡大表示され、詳細を確認できます。矢印キーを使って他に生成された動画を見ることができます。
動画の編集
プロンプトとストーリーボードの編集: 画面下部のツールバーから、プロンプトとストーリーボードを編集できます。
再カット: 「Re-Cut(再カット)」機能で動画の開始位置と終了位置を調整し、必要な部分だけを切り出すことができます。
リミックス: 「Remix(リミックス)」機能では、自然言語を使って動画の内容を修正できます。例えば、「空を夕焼けにして」と入力すると、空の色が夕焼けに変わります。
ブレンド: 「ブレンド」機能では、2つの動画をシームレスに繋ぎ合わせることができます。
ループ: 「ループ」機能で動画の特定区間を繰り返し再生することができます。
動画の管理と共有
お気に入り登録: 画面上部のハートアイコンをクリックしてお気に入りの動画を登録できます。
共有: 画面上部の共有アイコンから、動画を他のユーザーと共有できます。
ダウンロード: 画面上部のダウンロードアイコンから、動画をダウンロードできます。
ライブラリの活用: 画面左側のメニューから、最近作成した動画、おすすめ動画、保存済み動画、アップロード動画、新規フォルダ作成などができます。
その他
チュートリアル動画: 画面右上のユーザーアカウントメニューから、チュートリアル動画を視聴できます。
クレジットとプラン: 画面右上のユーザーアカウントメニューから、クレジット残高の確認やプランのアップグレードができます。
公開設定についての注意
Soraでは、デフォルトで生成した動画が他のユーザーにも見える状態になっています。
公開を望まない場合は、[設定] > [General] > [Publish to explore]をオフにしてください。
これにより、以後生成される動画はコミュニティフィードに表示されなくなります。
4. 安全性・透明性への取り組み
OpenAIは以下のような対策を通じて、Soraはユーザーが安心して利用できる環境を整えています。
コンテンツ透明化とメタデータ付与
C2PAメタデータでSora生成動画の出所を明確化
デフォルトで動画上にウォーターマークを表示し、情報源を可視化
悪用防止策と利用制限
児童性的虐待素材や性的ディープフェイクなど有害コンテンツは即時ブロック
人物映像アップロードは段階的に解禁、深層対策を整えながら徐々に拡大
責任ある運用に向けた社会的対話
技術を早期公開することで、利用者や社会との対話を通じて倫理的・法的枠組みの整備を加速
内部検索ツールや技術的分析で、Sora起源のコンテンツ特定と安全性向上を継続
継続的な改善とレッドチーミング
システムカードなどの公開資料で安全性・監視方針を明示
多面的な攻撃シナリオを想定したレッドチーミングによる改善サイクル構築
まとめ
OpenAIの動画生成AI「Sora」は、テキスト入力から多様な映像を迅速に生成できる新たなツールとして登場しました。
Sora Turboによる高速化や多彩な編集機能、柔軟な利用プランによって、個人から企業まで幅広いユーザーが新たな映像制作手法にアクセスしやすくなっています。
一方で、Proプランの価格設定は専門的な用途を想定しており、一般的な利用者にはPlusプランで十分とされています。今後、価格や機能がどのように最適化され、社会全体でどのように活用されていくかが注目されます。
ChatGPT研究所では、今後Soraについて深掘りして記事を書いていく予定です!
参考資料
https://help.openai.com/en/articles/9957612-generating-videos-on-sora
https://help.openai.com/en/articles/10249777-sora-data-controls-faq
告知
今後12日間連続でリリースがあり、知るべきことが多くなるため、23日夜にOpenAI勉強会やります👇