【AI史に残る】12 Days of OpenAl 総まとめ
2024年12月5日から12日間にわたり開催された「12 Days of OpenAI」。
初日に「o1モデル」を正式リリースし、最終日にはさらなるフロンティアモデル「o3」を発表するなど、驚きと衝撃が連続するイベントとなりました。
本記事では、その12日間にわたって行われたアップデートの全容を振り返りつつ、特に注目すべきポイントを一挙にご紹介します!
Day 1:o1モデル正式リリースとChatGPT Proプラン発表
2024年12月5日、1日目には次世代モデル「o1」の正式リリースが発表されると同時に、高性能版「o1 pro」および新たな「ChatGPT Pro」プランが導入されました。
o1はコーディング、数学、文章作成などの領域で性能が向上し、画像認識機能も搭載されました。
主なポイント:
o1モデル正式版提供開始:プレビュー版から正式版へ移行し、応答速度や複雑な問題解決能力が強化。
ChatGPT Proプラン(200ドル/月)の導入:o1やo1 pro modeへの無制限アクセス、Advanced Voice機能などを含む上位プラン。なお、o1自体はPlus/Teamプランでも利用可能です。
o1 pro modeの性能向上:数学・プログラミング・科学的推論分野での精度向上が確認され、評価基準(4回中4回正解)を満たした試験結果も公表されています。
コンテキストウィンドウ拡張:Freeプランでは8Kトークン、Plus/Teamプランでは32Kトークン、Pro/Enterpriseプランでは128Kトークンまで利用可能となり、大規模コンテキストでのやり取りに対応します。
今後、Webブラウジングやファイルアップロード拡張、API機能強化、ファンクションコーリング対応、Structured Outputs、開発者向け機能の実装などが予定されています。
Day 1の解説記事はこちら:
Day 2:強化学習によるファインチューニング(RFT)研究プログラム拡大
2024年12月6日、OpenAIは2日目の発表として、強化学習を用いた新たなファインチューニング技術(RFT: Reinforcement Fine-Tuning)の研究プログラム拡大を発表。
RFTは、専門ドメインに特化したタスクを用いてモデルを微調整し、その精度向上を目指す手法です。
主なポイント:
RFTの基本概要:数十~数千の高品質なタスクと参照解答をもとにモデルを強化学習的に微調整
適用分野:法律、保険、医療、金融、工学など、正解が明確で専門家の合意を得やすい領域
参加対象:研究機関、大学、エンタープライズなど
特典・取り組み内容:RFT用API(アルファ版)へのアクセス、ドメイン特化タスクでのテスト、フィードバック提供とデータ共有によるモデル改善支援
スケジュール:2025年初頭にRFTの一般公開を予定し、現段階では研究プログラムを通して機能改善を図る段階
詳細はこちら:
Day 3:動画生成ツール「Sora」の正式展開
2024年12月9日、OpenAIは動画生成モデル「Sora」の研究プレビュー終了と正式展開を発表しました。
Soraはテキストから高品質な動画を生成できるモデルで、今回新たに高速化された「Sora Turbo」を公開し、ChatGPT Plus/TeamおよびProユーザーが利用可能となります。
主なポイント:
Sora Turboのリリース:2月のプレビュー版から大幅な高速化を実現した新バージョンを公開。
多様な動画生成機能:最大1080p解像度、20秒までの動画生成が可能。ユーザーはテキストや画像・動画素材から映像を生成し、拡張・リミックス・ブレンドなどの操作が行えます。特定のアスペクト比(ワイド、縦長、スクエア)にも対応。
新たなインターフェース:テキスト・画像・動画を組み合わせて指示できるフレーム単位のストーリーボードツールを提供。コミュニティによる「Featured」や「Recent」作品フィードも用意されています。
提供プランと利用枠:
Plusプラン:追加料金なしで480p解像度の動画を50本程度、またはより少ない本数で720pなど、一定枠内での利用が可能。
Proプラン:より多くの動画生成、より高い解像度、長尺動画への対応。2025年初頭を目途に、用途に合わせた価格プランの提供も予定。
※ 注意点:人物の生成にはProプランへの加入が必須
安全性・透明性への配慮:
全てのSora生成動画にはC2PAメタデータを付与し、出所証明を可能に。
デフォルトで目視できる透かしを導入。
有害なコンテンツ(児童性的虐待、性的ディープフェイクなど)は厳しくブロック。
人物アップロードは当初制限付きで提供し、深刻な悪用を防ぐための対策強化後に拡大予定。
システムカードに安全性評価やレッドチーミングの結果を公表。
OpenAIは、Soraを早期に公開することで、社会とともに適切な利用方法や安全策を模索しながら、今後の映像生成技術の活用を広げていく方針を示しています。
解説記事はこちら:
https://help.openai.com/en/articles/9957612-generating-videos-on-sora
https://help.openai.com/en/articles/10249777-sora-data-controls-faq
Day 4: Canvasの解放
2024年12月11日、4日目の発表として、これまで有料プラン(Plus/Team)向けのベータ機能だった「Canvas」を、無料ユーザーを含む全ユーザーへ開放しました。
さらに、Canvas上でPythonコードを即時に実行できる機能や、カスタムGPT(GPTs)との統合が追加され、文章作成やコーディング作業がより便利になります。
主なポイント:
Canvas機能の正式リリース
従来のテキストチャットを拡張する形で、文書エディタ領域を併設し、ChatGPTとの共同作業を効率化。
複数の段落やコード行に直接コメントが付けられるため、修正ポイントをスムーズに把握できる。
Canvas内でのPython実行
WebAssemblyを利用してPython環境を内蔵し、即時にコードを実行・テスト可能。
Matplotlibなどの主要ライブラリに対応し、データ可視化や外部APIリクエストによるリアルタイムデータの取得・分析もCanvas内で完結。
GPTsへのCanvas搭載
カスタムGPTにCanvasを組み込むことで、特定の分野に特化したドキュメントやコードを、同一画面で編集・検証できる。
GPT設定画面で「Canvasツールを有効化」すると、初回からCanvasによる編集空間が利用可能。
提供開始時期・利用方法
12月11日より順次反映されすでに全てのユーザーが利用可能です。
ChatGPTのツールボタンから「Canvas」を選択するだけでエディタ領域が開き、Pythonコードを含む各種作業をすぐに始められる。
これにより、文章編集やコード開発など様々なタスクを一つのUIで完結できるため、ChatGPTの利便性が大きく高まります。
解説記事はこちら:
Day 5: Apple Siriへの統合 & iOS 18.2
2024年12月12日、5日目の発表では、AppleのAIアシスタント「Apple Intelligence」とChatGPTの統合を本格展開を発表しました。
Siriが必要に応じてChatGPTを呼び出すなど、iPhoneやMacなどのAppleデバイスでChatGPTを活用できる機能が順次提供されます。
主なポイント:
Siriとの連携
Siriがユーザーのタスク内容に応じてChatGPTを呼び出し、文章生成や画像生成、映像解析による情報取得を行う。
Writing Tools機能と連携し、文章の構想段階からChatGPTが提案や修正をサポート。
iPhone 16シリーズのカメラ機能(Camera Control)を通じて撮影映像を解析し、ChatGPTから関連情報を取得。
匿名利用オプション
アカウント未連携状態での利用時、OpenAI側ではリクエストを保存・学習に使用せず、IPアドレスも匿名化される。
アカウント接続を行うと、より高性能な回答や追加機能が利用可能。
利用可能地域と言語対応
現時点では「localized English」(米国、英国、オーストラリア、カナダ、アイルランド、ニュージーランド、南アフリカなど)に対応。
2025年4月以降、英語(インド、シンガポール)や中国語、日本語、ドイツ語、フランス語などへ順次拡大予定。
日本国内から利用する場合は、対応地域の英語設定へ変更することで一部機能が利用可能。
対象デバイスはiPhone 16シリーズ、iPhone 15 Proシリーズ、A17 Pro/M1以降のiPad、M1以降のMacなど。
Appleユーザーはデバイス上で直接ChatGPT機能を活用できるようになり、より多様なタスクをSiri経由で効率的にこなせるようになります。
詳細はこちら:
告知
来週月曜日の23日夜に、OpenAI勉強会を開催します!
今回の記事をさらに深掘りした活用事例などをお届けする予定ですので、興味がある方はぜひご参加ください。
AGIラボにご参加いただければ、勉強会にも追加料金なしでご参加いただけます!