【新AI時代の幕開け】人間を超えた知性 o1 pro 発表
2024年12月5日、OpenAIは待望のライブストリームで、ChatGPTの次世代モデル「o1」の正式リリースおよび、さらなる高性能モデル「o1 pro」と、新たな高度な機能を提供する「ChatGPT Pro」プランを発表しました。
今回の発表は、AI技術の新たな時代の幕開けを告げるものとなりました。
1. OpenAI o1が正式版としてリリース
これまでプレビュー版として提供されていたo1が、ついに正式版として一般提供を開始します。
新バージョンでは、推論性能が大幅に強化され、特にコーディング、数学、文章作成において顕著な性能向上が見られます:
従来のモデルと比較して、より高速な応答が可能に
複雑な質問に対するエラー率が34%削減
画像認識機能が新たに追加され、マルチモーダル処理が可能に
2. ChatGPT Proプランの導入
OpenAIは、より高度なAI機能へのアクセスを提供する新しい「ChatGPT Pro」プランを発表しました。
月額200ドルで提供される本プランには以下の機能が含まれます:
OpenAI o1への無制限アクセス
o1-mini、GPT-4o、Advanced Voice機能の利用権
独占提供される「o1 pro mode」(高性能版)へのアクセス
価格ページ:
重要:
o1 自体は、PlusプランやTeamプランでも使用可能です。
ほとんどの場合にはProプランは必要ないでしょう。
3. o1 pro modeの驚異的な性能
o1 pro modeは、様々なベンチマークテストで驚異的な性能向上を示しています:
数学能力(AIME 2024)
プレビュー版:36.7%
o1 pro mode:80.0%(43.3ポイント向上)
プログラミング(Codeforces)
プレビュー版:25.6%
o1 pro mode:74.9%(49.3ポイント向上)
科学的推論(GPQA Diamond)
プレビュー版:58.1%
o1 pro mode:74.2%(16.1ポイント向上)
特筆すべきは、これらの評価が「4回中4回正解」という厳格な基準で測定されていることです。この結果は、o1 pro modeの高い信頼性と一貫性を示しています。
有名な引っ掛け問題:「strawberry」にrは何個入っているにも難なくユーモアを交えて答えています:
モデルのコンテキスト長について
また、利用プランごとに異なるコンテキストウィンドウ(モデルが一度に参照可能なテキスト量)の上限が設定されていることも確認されています。
無料プラン(Free)では8Kトークンまで、PlusプランおよびTeamプランでは32Kトークンまで、そしてProプランやEnterpriseプランでは128Kトークンという大容量のコンテキストウィンドウを利用可能です。
4. 提供開始時期
ChatGPT Plus/Teamユーザー:即日利用可能
Enterprise/Eduユーザー:1週間後に提供開始
5. 今後の展開
OpenAIは、今後も継続的な機能拡張を予定しています:
近日実装予定の機能
Webブラウジング機能
拡張されたファイルアップロード機能
高度なAPI機能
ファンクションコーリング
Structured Outputs
その他開発者向け機能
ChatGPT Pro独自の機能強化
より高度な推論能力の実装
専門分野に特化した機能の追加
計算集約型タスクの処理能力向上
6. OpenAI o1の安全性評価
OpenAIは、o1およびo1-miniのリリースに際して、包括的な安全性評価を実施し、その結果を「o1 System Card」として公開しました。
この評価は、OpenAIの「Preparedness Framework(準備態勢フレームワーク)」に基づき、外部の専門家による検証(レッドチーミング)やフロンティアリスク評価を含む厳密なプロセスを経ています。
主要な評価領域
以下の4つの重要な領域について、詳細な評価が行われました:
不適切なコンテンツ生成の防止
学習データの再生(トレーニングデータの漏洩防止)
幻覚(誤った情報の生成)の抑制
バイアス(偏見)への対処
準備態勢スコアカード
OpenAIは、各リスク領域について「Low」から「Critical」までの4段階で評価を行い、以下の結果を得ました:
サイバーセキュリティリスク:Low(低)
CBRN(化学・生物・放射性物質・核)リスク:Medium(中)
説得力/影響力のリスク:Medium(中)
モデル自律性のリスク:Low(低)
特筆すべき点として、OpenAIは「Medium」以下の評価を得たモデルのみをデプロイ可能とし、「High」以下の評価を得たモデルのみを今後の開発対象としています。この厳格な基準により、o1は十分な安全性を確保した上でリリースされていることが確認されています。
まとめ
今回のOpenAIの発表は、AI技術の大きな転換点となる可能性を秘めています。特にo1 pro modeの性能は、多くの専門分野で人間レベルの、あるいはそれを超える能力を示しており、今後のAI活用の可能性を大きく広げるものとなっています。
ただし、月額200ドルという価格設定は、一般ユーザーにとっては高額であり、主にビジネスユースや研究目的での利用が想定されています。
なお、OpenAIのサムアルトマンCEOも、ほとんどのユーザーは Plusプランで十分幸せになれると思うよと言及しています。
今後、この強力なツールがどのように活用され、どのような影響をもたらすのか、注目が集まります。
参考
告知
今後12日間連続でリリースがあり、知るべきことが多くなるため、23日夜にOpenAI勉強会やります👇