【新AI時代の幕開け】人間を超えた知性 o1 pro 発表

2024年12月6日 04:14

2024年12月5日、OpenAIは待望のライブストリームで、ChatGPTの次世代モデル「o1」の正式リリースおよび、さらなる高性能モデル「o1 pro」と、新たな高度な機能を提供する「ChatGPT Pro」プランを発表しました。

今回の発表は、AI技術の新たな時代の幕開けを告げるものとなりました。

1. OpenAI o1が正式版としてリリース

これまでプレビュー版として提供されていたo1が、ついに正式版として一般提供を開始します。

新バージョンでは、推論性能が大幅に強化され、特にコーディング、数学、文章作成において顕著な性能向上が見られます：

従来のモデルと比較して、より高速な応答が可能に
複雑な質問に対するエラー率が34%削減
画像認識機能が新たに追加され、マルチモーダル処理が可能に

2. ChatGPT Proプランの導入

OpenAIは、より高度なAI機能へのアクセスを提供する新しい「ChatGPT Pro」プランを発表しました。

月額200ドルで提供される本プランには以下の機能が含まれます：

OpenAI o1への無制限アクセス
o1-mini、GPT-4o、Advanced Voice機能の利用権
独占提供される「o1 pro mode」（高性能版）へのアクセス

価格ページ：

https://openai.com/ja-JP/chatgpt/pricing/

重要：

o1 自体は、PlusプランやTeamプランでも使用可能です。
ほとんどの場合にはProプランは必要ないでしょう。

3. o1 pro modeの驚異的な性能

o1 pro modeは、様々なベンチマークテストで驚異的な性能向上を示しています：

数学能力（AIME 2024）

プレビュー版：36.7%
o1 pro mode：80.0%（43.3ポイント向上）

プログラミング（Codeforces）

プレビュー版：25.6%
o1 pro mode：74.9%（49.3ポイント向上）

科学的推論（GPQA Diamond）

プレビュー版：58.1%
o1 pro mode：74.2%（16.1ポイント向上）

特筆すべきは、これらの評価が「4回中4回正解」という厳格な基準で測定されていることです。この結果は、o1 pro modeの高い信頼性と一貫性を示しています。

有名な引っ掛け問題：「strawberry」にrは何個入っているにも難なくユーモアを交えて答えています：

on the first day of shipmas, o1 said to me: there are three r’s in strawberry pic.twitter.com/Z7vxktgwjs
— Nat McAleese (@__nmca__) December 5, 2024

モデルのコンテキスト長について

また、利用プランごとに異なるコンテキストウィンドウ（モデルが一度に参照可能なテキスト量）の上限が設定されていることも確認されています。

無料プラン（Free）では8Kトークンまで、PlusプランおよびTeamプランでは32Kトークンまで、そしてProプランやEnterpriseプランでは128Kトークンという大容量のコンテキストウィンドウを利用可能です。

4. 提供開始時期

ChatGPT Plus/Teamユーザー：即日利用可能
Enterprise/Eduユーザー：1週間後に提供開始

5. 今後の展開

OpenAIは、今後も継続的な機能拡張を予定しています：

近日実装予定の機能

Webブラウジング機能
拡張されたファイルアップロード機能
高度なAPI機能
- ファンクションコーリング
- Structured Outputs
- その他開発者向け機能

ChatGPT Pro独自の機能強化

より高度な推論能力の実装
専門分野に特化した機能の追加
計算集約型タスクの処理能力向上

6. OpenAI o1の安全性評価

OpenAIは、o1およびo1-miniのリリースに際して、包括的な安全性評価を実施し、その結果を「o1 System Card」として公開しました。

この評価は、OpenAIの「Preparedness Framework（準備態勢フレームワーク）」に基づき、外部の専門家による検証（レッドチーミング）やフロンティアリスク評価を含む厳密なプロセスを経ています。

主要な評価領域

以下の4つの重要な領域について、詳細な評価が行われました：

不適切なコンテンツ生成の防止
学習データの再生（トレーニングデータの漏洩防止）
幻覚（誤った情報の生成）の抑制
バイアス（偏見）への対処

準備態勢スコアカード

OpenAIは、各リスク領域について「Low」から「Critical」までの4段階で評価を行い、以下の結果を得ました：

サイバーセキュリティリスク：Low（低）
CBRN（化学・生物・放射性物質・核）リスク：Medium（中）
説得力／影響力のリスク：Medium（中）
モデル自律性のリスク：Low（低）

特筆すべき点として、OpenAIは「Medium」以下の評価を得たモデルのみをデプロイ可能とし、「High」以下の評価を得たモデルのみを今後の開発対象としています。この厳格な基準により、o1は十分な安全性を確保した上でリリースされていることが確認されています。

まとめ

今回のOpenAIの発表は、AI技術の大きな転換点となる可能性を秘めています。特にo1 pro modeの性能は、多くの専門分野で人間レベルの、あるいはそれを超える能力を示しており、今後のAI活用の可能性を大きく広げるものとなっています。

ただし、月額200ドルという価格設定は、一般ユーザーにとっては高額であり、主にビジネスユースや研究目的での利用が想定されています。

なお、OpenAIのサムアルトマンCEOも、ほとんどのユーザーは Plusプランで十分幸せになれると思うよと言及しています。

for extra clarity:

o1 is available in our plus tier, for $20/month.

with the new pro tier ($200/month), it can think even harder for the hardest problems.

most users will be very happy with o1 in the plus tier!
— Sam Altman (@sama) December 5, 2024

今後、この強力なツールがどのように活用され、どのような影響をもたらすのか、注目が集まります。

参考

告知

今後12日間連続でリリースがあり、知るべきことが多くなるため、23日夜にOpenAI勉強会やります👇

【緊急開催決定】年末のOpenAI勉強会！

OpenAIはこれから12日間連続で新機能をリリースする事を発表！

内容が多くなり情報が錯綜することが予想されます。そこで23日、終了に合わせて全内容をわかりやすく詳細解説する会の実施を決定しました！

お申し込みはこちらから👇https://t.co/U0uztdLtww
— ChatGPT研究所 (@ctgptlb) December 5, 2024