見出し画像

【新AI時代の幕開け】人間を超えた知性 o1 pro 発表

2024年12月5日、OpenAIは待望のライブストリームで、ChatGPTの次世代モデル「o1」の正式リリースおよび、さらなる高性能モデル「o1 pro」と、新たな高度な機能を提供する「ChatGPT Pro」プランを発表しました。

今回の発表は、AI技術の新たな時代の幕開けを告げるものとなりました。

1. OpenAI o1が正式版としてリリース

これまでプレビュー版として提供されていたo1が、ついに正式版として一般提供を開始します。

新バージョンでは、推論性能が大幅に強化され、特にコーディング、数学、文章作成において顕著な性能向上が見られます:

  • 従来のモデルと比較して、より高速な応答が可能

  • 複雑な質問に対するエラー率が34%削減

  • 画像認識機能が新たに追加され、マルチモーダル処理が可能に

2. ChatGPT Proプランの導入

OpenAIは、より高度なAI機能へのアクセスを提供する新しい「ChatGPT Pro」プランを発表しました。

月額200ドルで提供される本プランには以下の機能が含まれます:

  • OpenAI o1への無制限アクセス

  • o1-mini、GPT-4o、Advanced Voice機能の利用権

  • 独占提供される「o1 pro mode」(高性能版)へのアクセス

価格ページ:

重要:

  • o1 自体は、PlusプランやTeamプランでも使用可能です。

  • ほとんどの場合にはProプランは必要ないでしょう。

3. o1 pro modeの驚異的な性能

o1 pro modeは、様々なベンチマークテストで驚異的な性能向上を示しています:

数学能力(AIME 2024)

  • プレビュー版:36.7%

  • o1 pro mode:80.0%(43.3ポイント向上)

プログラミング(Codeforces)

  • プレビュー版:25.6%

  • o1 pro mode:74.9%(49.3ポイント向上)

科学的推論(GPQA Diamond)

  • プレビュー版:58.1%

  • o1 pro mode:74.2%(16.1ポイント向上)

特筆すべきは、これらの評価が「4回中4回正解」という厳格な基準で測定されていることです。この結果は、o1 pro modeの高い信頼性と一貫性を示しています。

有名な引っ掛け問題:「strawberry」にrは何個入っているにも難なくユーモアを交えて答えています:

モデルのコンテキスト長について

また、利用プランごとに異なるコンテキストウィンドウ(モデルが一度に参照可能なテキスト量)の上限が設定されていることも確認されています。

無料プラン(Free)では8Kトークンまで、PlusプランおよびTeamプランでは32Kトークンまで、そしてProプランやEnterpriseプランでは128Kトークンという大容量のコンテキストウィンドウを利用可能です。

https://openai.com/chatgpt/pricing/

4. 提供開始時期

  • ChatGPT Plus/Teamユーザー:即日利用可能

  • Enterprise/Eduユーザー:1週間後に提供開始

5. 今後の展開

OpenAIは、今後も継続的な機能拡張を予定しています:

近日実装予定の機能

  • Webブラウジング機能

  • 拡張されたファイルアップロード機能

  • 高度なAPI機能

    • ファンクションコーリング

    • Structured Outputs

    • その他開発者向け機能

ChatGPT Pro独自の機能強化

  • より高度な推論能力の実装

  • 専門分野に特化した機能の追加

  • 計算集約型タスクの処理能力向上

6. OpenAI o1の安全性評価

OpenAIは、o1およびo1-miniのリリースに際して、包括的な安全性評価を実施し、その結果を「o1 System Card」として公開しました。

この評価は、OpenAIの「Preparedness Framework(準備態勢フレームワーク)」に基づき、外部の専門家による検証(レッドチーミング)やフロンティアリスク評価を含む厳密なプロセスを経ています。

主要な評価領域

以下の4つの重要な領域について、詳細な評価が行われました:

  1. 不適切なコンテンツ生成の防止

  2. 学習データの再生(トレーニングデータの漏洩防止)

  3. 幻覚(誤った情報の生成)の抑制

  4. バイアス(偏見)への対処

準備態勢スコアカード

OpenAIは、各リスク領域について「Low」から「Critical」までの4段階で評価を行い、以下の結果を得ました:

  • サイバーセキュリティリスク:Low(低)

  • CBRN(化学・生物・放射性物質・核)リスク:Medium(中)

  • 説得力/影響力のリスク:Medium(中)

  • モデル自律性のリスク:Low(低)

特筆すべき点として、OpenAIは「Medium」以下の評価を得たモデルのみをデプロイ可能とし、「High」以下の評価を得たモデルのみを今後の開発対象としています。この厳格な基準により、o1は十分な安全性を確保した上でリリースされていることが確認されています。

まとめ

今回のOpenAIの発表は、AI技術の大きな転換点となる可能性を秘めています。特にo1 pro modeの性能は、多くの専門分野で人間レベルの、あるいはそれを超える能力を示しており、今後のAI活用の可能性を大きく広げるものとなっています。

ただし、月額200ドルという価格設定は、一般ユーザーにとっては高額であり、主にビジネスユースや研究目的での利用が想定されています。

なお、OpenAIのサムアルトマンCEOも、ほとんどのユーザーは Plusプランで十分幸せになれると思うよと言及しています。

今後、この強力なツールがどのように活用され、どのような影響をもたらすのか、注目が集まります。

参考


告知

今後12日間連続でリリースがあり、知るべきことが多くなるため、23日夜にOpenAI勉強会やります👇

ここから先は

0字

AGIラボ

¥2,980 / 月
このメンバーシップの詳細