見出し画像

【インターネットの新しいUI】ChatGPTの新機能「Deep Research」登場。

2025年2月3日、OpenAIはChatGPT向けの新機能「Deep Research」を発表しました。

これは、オンライン情報の高度な探索と分析を自動で行う新しいエージェント型機能です。

数十分かかるような複雑な調査を、一度のリクエストで大幅に短縮することができます。

また、OpenAIはこの機能をAGIへの重要なステップであり、インターネットの新しいUIにもなり得る試みとして位置付けているようです。


Deep Researchの特徴

Deep Researchの主な特徴は以下のとおりです。

  • o3モデルに基づくエージェント設計
    Deep Researchは、OpenAIの最新モデル「o3」を活用し、ウェブ閲覧とPython実行を組み合わせた高い汎用性を持つエージェントとして機能します。

  • マルチステップ調査の自動化
    ウェブ検索・ファイル解析・テキスト要約などを段階的に実行し、包括的なレポートを生成します。

  • Pythonツール・画像/PDF解析の統合
    リサーチ過程でPythonコードを用いた分析やPDFの中身の読み取りを行い、結果を統合できます。

  • 専門分野への対応
    化学・医療・言語学など多様な領域のリサーチで、人間が数時間要する作業を短時間で済ませられるケースが報告されています。


提供プラン:Proユーザー先行

OpenAIは、まずProユーザー向けにDeep Researchを優先提供し、その後PlusやTeamユーザーにも段階的に開放していきます。

  • Proプラン

    • 即日アクセス可能

    • 月あたり最大100クエリの利用枠

  • Plus / Teamプラン

    • 数週間〜1か月後に導入予定

  • Enterprise

    • 将来的な拡大を検討中

現状では、Deep Researchの推論に高い計算コストがかかるため、利用回数に制限が設けられています。

将来的に小型モデル版がリリースされることで、より多くのユーザーが頻繁に使えるようになる見込みです。


Deep Researchの性能・ベンチマーク結果

Deep Researchを支える新モデルは、さまざまな指標で大幅な性能向上を示しています。特に以下の2つのベンチマークでの結果が注目されています。

Humanity’s Last Exam

このベンチマークは、多領域にわたる専門家レベルの知識を問う大型試験で、数千問におよぶ学術的・専門的な問題が出題されます。

  • 既存モデル(例:OpenAI o1)の平均正答率:9.1%程度

  • Deep Research:26.6%

従来モデルと比べて約16ポイントのアップを達成し、医学・物理・歴史など多岐にわたる課題への対応力が向上したことが示されています。

*モデルはマルチモーダルではなく、テキストのみのサブセットで評価
**ブラウジング + Pythonツールを使用

GAIA

GAIAは、実社会で生じる複雑な問題を模擬したテストです。

  • 従来モデルのSOTA(State Of The Art:最先端モデルのベストスコア):63.64%

  • Deep Research:72.57%

財務分析や政策立案、法的文書の読解など、複雑な現実タスクを想定した課題でも高水準の成功率を見せています。

専門家が数時間かけるリサーチを数十分程度に短縮した実例も報告されており、実務や研究現場での有用性が期待されています。


提供開始時期

Deep Researchの提供時期は以下のとおり発表されています。

  • Proユーザー:2025年2月3日から利用開始

  • Plus/Teamユーザー:数週間〜1か月後を目安に段階的に開放

  • Enterprise/Eduユーザー:順次拡大(詳細は後日案内)


今後の展開

OpenAIは、Deep Researchを継続的にアップデートし、さらなる機能追加を計画しています。

  • 購読コンテンツ/内部データ連携
    購読制のリソースや企業内システムへのアクセスを想定しており、大規模な調査にも対応可能になります。

  • Operator連携(名称仮)
    ほかのエージェント機能と統合し、オンライン情報調査だけでなく実タスクへのアクションまで自動化する構想が示されています。

  • アプリ対応とリソース強化
    モバイル・デスクトップアプリでの利用や、より軽量なモデルでの高速動作を検討中です。

AGIへの重要なステップ

OpenAIは、Deep ResearchがAGI(汎用人工知能)に向けた重要なマイルストーンであると位置付けています。

  • これまでモデルは比較的短い対話サイクルで回答するのが一般的でしたが、Deep Researchでは5分から最大30分以上にわたって自主的に調査を行い、より複雑なタスクを完結。

  • 「長時間かけて思考し、自律的に新情報を取り込む」能力が、AGIに不可欠な要素の一つと考えられています。

インターネットの新たなUI

OpenAIスタッフは、Deep Researchを「インターネットの新しいUI」として捉えています。

  • 現在、人間は検索エンジンを使い、自らリンクをクリックして情報を探し出す必要がありますが、Deep Researchなら膨大なサイトを自動で巡回して要点を集約

  • たとえば、ホテルのレビューや旅行情報を集める場合、従来は多数のページを比較・検討する必要がありましたが、今後はAIが最適な情報だけをまとめて提示してくれます。

  • スタッフの投稿では、「いずれ手動でのブラウジングは計算機なしでの手作業計算のように"時代遅れ"になるかもしれない」とも語られており、大きなパラダイムシフトが期待されます。

https://x.com/_jasonwei/status/1886213911906504950


Deep Researchの安全性評価

OpenAIは既存モデルと同様、Deep Researchでも包括的な安全評価を実施しています。特に以下の点を重点的に検証中とのことです。

  1. 誤情報(ハルシネーション)の低減

  2. 出典開示とエビデンス提示

  3. 学習データの再生(漏洩)の防止

  4. バイアス・偏見への対処


まとめ

現時点ではProユーザーからの先行提供となり、将来的にPlus/Teamユーザーへ拡大予定です。高い計算コストゆえの利用制限や、残る安全面の課題もありますが、OpenAIは継続的な改善とアップデートを進める方針です。

Deep ResearchがAI活用の可能性をどのように広げていくのか、引き続き注目していきたいところです。

ここから先は

0字

AGIラボ

¥2,980 / 月
このメンバーシップの詳細

この記事が参加している募集