見出し画像

【週刊AI】AI業界激震!OpenAI新モデル、ソフトバンク巨額投資、DeepSeekの急成長など | #1 2025年1月24日~2025年2月2日

2025年1月が早くも過ぎ去りました。しかし、AI領域の動きはますます加速しているようで、毎日新たな発表や話題が絶えません。新しいモデルのリリースから大型投資の発表、さらには自動化技術や政府向けの導入事例まで、多様なトピックが日々登場しています。

こうした情報量の多さに「すべてを把握するのは難しい」と感じる方も多いのではないでしょうか。

「ChatGPT研究所」では、そんな膨大なAI関連の情報を整理し、より分かりやすい形でお届けしたいと考え、毎週、主要ニュースをまとめた記事を投稿していくことに決めました。

今週は特に注目度の高い発表や投資のニュースが重なりましたので、その内容をかいつまんでご紹介していきます。



1. OpenAIが「o3-mini」をリリース

OpenAI

OpenAIは日本時間2月1日、小型推論モデル「o3-mini」をChatGPTおよびAPIで正式公開しました。主にSTEM(科学・数学・コーディング)分野の推論性能を高めながら、応答速度やコスト面も大幅に最適化している点が特徴です。既存のo1モデルと比較し、1トークンあたりの価格は約63〜93%ほど低減されています。

新機能とベンチマーク:

  • Reasoning Effortの3段階設定(low / medium / high)

    • low: 迅速に答えを返す代わりに、推論の深さはやや抑えめ

    • medium: 速度と正確性のバランスを重視(ChatGPT標準設定)

    • high: 時間をかけて深く検証するため、科学や数学の複雑な問題でも正答率が向上
      たとえば、数学テスト(AIME 2024)やPhDレベルの問題集(GPQA Diamond)において、高設定を使うと正答率が上がる傾向が確認されています。

OpenAI Playground
  • STEM領域の主な評価結果

    • AIME 2024: 高精度モードで87.3%の正答率

    • Codeforces: コーディングタスクでEloスコア2130を記録

  • API提供

    • tiers 3–5 の開発者向けにChat Completions APIやBatch APIを公開し、大規模運用でも導入しやすい仕組みを整えています。

    • 入力トークンは100万トークンあたり0.55ドル~、出力トークンは4.40ドル~で、従来のo1-miniよりも大幅なコスト削減が見込まれます。

提供範囲と活用のポイント:

  • ChatGPT Plus / Teamユーザー: 1日あたりの利用上限が150メッセージに拡大され、即日からo3-miniおよびo3-mini-highを利用できます。

  • Freeユーザー: “Reason”ボタンからo3-miniを試用可能ですが、上限や一部機能に制限があります。

  • Enterpriseプラン: 約1週間以内に利用開始見込み。

o3モデルから推論の「深さ」を指定できることで、用途に応じた応答品質や処理速度のカスタマイズが可能になります。たとえば、素因数分解や物理シミュレーションなど計算負荷の高いタスクではhigh設定を用いて精度を上げ、日常的なQAにはmedium以下を使うといった運用が想定されます。

DeepSeekなど他社の類似モデルやウェブ版で提供されているo1 Proモデルと比較すると、すべてのベンチマークや精度で上回るわけではないものの、コストや応答速度面で優位性があるという点が評価され始めています。

o3 miniについてはこちらで詳しく解説しています:


2. OpenAIのAIエージェント「Operator」が登場

OpenAIは日本時間1月24日、ウェブブラウザを自動操作するAIエージェント「Operator」を公開しました。現在はアメリカのChatGPT Pro(約200ドル/月)ユーザー向けの研究プレビュー版として提供されており、近い将来PlusやTeam、Enterpriseユーザーにも段階的に拡大するとされています。

ブラウザ上のボタンやフォームを人間が操作するかのように扱い、多様なウェブタスクを自動化できる点が特徴です。

主な特徴と仕組み:

① Computer-Using Agent(CUA)

  • GPT-4oの視覚認識と強化学習による推論能力を組み合わせた新モデル。

  • ウェブページのGUIを読み取り、マウスやキーボードの動きをエミュレートすることでAPI非対応サイトでも操作可能です。

②タスク自動化の事例

  • オンライン予約: レストラン予約サイトを開き、空き枠を確認したうえでユーザーに提案する。

  • ネットショッピング: 商品ページを検索し、カートへの追加や注文確定を自動で実行。

  • 情報収集: SNSや検索エンジンなどを横断し、調べものをまとめて行う。

③ 操作のモニタリングと引き継ぎ

  • エージェントが誤操作した場合や詰まった場合、「Take over」機能でユーザーが手動操作を引き継げます。

  • 複数タスクを並行して進められますが、銀行取引など機密性の高い操作は一部制限があります。

ベンチマークと現状の成功率:

  • WebArena(模擬サイト操作): 成功率58.1%

  • WebVoyager(AmazonやGitHubなど実サイト操作): 成功率87%

  • OSWorld(各種OS環境の操作): 成功率38.1%
    いずれも既存モデルより改善傾向にあるものの、まだ人間の操作を完全に置き換えられる水準ではないとされています。

安全性と今後の展望:

  • 海外展開の課題:

    • EUなどの厳格な規制下では提供開始が遅れる見込み。

  • 今後のロードマップ:

    • エージェントを複数追加し、特定の業務領域に特化した機能を拡張する計画。

    • CUA自体をAPIとして開放し、開発者が独自に高度な自動化ツールを構築できるようにする方針。

Operatorは、「人間の画面操作をそのまま再現できる」点が従来のAPI連携型RPAとは異なります。多様なウェブサービスを横断的に扱える半面、完全自動化には安全性や技術的課題が残っているのも事実です。

今後、特定領域に特化したエージェントやCUAのAPI化によって、自社専用の自動化ソリューションを開発する流れが加速する可能性があります。企業や個人が日常的なタスクをAIに任せられる時代へ、さらに一歩近づいたと言えそうです。

Operatorについてはこちらで詳しく解説しています:


3. ソフトバンクがOpenAIに最大で $25B 投資か ― 時価総額は 最大で$300B に

ソフトバンクが、OpenAIへの大型出資を検討中であると複数メディアが報じています。投資額は $15B~$25B 規模で調整されており、他投資家の出資を含め 最大$40B の資金調達につながる可能性があります。

もし実現すれば、OpenAIの時価総額は 最大で$300B に達する見込みです。当初は $340B という報道もありましたが、最近の交渉で下方修正されたとの情報も出ています。

背景と資金の使途

① Stargateプロジェクトへのコミット

  • ソフトバンク、Oracleなどと共同で進める大規模データセンター計画「Stargate」への拠出として、OpenAIは 約$18B を割り当てる義務があるとされています。

  • 同プロジェクト全体で $100B を投資し、最終的には $500B 規模に拡大する構想も報じられています。

②事業運営の赤字補填

  • OpenAIは2024年の売上を $3.7B と見込む一方で、約 $5B の赤字を出したとされています。

  • 新たに調達する資金は、赤字の補填や高額なAI開発コストの確保に充てられる見込みです。

The Information

投資の規模と評価額の推移

  • OpenAIは2025年1月に $6.6B を調達し、評価額が $157B と報じられたばかりです。

  • 今回の 最大$40B 規模の調達が実現すれば、評価額は 最大$300B に上昇し、SpaceXに次ぐ世界第2位のスタートアップとなる可能性があります。

  • ソフトバンクは最大で $25B を拠出する計画とされ、残額は他の投資家が出資する見通しです。

引用:The Information

ソフトバンクとの連携強化

  • ソフトバンクCEOの孫正義氏とOpenAIのサム・アルトマンCEOは、2025年1月下旬にホワイトハウスで共同会見を行い、AIインフラへの投資を発表しました。

  • 2024年末には、ソフトバンクがOpenAIの従業員株約 $1.5B 分を買い取る「テンダーオファー」を提示したとの報道もあり、両社のパートナーシップは急速に進んでいるとみられます。

最大$40B に及ぶラウンドは、シリコンバレー史上でも極めて大規模な資金調達となります。OpenAIが一気に追加資金を確保することで、データセンターの増強や研究開発の加速が期待される一方、競合との競争も激化しそうです。マイクロソフトに次ぐ主要投資家としてソフトバンクが位置づけられることで、OpenAIの事業戦略や技術ロードマップにも大きな影響を与えると考えられます。


4. OpenAI、アメリカ政府機関向けに「ChatGPT Gov」を発表

ここから先は

3,560字 / 6画像
この記事のみ ¥ 1,280

この記事が参加している募集