見出し画像

OpenAI がまたやった!OpenAI DevDay 総まとめ

11月7日 、OpenAI DevDay が開催。

全ての内容が革命的という衝撃の発表となりました。

発表された内容は、大きくまとめると、主に3つです。

1. GPT API が大幅に改善、新しいAPIも

2. GPTs 発表: 自然言語で作れるAIボット

3. Assistants API 発表: 開発者のための、AIアシスタントAPI

全て、インパクトが非常に大きいです。

それぞれ、詳しく解説していきます。



GPT API を全般的に大幅に改善、新しいAPIも

まず、API に多くの改善が加えられます。

完全に新しいAPIも発表されました。

主に6つあるため、それぞれ、詳しく説明します。

1.コンテキスト長が、128kトークンに拡大

なんと、受付可能なコンテキスト長が、一挙に12万8千まで拡大しました。

これは、300ページ以上のテキストに相当する情報です。

また、コンテキスト長が大幅に拡張されたにも関わらず、精度が保たれている点について強調しています。


2.コントロール

アプリや外部APIの機能をモデルに説明し、JSONオブジェクトを出力してその機能を呼び出せる「Function calling」がアップデートしました。

  • 一つのメッセージで複数の機能を呼び出すことが可能に。

    • 「車の窓を開けて、エアコンを切る」などの複数のアクションを一回のメッセージで要求可能。

  • これまでは複数のやりとりが必要だったが、今後は不要に

  • Function callingの精度向上:

    • GPT-4 Turboは適切な機能パラメータを返す可能性が高くなる。

また、指示に忠実なタスク(特定のフォーマット生成など)で、以前のモデルよりもGPT-4 Turboの性能が向上します。

  • 新しいJSONモードに対応し、モデルが有効なJSONを返信することを保証

  • APIの新パラメータresponse_formatにより、モデルの出力が文法的に正しいJSONオブジェクトであることを制約

  • Function calling外でChat Completions APIを通じてJSONを生成する開発者にとって有用


3.知識幅の拡大

ナレッジカットオフ(Knowldge Cutoff)が、2023年4月に拡張しました。

Webから使える通常の ChatGPT の方もすでに拡張されていました。


4.新しいモダリティ: 画像生成, 画像理解, 音声合成 APIの公開

今回の発表の中でも、非常に重要なアップデートです。

GPT-4 Turboの視覚機能: GPT-4 Vision API

  • 画像を入力として受け入れることが可能になり、キャプション生成、実世界の画像の詳細分析、図入り文書の読解などが可能。

  • BeMyEyesはこの技術を利用し、視覚障害者が日常生活のタスクを行うのを支援。

  • 開発者はAPIでgpt-4-vision-previewを使用してアクセス。

  • 安定版リリース時にはGPT-4 Turboの主モデルに視覚サポートが組み込まれる予定。

  • 価格は入力画像サイズに依存、例: 1080×1080ピクセルの画像は$0.00765。

詳しくはこちら:


画像生成: DALL·E 3 API

  • ChatGPT PlusおよびEnterpriseユーザー向けにリリースされた後、開発者はAPI経由でアプリや製品に直接統合可能。

  • Snap、Coca-Cola、Shutterstockなどが顧客やキャンペーン向けに画像やデザインを生成。

  • 内蔵モデレーション機能付きで、悪用防止に役立つ。

  • 価格は生成された画像一枚あたり$0.04から。

詳しくはこちら:

DALL·E 3はこちらで詳しくまとめています:


音声合成: TTS(Text To Speech) API

  • テキストから人間のような音声を生成するTTS APIが利用可能に。

  • 6種類のプリセットボイスと2つのモデルバリアント(tts-1とtts-1-hd)が選択可能。

  • tts-1はリアルタイム用途、tts-1-hdは品質に最適化。

  • 価格は入力1,000文字につき$0.015から。

詳しくはこちら:

5.カスタマイゼーション

モデルカスタマイズとGPT-4ファインチューニング実験アクセスを開始しています。

  • GPT-4のファインチューニング実験アクセスプログラムを開始。

  • 初期結果によると、GPT-3.5のファインチューニングで実現した大幅な改善に比べて、GPT-4をファインチューニングするためにはさらなる作業が必要。

  • GPT-4ファインチューニングの品質と安全性が向上するにつれ、GPT-3.5ファインチューニングを活用している開発者には、ファインチューニングコンソール内でGPT-4プログラムへの応募オプションが提供される予定。

カスタムモデルプログラム:

  • ファインチューニング以上のカスタマイズを必要とする組織(特に極めて大規模な独自データセットを持つ分野)向けにカスタムモデルプログラムを開始。

  • 選ばれた組織は、OpenAIの研究者チームと協力して特定分野に特化したカスタムGPT-4をトレーニングする機会を得られる。

  • モデルトレーニングプロセスの各ステップを変更可能で、追加のドメイン固有プリトレーニングから、特定分野に合わせたカスタムRLポストトレーニングまで実施。

  • 組織はカスタムモデルへの独占的アクセス権を持つ。

  • 既存のエンタープライズプライバシーポリシーに従い、カスタムモデルは他の顧客と共有されたり、他のモデルのトレーニングに使用されたりしない。

  • トレーニングに提供される独自データは他のコンテキストで再利用されない。

  • 当初は非常に限定的(かつ高価な)プログラムとしてスタート。興味のある組織はこちらで応募可能。


6.レート制限の引き上げ

  • アプリケーションのスケールをサポートするため、全ての有料GPT-4顧客のトークン利用可能数/分を2倍に増加。

  • 新しいレート制限はレート制限ページで確認可能。

  • 利用量のティアを公開し、レート制限の自動増加がどのように行われるかを明確にした。

  • アカウント設定から利用限度の増加をリクエストできるようになった。

著作権シールド:

  • OpenAIは、システム内に組み込まれた著作権保護により顧客を守ることに尽力。

  • さらに一歩進んで「著作権シールド」を導入。顧客が著作権侵害に関する法的請求に直面した場合に介入し、発生した費用を負担。

  • これはChatGPT Enterpriseと開発者プラットフォームの一般的に利用可能な機能に適用される。


価格の引下げ:

プラットフォーム全体で価格が引下げられました。

以下の価格は全て1,000トークンあたり:

  • GPT-4 Turboの入力トークンはGPT-4と比較して3倍安い$0.01、出力トークンは2倍安い$0.03。

  • GPT-3.5 Turboの入力トークンは以前の16Kモデルと比較して3倍安い$0.001、出力トークンは2倍安い$0.002。以前GPT-3.5 Turbo 4Kを使用していた開発者は、入力トークンが33%割引の$0.001に。

  • ファインチューニングされたGPT-3.5 Turbo 4Kモデルの入力トークンは4倍安い$0.003、出力トークンは2.7倍安い$0.006。ファインチューニングは新しいGPT-3.5 Turboモデルで4Kと同じ価格で16Kコンテキストにも対応。これらの新価格はファインチューニングされたgpt-3.5-turbo-0613モデルにも適用。


GPTs: 自然言語で作れるAIボット

OpenAIは、個人のニーズに合わせてカスタマイズ可能なChatGPTの新しい形、GPTs(ジーピーティーズ)を発表しました。

これにより、ユーザーは独自の指示、追加知識、スキルの組み合わせを持つChatGPTのカスタムバージョンを簡単に作成し、共有することができるようになります。

実際のGPTの作り方はこちらから:

GPTsとは?

GPTsは、特定の目的に合わせてChatGPTをカスタマイズする新しい方法です。

日々の生活、仕事、家庭での特定のタスクに役立てるために、誰でも簡単に独自のGPTを構築でき、コーディングの知識は不要です。

CanvaやZapier AI Actionsといった既存のGPTsの例は、現在ChatGPT PlusとEnterpriseユーザーが試用可能です。

GPTsのカスタマイズ性

Custom Instructionsの導入以降、より具体的なカスタマイズを求める声が増えていました。GPTsはこれらのニーズに応え、ユーザーが事前に設定したプロンプトや指示を自動で扱うことができます。

サムが Startup Mentor を作る様子

GPT Storeの導入

GPTsは今日から公開され、ユーザーは自分の作成したGPTを共有できます。さらに、今月後半にはGPT Storeがオープン予定で、認証されたビルダーによる作品が展示される予定です。

GPTsは検索可能となり、リーダーボードで上位にランクされる可能性もあります。また、ここから収益を得ることができます。

プライバシーとセーフティ

OpenAIでは、GPTsを構築する際もプライバシーと安全性を重視しています。GPTとのチャットはビルダーと共有されず、第三者のAPIを使用する場合もデータ送信の許可はユーザーに委ねられます。

GPTsとリアルワールド

GPTsは、リアルタスクに取り組む機能も備えており、AIの分野で「エージェント」として語られることが多くあります。GPTsを通じて、データベースやEメール、Eコマース注文などに接続できるようになります。

企業内でのGPTs利用

ChatGPT Enterpriseユーザーは、特定のユースケースや部署、独自のデータセットに合わせたChatGPTバージョンを作成できます。管理コンソールを通じて、GPTsの共有方法を選択し、ビジネス内での外部GPTsの使用を管理できます。


Assistants: 開発者のためのAIアシスタントAPI

GPTs は、一般ユーザー向けですが、開発者が自身のアプリケーション内でエージェントを構築するために、Assistants API もリリースされています。

エージェントとは

エージェントとは、特定の指示を持ち、追加知識を活用し、タスクを遂行するためにモデルやツールを呼び出すことができる目的に応じたAIです。

新しいAssistants APIは、これまで開発者が自分で行う必要があった多くの複雑な処理を取り除き、高品質なAIアプリの構築を可能にする新しい機能、Code InterpreterとRetrieval、さらに関数呼び出しを提供します。

このAPIは柔軟性を意図して設計されており、自然言語に基づいたデータ分析アプリ、コーディングアシスタント、AI駆動のバケーションプランナー、音声制御DJ、スマートビジュアルキャンバスなど、使用例は多岐にわたります。

Assistants APIは、カスタム指示やツールを利用する新しいGPTs製品と同じ機能を基盤として構築されています。

ステートフルスレッド機能

このAPIによってもたらされる主要な変更は、永続的で無限に長いスレッドです。

これにより開発者は、スレッドの状態管理をOpenAIに任せ、コンテキストウィンドウの制約を回避できます。

Assistants APIを使用する場合、新しいメッセージを既存のスレッドに追加するだけです。

さらに追加のツール呼び出し

Assistantsは必要に応じて新しいツールも呼び出せます。これには以下が含まれます:

  • Code Interpreter: サンドボックス環境でPythonコードを書いて実行し、グラフやチャートを生成し、さまざまなデータとフォーマットのファイルを処理できます。これにより、アシスタントは反復的にコードを実行して、難しいコードや数学の問題を解決することができます。

  • Retrieval: モデル外部の知識、たとえば独自のドメインデータや製品情報、ユーザーが提供する文書などでアシスタントを強化します。これにより、文書の埋め込みを計算して保存したり、チャンキングや検索アルゴリズムを実装する必要がありません。Assistants APIは、ChatGPTでの知識検索構築の経験に基づいて、どの検索技術を使用するかを最適化します。

  • Function calling: アシスタントが定義する関数を呼び出し、その関数のレスポンスをメッセージに組み込むことができます。

プラットフォームの他の部分と同様に、OpenAI APIに渡されるデータやファイルは、モデルのトレーニングには使用されず、開発者は適宜データを削除できます。

Assistants APIベータ版は、Assistantsプレイグラウンドにアクセスすることで、コードを書かずに試すことができます。

コードなしで高品質のアシスタントを作成するに、Assistantsプレイグラウンドを使用できます。

Assistants APIはベータ版であり、本日よりすべての開発者が利用可能です。

Assistants API:
https://platform.openai.com/docs/assistants/overview


GPTs ラボ、始動します

GPTs の可能性は無限大で、うまく使いこなせれば、これほど有用なものはありません。

月末には GPTs Store が公開され、他の人に多く使われるほどに収益が得られるようになります。

GPTs Store は次世代のアプリストアです。

さらにマイクロソフトは、将来的にCopilotにもGPTsを搭載可能という事を先日発表しました。

GPTsは極めて重要なのですが、あまりにも発展スピードが早く、大量の情報を追うことが困難です。

そんな中、信頼性や網羅性のある、GPTs特化型メディア開発が急務と考え、「GPTsラボ」の開設を決意しました。


主なコンテンツです:
【ほぼ日刊 GPTsマガジン】
話題のGPTの深掘りや、本当に便利なGPTを日刊でお届け

【GPT用プロンプトノウハウ】
高度なGPTsの作り方の紹介やChatGPT研究所製GPTのプロンプトを完全公開プロンプトインジェクション対策

【参加特典】
あなたのGPTを無料PR(条件あり)
限定のGPTsコミュニティ
大量のGPTsデータへのアクセス

「GPTsラボ」を日本一のGPT情報源にします。どうぞよろしくお願いします。

以下のURLからウェイトリストへのご登録お待ちしております。


みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!