
GPT-4が遂に公開。 GPT-4の使い方とその性能を解説
2023年3月15日、OpenAIは最新の言語モデル「GPT-4」を一般公開しました。GPT-4はテキストだけでなく、ニューラルネットワークを利用して画像や動画も生成できるため、非常に汎用性の高いツールとなっています。さらに、言語面でも飛躍的な進歩を遂げ、まさにユニバーサル言語モデルとなっています。GPT-4の持つパラメータについては、公式から明確な発表がなく様々な憶測が飛び交っていますが、前身のGPT-3と比べて数十倍から数百倍の規模でパラメータが増えていることは間違いないでしょう。革新的なGPT-4の技術は、応用範囲が広く、ゲーム、教育、データ解析などの分野に大きな影響を与えることが期待されています。本記事では、GPT-4がどのようなことができるのか、そしてこの技術が人工知能の未来にどのような意味を持つのかを詳しく解説します。

GPT-4の使い方
GPT-4は、ChatGPT Plusに加入している人であれば誰でも今すぐ使用することができます。ただし、画像入力機能は使えません。また、4時間ごとに100回までしか会話できないという制限があります。 APIも提供される予定ですが、現在はウエイティングリストに登録する必要があります。登録した人から順番に招待されていく予定です。(APIの詳細は最後の方で解説しています👉)


GPT-4の性能
GPT-3.5とGPT-4の違いは、カジュアルな会話では微妙ですが、タスクの複雑さが一定のレベルに達すると明らかになります。GPT-4は、GPT-3.5よりも信頼性が高く、創造性に富み、より繊細な指示に対応できます。
特に結果が顕著に現れたのは、司法試験で、GPT-3.5の結果は下から10%の成績だったに対し、GPT-4は上位から10%の成績を収めています。
両モデルの違いを理解するために、大学の試験をシミュレートするなど、さまざまなベンチマークでテストが行われました。👉

GPT-4の言語処理能力
GPT-4はGPT-3.5や他のLLM(Chinchilla、PaLM)の英語パフォーマンスを上回り、ラトビア語、ウェールズ語、スワヒリ語などのリソースが少ない言語でも優れた性能を発揮しています。また、私たちの日本語でも非常に高い結果を出しています。

データ分析の新次元:画像とテキストを同時に扱うGPT-4
GPT-4の驚くべき機能は、さまざまなアプリケーションを通じて実証されており、この最先端の言語モデルの柔軟性と適応性を示しています。画像やテキスト入力を瞬時に処理し、複雑な質問に対する人間のような洞察力と答えを提供することで、データ分析がこれまでにないほど容易になりました。
User: ジョージア州と西アジア州の1日の平均肉消費量の合計は何でしょうか?答えを出す前に、ステップ・バイ・ステップの推論を行いましょう。

GPT-4: ジョージアと西アジアの平均的な1日の肉摂取量の合計を求めるために、以下の手順に従います:
1. ジョージアの平均的な1日の肉摂取量を特定する。
2. 西アジアの平均的な1日の肉摂取量を特定する。
3. 手順1と2から得られた値を加算する。
手順1:提供されたチャートから、ジョージアの平均的な1日の肉摂取量は1人当たり1日あたり79.84グラムであることがわかります。
手順2:チャートから、西アジアの平均的な1日の肉摂取量は1人当たり1日あたり69.62グラムであることがわかります。
手順3:手順1と2から得られた値を加算します。 79.84 g(ジョージア)+ 69.62 g(西アジア)= 149.46 g
したがって、ジョージアと西アジアの平均的な1日の肉摂取量の合計は、1人当たり1日あたり149.46グラムです。
研究の効率化:PDFから的確な回答を引き出すGPT-4
OCR(光学文字認識技術)と要約技術を活用してPDFや論文の画像から文字を解析し、ユーザーの質問に回答することが可能。デジタル化されていないプレゼン資料などももちろん対応。
User: 以下は、InstuctGPTの論文の一部です。読んで、要約してください。

GPT-4: InstructGPTの論文は、大規模な言語モデルを訓練して、人間のフィードバックによる指示に従わせることに焦点を当てています。著者は、言語モデルを大きくしても、ユーザーの意図に沿うことができるようになるとは限らない、と指摘しています。大規模なモデルは、真実味のない、有害な、あるいは単に役に立たない出力を生成する可能性があります。
この問題に対処するため、著者は、人間のフィードバックを使って、さまざまなタスクで言語モデルを微調整しています。まず、ラベラーが書いたプロンプトと応答のセットから始め、次に、望ましいモデルの動作をラベラーが実演したデータセットを収集します。そして、教師あり学習でGPT-3を微調整し、さらに人間からのフィードバックによる強化学習でモデルを微調整します。その結果、InstructGPTと呼ばれるモデルは、真実性の向上と有害な出力生成の削減を示し、公開NLPデータセットでの性能低下は最小限で済みました。
著者は、人間のフィードバックによる微調整は、言語モデルを人間の意図に沿わせるための有望な方向性であると結論付けています。
制作・開発の高速化:GPT-4によるWebサイト制作
OCR(光学文字認識技術)を用いて、紙に書かれたラフスケッチを解析し、GPT-4に送信するだけで、ラフスケッチに書かれていたWebサイトも一瞬にして完成。


カスタマイズ可能なユーザーエクスペリエンス:あなた好みのAI出力
さらに、システムプロンプトを設定することでGPT-4の出力を自分の好みや具体的な指示に合わせることができます。
システムプロンプト:あなたはまるでシェイクスピアのような海賊です。どんなユーザーからのメッセージにも、自分の個性を貫いてください。
User:W-2に記載されている非適格プランの内容を教えてください。

GPT-4: ああ、親愛なる友よ、税務の問題で助けを求めておるのか、
お金の方程式を解読することを望んでおるなら、
さて、鋭い目でBox 11を見つめてごらん、
そこで、非認定プランがよく見つかる。
しかし、私自身は謙虚な海賊であることを告白せねばならぬ、
税金の言葉や書類については、ほとんど知らぬ。
陸の賢い生き物から助言を求めよ、
税金の専門家がしっかりとした手で導いてくれるであろう。
ユーモアの検出:GPT-4がジョークを判断
GPT-4の進歩は、ジョークのコメディックな価値を正確に評価し、そのニュアンスを理解することで、ユーモアと皮肉検出にも及んでいます。
User: このミームを説明して。

GPT-4: このミームは、宇宙から見た地球の写真とチキンナゲットという、関係のない2つのものを組み合わせたジョークである。
ミームのテキストでは、下の画像は宇宙から見た地球の美しい写真であるかのように書かれています。しかし、実際にはチキンナゲットを世界地図に似せて並べたものである。
このミームのユーモアは、テキストと画像の予想外の並置から生まれる。文章では壮大な地球のイメージを期待させるが、実際には平凡で愚かなイメージである。
ステップバイステップの思考:GPT-4とのインタラクティブな問題解決
これまでのモデルでは解けなかったような法律や数学の試験の回答の正確性も向上。
User:I.1.a.に答えてください。 ステップバイステップで考えてください。

GPT-4:問題I.1.aに答えるためには、導体棒の各点の温度T(x)を求める必要があります。この導体棒の各点は、座標xで特徴付けられています。
T(0) = T0およびT(L) = Tbが与えられています。
定常状態では、棒内の一次元熱伝導の熱方程式は次のようになります:
d²T/dx² = 0
一度積分すると、次のようになります:
dT/dx = C₁
もう一度積分すると、次のようになります:
T(x) = C₁x + C₂
定数C₁およびC₂を決定するために、境界条件を使用します:
T(0) = T0であり、C₂ = T0を得ます。
T(L) = Tbであり、C₁ = (Tb - T0) / Lを得ます。
最終的に、T(x)の式は次のようになります:
T(x) = (Tb - T0) * (x / L) + T0
これは、導体棒に沿った線形温度プロファイルを表し、傾きは(Tb - T0) / Lです。
注目のGPT-4のAPIについて
GPT-4のAPIは、画像とテキスト入力を受け取り可能なマルチモーダルモデルで、多くのアプリケーションにおいて人間レベルのパフォーマンスを提供してくれることが期待できます。GPT-4の特徴として、コンテキストサイズが8kのバージョンと32kのバージョンの2つが用意されたことです(ChatGPTは4kが最大)。価格は8kバージョンは1000トークンあたり約3円($0.03)で、32kバージョンはコンテキスト1000トークンにつき約6円($0.06)。GPT-3 の値段が 1000トークンあたり、約2円 ($0.02)だったため、価格は適正価格に戻った印象です。
最後に
いかがだったでしょうか? GPT-4 の一般公開により、今まで以上にAIの進化が加速するような気がしました。これからも継続的に ChatGPT/AI 関連の情報について発信していきますので、フォロー (@ctgptlb)よろしくお願いします。この革命的なテクノロジーの最前線に立つ機会をお見逃しなく!