遂に登場。Grokの使い方とその性能を解説
はじめに
日本時間2023年11月5日、イーロン・マスク率いる米国xAIから新型AIツール「Grok」が公開されました。Grokは、ユーザーの質問に対して独特な回答を提供します。「Grok」は人類の理解と知識の探求を目標に開発され、𝕏を通じてリアルタイム情報にアクセスする機能を備えています。本記事では、Grokの全体像から詳細な特徴、そして次世代AIツールとしてのGrokがこれからどのような影響を及ぼす可能性があるのかについて、深く掘り下げて解説していきます。
Grokの特徴
最新情報にアクセス可能
Grokの一つのユニークな特徴は、𝕏を通じてリアルタイム情報にアクセスできることです。これにより、Grokは最新の情報に基づいて回答を提供することが可能になります。
挑戦的な質問に対する回答
さらに、Grokは他の多くのAIシステムが拒否するような挑戦的な質問にも対応します。これにより、Grokはユーザーが求める情報をより広範囲にわたって提供することができます。
マルチタスクが可能
画面を分割し、複数のチャットを同時に進行できます。例えば、ユーザーは複数のプログラミング言語やコードスニペットを同時に確認し、比較することができます。これにより、コンテキストの切り替えに伴う時間のロスを減らすことができ、作業効率向上が期待されます。
モードの切り替え: レギュラーモード/ファンモード
Grokには、「レギュラーモード」と「ファンモード」という二つの異なるモードがあり、ユーザーはその場のニーズに合わせてこれらを切り替えることができます。
生成したコードを VS codeでそのまま編集
Grokが生成したコードをそのままVS codeにエキスポートして編集することもできます。
Grokの性能
初期モデルのGrok-0に比べ、推論とコーディング能力が大幅に向上し、最先端の言語モデルであるGrok-1が開発されました。Grok-1は、HumanEvalコーディングタスクで63.2%、MMLUで73%という結果を達成しています。これは、GPT-3.5モデルやInflection-1を上回る性能です。
また、2023年のハンガリー国立高等学校(Hungarian national high school)最終試験の数学問題に対する評価でも、Grok-1は59%というスコアを得ています(Claude-2は55%、GPT-4は68%でした。すべてのモデルはtemperature 0.1、同じプロンプトで評価された)。これは、Grok-1が実際の試験問題に対しても一定の能力を持っていることを示しています。
ちなみに、Grokの初期モデル「Grok-0」は、330億パラメータを持つと報告されています。このモデルは、標準の言語モデル基準においてLLaMA 2 (70B)と同等の能力を示していましたが、訓練リソースの半分しか使用していなかったと報告されています。
Grokの使い方
現時点で日本ではGrokを利用することはできませんが、今週からX Premium+サブスクリプションユーザーに向けて公開される予定です。
X Premium+の登録は以下からできます:
https://twitter.com/settings/subscription
最後に
いかがだったでしょうか? Grokがリリースされたことで、AI業界に大きな変化が起こりそうです。これからのAIの発展にどんな影響があるのか、目が離せません。これからも継続的に ChatGPT/AI 関連の情報について発信していきますので、フォロー (@ctgptlb)よろしくお願いします。この革命的なテクノロジーの最前線に立つ機会をお見逃しなく!