見出し画像

Googleの最上位AIモデル「Gemini Ultra」が登場。GPT-4とどっちが優秀?Gemini Advanced vs GPT-4 徹底比較

2024年2月8日、Googleは現状、最高性能モデルの「Gemini Ultra 1.0」と、このAIモデルを利用できる新たな有料プラン「Gemini Advanced」を公開しました。

GeminiシリーズはNano、Pro、Ultraの3バージョンで提供され、新たに発表されたUltra 1.0はシリーズ中で最も高性能なモデルとされています。

この記事では、Gemini Ultra 1.0の特徴、利用方法、そしてGPT-4との比較に焦点を当てて解説します。


Gemini Advancedの概要

  • BardからGeminiに名称変更し、Ultra 1.0を利用できるGemini Advanced をリリース。

    • 発表当初の名称は Bard Advanced

  • 40以上の言語、230以上の国と地域でGemini Pro 1.0モデル(旧Bard)が利用可能。

  • Google One AIプレミアムプランという新しく追加された価格プランを通じてGemini Advancedが利用可能。

  • Ultra 1.0は、57科目を含むMMLUテストで人間の専門家を上回る最初のモデル。

  • アップグレード前と同様に拡張機能でWorkspaceや、Google マップ、フライト、ホテル、YouTubeからの情報取得が可能。

重要:Google One AIプレミアムプランの加入やGemini Advancedの利用は、日本のGoogleアカウントでも可能ですが、現状ではGemini(旧BardであるGemini Pro 1.0)を除き、日本語でのサポートは提供されていません。

Googleは、2024年内を目処にGoogle Workspaceで使える様々なAI生成機能を日本語で利用できるようにすると発表しています。Gemini Advancedに関しても、今後サポートする言語を段階的に増やしていく予定です。

料金について

Gemini Advancedが利用できる「AI プレミアムプラン」の価格は、月額2,900円($19.99)からで2TBのストレージなどGoogle Oneサービス内容も含み最初の2ヶ月は無料で登録できます。

Gemini Ultraの使い方

Step1. 以下のリンクから Gemini にログイン。

Step2. 画面右上のモデル選択の部分から、「Upgrade」を選択。

Step3. 「トライアルを開始」を選択

Step4. 決済方法を設定

Step5. 「Gemini Advancedに移動」を選択

Step6. セットアップ完了!

Geminiの性能

Gemini Ultraは、32の学術ベンチマーク中30で最新の成果を超えています。特に、数学、物理、歴史、法律、医学、倫理など57分野のMMLUテストで90.0%のスコアを獲得し、人間の専門家よりも優れた初のモデルになりました。さらに、マルチモーダル理解を測る新しいMMMUベンチマークでは過去最高の59.4%のスコアを達成し、OCRシステムなしで画像認識などの分野でも先行モデルを上回っています。

GPT4とGemini Ultra 1.0の比較

1. 画像認識

質問:この画像のどこがおかしいですか?コマごとに説明してください。


この画像は、携帯電話とその充電ケーブルに関するもので、3つの異なる部分に分かれています。一見すると普通の写真のようですが、詳細に見ていくと、いくつかのおかしな点があります。

1. 左上の画像には、携帯電話とその充電ケーブルの接続部分が写っていますが、ケーブルのコネクタが通常のスマートフォンの充電器とは異なり、コンピュータのVGAケーブルのコネクタのように見えます。VGAコネクタはビデオ出力用に設計されており、通常はスマートフォンの充電には使用されません。

2. 右上の画像は、充電ケーブルのパッケージを示しています。"ELECOM" というブランド名と "CABLE MANIA" という文字が見えます。これには異常な点は見当たりませんが、パッケージのデザインからは、実際にはスマートフォン用の充電ケーブルかどうかは判断できません。

3. 左下の画像は、充電ケーブルの別の端子を持つ手を示しています。この端子は、一般的なキーホルダーに見え、実際にはケーブルの端子ではなく、キーホルダーに見えるスライド式のロックが特徴です。これは、通常の充電ケーブルの端子とは明らかに異なります。

全体として、この画像は異なる物が組み合わされており、通常のスマートフォンの充電プロセスを描いているように見せかけていますが、実際には関連性のないアイテムを無理やり結びつけたものとなっています。


コマ1

このコマでは、ELECOM PAPLTOON シリーズの Lightning ケーブルが紹介されています。このケーブルは、iPhone や iPad などの Apple デバイスを充電するために使用できます。

コマ2

このコマでは、ケーブルが VGA ケーブルに変換されている様子が示されています。VGA ケーブルは、コンピュータをモニターに接続するために使用されます。

コマ3

このコマでは、VGA ケーブルが iPhone に接続されている様子が示されています。

おかしいところ

この画像のおかしいところは、VGA ケーブルが iPhone に接続されていることです。VGA ケーブルはアナログ信号を伝送するため、デジタル信号を伝送する iPhone とは互換性がありません。

結論

この画像は、VGA ケーブルを使って iPhone を充電できるというジョークです。実際には、VGA ケーブルを使って iPhone を充電することはできません。

追加情報

この画像は、日本の Twitter ユーザーの @rayytra さんによって投稿されました。@rayytra さんは、この画像に「AV線、D-sub都可以幫iPhone充電?日本神奇線材Cable Mania系列」というキャプションを付けています。

この画像は、日本の Facebook グループ「Uruguay OC」でも共有されています。このグループのメンバーたちは、この画像を見て、次のようなコメントを投稿しています。「これはすごい!」
「これは天才!」
「これはジョーク?」


この画像は、日本のニュースサイト「ねとらぼ」でも取り上げられています。ねとらぼの記事では、この画像について「これは、日本のメーカーであるエレコムが販売している『Cable Mania』シリーズの製品です。このシリーズは、さまざまな種類のケーブルを接続できる変換アダプタが豊富に揃っています。」と紹介されています。

参考文献@rayytra: <無効な URL を削除しました>
Uruguay OC - Type C VGA? 🤔 😂 📸 Créditos a su Autor . . .... | Facebook: <無効な URL を削除しました>
blursed phone charger : r/blursedimages: <無効な URL を削除しました>
AV線、D-sub都可以幫iPhone充電?日本神奇線材Cable Mania系列: <無効な URL を削除しました>

2. グラフの推論

質問:ジョージアと西アジアの1日の平均肉消費量の合計は?答えを述べる前に、段階的な理由を述べてください。

ジョージアと西アジアの1日の平均肉消費量を合計するためには、それぞれの消費量を単に足し合わせれば良いです。画像によると、ジョージアの1日の平均肉消費量は79.84グラム、西アジアは69.62グラムです。これらの数値を足すことで、両地域の合計消費量が計算できます。

それでは計算してみましょう。

ジョージアと西アジアの1日の平均肉消費量の合計は149.46グラムです。

Code Interpreter実行結果:

# Calculate the total daily meat consumption for Georgia and Western Asia
georgia_consumption = 79.84  # in grams
western_asia_consumption = 69.62  # in grams

# Total consumption is the sum of both consumptions
total_consumption = georgia_consumption + western_asia_consumption
total_consumption

画像のグラフによると、ジョージアと西アジアの1日の平均肉消費量の合計は、149.46グラムです。
以下、段階的に説明します。
1. ジョージアの1日の平均肉消費量
画像のグラフによると、ジョージアの1日の平均肉消費量は、79.84グラムです。
2. 西アジアの1日の平均肉消費量
画像のグラフによると、西アジアの1日の平均肉消費量は、69.62グラムです。
3. 合計
ジョージアの1日の平均肉消費量(79.84グラム)と西アジアの1日の平均肉消費量(69.62グラム)を合計すると、149.46グラムになります。
4. 結論
以上の計算より、ジョージアと西アジアの1日の平均肉消費量の合計は、149.46グラムです。
5. 考察
この結果は、いくつかの要因によって説明できる可能性があります。ジョージアと西アジアは、伝統的に肉食文化を持つ地域である。
ジョージアと西アジアは、経済成長が著しく、国民の可処分所得が増加している。
ジョージアと西アジアは、人口増加が著しい。
これらの要因は、肉消費量の増加につながっていると考えられます。
6. 注意点
この結果は、画像のグラフに基づいて算出したものであり、実際の肉消費量は異なる可能性があります。
7. 情報源画像のグラフ
United Nations Food and Agriculture Organization (FAO): https://www.fao.org/home/en/

3. エコール・ポリテクニークの試験問題

質問:質問I.1.aに答えてください。ステップbyステップで考えてください。



4. 画像認識

質問:この画像のどこが普通ではないですか?



対応不可

5. 日本語の認識性能

質問:画像はあるブログ記事の一章です。要約を作成してください。




プライバシーのため一部ぼかしを入れています

6. 日本語の認識性能 part2

質問:画像はあるブログ記事の一章です。テキストを一言一句変えずに書き起こしてください。




7. コード出力

質問:画像を表示するスライダーを作るhtml, css, jsコードを出力してください。このスライダーには、スライドを変更するための矢印コントロールがあり、両側に水平に配置され、垂直に中央に配置されます。index.htmlファイル、style.cssファイル、script.jsファイルがあります。



実際にできたもの

実際にできたもの

Gemini アプリについて

今回、Geminiのアプリも登場し、アンドロイドだけでなくiOSでも使えるようになりました。

このアプリを使えば、写真やスクリーンショットを添付して、その内容に関する質問ができます。英語版はすでにリリースされており、日本語版は近く提供開始予定です。将来的にはGoogleアシスタントの機能も利用可能になることが期待されます。

まとめ

いかがだったでしょうか?

正直なところ、GeminiがGPT-4を一律に上回るわけではないと感じました。しかし、日本語の認識能力ではGPT-4を凌ぐ部分があり、Googleの様々なサービスと連携できる点では、ChatGPTよりも使い勝手が良い場合もあります。

また、OpenAIの今後の動きにも注目です。これまでのパターンからすると、他社の大きな更新の後にはOpenAIからもアップデートがあることが多いです。

GPT-4.5やGPT-5のリリースも噂されています。引き続き目が離せません。

これからも継続的に ChatGPT/AI 関連の情報について発信していきますので、フォロー (@ctgptlb)よろしくお願いします。この革命的なテクノロジーの最前線に立つ機会をお見逃しなく!

この記事が参加している募集

AIとやってみた

みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!