🚨今週の主要AIニュース7選: OpenAI, Google, Apple, NVIDIA...etc【10月23日~10月29日】
今週も、OpenAI, Google, Apple, ボストン・ダイナミクス などからAIに関する大きなアップデートがありました。早速振り返っていきましょう!
今週の主要AIニュース一覧:
🌐【Google】新AIモデル「Gemini」とAIアプリジェネレータ「Stubbs」の詳細リーク
Mediumのブログ投稿で、Googleの新しいLLM Geminiの詳細とプレビューがリークされ、Googleの新しいAIツール「Stubbs」についても情報が公開されました。
主な注目点:
GeminiモデルはGoogleのPaLM-2を置き換え、GoogleのMakersuiteやVertex AIを動かす可能性がある
Google DeepmindのCEO、Demis Hassabisは、GeminiがGPT-4の能力を超えると述べ、2023年末のリリースが予想されている
Stubbsは、基本的なAIプロトタイプアプリを簡単に構築するためのノーコードツールで、ユーザーはStubbsで作成したプロトタイプを公開、共有できる
Geminiのローンチが近づいていると予想されており、その能力が期待通りであれば、再び大きな衝撃を与える可能性があります。GoogleがGeminiをすべてのデータ(YouTubeのトランスクリプトを含む)でトレーニングした場合、公開時には世界に大きな影響を与えることが予想されます。
関連情報・出展:
🤖【Eureka: NVIDIA Research】ロボットがペン回しを学習
NVIDIA Researchが開発した新しいAIエージェントは、ロボットに複雑なスキルを教えることができ、ペン回しをロボットに学習させたと報告されています。
主な注目点:
Eurekaは、GPT-4を活用し、報酬アルゴリズムを自動的に書き込むことで、ロボットに専門的に達成するための複雑なスキルを教えることに成功
Eurekaが、ロボットに学習させたタスクは、引き出しやキャビネットを開ける、ボールを投げてキャッチする、はさみを操作するなどなど
Eurekaの研究は、NVIDIA Isaac Gymを使用して開発者が実験できるように、プロジェクトのAIアルゴリズムとともに公開
NVIDIAの研究は、AI、コンピュータグラフィックス、コンピュータビジョン、自動運転車、ロボティクスなどのトピックに焦点を当てた世界中の数百人の科学者とエンジニアで構成されています。
関連情報・出展:
🍎【Apple】AI技術の強化を目指す、新しいSiriバージョンと多数のAI機能を計画中
Bloombergの新しいレポートによれば、Appleは全ての製品に生成AIを組み込むための計画をしていると報告されています。
主な注目点:
新しいSiriのバージョンには、独自の大規模言語モデルが組み込まれる予定
新しいAI機能には、Messagesの自動生成・返信、Musicのプレイリスト作成、Xcodeのコード提案などが含まれる
Appleは、異なるAI機能のためのデバイス上の処理とクラウド処理の間のトレードオフを議論中
AppleのAI技術がChatGPT、LaMDA、Claudeのようなモデルの強みに匹敵するかどうかについての内部的な懸念が残っているとのことです。
関連情報・出展:
🔬【OpenAI】ナレッジカットオフが2023年4月に変更か
一部の海外ユーザーのChatGPTでナレッジカットオフが2023年4月、もしくは2023年9月に変更されていることが確認されています。LangChainなどの知識を得ていることが確認できます。
主な注目点:
2023年4月、もしくは2023年9月にナレッジカットオフが変更されている
LangChainなどの知識を得ていることが確認できる
関連情報・出展:
🤖【Boston Dynamics】「Spot」ロボットにChatGPTを搭載し、社内ツアーを実施
Boston Dynamicsの施設で「Spot」がChatGPTによる音声を使用してツアーをしました。その会話スキルが新しいデモビデオで公開されています。
主な注目点:
Spotは、プロンプト、事前に決められたスクリプト、およびビジュアルの認識も可能
さまざまな性格やアクセントでツアーの質問に答え、ナレーションを行う
Boston Dynamicsは、ChatGPTや他の大規模な言語モデルを使用してSpotの応答を訓練
関連情報・出展:
🔧【速報】OpenAI、GPT-4の最新アップデート
ChatGPT Plusの一部ユーザーがGPT-4の新しいアップデートを確認しました。さまざまなドキュメントのアップロードが可能となり、ChatGPTが自動でモードを切り替える機能が追加されました。
主な注目点:
モード(ブラウジング, データアナリティクス, DALL·E)の自動切り替え
データ処理が容易に、ユーザー体験の向上
これにより、より効率的なデータ処理と優れたユーザー体験が期待されます。
関連情報・出展:
🎨【DALL·E 3】 基本的な使い方、コツ
OpenAIが開発したテキストから画像を生成するAIモデル、DALL·E 3を使えば、自然な日本語から画像を生成できます。
例えば、「赤いリンゴを持った猫を出して」と入力すると、以下のような画像が生成されます。画像は以前は自動的に4枚生成されましたが、現在は2枚生成されます。
ChatGPTがユーザーの要望を汲み取ってプロンプトを構築し、DALL·E 3が画像を生成します。細かく設定すればするほど自分の望みの画像が得られます。
実は、DALL·E 3は、出力する画像の枚数をテキストで指定することができます。例えば、「赤いリンゴを持った猫を1枚出して」と入力すると、以下のような画像が生成されます。
関連情報・出展:
【決定版】DALL·E 3完全攻略ガイド|ChatGPT研究所 (chatgpt-lab.com)
いかがだったでしょうか?これからも継続的に ChatGPT/AI 関連の情報について発信していきますので、フォロー (@ctgptlb)よろしくお願いします。この革命的なテクノロジーの最前線に立つ機会をお見逃しなく!