Googleが新AIモデル「Gemini 3.5」「Omni」を発表、個人AIアシスタントやスマートグラスも導入へ

Googleは間もなく、能動的にタスクを実行するAIアシスタントを含む、多数の新しいAI搭載ツールとシステムを公開する予定である。Googleの年次開発者会議「Google I/O」では「Agentic AI」が中心的な焦点となり、発表されたAIエージェントの一つが「Gemini Spark」である。GoogleのSundar Pichai CEOは、同社が「agentic Gemini時代」に確固たる足場を築いていると述べた上で、AIエージェントの潜在能力は大きいものの、使いやすさ、セキュリティ、真の有用性においてはまだ初期段階であるとの認識を示した。Googleとその親会社Alphabet Inc.はAI開発に多額の投資を行っており、上級財務幹部は4月下旬の投資家向け電話会議で、今年の設備投資が最大1,900億ドルに達する可能性があると述べた。四半期決算は力強い成長を示し、前月の報告以来、株価はさらに11%上昇した。

Pichai CEOは基調講演で、Geminiアプリの月間アクティブユーザー数が昨年の4億人から現在9億人を超え、1年間で2倍以上に増加したと発表した。最新のモデルファミリー「Gemini 3.5」は、火曜日に「Gemini 3.5 Flash」から世界中の何十億人ものユーザーに展開され始めた。Googleによると、Flashモデルは速度に特化しており、同社のこれまでの最強のagenticおよびコーディングモデルであり、一部の競合他社よりも約4倍高速であるという。このモデルは現在、GeminiアプリとGoogle検索の「AIモード」のデフォルトとなっている。同社は「Gemini Pro」の3.5バージョンも開発中で、社内で使用しており、来月にはリリース予定である。Gemini 3.5は、新しいより高度な安全トレーニングと軽減策を用いて開発され、有害なコンテンツの生成や安全なクエリへの回答の誤った拒否の可能性が低いと会社は述べた。

Googleは、テキスト、画像、動画、音声などあらゆる入力から高品質な動画を作成できる新しいモデル「Gemini Omni」も発表した。作成された動画は、モデルとの会話を通じて簡単に編集できる。ユーザーは最終的にOmniで画像や音声も作成できるようになるが、これらの機能の展開時期の詳細は特定されていない。Omniが生成する動画は、重力、運動エネルギー、流体力学といった物理法則を理解しているため、他のモデルが生成する動画よりも現実的に見えると会社は述べている。Omniファミリーの最初のモデルである「Gemini Omni Flash」は、火曜日にGoogle AI Plus、Pro、Ultraの加入者向けにGeminiアプリとGoogle Flowを通じて提供が開始された。今週から、YouTube ShortsとYouTube Createアプリで無料で利用可能となる。Omniで作成されたすべての動画には、Googleの知覚できないデジタル透かし「SynthID」が含まれる。また、GoogleはGeminiアプリにコンテンツ認証機能を追加し、このツールは写真や動画などのコンテンツがAIによって作成されたものか、携帯電話のカメラで撮影されAIツールで編集されたものかを判断すると会社は述べた。この機能は数か月以内にChromeの検索で利用可能となる予定である。Googleは、AI企業であるOpen AI、Kakao、Eleven LabsもSynthID技術をより多くのAI生成コンテンツに採用していると発表した。

AIエージェント「Gemini Spark」とウェアラブルAI
Gemini 3.5を搭載した「Gemini Spark」は、会議のメモ、メール、チャットを整理し、主要な要点とToDoを含むドキュメントを作成するなど、日常的なタスクを完了できる。Sparkはクラウドベースであるため、ユーザーがデバイスを閉じてもバックグラウンドで作業を続ける。AIエージェントの能動的な性質はチャットボットとの違いであり、Gemini Sparkはメール送信や購入など「リスクの高い」タスクを実行する前に許可を求めるように設計されていると会社は述べた。一部のテスターは火曜日からSparkにアクセスでき、ベータ版は米国のGoogle AI Ultra層の加入者に展開される予定である。この夏後半には、Gemini SparkがChrome内で直接動作するようになると会社は述べた。会議では、Googleのスマートグラスに関する更新も発表された。これには音声で助言を提供する「オーディオグラス」と、視覚的に情報を提供する「ディスプレイグラス」の2種類がある。オーディオグラスが最初に登場し、この秋後半にリリースされる予定である。ユーザーは「Hey Google」と話すか、フレームの側面をタップすることでGeminiにアクセスでき、ナビゲーション、携帯電話でのコミュニケーション管理、リアルタイム翻訳などのタスクを支援する。GoogleはSamsung、アイウェアブランドのGentle Monster、Warby Parkerと提携してグラスを開発し、火曜日に2つのデザインを初公開した。これらのデザインは、今年の後半にアイウェアブランドのフルコレクションの一部として発売されるとGoogleは述べた。

検索とショッピングへのAI統合
昨年の会議で導入されたGoogle検索エンジンの「AIモード」は、関連リンクの提供前にユーザーのクエリに対してより会話的な回答を提供する。Googleの検索責任者であるLiz Reid氏によると、AIモードのクエリは昨年導入されて以来、四半期ごとに2倍以上に増加し、最近月間ユーザー数が10億人を超えた。検索の新しいデフォルトモデルは「Gemini 3.5 Flash」となり、同社は「インテリジェントな検索ボックス」を導入する。Reid氏は、これを検索ボックスの25年間で最大のアップグレードであるとし、ボックスがより長いクエリに対応し、AI搭載の提案でユーザーが質問を作成するのに役立つと述べた。ユーザーはテキスト、画像、動画、ファイル、Chromeタブを検索入力として使用し、複数のモダリティで検索できる。新しい検索ボックスは火曜日から、AIモードが現在利用可能なすべての国と言語で展開が開始される。同社は新しいツール「ユニバーサルカート」も発表し、これは複数の販売業者やサービス間で機能し、ユーザーはGoogle検索を閲覧中、Geminiとチャット中、YouTube視聴中、Gmailでメールを読んでいる間にも商品をカートに追加できる。カートはGeminiモデル上で動作し、商品がカートに入れられるとすぐに、セールや価格の下落を探し、価格履歴情報を提供し、在庫が戻ったときにユーザーに通知する。ユニバーサルカートツールは、この夏に検索とGeminiアプリでユーザーに提供され、その後YouTubeとGmailにも展開される。

出典: nbcbayarea.com: Google announces slew of AI advances, including a personal AI assistant coming soon

シリコンバレー地方版

カリフォルニア・シリコンバレーからホットなローカルニュースを（ほぼ）毎日更新しています。

Googleが新AIモデル「Gemini 3.5」「Omni」を発表、個人AIアシスタントやスマートグラスも導入へ

Ads Blocker Detected!!!

関連記事:

Ads Blocker Detected!!!