Vietnam.vn - Nền tảng quảng bá Việt Nam

AI Google Gemini 2.5はブラウザで本物の人間のように動作します

Googleは、AIが人間のようにクリック、入力、スクロール、ドラッグ&ドロップを行えるAIモデル「Gemini 2.5 Computer Use」を発表した。

Báo Khoa học và Đời sốngBáo Khoa học và Đời sống10/10/2025

Google は、人工知能が実際のユーザーのように Web ブラウザと直接対話できるようにする、Gemini 2.5 Computer Use という新しい AI モデルを発表しました。

この AI の機能には、クリック、スクロール、入力、ドラッグ アンド ドロップ、Web サイトのナビゲーションなどがあります。

これは、API や直接接続なしで AI がインターフェース上のタスクを処理できるようにするための重要な前進です。

Google によれば、Gemini 2.5 Computer Use には、画面上のコンテンツを理解し、フォームへの記入、データの送信、ユーザー インターフェースのナビゲート (UI テスト) などのユーザー要求を実行するための視覚的な理解および推論機能が搭載されています。

このモデルの初期バージョンのいくつかは、AI Mode や Project Mariner などの社内プロジェクトでテストされており、ユーザーが提供する材料リストに基づいて商品をショッピングカートに追加するなど、AI がブラウザ内でタスクを自動的に完了できます。

注目すべきは、Google の発表は、OpenAI が Dev Day イベントで ChatGPT の新しいアプリケーション シリーズを発表したわずか 1 日後に行われ、Anthropic も昨年 Claude モデルに「コンピューター使用」機能を導入した点だ。

Google によれば、Gemini 2.5 Computer Use は、多くの Web およびモバイル ベンチマーク テストで競合モデルよりも優れたパフォーマンスを発揮します。

ただし、ChatGPT Agent や Claude とは異なり、Google のモデルはブラウザ環境でのみ動作し、コンピューターのオペレーティング システムを完全に制御できるように最適化されていません。

現在、ブラウザの起動、テキスト入力、ドラッグ&ドロップ、インターフェース要素の移動など、13種類のアクションをサポートしています。このモデルはGoogle AI StudioとVertex AIを通じて開発者に提供されており、ユーザーはBrowserbaseでライブデモを視聴できます。このデモでは、AIが「2048をプレイする」や「Hacker Newsで物議を醸しているトピックを見つける」といったタスクを実行します。

Gemini はブラウザの「私はロボットではありません」テストに簡単に合格します。

出典: https://khoahocdoisong.vn/ai-google-gemini-25-thao-tac-voi-trinh-duyet-nhu-nguoi-that-post2149059532.html


コメント (0)

No data
No data

同じカテゴリー

ベトナム代表、ネパール戦勝利でFIFAランク昇格、インドネシアは危機に
解放から71年経った今でも、ハノイは現代社会の流れの中でその美しい伝統を保っている。
首都解放記念日71周年 - ハノイが新たな時代へとしっかりと踏み出すための精神を奮い立たせる
ヘリコプターから見たランソンの洪水地域

同じ著者

遺産

人物

企業

No videos available

時事問題

政治体制

地方

商品