iPhone 17の発表イベントで、Appleは多くの旅行者が夢見るようなシナリオを再現した動画を公開しました。動画では、英語を話す観光客が、名前のないスペイン語圏の国で花を買い物している様子が映し出されています。花屋は観光客にスペイン語で話しかけますが、観光客が聞き取っているのは明瞭で分かりやすい英語です。
「今日は赤いカーネーションが全て50%オフです」と、店員が話すのとほぼ同時に、観光客はヘッドセットから英語で聞いた。
このビデオはAppleの最新AirPods Pro 3のプロモーション用資料だが、この機能はGoogleの親会社AlphabetやFacebookおよびInstagramの所有者Metaなど、他のテクノロジー企業の多くの類似製品にすでに搭載されている。
AppleはAirPodsヘッドフォンにライブ翻訳機能を導入しました。(写真:Apple)
2022年後半にOpenAIがChatGPTをリリースしたことで加速した技術進歩は、生成AIの時代を先導しました。それから約3年後、これらの進歩はリアルタイム言語翻訳ツールの実現へとつながっています。
Appleにとって、ライブ翻訳機能は火曜日に発表されたAirPods Pro 3の大きな目玉です。250ドルの新しいイヤホンは来週発売され、ライブ翻訳機能により、フランス語、ドイツ語、ポルトガル語、スペイン語などの言語をリアルタイムで英語に翻訳して聞くことができます。ライブ翻訳はAirPods 4とAirPods Pro 2にも搭載される予定です。

AirPodsを装着した2人が会話すると、それぞれのヘッドフォン内で同時に双方向の翻訳が可能になります。(写真:MacRumors)
アナリストらは、この機能はアップルのAI戦略における大きな前進となる可能性があり、アップルのAIソフトウェアスイートであるApple Intelligenceを実行できる新型iPhoneと組み合わせる必要があると述べている。
「もし実際にAirPodsを使って直接翻訳できるようになれば、人々がデバイスをアップグレードしたくなる機能になるだろう」とDAデイビッドソンのアナリスト、ギル・ルリア氏は語った。
エキサイティングな翻訳機器レース
過去 1 年間で、Google と Meta もリアルタイム翻訳機能を備えたハードウェア製品を発売しました。
GoogleのPixel 10スマートフォンには、通話中に相手の話している内容を相手の言語に翻訳する機能が搭載されています。この機能は「音声翻訳」と呼ばれ、話者のイントネーションを維持するように設計されています。音声翻訳は、来週月曜日のソフトウェアアップデートでユーザーのスマートフォンに展開されます。
司会者のジミー・ファロンが、音声翻訳機能を搭載した折りたたみ式スマートフォン「Pixel 10 Pro Fold」を手に持っている。音声翻訳機能は通話をリアルタイムで翻訳し、話者の音声も保存する。(写真:ロイター)
8月に行われたGoogleのライブデモでは、音声翻訳機能がジミー・ファロンの発言を、彼独特のアクセントを保ちながらスペイン語に翻訳しました。一方、Appleの機能はユーザーの声を真似るものではありません。
一方、Metaは5月に、Ray-Ban Metaメガネがデバイスのスピーカーを通じて音声を他の言語に翻訳できるようになり、会話の相手はユーザーの携帯電話に録音された翻訳された応答を見ることができるようになると発表した。
CNBCは8月に、Metaが来週独自の製品発表イベントを開催すると報じました。このイベントでは、レンズの片方に小型スクリーンを搭載した次世代スマートグラスを発表すると予想されています。Metaが新たな翻訳機能を導入するかどうかは不明です。
Ray-Ban Meta グラスを使用すると、携帯電話で翻訳を聞いたり見たりすることができます。
近年、世界的な高速モバイル ネットワークやオンライン翻訳サービスの向上を活用し、わずか数百ドルで翻訳機能を内蔵したコンパクトなデバイスやヘッドフォンなど、さまざまな専用翻訳デバイスが市場に登場しています。
「アップルの良いところは、この問題の緊急性を本当に強調していることだ」と、音声とテキストの両方で異なる言語を話す二人の会話を翻訳できる299ドルの翻訳機を製造しているポケトークの米国マネージングディレクター、ジョー・ミラー氏は語った。
Canalys によれば、Apple は今年第 1 四半期だけで約 1,800 万台のワイヤレスヘッドホンを販売しており、Apple の市場参入により、より多くの顧客が翻訳技術の進歩にアクセスできるようになる。
Apple が市場に参入したにもかかわらず、専用デバイスメーカーは、正確性と言語知識に重点を置くことで、新しい携帯電話が無料で提供できるものよりも優れた翻訳結果が得られると主張している。
「実際に言語学者を雇いました」と、Googleの機能に似た、ユーザーの声を模倣する翻訳イヤホンを発売しているVasco Electronicsの米国・カナダ部門責任者、アレクサンダー・アルスキ氏は述べた。 「AIと人間の入力を組み合わせることで、提供しているすべての言語で、はるかに高い精度を実現しています。」
特殊機器メーカーはホームフィールドアドバンテージも有しています。Vasco Electronicsの最大の市場はヨーロッパですが、同社のウェブサイトによると、Appleのライブ翻訳機能はまだEUのユーザーには提供されていません。
テクノロジー企業の新製品の中には、対応言語が限られているものもあり、対応言語が限られています。Appleはこの機能を5言語のみで提供しているのに対し、Pocketalkは最大95言語に対応しています。
出典: https://vtcnews.vn/tai-nghe-cung-biet-dich-noi-cuoc-dua-ai-cua-cac-big-tech-ngay-cang-soi-dong-ar965160.html
コメント (0)