マイクロソフト、写真にエフェクトを作成するAI「VASA-1」を発表

[広告1]

VASA-1の最大の特徴は、あらゆる画像をアニメーション化できることです。人物の写真を撮影するだけで、表情豊かに動かしたり、話させたり、歌わせたりすることができます。このAIソリューションの興味深い点は、高いレベルのリアリティを実現していることです。

VASA-1 có thể biến những bức ảnh trở nên sinh động hơn — VASA-1は写真をより鮮明にすることができる

VASA-1ソリューションは、コミュニケーションに困難を抱える人々のアクセシビリティ向上に重点を置いています。必要とする人々に寄り添い、セラピーのサポートを提供することを目指しており、リアルな話し声をリアルタイムで作成できます。VASA-1に必要なのは、声を吹き込みたい人物の顔画像だけです。さらに、他の要素を追加することで、よりリアルな表情を作ることができます。目の位置や口の動きを編集することで、笑顔や叫び声といった表情を作ることもできます。

Microsoft は、これらのビデオが人物の写真からいかにリアルで生き生きと作成されるかを強調していますが、絵やアートに音声や簡単でリアルな動きを追加できるだけでなく、VASA-1 には感情や表情を追加したり、頭部に動きを追加したりする機能もあります。

Microsoft giới thiệu AI VASA-1 tạo hiệu ứng cho ảnh- Ảnh 2. — VASA-1は一般公開されません。

しかし、OpenAIのSoraと同様に、MicrosoftはVASA-1に関連するデモ、API、製品、サービスは一切公開しないため、VASA-1はアクセスできないと警告しています。これは新技術の最初のバージョンに過ぎず、まだ開発段階にある可能性があり、Microsoftはディープフェイクが悪意のある目的で利用されるリスクを懸念しています。そのため、VASA-1は、様々なコミュニケーション障害を持つ人々を支援する専門センターとの契約に基づいてのみ使用されるようです。

将来的にはVASA-1が導入される可能性はありますが、問題を回避するために管理された方法で導入されるでしょう。VASA-Aは、よりユーザーフレンドリーなバーチャルアシスタントを開発できる公的機関を対象としており、Copilotのアドオン機能としてWindowsに近いバーチャルアシスタントを開発することも可能です。

しかし、たとえそのようなことが起こったとしても、マイクロソフトは、不正なプラットフォームに利用されたり、不正な活動への投資を奨励されたりすることを避けるため、セキュリティの問題を非常に懸念しています。

[広告2]
ソースリンク