AIを組み合わせてベトナム語を「教える」
ベトナムの外国直接投資(FDI)企業のリーダーは、ベトナム語を短期間で習得し、一般的な文書の90%を読めるようになりたいと考えています。しかし、彼は多忙で、勉強に使える時間が1時間(毎日12~13時)しかありません。そこで、彼が短期間で外国語を習得できるようにするには、言語学習ソフトウェアにテクノロジーをどのように活用すればよいのでしょうか?
上記は、ホーチミン市ベトナム国家大学理科大学計算言語学センター所長のディン・ディエン准教授に提起された、FDI企業のリーダーシップポジションに関する問題です。
機械翻訳、批判言語学、外国人へのベトナム語教育における人工知能(AI)の応用に関する多くの科学的研究テーマと国際的な出版物を持つディエン准教授は、言語学の問題を解決するにはAIの応用が非常に必要だと考えています。
具体的には、どんな言語を学ぶにしても、まずはその言語の音を教えることが第一歩です。ここで障壁となるのは、ベトナム語には声調とリズムがあるため、英語やフランス語など声調のない言語を学習する人に教えるのは非常に困難です。例えば、「もう寝ましたか?」と尋ねる代わりに、学習者は声調を区別できないため、「もう寝ましたか?」と答えてしまいます。発音する際の注意点、口の持ち方、そして正しい発音と間違った発音の違いを教えることが重要です。
現在、外国語教育におけるAI応用ソフトウェアは、歯磨きの口の形をシミュレートし、学習者に真似させる音を再生することができます。学習者はその音を再生し、ソフトウェアに録音します。そして、学習者の発音とソフトウェアの標準発音を比較する技術を用いて、発音を迅速に改善します。以上のすべてのステップにAIが活用されています。
もう一つの例を挙げると、故ホアン・ペ教授が編集した言語学研究所ベトナム語辞典によると、ベトナム語の原語彙は約34,000語です。計算によると、機械が一般的なベトナム語テキストの約90%を読めるようにするには、約10%の単語、つまり3,400語の応用情報を機械に学習させる必要があることが示されています。このデータ表を作成するために、ディエン准教授はAIを用いてベトナム語コーパスの語彙体系にラベルを付ける必要がありました。
AIは教育分野における教育と学習の方法を変えたと言えるでしょう。実際、教育と学習のプロセスをより迅速かつ効果的にするための支援を目的とした、多くの人工知能アプリケーションが誕生しています。
上記のコンピュータサイエンスと言語学の融合に関する興味深い話は、AIの訓練と実践への適用プロセスが不可欠でありながら、容易ではないことを示しています。データは複数の識別層に分割する必要があり、各層では各変数を異なる特定の識別子で処理する必要があります。
機械が言語を学習すると...
AIは人間の言語学習を支援するだけでなく、言語知能をより良くサポートするシステムにも役立ちます。機械は日々訓練され、進化しています。
ディエン准教授のストーリーと同様に、以下はインテリジェントアシスタントが人間の言語を理解するもう 1 つの鮮明な例です。
これは、ベトナムの車載音声アシスタントKikiを研究開発し、様々な地域訛りの音声を良好に認識できるようにするプロセスです。コンピュータサイエンスにおいて、音声認識は人工知能(AI)の重要な分野であり、人間の音声をコンピュータアプリケーションが理解しやすい有用な形式に変換します。この技術は、機械と人間をつなぐ架け橋です。音声アシスタントは世界中で欠かせないアプリケーションとなっています。最も人気のあるものは、AppleのSiri、Googleアシスタント、Amazon Alexa、そしてベトナムのKikiです。
Kiki の最初のコードを書いた Nguyen Hoang Khanh Duy 氏は、音声を認識して正しい情報でユーザーに応答できるほど賢い AI モデルをトレーニングするには、言語データが重要な役割を果たすと述べました。
例えば、ベトナム語の車載アシスタント「Kiki」のユーザーにとって、ナビゲーション機能は非常に重要です。そのため、製品開発チームは、ユーザーからの指示を「スムーズに」サポートするためのデータと語彙を準備する必要がありました。データ収集とモデルの学習プロセスを経て、後期バージョンの音声認識品質を示す指標は、オリジナルバージョンと比較して40%向上しました。
車内の音声認識は、ナビゲーションや位置情報の問題に限らず、他の多くの問題もカバーします。
例えば、Kikiを車内で使用する場合、エンジン、風、道路上の交通設備などからの騒音が多く発生し、車内でのKikiの音声認識品質に直接影響を及ぼします。そのため、Kikiチームは、騒音下での音声認識データを強化し、実際の状況に最も適合するようにすることで、騒音環境の問題を解決する必要があります。
さらに、自己教師学習などの新たな技術を駆使し、Kikiはラベル付けされていないデータからも「学習」することで、モデルのさらなる改善を目指しています。このベトナム語音声アシスタントの安定性は、継続的なトレーニングと製品のアップグレードによって向上しています。
言うまでもなく、技術の進歩は日々、毎時間起こっています。2022年末にローンチされたChatGPTは、ビッグデータの仕組みという問いに部分的に答えを出しました。テクノロジーは、特に教育や言語といった、これまで人間に大きく依存していた分野において、生活の真ん中に「踏み込んで」います。AIは、上記の具体的な例のように、私たちの学び方、働き方、生活様式を再定義します。
[広告2]
ソース
コメント (0)