AIを組み合わせてベトナム語を「教える」
ベトナムの外国直接投資(FDI)企業のリーダーは、ベトナム語を短期間で習得し、一般的な文書の90%を読解したいと考えています。しかし、彼は多忙で、勉強に使える時間が1時間(毎日12~13時)しかありません。そこで、彼が短期間で外国語を習得できるようにするには、言語学習ソフトウェアにテクノロジーをどのように活用すればよいのでしょうか?
上記は、ホーチミン市ベトナム国家大学理科大学計算言語学センター所長のディン・ディエン准教授に提起された、FDI企業のリーダーシップポジションに関する問題です。
機械翻訳、批判言語学、外国人へのベトナム語教育における人工知能 (AI) の応用に関する多くの科学的研究テーマと国際的な出版物を持つディエン准教授は、言語学の問題を解決するには AI の応用が不可欠であると考えています。
具体的には、どんな言語を学ぶにしても、まずはその言語の音を教えることが重要です。ここで障壁となるのは、ベトナム語には声調やリズムがあるため、英語やフランス語など声調のない言語の学習者に教えるのは非常に困難です。例えば、「もう寝ましたか?」と尋ねる代わりに、学習者は声調を区別できないため、「もう寝ましたか?」と答えてしまいます。発音時にどこに注意を向けるか、口の形はどのようなものか、正しい発音と間違った発音の違いはどのようなものかを教える必要があります。
現在、外国語教育におけるAI応用ソフトウェアは、歯磨きの口の形を模倣し、学習者が真似できるようにあらかじめ用意された音を再生することができます。学習者はその音を再生し、ソフトウェアに録音します。そして、学習者の発音とソフトウェアの標準発音をテクノロジーを用いて比較することで、発音を迅速に改善します。上記のすべてのステップにはAI応用が必要です。
もう一つの例を挙げると、故ホアン・ペ教授が編纂した言語学研究所ベトナム語辞典によると、ベトナム語の原語彙は約34,000語です。計算によると、機械が一般的なベトナム語テキストの約90%を読めるようにするには、約10%の単語、つまり3,400語の応用情報を機械に学習させる必要があることが示されています。このデータ表を作成するために、ディエン准教授はAIを用いてベトナム語コーパスの語彙体系にラベルを付ける必要がありました。
AIは教育分野における教育と学習の方法を変えたと言えるでしょう。実際、教育と学習のプロセスをより迅速かつ効果的にするために、多くの人工知能アプリケーションが誕生しています。
上記のコンピュータサイエンスと言語学の融合に関する興味深い話は、AIの訓練と実践への適用プロセスが不可欠でありながら、容易ではないことを示しています。データは複数の識別層に分割する必要があり、各層では各変数を異なる特定の識別子で処理する必要があります。
機械が言語を学習すると...
人工知能は人間の言語学習を支援するだけでなく、言語知能をより良くサポートするシステムにも役立ちます。機械は日々訓練され、改良されています。
ディエン准教授のストーリーと同様に、以下はインテリジェントアシスタントが人間の言語を理解するもう 1 つの鮮明な例です。
これは、ベトナムの車載音声アシスタントKikiの研究開発プロセスであり、様々な地域アクセントの音声を良好に認識することを目指しています。コンピュータサイエンスにおいて、音声認識は人工知能(AI)の重要な分野であり、人間の音声をコンピュータアプリケーションが理解しやすい有用な形式に変換します。この技術は、機械と人間のインタラクションの架け橋となっています。音声アシスタントは世界中で欠かせないアプリケーションとなっています。最も人気のあるものは、AppleのSiri、Googleアシスタント、Amazon Alexa、そしてベトナムのKikiです。
Kiki の最初のコードを書いた Nguyen Hoang Khanh Duy 氏は、音声を認識してユーザーに正しく応答できるほど賢い AI モデルをトレーニングするには、言語データが重要な役割を果たすと述べています。
例えば、ベトナム語の車載アシスタント「Kiki」のユーザーにとって、ナビゲーション機能は非常に重要です。そのため、製品開発チームは、ユーザーからの指示を「スムーズに」サポートするためのデータと語彙を準備する必要がありました。データ収集とモデルの学習プロセスを経て、後期バージョンの音声認識品質を示す指標は、オリジナルバージョンと比較して40%向上しました。
車内での音声認識は、ナビゲーションや位置情報の問題だけでなく、他の多くの問題にも関係します。
例えば、Kikiを車内で使用する場合、エンジン音、風切り音、道路上の交通機器の騒音などにより、非常に騒音が多くなります。これは、車内でのKikiの音声認識品質に直接影響を及ぼします。そのため、Kikiチームは、騒音下での音声認識データを強化し、実際の状況に最も適合するようにすることで、この騒音環境の問題を解決する必要があります。
さらに、自己教師学習などの新たな技術を駆使し、Kikiはラベル付けされていないデータからも「学習」し、モデルのさらなる改善を目指しています。このベトナム語音声アシスタントの安定性は、継続的なトレーニングと製品のアップグレードによって向上しています。
言うまでもなく、テクノロジーの進歩は日々、毎時間のように続いています。2022年末にローンチされたChatGPTは、ビッグデータの仕組みという問いに部分的に答えを出しました。テクノロジーは、特に教育や言語といった、これまで人間に大きく依存していた分野において、生活の真ん中に「踏み込んで」います。AIは、上記の具体的な例のように、私たちの学び方、働き方、生活様式を再定義します。
[広告2]
ソース
コメント (0)