Nvidia、音を変換するAI技術を発表

この AI テクノロジーは、テキストの説明に基づいて、トランペットの音を犬の鳴き声に変えたり、メロディーに歌声を加えたりといったユニークな効果を生み出すことができます。

Nvidia ra mắt công nghệ AI biến hóa âm thanh. (Nguồn:

革新的なAIテクノロジーは、音楽に新たな可能性をもたらすと期待されています。（出典：Nvidia）

11月25日、人工知能（AI）システム向けチップとソフトウェアの世界的リーディングカンパニーであるNVIDIAは、「Fugatto」と呼ばれる画期的な技術を発表しました。これは、音楽制作だけでなく、サウンドをクリエイティブな方法で変化・変換できるAIモデルであり、音楽、映画、ビデオゲーム業界のクリエイターにとって画期的な可能性を切り開きます。

Nvidiaによると、Fugattoはテキスト記述に基づいて独自のサウンドエフェクトを作成できるという。例えば、トランペットの音を犬の鳴き声に変えたり、ピアノのメロディーに感情的な歌声を加えたり、録音音声をイギリス訛りからアメリカ訛りに変えたり、さらには声に込められた感情を喜び、悲しみ、そして興奮へと変化させたりすることができる。

「過去50年を振り返ると、コンピューターとシンセサイザーのおかげで音楽は大きく変化しました」と、NVIDIAの応用ディープラーニング研究担当副社長、ブライアン・カタンザーロ氏は述べています。「クリエイティブAIは、音楽、ビデオゲーム、そしてユニークな芸術作品を作りたいと願う一般の人々にも、新たな可能性をもたらすと信じています。」

しかし、NVIDIAはこの技術にはリスクがあることを認めている。「創造的な技術には、虚偽の情報の作成や著作権侵害など、悪用されるリスクが常に存在します」とカタンザーロ氏は警告する。「この技術を使って、偽の声を作ったり、海賊版キャラクターを作ったりする可能性があるのです。」

Fugattoは、AIを活用した音声・動画生成分野における唯一の技術ではありません。Metaのような大企業やRunwayのようなスタートアップ企業も同様のモデルを開発しています。しかし、OpenAIやMetaと同様に、NvidiaもFugattoのリリース時期について具体的な発表をしていません。

[広告2]
ソース