OpenAIがテキストベースのビデオ作成ツールをリリース

[広告_1]

CNBCによると、OpenAIはSoraを発表しました。これは、同社の従来の画像生成AIツールDALL-Eと同様に動作する次世代AIモデルです。ユーザーは希望のシーンを入力するだけで、Soraは高解像度の動画クリップを生成します。また、Soraは静止画からインスピレーションを得た動画クリップを作成したり、既存の動画を拡張したり、欠落したフレームを補ったりすることも可能です。

OpenAI ra mắt công cụ sáng tạo video bằng văn bản- Ảnh 1. — AI生成の動画で、サモエド犬とゴールデンレトリバー犬が夜のネオン街を戯れる

チャットボットや画像生成ツールが消費者やビジネスの世界に浸透し始めたのはつい最近のことですが、動画作成はクリエイティブAIの新たなフロンティアとなる可能性があります。コンテンツ作成はAI愛好家を刺激する一方で、世界的な主要選挙が近づくにつれ、これらの新技術は誤情報に関する深刻な懸念を引き起こしています。機械学習企業Clarityのデータによると、AI生成のディープフェイクの数は前年比900%増加しています。

OpenAIはSoraによって、GoogleやMetaといった企業の動画生成AIツールに対抗しようとしています。同様のAIツールは、Stable Video Diffusionという製品を提供するStability AIなど、他のスタートアップ企業からも提供されています。Amazonもまた、Alexaの指示に基づいて子供向けの短編アニメーションコンテンツを生成することに特化したモデル「Create with Alexa」をリリースしました。

Soraは現在、1分以下の動画生成に制限されています。OpenAIは、より幅広いAIモデルを提供することを目指し、テキスト、画像、動画生成を組み合わせたマルチモーダル性（マルチモーダル性）を目標としています。

これまでのところ、Soraは、誤情報などの脆弱性を検証する「レッドチーム」と呼ばれる少数の安全性テスターグループにのみ提供されています。同社はウェブサイトで公開されている10本のサンプルクリップ以外には、一般向けのデモは公開しておらず、付随する技術ドキュメントは近日中に公開される予定です。

OpenAIはまた、Soraが生成した動画クリップを識別できる「検出分類器」を開発中であり、AI生成コンテンツの識別に役立つ特定のメタデータを出力に含める予定だと述べている。Metaは、AI生成画像を識別するために、まさにこのようなメタデータの使用を検討している。

Soraは、Googleの研究者が2017年に論文で紹介したTransformerアーキテクチャを使用したAIモデルです。OpenAIは発表の中で、Soraは現実世界を理解してシミュレートするモデルの基盤として機能すると述べています。

[広告2]
ソースリンク