ByteDanceの新ツールは、自信を持ってすべての競合他社を凌駕しています。写真: ByteDance 。 |
TikTokとDouyinの親会社であるByteDanceは、テキストと画像から動画を作成できる人工知能(AI)ツール「Seedance 1.0」を正式にリリースしました。これは、AIベースのコンテンツ作成プラットフォームの開発競争において、この中国のテクノロジーグループにとって重要な前進と捉えられています。
同社は最近、Seedance 1.0に関する詳細な研究論文を発表しました。Seedance 1.0は、詳細なスクリプトや複雑なコマンドを必要とせずに、シンプルな指示を高品質の動画に変換できるように設計されています。このツールは、個々のショットを処理するだけでなく、複数のカメラアングルを組み合わせ、スムーズなトランジションを実現し、動画全体を通してキャラクターの一貫性を保ちます。
「動画内の空間情報と時間情報を分離する方法を発見しました。この技術は、独自の方法で位置を『エンコード』することで、AIがテキストと画像の両方から同じモデルで動画を生成することを学習できるようにします。その結果、AIは異なるシーンをスムーズに自動生成できるようになります」と、バイトダンスは研究論文で述べています。
ByteDanceは、Seedance 1.0は、特にユーザーのアイデアを忠実に再現する能力、画像の鮮明さ、キャラクターの動きの自然さにおいて、市場の既存のAIビデオ作成ツールよりも優れていると自信を持って主張しています。
AIモデルの性能分析と評価に特化したプラットフォームであるArtificial Analysisによると、Seedance 1.0は、GoogleのVeo 3、KuaishouのKling 2.0、OpenAIのSoraといった他の動画生成AIツールを凌駕しています。このツールは、テキストから動画への変換と画像から動画への変換の両方のタスクにおいて、卓越したパフォーマンスを示しています。
同社はまた、Seedance 1.0が、公開されライセンス供与された情報源から収集された膨大な動画データセットを用いて学習されたことも明らかにした。学習用動画は、暴力的またはセンシティブなコンテンツを除去するための厳格なフィルタリングプロセスを経ている。
多くの意見によると、データソースは主に、ByteDance自身が運営する2つのプラットフォームであるTikTokとDouyinから来ていると言われています。
Seedance 1.0 のトレーニング プロセスはいくつかの段階に分かれています。最初は豊富な画像やビデオ データから学習し、次にさまざまなスタイルの詳細なシーン遷移テクニックを学習し続けます。
人間もトレーニングプロセスにおいて重要な役割を果たします。エンジニアはモデルの学習に使用する高品質な動画を選択します。トレーニングループは、Seedance 1.0がオンデマンドで生成される大量の動画から最適な結果を選択できるようになるまで継続されます。
現在、Seedance 1.0では動画の最大再生時間が5秒に制限されています(Veo 3は8秒)。しかし、処理速度が高速なのが大きな利点で、フルHD動画の作成にわずか41秒しかかかりません。Seedance 1.0の欠点は、Googleの競合製品のように自動音声ダビングに対応していないことです。
ByteDance は、ソーシャル ネットワーク上のプロモーション ビデオや短いコンテンツを制作するニーズに応えるため、一般ユーザーとプロのコンテンツ クリエイターの両方向けにこのツールを近日中にリリースする予定です。
Seedance 1.0以前にも、ByteDanceはOmniHuman、Goku、Jimeng AIといったAI動画作成ツールを開発していました。しかし、Seedance 1.0は、AI動画作成機能において競合他社を凌駕できると同社が自信を持って主張する初の製品です。
出典: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html
コメント (0)