(Dan Tri) - ByteDance, perusahaan induk TikTok, mengejutkan semua orang ketika memperkenalkan alat AI yang mampu membuat video dengan konten realistis.
ByteDance, perusahaan teknologi di balik jejaring sosial TikTok, baru saja memperkenalkan model kecerdasan buatan (AI) baru bernama OmniHuman-1, dengan kemampuan menciptakan video animasi yang tampak nyata.
ByteDance menyatakan bahwa OmniHuman-1 didasarkan pada teknologi deepfake, yang memungkinkannya membuat video dengan gerakan yang sangat halus dan sangat sulit dikenali sebagai produk AI. ByteDance dengan yakin mengklaim bahwa perangkat AI-nya dapat menghasilkan produk dengan kualitas superior dibandingkan perangkat pembuat video AI lain yang ada.
Video pembicaraan Albert Einstein yang dibuat oleh OmniHuman-1 dari gambar ilmuwan (Video: ByteDance).
Menurut para peneliti ByteDance, OmniHuman-1 hanya membutuhkan satu gambar dan suara sebagai sampel, misalnya suara orang acak atau suara nyanyian. Berdasarkan data ini, mesin AI dapat menghasilkan video berdurasi berapa pun, dengan suara atau suara nyanyian yang identik dengan sampel audio.
OmniHuman-1 juga dapat mengedit dan memodifikasi video yang ada untuk mengubah konten video asli.
Selain itu, OmniHuman-1 juga memungkinkan pengguna untuk membuat video baru dengan berbagai gaya visual dan audio, seperti video animasi atau gaya sinematik atau video yang tampak nyata.
Video dibuat oleh OmniHuman-1 atas permintaan pengguna (Video: ByteDance).
Pengguna hanya perlu memberikan persyaratan pada rasio aspek, rasio tubuh (potret, setengah tubuh, tubuh penuh atau semua dalam satu), alat AI ini dapat membuat video dengan keaslian tertinggi, termasuk gerakan, pencahayaan, detail sekitar...
ByteDance belum secara resmi merilis OmniHuman-1 ke publik, tetapi perusahaan telah membagikan contoh video yang dibuat oleh alat tersebut.
Video berdurasi 23 detik dibuat dari gambar Albert Einstein, di mana ilmuwan terkenal itu memberikan ceramah, dengan gerakan wajah dan gerakan bibir yang tampak nyata.
Beberapa video pendek lainnya yang dibuat oleh OmniHuman-1 menunjukkan orang-orang melakukan presentasi dengan gerak tubuh dan ekspresi wajah yang tampak nyata.
Video karakter yang memberikan presentasi, dibuat oleh OmniHuman-1 dari gambar diam (Video: ByteDance).
Video demonstrasi kemampuan OmniHuman-1 telah membuat komunitas daring dan komunitas teknologi kagum, banyak yang mengakui bahwa ini adalah video palsu paling realistis yang pernah mereka lihat.
Peneliti ByteDance mengatakan mereka telah membangun model AI yang mampu mencampur data dari gambar, video, dan audio untuk membuat video realistis, dengan proporsi wajah, tubuh, ekspresi wajah, tindakan... semirip mungkin dengan manusia.
Tim peneliti mengatakan bahwa video yang dibuat oleh AI memiliki wajah alami, gerakan kepala, gestur... yang sesuai dengan suara dan pemandangan di sekitarnya, membantu meningkatkan "realisme" dalam video.
ByteDance belum mengungkapkan kapan OmniHuman-1 akan tersedia bagi pengguna.
Video yang dibuat oleh OmniHuman-1 dari gambar, dengan pemandangan di luar jendela kereta berubah secara realistis (Video: ByteDance).
Munculnya OmniHuman-1 menunjukkan kemampuan luar biasa alat AI yang berasal dari Tiongkok, tetapi banyak yang khawatir bahwa OmniHuman-1 dapat digunakan untuk tujuan jahat, seperti membuat video selebriti palsu untuk menyebarkan informasi palsu, penipuan, atau bahkan membuat video porno palsu untuk pemerasan.
Perlombaan pengembangan AI makin sengit antara AS dan China, karena kedua negara adidaya ini terus-menerus memperkenalkan perangkat AI dengan fitur-fitur unggul untuk mengalahkan lawan-lawannya.
Beberapa hari yang lalu, OpenAI juga mengintegrasikan fitur baru ke dalam ChatGPT, yang memungkinkan alat tersebut menyelesaikan laporan dari sejumlah besar data hanya dalam beberapa menit, sebuah tugas yang memerlukan waktu berjam-jam bagi manusia untuk menyelesaikannya.
Deepfake adalah teknologi kecerdasan buatan yang menggunakan teknik sintesis gambar seseorang untuk menggabungkan dan melapiskan gambar wajah ke video atau gambar orang lain.
Deepfake akan melalui "proses pembelajaran", berdasarkan data masukan untuk membuat model dan memilih algoritma yang tepat untuk terus memproses dan belajar dari model tersebut. Setelah periode "pembelajaran", deepfake dapat menggabungkan wajah dengan akurasi tinggi yang sulit dikenali dengan mata telanjang.
[iklan_2]
Sumber: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm
Komentar (0)