เครื่องมือใหม่ของ ByteDance เหนือกว่าคู่แข่งทั้งหมดอย่างมั่นใจ ภาพ: ByteDance |
ByteDance บริษัทแม่ของ TikTok และ Douyin เพิ่งเปิดตัว Seedance 1.0 อย่างเป็นทางการ ซึ่งเป็นเครื่องมือปัญญาประดิษฐ์ (AI) ที่สามารถสร้าง วิดีโอ จากข้อความและรูปภาพได้ ถือเป็นก้าวสำคัญสำหรับกลุ่มบริษัทเทคโนโลยีจีนในการพัฒนาแพลตฟอร์มการสร้างคอนเทนต์ที่ใช้ AI
บริษัทเพิ่งเผยแพร่งานวิจัยโดยละเอียดเกี่ยวกับ Seedance 1.0 ซึ่งออกแบบมาเพื่อแปลงคำแนะนำง่ายๆ ให้เป็นวิดีโอคุณภาพสูงโดยไม่ต้องใช้สคริปต์หรือคำสั่งที่ซับซ้อน เครื่องมือนี้ไม่เพียงแต่จัดการช็อตเดี่ยวๆ เท่านั้น แต่ยังผสานรวมมุมกล้องที่หลากหลาย การเปลี่ยนฉากที่ราบรื่น และรับประกันความสอดคล้องของตัวละครตลอดทั้งวิดีโอ
“เราค้นพบวิธีแยกข้อมูลเชิงพื้นที่และเวลาในวิดีโอ เทคโนโลยีนี้ใช้วิธีการเฉพาะในการ ‘เข้ารหัส’ ตำแหน่ง ซึ่งทำให้ AI สามารถเรียนรู้การสร้างวิดีโอจากทั้งข้อความและรูปภาพในแบบจำลองเดียวกันได้ ส่งผลให้ AI สามารถสร้างวิดีโอที่มีฉากต่างๆ ได้อย่างราบรื่นโดยอัตโนมัติ” ByteDance กล่าวในงานวิจัยนี้
ByteDance อ้างอย่างมั่นใจว่า Seedance 1.0 เหนือกว่าเครื่องมือสร้างวิดีโอ AI ที่มีอยู่ในตลาด โดยเฉพาะอย่างยิ่งในด้านความสามารถในการติดตามความคิดของผู้ใช้ ความคมชัดของภาพ และความเป็นธรรมชาติในการเคลื่อนไหวของตัวละคร
จากข้อมูลของ Artificial Analysis ซึ่งเป็นแพลตฟอร์มที่เชี่ยวชาญด้านการวิเคราะห์และประเมินประสิทธิภาพของโมเดล AI พบว่า Seedance 1.0 ได้ก้าวข้ามเครื่องมือ AI สร้างวิดีโออื่นๆ ไปแล้ว เช่น Veo 3 ของ Google, Kling 2.0 ของ Kuaishou หรือ Sora ของ OpenAI เครื่องมือนี้แสดงให้เห็นถึงประสิทธิภาพที่โดดเด่นทั้งในงานแปลงข้อความเป็นวิดีโอและงานแปลงรูปภาพเป็นวิดีโอ
บริษัทยังเปิดเผยอีกว่า Seedance 1.0 ได้รับการฝึกอบรมจากชุดข้อมูลวิดีโอขนาดใหญ่ ซึ่งรวบรวมจากแหล่งข้อมูลสาธารณะและได้รับอนุญาต วิดีโอฝึกอบรมเหล่านี้ผ่านกระบวนการกรองที่เข้มงวดเพื่อลบเนื้อหาที่มีความรุนแรงหรือละเอียดอ่อนออก
หลายความเห็นระบุว่าแหล่งที่มาของข้อมูลส่วนใหญ่มาจาก TikTok และ Douyin ซึ่งเป็นสองแพลตฟอร์มที่ดำเนินการโดย ByteDance เอง
กระบวนการฝึกอบรม Seedance 1.0 แบ่งออกเป็นหลายขั้นตอน: ขั้นแรกเรียนรู้จากข้อมูลรูปภาพและวิดีโอที่หลากหลาย จากนั้นเรียนรู้เทคนิคการเปลี่ยนฉากเชิงลึกในรูปแบบต่างๆ ต่อไป
มนุษย์ก็มีบทบาทสำคัญในกระบวนการฝึกอบรมเช่นกัน เนื่องจากวิศวกรจะเลือกวิดีโอคุณภาพสูงให้แบบจำลองเรียนรู้ วงจรการฝึกอบรมจะดำเนินต่อไปจนกระทั่ง Seedance 1.0 สามารถเลือกผลลัพธ์ที่ดีที่สุดจากวิดีโอจำนวนมากที่สร้างขึ้นตามความต้องการได้
ปัจจุบัน Seedance 1.0 จำกัดความยาววิดีโอสูงสุดไว้ที่ 5 วินาที (เทียบกับ Veo 3 ที่ 8 วินาที) อย่างไรก็ตาม ข้อได้เปรียบที่โดดเด่นคือความเร็วในการประมวลผลที่รวดเร็ว โดยใช้เวลาเพียง 41 วินาทีในการสร้างวิดีโอ Full HD ข้อเสียอย่างหนึ่งของ Seedance 1.0 คือไม่รองรับการพากย์เสียงอัตโนมัติเหมือนคู่แข่งจาก Google
ByteDance มีแผนที่จะเปิดตัวเครื่องมือนี้ในเร็วๆ นี้ ทั้งสำหรับผู้ใช้ทั่วไปและผู้สร้างเนื้อหาระดับมืออาชีพ เพื่อตอบสนองความต้องการในการผลิตวิดีโอโปรโมตหรือเนื้อหาสั้นๆ บนเครือข่ายโซเชียล
ก่อน Seedance 1.0 บริษัท ByteDance ได้พัฒนาเครื่องมือสร้างวิดีโอด้วย AI อย่างเช่น OmniHuman, Goku และ Jimeng AI อย่างไรก็ตาม Seedance 1.0 เป็นผลิตภัณฑ์ตัวแรกที่บริษัทมั่นใจและมั่นใจว่าสามารถเหนือกว่าคู่แข่งในด้านความสามารถในการสร้างวิดีโอด้วย AI
ที่มา: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html
การแสดงความคิดเห็น (0)