DeepSeek เลื่อนการเปิดตัวโมเดล R2 ภาพ: Bloomberg |
DeepSeek บริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ของจีน ยังไม่ได้เปิดตัวโมเดลภาษา R2 อย่างเป็นทางการ ตามรายงานจาก The Information เมื่อวันที่ 26 มิถุนายน สาเหตุหลักคือ Liang Wenfeng ซีอีโอไม่พอใจกับประสิทธิภาพปัจจุบันของโมเดลที่ทีมงานกำลังพัฒนาอยู่
คาดว่า R2 จะเป็นการอัพเกรดที่สำคัญของโมเดล R1 ซึ่งได้รับความนิยมไปทั่วโลกด้วยความสามารถในการอนุมานและการเขียนโปรแกรมที่เหนือกว่า ก่อนหน้านี้ Reuters รายงานไว้ว่า DeepSeek วางแผนที่จะเปิดตัว R2 ในเดือนพฤษภาคม โดยมีเป้าหมายเพื่อปรับปรุงความสามารถในการจัดการภาษาต่างๆ ท่ามกลางความต้องการที่เพิ่มขึ้นในการแปลเป็นภาษาท้องถิ่นด้วย AI
ในช่วงหลายเดือนที่ผ่านมา ทีมวิศวกรของ DeepSeek ได้ปรับปรุงโมเดล R2 อย่างต่อเนื่อง แต่การตัดสินใจว่าจะเผยแพร่โมเดลนี้เมื่อใดยังคงเป็นหน้าที่ของซีอีโอ Liang แหล่งข่าวภายในกล่าวว่าเขาระมัดระวังในทุกแง่มุมของผลิตภัณฑ์ ตั้งแต่ประสิทธิภาพทางเทคนิคไปจนถึงความสามารถในการทำกำไร เพื่อหลีกเลี่ยงความเสี่ยงที่ไม่จำเป็น
นอกเหนือจากปัจจัยภายในแล้ว DeepSeek ยังเผชิญกับความท้าทายภายนอกอีกด้วย โดยเฉพาะอย่างยิ่งการขาดแคลนอุปทานชิป AI ทำให้บริษัทดำเนินงานได้ยากเนื่องจากพลังฮาร์ดแวร์มีจำกัด บริษัทคลาวด์คอมพิวติ้งของจีนซึ่งเป็นพันธมิตรในการจัดจำหน่ายโมเดลให้กับลูกค้าองค์กรกำลังประสบปัญหาเนื่องจากข้อจำกัดในการส่งออกเทคโนโลยีของสหรัฐฯ เมื่อเร็วๆ นี้
ตาม ข้อมูล ระบุว่าลูกค้าปัจจุบันส่วนใหญ่ใช้ชิปรุ่น R1 บนแพลตฟอร์มชิป H20 ของ Nvidia อย่างไรก็ตาม ตั้งแต่เดือนเมษายนเป็นต้นมา ชิปดังกล่าวถูกจัดให้อยู่ในรายชื่อข้อจำกัดการส่งออกของรัฐบาลสหรัฐฯ ซึ่งถือเป็นชิป AI เพียงรายการเดียวที่ Nvidia สามารถส่งออกไปยังจีนได้อย่างถูกกฎหมายในขณะนั้น
ในขณะเดียวกัน DeepSeek ดูเหมือนจะได้ติดต่อผู้ให้บริการคลาวด์ในประเทศรายใหญ่หลายรายและส่งข้อมูลจำเพาะทางเทคนิคเพื่อเตรียมโครงสร้างพื้นฐานสำหรับ R2 อย่างไรก็ตาม ความสามารถในการปรับขนาดของโมเดลยังคงไม่ชัดเจน เนื่องจากขึ้นอยู่กับทั้งการตัดสินใจของผู้นำและสถานการณ์ตลาดชิป AI ทั่วโลก
ที่มา: https://znews.vn/deepseek-hoan-ra-mat-ai-moi-post1564148.html
การแสดงความคิดเห็น (0)