Apple, Microsoft, Meta และ Google ต่างเปิดตัวโมเดล AI ใหม่ที่มี "พารามิเตอร์" น้อยลงแต่ยังคงความสามารถอันทรงพลัง ซึ่งถือเป็นการเคลื่อนไหวที่เป็นส่วนหนึ่งของความพยายามของกลุ่มเทคโนโลยีที่ต้องการส่งเสริมให้ธุรกิจที่มีข้อจำกัดทางการเงินใช้ AI
ภาพประกอบ: FT
โดยทั่วไป ยิ่งจำนวนพารามิเตอร์สูงขึ้นเท่าใด ประสิทธิภาพของซอฟต์แวร์ AI ก็จะยิ่งดีขึ้นเท่านั้น และงานต่างๆ ก็จะซับซ้อนและละเอียดอ่อนมากขึ้นเท่านั้น โมเดล GPT-4o ล่าสุดของ OpenAI และ Gemini 1.5 Pro ของ Google ซึ่งเปิดตัวในสัปดาห์นี้ คาดว่าจะมีพารามิเตอร์มากกว่า 1 ล้านล้านพารามิเตอร์ ขณะเดียวกัน Meta กำลังฝึกอบรมโมเดล Llama แบบโอเพนซอร์สที่มีพารามิเตอร์ 4 แสนล้านพารามิเตอร์
ความกังวลเกี่ยวกับข้อมูลและความรับผิดด้านลิขสิทธิ์ทำให้บริษัทเทคโนโลยียักษ์ใหญ่ เช่น Meta และ Google ออกโมเดลภาษาขนาดเล็กที่มีพารามิเตอร์เพียงไม่กี่พันล้านตัว ซึ่งมีราคาถูกกว่า ประหยัดพลังงาน ปรับแต่งได้ ใช้พลังงานน้อยกว่าในการฝึกและรัน และยังสามารถป้องกันไม่ให้มีการจัดเก็บข้อมูลที่ละเอียดอ่อนได้อีกด้วย
Eric Boyd รองประธานฝ่ายองค์กรของ Azure AI Platform ของ Microsoft ซึ่งจำหน่ายโมเดล AI ให้กับธุรกิจต่างๆ กล่าวว่า “การได้รับคุณภาพสูงในราคาที่ต่ำกว่า จะช่วยให้คุณมีแอปพลิเคชันให้ลูกค้าเข้าถึงได้มากขึ้น”
Google, Meta, Microsoft และบริษัทสตาร์ทอัพสัญชาติฝรั่งเศส Mistral ได้เปิดตัวโมเดลภาษาขนาดเล็กเช่นกัน แต่ยังคงแสดงให้เห็นถึงความคืบหน้าและสามารถมุ่งเน้นไปที่งานเฉพาะได้ดีขึ้น
นิค เคล็ก ประธานฝ่ายกิจการทั่วโลกของ Meta กล่าวว่าโมเดลพารามิเตอร์ 8 พันล้านตัวใหม่ของ Llama 3 นั้นเทียบได้กับ GPT-4 ไมโครซอฟท์กล่าวว่าโมเดล Phi-3 ขนาดเล็กที่มีพารามิเตอร์ 7 พันล้านตัวนั้นมีประสิทธิภาพเหนือกว่า GPT-3.5 ซึ่งเป็นโมเดลเวอร์ชันก่อนหน้าของ OpenAI
ไมโครชิปยังสามารถประมวลผลงานในเครื่องอุปกรณ์ได้แทนที่จะส่งข้อมูลไปยังคลาวด์ ซึ่งอาจดึงดูดลูกค้าที่ใส่ใจความเป็นส่วนตัวและต้องการให้แน่ใจว่าข้อมูลจะยังคงอยู่ในเครือข่าย
ชาร์ลอตต์ มาร์แชลล์ หุ้นส่วนบริษัทกฎหมายแอดเดิลชอว์ ก็อดดาร์ด กล่าวว่า “หนึ่งในความท้าทายที่ฉันคิดว่าลูกค้าของเราหลายคนต้องเผชิญ” เมื่อนำผลิตภัณฑ์ AI เชิงสร้างสรรค์มาใช้ คือการปฏิบัติตามข้อกำหนดด้านกฎระเบียบเกี่ยวกับการประมวลผลและการส่งข้อมูล เธอกล่าวว่าโมเดลขนาดเล็กกว่ามอบ “โอกาสให้ธุรกิจเอาชนะ” ข้อกังวลด้านกฎระเบียบและต้นทุน
รุ่นเล็กยังช่วยให้ฟีเจอร์ AI สามารถทำงานบนอุปกรณ์ต่างๆ เช่น โทรศัพท์มือถือได้อีกด้วย โมเดล “Gemini Nano” ของ Google ถูกฝังอยู่ในโทรศัพท์ Pixel รุ่นล่าสุดและสมาร์ทโฟน S24 รุ่นล่าสุดของ Samsung
Apple ยังเปิดเผยว่ากำลังพัฒนาโมเดล AI เพื่อใช้งานบน iPhone รุ่นขายดี เมื่อเดือนที่แล้ว บริษัทยักษ์ใหญ่ในซิลิคอนแวลลีย์ได้เปิดตัว OpenELM โมเดลขนาดเล็กที่ออกแบบมาเพื่อทำงานแบบข้อความ
Boyd จาก Microsoft กล่าวว่าโมเดลขนาดเล็กจะนำไปสู่ "แอปพลิเคชันที่น่าสนใจ รวมถึงโทรศัพท์และแล็ปท็อป"
แซม อัลท์แมน ผู้อำนวยการ OpenAI กล่าวเมื่อเดือนพฤศจิกายนว่า บริษัทได้นำเสนอโมเดล AI ขนาดต่างๆ ให้กับลูกค้า “เพื่อวัตถุประสงค์ที่แตกต่างกัน” “มีบางสิ่งที่โมเดลขนาดเล็กกว่าจะทำได้ดีจริงๆ ผมตื่นเต้นกับเรื่องนี้มาก” เขากล่าว
อย่างไรก็ตาม Altman กล่าวเสริมว่า OpenAI จะยังคงมุ่งเน้นไปที่การสร้างแบบจำลอง AI ที่ใหญ่ขึ้นพร้อมความสามารถในการปรับขนาด รวมถึงความสามารถในการใช้เหตุผล วางแผน และดำเนินการงาน และในที่สุดก็บรรลุถึงระดับสติปัญญาของมนุษย์
ฮวงไห่ (ตามรายงานของ FT)
ที่มา: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html
การแสดงความคิดเห็น (0)