ในยุค AI เนื้อหาที่เกี่ยวข้องกับมนุษย์ล้วนๆ มีปริมาณน้อยลง ภาพ: Advertising Week |
การเกิดขึ้นของ ChatGPT ในปี 2022 จะส่งผลให้เนื้อหาปัญญาประดิษฐ์แพร่หลายไปทั่วอินเทอร์เน็ต ตาม การคาดการณ์ของ Gartner ระบุว่าภายในปี 2026 เนื้อหา 90% บนอินเทอร์เน็ตจะสร้างขึ้นโดย AI ซึ่งรวมถึงข้อความ รูปภาพ และ วิดีโอ
AI ได้รับการฝึกฝนให้เข้าใจความคิดของมนุษย์ แต่หากไม่มีข้อมูลที่มนุษย์สร้างขึ้นอย่างแท้จริง เทคโนโลยีจะใช้ข้อมูลเก่าของตัวเอง เช่น เครื่องถ่ายเอกสารที่จำลองตัวเองขึ้นมา
นักวิจัยหลายคนเปรียบเทียบเนื้อหาต้นฉบับที่มนุษย์สร้างขึ้นกับเหล็ก “สะอาด” ในยุคปัจจุบัน ซึ่งเป็นวัสดุที่หายากและหาได้ยาก พวกเขากลัวว่าหากไม่มีใครบันทึกสำเนาของข้อมูลเหล่านี้ก่อนปี 2022 อินเทอร์เน็ตจะสูญเสียความบริสุทธิ์ไปโดยสิ้นเชิง
ภัยพิบัติทางประวัติศาสตร์ที่เกิดขึ้นใหม่
ในยุคหลังนิวเคลียร์ นักวิทยาศาสตร์ ได้ค้นพบว่าเหล็กทั้งหมดที่ผลิตหลังจากปี 1945 ล้วนปนเปื้อน ระเบิดปรมาณูทำให้บรรยากาศปนเปื้อนรังสี ซึ่งแพร่กระจายไปยังโลหะที่ผลิตขึ้นในสภาพแวดล้อมนั้น
ซึ่งทำให้เหล็กจำนวนมากไม่สามารถนำไปใช้ในอุปกรณ์วัดที่มีความแม่นยำสูง เช่น เครื่องตรวจจับไกเกอร์และเซ็นเซอร์ตรวจจับที่ละเอียดอ่อนอื่นๆ ได้ วิธีแก้ปัญหาคือกู้เหล็กเก่าจากเรือรบที่จมอยู่ใต้ท้องทะเลลึก ซึ่งจะไม่ได้รับผลกระทบจากกัมมันตภาพรังสี
สำหรับนักพัฒนา AI โมเดลส่วนใหญ่ได้รับการฝึกฝนจากข้อมูลมนุษย์จำนวนมากที่รวบรวมจากอินเทอร์เน็ต แต่หากซอฟต์แวร์ในปัจจุบันเรียนรู้จากข้อความที่สร้างขึ้นในอดีต โมเดลเหล่านี้อาจเสี่ยงต่อการพังทลาย ส่งผลให้ความคิดสร้างสรรค์และความลึกของโมเดลลดน้อยลง
![]() |
เรือรบฮินเดนเบิร์กที่จมในสมัยสงครามโลกครั้งที่ 1 ได้รับการกู้ขึ้นมาแล้ว ภาพ: Reuters Connect |
Will Allen รองประธานของ Cloudflare ซึ่งดำเนินการเครือข่ายอินเทอร์เน็ตที่ใหญ่ที่สุดแห่งหนึ่งของโลก กล่าวว่าสิ่งนี้ทำให้เนื้อหาที่สร้างโดยมนุษย์ โดยเฉพาะก่อนปี 2022 มีคุณค่ามากขึ้น เขาบอกว่าสิ่งนี้ช่วยยึดโมเดล AI และสังคมโดยรวมให้สอดคล้องกับความเป็นจริงร่วมกัน หากไม่มีรากฐานนั้น ทุกอย่างก็จะซับซ้อนขึ้น
พื้นฐานมีความสำคัญอย่างยิ่งในสาขาที่ต้องใช้เทคนิคขั้นสูง เช่น การแพทย์ กฎหมาย หรือภาษี ตัวอย่างเช่น แพทย์ควรพึ่งพาเนื้อหาที่เขียนโดยผู้เชี่ยวชาญและการวิจัยจริง ไม่ใช่จากแหล่งที่มาที่สร้างโดย AI
อันตรายนี้กำลังกลายเป็นจริงมากขึ้น หนึ่งปีหลังจากเปิดตัว ChatGPT นักลงทุนเสี่ยงภัย Paul Graham กล่าวว่าเขาต้องค้นหาเนื้อหาเก่าๆ เพื่อค้นหาแบบง่ายๆ เพื่อหลีกเลี่ยง “เหยื่อ SEO ที่สร้างโดย AI” Malte Ubl ซึ่งเป็น CTO ของ Vercel ซึ่งเป็นบริษัทสตาร์ทอัพด้าน AI ตอบว่า Graham กำลังกรองเนื้อหาบนอินเทอร์เน็ต “ก่อนที่จะถูก AI ปนเปื้อน”
Matt Rickard อดีตวิศวกรของ Google เห็นด้วย โดยเขาเขียนไว้ในบล็อกโพสต์เมื่อปี 2023 ว่า AI ดึงข้อมูลจากอินเทอร์เน็ต แต่เนื้อหาในอินเทอร์เน็ตส่วนใหญ่นั้นสร้างขึ้นโดย AI "ผลลัพธ์ของแชทบ็อตนั้นตรวจจับได้ยาก การค้นหาข้อมูลการฝึกอบรมที่ไม่ถูก AI แทรกแซงจะกลายเป็นเรื่องยากมากขึ้นเรื่อยๆ" Rickard อธิบาย
“การค้นหาเหล็กกล้าใต้ท้องทะเล”
คำตอบสำหรับปัญหานี้อยู่ที่การรักษาข้อมูลเวอร์ชันที่มนุษย์สร้างขึ้นก่อนที่ AI จะเติบโตอย่างรวดเร็ว หนึ่งในผู้บุกเบิกคือ John Graham-Cumming ซึ่งเป็นสมาชิกคณะกรรมการและ CTO ของ Cloudflare
โครงการของเขาซึ่งมีชื่อว่าเว็บไซต์ LowBackgroundSteel.ai ได้ทำการรวบรวมชุดข้อมูล ลิงก์ และสื่อต่างๆ ที่มีอยู่ก่อนปี 2022 ตัวอย่างหนึ่งที่ยกมาคือ Arctic Code Vault ของ GitHub ซึ่งเป็นที่เก็บซอฟต์แวร์โอเพ่นซอร์สที่ถูกฝังอยู่ในเหมืองถ่านหินร้างในนอร์เวย์ โดยเก็บรักษาไว้ตั้งแต่เดือนกุมภาพันธ์ 2020
โครงการรักษาข้อมูลของมนุษย์ของ Graham-Cumming ภาพ: Lowbackgroundsteel.ai |
แหล่งข้อมูลอีกแหล่งหนึ่งที่เขาแสดงรายการคือ "wordfreq" ซึ่ง เป็นโครงการที่ติดตามความถี่ ในการใช้ คำศัพท์ออนไลน์ นักภาษาศาสตร์ Robyn Speer ได้ดูแลโครงการนี้จนถึงปี 2021
Speer กล่าวว่า “Generative AI ได้ทำให้ข้อมูลปนเปื้อน” เธอยกตัวอย่างความหมกมุ่นของ ChatGPT กับคำว่า “delve” ซึ่งปรากฏขึ้นบ่อยขึ้นเรื่อยๆ ในช่วงนี้ ซึ่งทำให้ข้อมูลบนอินเทอร์เน็ตบิดเบือน ทำให้ข้อมูลไม่น่าเชื่อถือในฐานะที่สะท้อนถึงวิธีการเขียนและการคิดของมนุษย์
โมเดล AI ที่ได้รับการฝึกอบรมบางส่วนเกี่ยวกับเนื้อหาสังเคราะห์สามารถเร่งความเร็วเวิร์กโฟลว์และลดความเบื่อหน่ายในการทำงานสร้างสรรค์ได้ แต่เหนือไปกว่าประสิทธิภาพแล้ว ผู้ใช้ยังอาจต้องพึ่งพาเนื้อหาที่สร้างโดยมนุษย์เพื่อให้ตัดสินใจได้อย่างแม่นยำ เช่น การใช้ "เหล็กกล้าพื้นต่ำ" เพื่อการวัดที่แม่นยำ
นักวิทยาศาสตร์ได้พัฒนาวิธีการต่าง ๆ ในการผลิตเหล็กโดยใช้ออกซิเจนบริสุทธิ์ ซึ่งเป็นเครื่องเตือนใจว่าการอนุรักษ์อดีตอาจเป็นหนทางเดียวที่จะสร้างอนาคตที่เชื่อถือได้ ตามรายงานของ Business Insider
ที่มา: https://znews.vn/thu-sap-thanh-hoai-niem-tren-internet-post1559151.html
การแสดงความคิดเห็น (0)