Meta Platforms ได้เปิดตัวโมเดลปัญญาประดิษฐ์ Llama 3 เวอร์ชันที่กว้างขวางที่สุด โดยแสดงให้เห็นถึงการปรับปรุงความสามารถทางภาษาและการแก้ปัญหาทางคณิตศาสตร์ บริษัทประกาศเปิดตัวโมเดล AI ใหม่ ซึ่งสามารถสื่อสารในแปดภาษาที่แตกต่างกัน ผลิตโค้ดคอมพิวเตอร์คุณภาพสูงขึ้น และจัดการกับปัญหาทางคณิตศาสตร์ที่ซับซ้อนกว่ารุ่นก่อน
โมเดล Llama 3 ที่มีพารามิเตอร์ 405 พันล้านตัว แสดงถึงก้าวสําคัญจากการทําซ้ําครั้งล่าสุด และเป็นส่วนหนึ่งของการผลักดันของ Meta ต่อโมเดลคู่แข่งที่จ่ายเงิน เช่น GPT-4 ของ OpenAI ซึ่งมีพารามิเตอร์หนึ่งล้านล้านตัว และโมเดลที่กําลังจะมาถึงจาก Amazon ที่มีพารามิเตอร์สองล้านล้านตัว
ในการเคลื่อนไหวเชิงกลยุทธ์ Meta กําลังเสนอโมเดล Llama 3 ฟรีให้กับนักพัฒนาเป็นส่วนใหญ่ ซึ่ง Mark Zuckerberg ซีอีโอเชื่อว่าจะส่งเสริมนวัตกรรมและลดการพึ่งพาคู่แข่ง คาดว่าจะมีการนําแชทบอท AI ที่ขับเคลื่อนโดยโมเดลเหล่านี้มาใช้อย่างแพร่หลาย โดย Zuckerberg คาดการณ์ว่าจะกลายเป็นผู้ช่วย AI ที่ได้รับความนิยมมากที่สุดภายในสิ้นปีนี้ ซึ่งมีผู้ใช้งานหลายร้อยล้านคนแล้ว
การเปิดตัวนี้เน้นย้ําถึงการแข่งขันของอุตสาหกรรมเทคโนโลยีเพื่อแสดงให้เห็นถึงคุณค่าของโมเดลภาษาขนาดใหญ่ในการจัดการกับความท้าทายในการให้เหตุผลที่ซับซ้อน นักวิทยาศาสตร์ AI ชั้นนําของ Meta แนะนําว่าในขณะที่โมเดลเหล่านี้กําลังก้าวไปสู่ระดับใหม่ แต่ระบบ AI ทางเลือกอาจจําเป็นสําหรับความก้าวหน้าในอนาคต
นอกจากรุ่นเรือธงแล้ว Meta ยังอัปเดตเวอร์ชันพารามิเตอร์ที่เบากว่า 8 พันล้านและ 70 พันล้าน ขณะนี้โมเดลเหล่านี้มี "หน้าต่างบริบท" ที่ขยายออกไป ซึ่งช่วยให้สามารถจัดการกับคําขอของผู้ใช้ที่ใหญ่ขึ้นและจดจําข้อมูลเพิ่มเติม ซึ่งเป็นประโยชน์อย่างยิ่งสําหรับการสร้างโค้ดคอมพิวเตอร์
Ahmad Al-Dahle หัวหน้าฝ่าย Generative AI ของ Meta กล่าวถึงความสําคัญของหน้าต่างบริบทที่ใหญ่ขึ้น เนื่องจากเป็นข้อเสนอแนะหลักจากชุมชนนักพัฒนา ทีมของเขายังปรับปรุงความสามารถของโมเดล Llama 3 ในการแก้ปัญหาทางคณิตศาสตร์โดยใช้ข้อมูลที่สร้างโดย AI สําหรับการฝึกอบรม
แม้จะมีค่าใช้จ่ายที่เกี่ยวข้องซึ่งดึงดูดการตรวจสอบของนักลงทุน แต่กลยุทธ์ของ Meta อาจขัดขวางรูปแบบธุรกิจของคู่แข่งได้หากนักพัฒนาชอบโมเดลฟรี บริษัทได้อวดเกี่ยวกับประสิทธิภาพของ Llama 3 ในเกณฑ์มาตรฐาน โดยมีคะแนนที่แข่งขันหรือสูงกว่ารุ่นชั้นนําอย่าง GPT-4o และ Claude 3.5 Sonnet ในการทดสอบคณิตศาสตร์และความรู้
โมเดล Llama 3 ได้คะแนน 73.8 ในเกณฑ์มาตรฐาน MATH ตามหลัง 76.6 ของ GPT-4o และนําหน้า 71.1 ของ Claude 3.5 Sonnet นอกจากนี้ยังได้คะแนน 88.6 ในเกณฑ์มาตรฐาน MMLU ซึ่งครอบคลุมวิชาต่างๆ เกือบจะใกล้เคียงกับ 88.7 ของ GPT-4o และเหนือกว่า 88.3 ของ Claude 3.5 Sonnet เล็กน้อย
เมื่อมองไปข้างหน้า นักวิจัยของ Meta กําลังล้อเลียนการพัฒนาโมเดลเวอร์ชัน "มัลติโมดอล" ซึ่งจะรวมความสามารถของรูปภาพ วิดีโอ และคําพูดควบคู่ไปกับฟังก์ชันข้อความหลัก สิ่งเหล่านี้คาดว่าจะสามารถแข่งขันกับโมเดลมัลติโมดอลอื่นๆ เช่น Gemini 1.5 ของ Google และ Claude 3.5 Sonnet ของ Anthropic และมีกําหนดวางจําหน่ายในปลายปีนี้
รอยเตอร์มีส่วนร่วมในบทความนี้บทความนี้ถูกแปลโดยใช้ความช่วยเหลือจากปัญญาประดิษฐ์(AI) สำหรับข้อมูลเพิ่มเติม โปรดอ่านข้อกำหนดการใช้งาน