เมื่อวันที่ 5 เมษายน 2025 Meta ประกาศเปิดตัว Llama 4 โมเดลภาษาขนาดใหญ่ (LLM) รุ่นใหม่ล่าสุดในตระกูล Llama ชูจุดเด่นคือการเป็นโมเดลแบบ multimodal อย่างแท้จริงที่สามารถเข้าใจและประมวลผลข้อมูลได้หลากหลายรูปแบบ ไม่ใช่แค่เพียงข้อความเท่านั้น
Llama 4 เปิดตัวพร้อมกันสองรุ่นหลัก ได้แก่
สิ่งที่น่าสนใจคือ Llama 4 ทั้งสองรุ่นถูกพัฒนาด้วยสถาปัตยกรรมแบบ “Mixture-of-Experts” (MoE) ซึ่งทำให้โมเดลมีความฉลาดและมีประสิทธิภาพมากขึ้น โดยแต่ละโทเค็นจะถูกประมวลผลโดยกลุ่มพารามิเตอร์ย่อย ๆ เท่านั้น ส่งผลให้ใช้ทรัพยากรในการฝึกฝนและใช้งานน้อยลง แต่ยังคงรักษาคุณภาพของผลลัพธ์ไว้ได้
นอกจากนี้ Llama 4 ยังถูกออกแบบมาให้รองรับความสามารถแบบมัลติโมดัลตั้งแต่เริ่มต้น (natively multimodal) ด้วยการรวมข้อมูลข้อความและภาพเข้าด้วยกันในโครงสร้างโมเดลเดียว ทำให้สามารถเรียนรู้ความสัมพันธ์ระหว่างข้อมูลหลากหลายรูปแบบได้อย่างเป็นธรรมชาติ และยังมีการปรับปรุงส่วนเข้ารหัสภาพ (vision encoder) ให้ทำงานร่วมกับโมเดลภาษาได้ดียิ่งขึ้น
เมต้าเคลมว่า Llama 4 Scout เป็นโมเดลที่ดีที่สุดในระดับเดียวกัน ด้วยความสามารถประมวลผลข้อมูลได้ยาว 10 ล้านโทเค็น ซึ่งถือเป็นผู้นำในอุตสาหกรรม ทำให้สามารถนำไปใช้งานที่ซับซ้อน เช่น การสรุปเอกสารจำนวนมาก การวิเคราะห์พฤติกรรมผู้ใช้ในวงกว้าง หรือการทำความเข้าใจฐานโค้ดขนาดใหญ่
ขณะที่ Llama 4 Maverick โมเดลตัวกลาง เมต้าก็เคลมว่าให้ประสิทธิภาพที่เทียบเคียงหรือเหนือกว่าโมเดลขนาดใหญ่กว่าอย่าง GPT-4o และ Gemini 2.0 Flash ในหลากหลายเกณฑ์มาตรฐาน ไม่ว่าจะเป็นด้านการเขียนโค้ด การให้เหตุผล ความเข้าใจภาษาที่หลากหลาย และความเข้าใจภาพ โดยยังคงมีขนาดพารามิเตอร์ที่เล็กกว่ามาก ทำให้เป็นตัวเลือกที่คุ้มค่าทั้งในด้านประสิทธิภาพและต้นทุน
Llama 4 Scout และ Maverick เป็นโมเดลขนาดเล็กที่ได้มาจากการกลั่นกรองความรู้ (distillation) จาก Llama 4 Behemoth โมเดลขนาดมหึมาที่มีพารามิเตอร์มากถึง 288 พันล้านพารามิเตอร์ ซึ่ง Meta ระบุว่าเป็นหนึ่งใน LLM ที่ฉลาดที่สุดในโลก และมีประสิทธิภาพเหนือกว่า GPT-4.5, Claude Sonnet 3.7 และ Gemini 2.0 Pro ในหลายเกณฑ์มาตรฐานด้านวิทยาศาสตร์ เทคโนโลยี วิศวกรรม และคณิตศาสตร์ (STEM) แม้ว่า Llama 4 Behemoth จะยังอยู่ในระหว่างการฝึกฝน แต่ก็ถูกนำมาใช้เป็นโมเดลครูเพื่อถ่ายทอดความรู้ให้กับ Llama 4 รุ่นน้อง ส่งผลให้คุณภาพของโมเดลมีความก้าวหน้าอย่างมาก
Meta ได้เปิดให้ดาวน์โหลดโมเดล Llama 4 Scout และ Llama 4 Maverick แล้วบนแพลตฟอร์ม llama.com และ Hugging Face เพื่อให้นักพัฒนาและผู้สนใจสามารถนำไปใช้งานและสร้างสรรค์แอปพลิเคชัน AI รูปแบบใหม่ๆ ได้อย่างอิสระ นอกจากนี้ Meta AI ที่ขับเคลื่อนโดย Llama 4 ก็พร้อมให้ทดลองใช้งานแล้วบน WhatsApp, Messenger, Instagram Direct และเว็บไซต์ Meta.AI
การเปิดตัว Llama 4 ในครั้งนี้ถือเป็นอีกก้าวสำคัญในการขับเคลื่อนนวัตกรรม AI แบบเปิด (open-weight) ซึ่ง Meta เชื่อมั่นว่าการเข้าถึงเทคโนโลยี AI ที่ทันสมัยอย่างกว้างขวาง จะช่วยให้เกิดการพัฒนาประสบการณ์ที่เป็นส่วนตัวและมีประโยชน์มากยิ่งขึ้นสำหรับทุกคน
ที่มา: Meta