Alibaba เปิดตัว Qwen3 LLM โอเพ่นซอร์สรุ่นใหม่ ชูโรง “Hybrid Reasoning” พลิกโฉม AI

CEEi TeamAI1 year ago100 Views

Home
Tech & Innovation
AI
Alibaba เปิดตัว Qwen3 LLM โอเพ่นซอร์สรุ่นใหม่ ชูโรง “Hybrid Reasoning” พลิกโฉม AI

หัวข้อในเนื้อหานี้

อาลีบาบา คลาวด์ (Alibaba Cloud) เปิดตัว Qwen3 โมเดลภาษาขนาดใหญ่ (Large Language Model – LLM) แบบโอเพ่นซอร์สเจเนอเรชันล่าสุด พร้อมสร้างมาตรฐานใหม่ด้วยความสามารถ “Hybrid Reasoning” หรือการใช้เหตุผลแบบผสมผสาน ที่ออกแบบมาเพื่อให้นักพัฒนาสามารถสร้างแอปพลิเคชันยุคหน้าได้อย่างยืดหยุ่นและทรงพลัง

ซีรีส์ Qwen3 ประกอบด้วยโมเดลหลากหลายขนาด ตั้งแต่โมเดลขนาดเล็กสำหรับอุปกรณ์พกพาไปจนถึงโมเดลขนาดใหญ่ระดับหลายแสนล้านพารามิเตอร์ โดยมีทั้ง dense model 6 รุ่น (ตั้งแต่ 0.6B ถึง 32B พารามิเตอร์) และ Mixture-of-Experts (MoE) model อีก 2 รุ่น (30B โดยมี 3B active และ 235B โดยมี 22B active) ซึ่งทั้งหมดเปิดเป็นโอเพ่นซอร์สให้นักพัฒนาทั่วโลกเข้าถึงได้

“Hybrid Reasoning” นวัตกรรมแกนหลักของ Qwen3

หัวใจสำคัญของ Qwen3 คือการเป็น Hybrid Reasoning Model แรกของอาลีบาบา ซึ่งเป็นการผสานความสามารถของ LLM แบบดั้งเดิมเข้ากับการใช้เหตุผลแบบไดนามิกที่ล้ำหน้า โดยโมเดลสามารถสลับระหว่าง:

Thinking Mode (โหมดการคิดเป็นขั้นเป็นตอน): ใช้สำหรับงานที่ซับซ้อนและต้องการการวิเคราะห์หลายขั้นตอน เช่น การแก้ปัญหาคณิตศาสตร์ การเขียนโค้ด และการอนุมานเชิงตรรกะ
Non-thinking Mode (โหมดการใช้สัญชาตญาณ): ใช้สำหรับการตอบสนองที่รวดเร็วและตรงไปตรงมาสำหรับงานทั่วไป

นักพัฒนาที่ใช้งาน Qwen3 ผ่าน API จะสามารถควบคุม “ระยะเวลาการคิด” ของโมเดลได้อย่างละเอียด (สูงสุดถึง 38,000 โทเค็น) ทำให้สามารถสร้างสมดุลระหว่างความชาญฉลาดในการประมวลผลและประสิทธิภาพ โดยเฉพาะโมเดล Qwen3-235B-A22B MoE ที่ช่วยลดต้นทุนการติดตั้งใช้งานได้อย่างมากเมื่อเทียบกับโมเดลอื่นในระดับเดียวกัน

ยกระดับความสามารถรอบด้าน

Qwen3 ได้รับการฝึกฝนจากชุดข้อมูลมหาศาลถึง 36 ล้านล้านโทเค็น (มากกว่า Qwen2.5 สองเท่า) ส่งผลให้มีประสิทธิภาพก้าวกระโดดในหลายมิติ:

เชี่ยวชาญหลายภาษา: รองรับถึง 119 ภาษา ทั้งภาษาหลักและภาษาถิ่น มีความสามารถในการแปลและปฏิบัติตามคำสั่งหลายภาษาได้อย่างยอดเยี่ยม
Agent ประสิทธิภาพสูง: รองรับ Model Context Protocol (MCP) และการเรียกใช้ฟังก์ชัน (Function Calling) หรือเครื่องมือ (Tool Calling) ที่ทรงพลัง เหมาะสำหรับงานที่ต้องใช้เอเจนต์ AI ที่ซับซ้อน
การใช้เหตุผลที่เหนือกว่า: ทำคะแนนได้ดีกว่า Qwen รุ่นก่อนหน้าในการวัดผลด้านคณิตศาสตร์ การเขียนโค้ด และการใช้เหตุผลเชิงตรรกะ
สอดคล้องกับมนุษย์มากขึ้น: มอบการเขียนเชิงสร้างสรรค์ การสวมบทบาท และการสนทนาโต้ตอบที่เป็นธรรมชาติและน่าสนใจยิ่งขึ้น

ความก้าวหน้าเหล่านี้เกิดจากสถาปัตยกรรมโมเดลที่ปรับปรุงใหม่ ปริมาณข้อมูลการฝึกที่เพิ่มขึ้นมหาศาล และวิธีการฝึกที่มีประสิทธิภาพมากขึ้น ทำให้ Qwen3 ทำผลงานได้โดดเด่นในการทดสอบมาตรฐานอุตสาหกรรม เช่น AIME25 (คณิตศาสตร์), LiveCodeBench (เขียนโค้ด), BFCL (การใช้เครื่องมือ) และ Arena-Hard (การทำตามคำสั่งที่ซับซ้อน)

วิธีเข้าใช้งาน

โดยโมเดล Qwen3 พร้อมให้ดาวน์โหลดฟรีแล้วบน Hugging Face, Github, ModelScope และสามารถทดลองใช้งานได้ที่ chat.qwen.ai ส่วนการเข้าใช้งานผ่าน API บน Model Studio ซึ่งเป็นแพลตฟอร์มพัฒนา AI ของอาลีบาบา จะเปิดให้บริการเร็วๆ นี้

นับตั้งแต่เปิดตัว โมเดลในตระกูล Qwen มียอดดาวน์โหลดแล้วมากกว่า 300 ล้านครั้งทั่วโลก และมีนักพัฒนาสร้างโมเดลต่อยอดจาก Qwen มากกว่า 100,000 โมเดลบน Hugging Face ทำให้ Qwen กลายเป็นหนึ่งในซีรีส์โมเดล AI โอเพ่นซอร์สที่ถูกนำไปใช้อย่างแพร่หลายที่สุดในโลก การมาถึงของ Qwen3 คาดว่าจะยิ่งกระตุ้นให้นวัตกรรม AI จากชุมชนนักพัฒนาทั่วโลกเติบโตอย่างก้าวกระโดดต่อไป