Anthropic บริษัทวิจัยและพัฒนา AI ประกาศเปิดตัว Claude 4 ชุดโมเดล AI เจเนอเรชันล่าสุด ประกอบด้วย Claude Opus 4 และ Claude Sonnet 4 ชูความสามารถที่ก้าวกระโดดในด้านการเขียนโค้ด การให้เหตุผลในงานที่ซับซ้อน และความสามารถใหม่ๆ อย่าง “Extended Thinking with Tool Use” ที่จะมาปฏิวัติวิธีการทำงานร่วมกับ AI
Anthropic โชว์ผลงาน Claude Opus 4 ว่าเป็นโมเดลที่มีความสามารถในการเขียนโค้ดที่ดีที่สุดในโลก สามารถทำคะแนนได้อย่างยอดเยี่ยมบน SWE-bench (72.5%) และ Terminal-bench (43.2%) ออกแบบมาเพื่องานที่ต้องการการประมวลผลที่ซับซ้อนและต่อเนื่องยาวนาน (long-running tasks) รวมถึงเวิร์กโฟลว์ของ Agent ที่ซับซ้อน โดยสามารถทำงานต่อเนื่องได้หลายชั่วโมง นอกจากนี้ Opus 4 ยังมาพร้อมความสามารถด้านหน่วยความจำ (memory capabilities) ที่เหนือกว่ารุ่นก่อน ๆ มาก โดยเฉพาะเมื่อนักพัฒนาให้สิทธิ์เข้าถึงไฟล์ในเครื่อง (local files) จะสามารถสร้างและจัดการ “memory files” เพื่อเก็บข้อมูลสำคัญได้อย่างมีประสิทธิภาพ
สำหรับโมเดลตัวรองคือ Claude Sonnet 4 เป็นการอัปเกรดครั้งสำคัญจาก Claude Sonnet 3.7 มอบประสิทธิภาพที่เหนือกว่าทั้งในด้านการเขียนโค้ด (ทำคะแนน 72.7% บน SWE-bench) และการให้เหตุผล พร้อมทั้งความสามารถในการทำตามคำสั่งได้แม่นยำยิ่งขึ้น Sonnet 4 ยังคงเน้นความสมดุลระหว่างประสิทธิภาพและความคุ้มค่า เหมาะสำหรับงานหลากหลายประเภททั้งภายในและภายนอกองค์กร โดยมีการปรับปรุงด้านการควบคุม (steerability) เพื่อให้นักพัฒนาสามารถปรับแต่งการทำงานได้ละเอียดยิ่งขึ้น
อีกฟีเจอร์เด็ดของ Claude 4 คือ Extended Thinking with Tool Use (Beta) ซึ่งช่วยให้โมเดลสามารถใช้เครื่องมือภายนอก เช่น การค้นหาเว็บ (web search) ในระหว่างกระบวนการคิดที่ยาวนานขึ้น ทำให้ Claude สามารถสลับระหว่างการใช้เหตุผลภายในกับการใช้เครื่องมือเพื่อปรับปรุงคุณภาพของคำตอบได้ ทั้ง Opus 4 และ Sonnet 4 ยังรองรับการใช้เครื่องมือหลายอย่างพร้อมกัน (parallel tool use)
นอกจากการปรับปรุงโมเดลหลักแล้ว Anthropic ยังได้เปิดตัว Claude Code อย่างเป็นทางการ (Generally Available) ขยายความสามารถให้นักพัฒนาทำงานร่วมกับ Claude ได้หลากหลายรูปแบบมากขึ้น โดยรองรับ background tasks ผ่าน GitHub Actions และการผนวกรวมแบบเนทีฟกับ VS Code และ JetBrains ทำให้สามารถแสดงผลการแก้ไขโค้ดได้โดยตรงในไฟล์
Anthropic API ยังมีความสามารถใหม่ 4 อย่างเพื่อช่วยให้นักพัฒนาสร้าง AI Agent ที่ทรงพลังยิ่งขึ้น ได้แก่:
Claude Opus 4 และ Sonnet 4 เป็นโมเดลแบบไฮบริดที่สามารถตอบสนองได้เกือบจะทันทีสำหรับงานทั่วไป และสามารถเข้าสู่โหมด “extended thinking” สำหรับงานที่ต้องการการวิเคราะห์เชิงลึก โมเดลใหม่นี้ยังมีแนวโน้มที่จะพยายามหาทางลัดหรือช่องโหว่ (shortcut or loophole behavior) น้อยลงถึง 65% เมื่อเทียบกับ Sonnet 3.7 ในงานที่ต้องใช้ Agent นอกจากนี้ Anthropic ยังคงให้ความสำคัญกับความปลอดภัยของ AI โดยมีการทดสอบและประเมินอย่างเข้มข้นเพื่อลดความเสี่ยงและเพิ่มความปลอดภัยสูงสุด รวมถึงการนำมาตรการสำหรับ AI Safety Levels ที่สูงขึ้น เช่น ASL-3 มาปรับใช้
แม้จะมีการอัปเกรดความสามารถอย่างมาก แต่ราคาสำหรับ Claude Opus 4 และ Sonnet 4 ยังคงเท่ากับโมเดล Opus และ Sonnet รุ่นก่อนหน้า โดย Opus 4 อยู่ที่ $15 (input) / $75 (output) ต่อล้านโทเค็น และ Sonnet 4 อยู่ที่ $3 (input) / $15 (output) ต่อล้านโทเค็น
เรียกว่าสัปดาห์นี้เป็นสัปดาห์ของ AI จริง ๆ ตั้งแต่ Google I/O ที่จัดเต็ม Gemini ชุดใหม่ ฝั่ง OpenAI ก็ประกาศซื้อบริษัท io ของ Jony Ive เพื่อร่วมพัฒนาฮาร์ดแวร์ AI จนปิดสัปดาห์ด้วยการเปิด Cluade 4 โลกของ AI นี่เปลี่ยนเร็วจริง ๆ
ที่มา: anthropic