OpenAI เปิดตัว GPT-5.4 เน้นใช้งานระดับมืออาชีพ พร้อมตัวเลือกโมเดล Pro และ Thinking

THE SUMMARY:

OpenAI เปิดตัว GPT-5.4 โมเดลพื้นฐานรุ่นใหม่ เน้นใช้งานระดับมืออาชีพ พร้อมเพิ่มตัวเลือก GPT-5.4 Thinking สำหรับงานที่ใช้เหตุผลเชิงลึก และ GPT-5.4 Pro สำหรับงานประสิทธิภาพสูง

API ของโมเดลใหม่นี้รองรับ หน้าต่างบริบทขนาดใหญ่ถึง 1 ล้านโทเค็น ซึ่งถือเป็นขนาดใหญ่ที่สุดที่ OpenAI เคยเปิดให้ใช้งาน พร้อมทั้งปรับปรุงประสิทธิภาพการใช้โทเค็น ส่งผลให้สามารถแก้ปัญหาเดียวกันได้ด้วยจำนวนโทเค็นที่ น้อยกว่ารุ่นก่อนหน้าอย่างมีนัยสำคัญ

GPT 5.4

ด้านผลการทดสอบประสิทธิภาพ โมเดลใหม่ทำคะแนนได้สูงขึ้นอย่างชัดเจน เช่น

  • ทำสถิติสูงสุดในการทดสอบ OSWorld-Verified และ WebArena Verified ที่วัดความสามารถในการใช้งานคอมพิวเตอร์
  • ได้คะแนน 83% ในการทดสอบ GDPval ของ OpenAI ซึ่งเป็นการวัดความสามารถด้านงานความรู้

นอกจากนี้ GPT-5.4 ยังครองอันดับหนึ่งในการทดสอบ APEX-Agents ของ Mercor ซึ่งประเมินทักษะระดับมืออาชีพด้านกฎหมายและการเงิน โดย Brendan Foody ซีอีโอของ Mercor ระบุว่า โมเดลนี้โดดเด่นในการสร้างงานระยะยาว เช่น สไลด์นำเสนอ โมเดลทางการเงิน และการวิเคราะห์กฎหมาย พร้อมให้ประสิทธิภาพสูง ทำงานได้เร็วกว่าและมีต้นทุนต่ำกว่าโมเดลคู่แข่ง

OpenAI ยังเดินหน้าลดปัญหาเรื่องการหลอนของ AI (hallucination) โดยระบุว่า GPT-5.4 มีโอกาสเกิดข้อผิดพลาดต่อการเรียกร้องข้อมูล ลดลง 33% เมื่อเทียบกับ GPT-5.2 โดยรวมมีโอกาสที่คำตอบจะผิดพลาดลดลง 18%

ส่วนการใช้งานผ่าน API ทางบริษัทได้ปรับปรุงระบบเรียกใช้เครื่องมือด้วยฟีเจอร์ใหม่ชื่อ Tool Search จากเดิมที่ต้องส่งคำจำกัดความของเครื่องมือทั้งหมดให้โมเดลทุกครั้ง ซึ่งใช้โทเค็นจำนวนมาก ระบบใหม่จะให้โมเดล ค้นหาเครื่องมือที่ต้องการตามความจำเป็น ทำให้คำขอประมวลผลได้เร็วขึ้นและประหยัดต้นทุนมากขึ้น โดยเฉพาะในระบบที่มีเครื่องมือจำนวนมาก

นอกจากนั้น OpenAI ยังเพิ่มการทดสอบด้านความปลอดภัยรูปแบบใหม่ เพื่อประเมินการลำดับความคิด (chain of thought) ของโมเดล ซึ่งเป็นคำอธิบายกระบวนการคิดในการแก้ปัญหาแบบหลายขั้นตอน เนื่องจากนักวิจัยด้าน AI กังวลมานานว่าโมเดลการให้เหตุผลอาจบิดเบือนกระบวนการคิดของตนเองได้

ผลการประเมินล่าสุดพบว่า GPT-5.4 Thinking มีโอกาสหลอกลวงหรือบิดเบือนเหตุผลน้อยลง บ่งชี้ว่าโมเดลยังไม่สามารถซ่อนกระบวนการให้เหตุผลของตนได้อย่างมีประสิทธิภาพ และการตรวจสอบลำดับความคิดยังคงเป็น เครื่องมือด้านความปลอดภัยที่สำคัญ สำหรับการพัฒนา AI ขั้นสูงต่อไป

ที่มา techcrunch

นักเขียนสาย Introvert ที่ชื่นชอบเรื่องนวัตกรรมและความคิดสร้างสรรค์ ใช้เวลาว่างกับ มังงะ, เสียงเพลงและ idol

Advertisement

Sidebar Search
Popular Now
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...