OpenAI จับมือ Broadcom เปิดตัว Jalapeño ชิปประมวลผลสำหรับ AI พัฒนาเพื่อ LLM โดยเฉพาะ

THE SUMMARY:

OpenAI จับมือ Broadcom เปิดตัว Jalapeño ชิปประมวลผลสำหรับ AI ที่ได้รับการออกแบบขึ้นใหม่ตั้งแต่ต้น โดยเน้นไปที่การประมวลผลโมเดลภาษาขนาดใหญ่ หรือ Large Language Model (LLM) โดยเฉพาะ ทำให้ AI ขั้นสูงทำงานได้เร็วขึ้น น่าเชื่อถือมากขึ้น และเข้าถึงได้ง่ายขึ้นกว่าเดิม

การเปิดตัวครั้งนี้ถือเป็นก้าวสำคัญในกลยุทธ์การสร้างเทคโนโลยีแบบ Full-stack ของ OpenAI ที่ครอบคลุมตั้งแต่ระดับผลิตภัณฑ์ โมเดล ซอฟต์แวร์ ไปจนถึงโครงสร้างพื้นฐานด้านฮาร์ดแวร์ ที่ผ่านมา OpenAI ต้องใช้ฮาร์ดแวร์และชิปจากผู้ผลิตภายนอกเป็นหลัก แต่การออกแบบชิปของตัวเองจะช่วยให้บริษัทสามารถปรับฮาร์ดแวร์ให้สอดคล้องกับลักษณะการทำงานของโมเดลได้โดยตรง แทนที่จะต้องปรับโมเดลให้เข้ากับฮาร์ดแวร์ที่ถูกออกแบบมาเพื่อให้รองรับงานหลายประเภท

OpenAI ระบุว่า Jalapeño ไม่ได้ถูกออกแบบให้รองรับเฉพาะโมเดลของบริษัทเท่านั้น แต่มีความยืดหยุ่นเพียงพอที่จะทำงานร่วมกับโมเดลภาษาขนาดใหญ่ทั้งในปัจจุบันและอนาคตของอุตสาหกรรมโดยรวม การออกแบบชิปจึงให้ความสำคัญกับองค์ประกอบที่มีผลโดยตรงต่อการประมวลผล LLM ได้แก่

  • รูปแบบการคำนวณของเคอร์เนลที่ใช้ในโมเดล AI
  • การย้ายข้อมูลระหว่างหน่วยประมวลผลและหน่วยความจำ
  • ความเร็วและความจุของระบบหน่วยความจำ
  • การสื่อสารระหว่างชิปและเซิร์ฟเวอร์
  • รูปแบบการให้บริการโมเดลแก่ผู้ใช้จำนวนมากพร้อมกัน
  • ลดระยะเวลาในการรอประมวลผล

การทำงานของโมเดล AI สามารถแบ่งอย่างกว้าง ๆ ได้เป็นสองส่วน คือการฝึกโมเดลหรือ Training และการนำโมเดลที่ฝึกแล้วมาใช้สร้างคำตอบหรือดำเนินงาน หรือที่เรียกว่า Inference โดยชิป Jalapeño ถูกสร้างขึ้นเพื่อเน้นขั้นตอน Inference โดยเฉพาะ เนื่องจากเป็นขั้นตอนที่ AI ต้องรับคำสั่งจากผู้ใช้งาน ประมวลผล และสร้างผลลัพธ์ออกมา ไม่ว่าจะเป็นการตอบคำถามใน ChatGPT การเขียนหรือวิเคราะห์โค้ดใน Codex หรือการเรียกใช้โมเดลผ่าน API

หนึ่งในแนวคิดสำคัญของ Jalapeño คือการลดปริมาณการเคลื่อนย้ายข้อมูลที่ไม่จำเป็นภายในระบบ ในการประมวลผล AI พลังงานและเวลาจำนวนมากไม่ได้ถูกใช้ไปกับการคำนวณเพียงอย่างเดียว แต่ถูกใช้ในการนำข้อมูลเข้าและออกจากหน่วยความจำ รวมถึงการส่งข้อมูลระหว่างชิป เซิร์ฟเวอร์ และอุปกรณ์เครือข่าย หากหน่วยประมวลผลทำงานได้เร็วแต่ไม่สามารถรับข้อมูลได้ทันเวลา ประสิทธิภาพที่เกิดขึ้นจริงจะต่ำกว่าความสามารถสูงสุดตามทฤษฎีอย่างมาก

OpenAI จึงออกแบบสถาปัตยกรรมของ Jalapeño ให้เกิดความสมดุลระหว่างพลังประมวลผล ระบบหน่วยความจำ และระบบเครือข่าย เป้าหมายคือทำให้ระดับการใช้งานจริงของฮาร์ดแวร์เข้าใกล้ประสิทธิภาพสูงสุดตามทฤษฎีมากที่สุด

แม้สถาปัตยกรรมของ Jalapeño จะถูกออกแบบโดยอาศัยข้อมูลและความต้องการของ OpenAI แต่การทำให้แนวคิดดังกล่าวกลายเป็นระบบที่สามารถผลิตและใช้งานในระดับศูนย์ข้อมูลต้องอาศัยความสามารถของหลายฝ่าย อย่าง Broadcom รับผิดชอบด้านการนำสถาปัตยกรรมไปพัฒนาเป็นซิลิคอนจริง รวมถึงเทคโนโลยีการเชื่อมต่อและเครือข่ายที่จำเป็นสำหรับการขยายระบบ ส่วน Celestica นำความเชี่ยวชาญด้านแผงวงจร ระบบแร็ก การประกอบระบบ และการออกแบบโครงสร้างพื้นฐานระดับศูนย์ข้อมูลเข้ามาสนับสนุน เพื่อให้แพลตฟอร์มสามารถผลิต ติดตั้ง และขยายการใช้งานได้ในระดับอุตสาหกรรม

OpenAI ตั้งเป้าเริ่มติดตั้งระบบรุ่นแรกภายในสิ้นปี 2026 และขยายการใช้งานต่อในปีถัด ๆ ไป การมาของ Jalapeño ถือเป็นสัญญาณสำคัญว่า การแข่งขันด้าน AI ในยุคต่อไปจะไม่ได้วัดกันเฉพาะว่าใครมีโมเดลที่เก่งที่สุด แต่ยังวัดด้วยว่าใครสามารถสร้างโครงสร้างพื้นฐานที่ทำให้โมเดลเหล่านั้นทำงานได้เร็ว มีเสถียรภาพ ใช้พลังงานอย่างมีประสิทธิภาพ และให้บริการแก่ผู้ใช้จำนวนมหาศาลด้วยต้นทุนที่ต่ำที่สุดด้วย

ที่มา OpenAI

Sidebar Search
Popular Now
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...