TurboQuant: เทคโนโลยีใหม่จาก Google บีบอัดข้อมูล ลดใช้ RAM ระหว่างประมวลผล AI ได้ถึง 6 เท่า

THE SUMMARY:

Google Research เปิดตัว TurboQuant เทคโนโลยีบีบอัดหน่วยความจำสำหรับ AI ที่ช่วยลดการใช้หน่วยความจำระหว่างการประมวลผล (KV cache) ได้อย่างน้อย 6 เท่า โดยยังคงประสิทธิภาพและความแม่นยำไว้

TurboQuant ของ Google Research เป็นเทคโนโลยีการบีบอัดขั้นสูง “แบบไม่ลดทอนคุณภาพ” เพื่อนำมาใช้แก้ปัญหาคอขวดสำคัญในระบบ AI ถูกออกแบบมาเพื่อลดการใช้หน่วยความจำระหว่างการประมวลผลของ AI โดยไม่กระทบต่อประสิทธิภาพการทำงาน

TurboQuant

หลักการทำงานคือการใช้เทคนิคการหาปริมาณเวกเตอร์ (vector quantization) เพื่อจัดการกับปัญหาคอขวดของแคช ทำให้ AI สามารถเก็บข้อมูลได้มากขึ้น ใช้พื้นที่น้อยลง และยังคงความแม่นยำไว้ได้ ด้วยการใช้เทคนิคสำคัญ 2 ส่วน คือ

  • PolarQuant: วิธีควอนไทเซชันรูปแบบใหม่
  • QJL: วิธีการฝึกและเพิ่มประสิทธิภาพโมเดล

แม้รายละเอียดเชิงคณิตศาสตร์จะค่อนข้างซับซ้อน แต่ผลลัพธ์ที่ได้กำลังสร้างความตื่นเต้นในวงการเทคโนโลยี เพราะหากนำไปใช้จริงได้สำเร็จ TurboQuant อาจช่วยลดการใช้หน่วยความจำระหว่างทำงาน (KV cache) ได้อย่างน้อยถึง 6 เท่า ซึ่งหมายถึงต้นทุนการรัน AI ที่ต่ำลงอย่างมีนัยสำคัญ

ทาง Matthew Prince ซีอีโอของ Cloudflare ถึงกับเรียกสิ่งนี้ว่าเป็น “DeepSeek ของ Google” เปรียบกับกรณีของโมเดล AI จากจีนที่สามารถทำผลงานได้ใกล้เคียงคู่แข่ง แต่ใช้ต้นทุนต่ำกว่ามาก ใครที่อยากใช้งานตอนนี้ TurboQuant ยังอยู่ในขั้นงานวิจัยและยังไม่ได้ถูกนำไปใช้งานจริงในวงกว้าง

ที่มา techcrunch

นักเขียนสาย Introvert ที่ชื่นชอบเรื่องนวัตกรรมและความคิดสร้างสรรค์ ใช้เวลาว่างกับ มังงะ, เสียงเพลงและ idol

Sidebar Search
Popular Now
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...