Amazon ถกด่วนหลังระบบล่มหลายครั้ง คาดโค้ดที่ AI ช่วยเขียนอาจทำงานผิดพลาด

THE SUMMARY:

Amazon จัดการประชุมภายเพื่อหารือเกี่ยวกับปัญหาการหยุดชะงักของระบบที่เกิดขึ้นบ่อยครั้งในช่วงที่ผ่านมา คาดส่วนหนึ่งอาจเกิดจาก AI เขียนโค้ดผิดพลาด

การประชุมครั้งนี้นำโดยเดฟ เทรดเวลล์ รองประธานอาวุโสฝ่าย eCommerce Foundation ที่ดูแลด้านเทคโนโลยีของเว็บไซต์ Amazon ซึ่งเกิดขึ้นหลังจากเว็บไซต์และแอปของ Amazon ประสบปัญหาขัดข้องเมื่อสัปดาห์ที่ผ่านมา โดยเกิดเหตุการณ์ระดับรุนแรง (Severity 1) ถึง 4 ครั้งภายในหนึ่งสัปดาห์ ทำให้ระบบสำคัญหยุดชะงักหรือทำงานได้ไม่เต็มประสิทธิภาพ ส่งผลให้ผู้ใช้บางส่วนไม่สามารถชำระเงิน เข้าถึงข้อมูลบัญชี หรือดูราคาสินค้าได้เป็นเวลาประมาณ 6 ชั่วโมง

ระบบ Amazon ล่ม เกิดจากอะไร?

ก่อนการประชุม มีเอกสารภายในระบุว่า “การปรับใช้โค้ดที่ให้ Gen AI ช่วยเขียน” อาจเป็นหนึ่งในปัจจัยที่อาจเกี่ยวข้อง แต่ข้อมูลส่วนที่กล่าวถึง Gen AI ถูกลบออกจากเอกสารฉบับอัปเดตก่อนการประชุม ในขณะที่โฆษกของ Amazon ออกมาชี้แจงภายหลังว่า มีเพียงเหตุการณ์เดียวที่เกี่ยวข้องกับ AI และไม่มีกรณีใดที่เกิดจากโค้ดที่เขียนโดย AI โดยตรง

ปัญหาที่เกิดขึ้นรวมถึงสิ่งที่ผู้บริหารเรียกว่า “high blast radius changes” ซึ่งหมายถึง การอัปเดตซอฟต์แวร์ที่ส่งผลกระทบเป็นวงกว้าง เนื่องจากระบบควบคุมขาดมาตรการป้องกันที่เพียงพอ ทำให้การเปลี่ยนแปลงหนึ่งจุดสามารถกระจายผลกระทบไปยังหลายส่วนของระบบได้อย่างรวดเร็ว ในบางกรณีการแก้ไขความเสียหายของข้อมูลใช้เวลานานหลายชั่วโมง

เมื่อตรวจสอบย้อนกลับไปยังขั้นตอนพื้นฐานของกระบวนการพัฒนาโค้ด เช่น กฎที่กำหนดให้ต้องมีผู้ตรวจสอบโค้ดอย่างน้อยสองคนก่อนนำไปใช้งานจริง ซึ่งในบางเคสกฎนี้ไม่ได้ถูกปฏิบัติหรือถูกละเลยไป

มาตรการป้องกันในอนาคต

เทรดเวลล์ยอมรับว่ามาตรการควบคุมและแนวปฏิบัติที่ดีที่สุดสำหรับการใช้งาน Generative AI ยังอยู่ระหว่างการพัฒนา ดังนั้นบริษัทจึงเตรียมเพิ่มมาตรการป้องกัน เช่น

  • การตรวจสอบโค้ดเพิ่มเติมสำหรับการเปลี่ยนแปลงระบบที่มี AI เข้ามาช่วย เพื่อป้องกันปัญหาในอนาคต
  • กำหนดให้วิศวกรต้องจัดทำเอกสารเกี่ยวกับการเปลี่ยนแปลงโค้ดที่ละเอียดมากขึ้น
  • ใช้เครื่องมือภายในองค์กรสำหรับการจัดทำเอกสารและขั้นตอนการอนุมัติ รวมถึงระบบเขียนโค้ดอัตโนมัติที่ต้องปฏิบัติตามมาตรฐานด้านวิศวกรรมความน่าเชื่อถือของ Amazon อย่างเคร่งครัด
  • วิศวกรของ Amazon จะต้องให้ผู้ตรวจสอบอย่างน้อยสองคนตรวจทานงานก่อนดำเนินการเปลี่ยนแปลงโค้ดใด ๆ
  • กำหนดให้เจ้าของระบบระดับ Tier-1 ทุกคน รวมถึงผู้บริหารระดับผู้อำนวยการและรองประธาน ต้องเข้ามาตรวจสอบกิจกรรมการเปลี่ยนแปลงโค้ดที่ถูกนำไปใช้ในระบบจริงภายในหน่วยงานของตน เพื่อเพิ่มการกำกับดูแลและลดความเสี่ยงที่อาจเกิดขึ้นกับบริการหลักของบริษัท

ที่มา cnbc / businessinsider

นักเขียนสาย Introvert ที่ชื่นชอบเรื่องนวัตกรรมและความคิดสร้างสรรค์ ใช้เวลาว่างกับ มังงะ, เสียงเพลงและ idol

Banner
Sidebar Search
Popular Now
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...