โมเดล MedGemma 1.5 ของ Google สามารถอ่านผล MRI และ CT Scan ได้แล้ว

วัชรกุล พัฒนาประทีปAI1 month ago25 Views

หัวข้อในเนื้อหานี้

THE SUMMARY:

Google Research ได้เปิดตัว MedGemma 1.5 ซึ่งมีจุดเด่นที่เป็นโมเดล AI ตัวแรกของโลกที่สามารถอ่านผล MRI และ CT Scan ได้ โดยก่อนหน้านี้ MedGemma รุ่นแรกที่เปิดตัวในงาน Google I/O เมื่อเดือนพฤษภาคม 2025 สามารถอ่านภาพ X-ray ปอด ภาพผิวหนัง หรือภาพจอประสาทตา ได้ดีอยู่แล้ว

เก่งขนาดไหน?

ข้อมูลจาก Google ได้เผยตัวเลขที่น่าสนใจเอาไว้ดังนี้

การจำแนกโรคจาก CT Scan มีประสิทธิภาพที่ดีขึ้นกว่าเดิม 3% จาก 58% เป็น 61%
มีประสิทธิภาพในการอ่านผล MRI ที่ดีขึ้น 14% จาก 51% เป็น 65%

แม้ว่าตัวเลขข้างต้นนี้อาจไม่ได้ดูหวือหวามาก แต่โจทย์เดิมในการพัฒนาโมเดล AI เหล่านี้ก็ถือว่าไม่ง่ายอยู่แล้ว ส่วนที่พัฒนาแบบก้าวกระโดดคือจุลพยาธิวิทยา คะแนนการสรุปผลจากสไลด์เนื้อเยื่อเพิ่มจากแทบใช้ไม่ได้ หรือ 0.02 เป็น 0.49 ซึ่งเทียบเท่าโมเดลเฉพาะทางระดับงานวิจัย

ยังมี MedASR ที่ฟังแพทย์ได้ปรื๋อ

นอกจาก MesGemma 1.5 แล้ว Google ยังปล่อยโมเดล MedASR หรือโมเดลที่สามารถฟังเสียงที่เป็นศัพท์ทางเทคนิคได้ โมเดล ASR ทั่ว ๆ ไปเมื่อฟังเจอศัพท์เทคนิคหรือศัพท์เฉพาะทางมักไปต่อไม่ได้ แต่ MedASR ไม่ใช่แบบนั้น

ตัวเลขการทดสอบเมื่อเทียบกับโมเดลยอดนิยมในตลาดอย่าง Whisper large-V3 พบว่า MedASR มี error ที่น้อยกว่า 58% เมื่อฟังผลเอกซ์เรย์หน้าอก และมี error ที่น้อยกว่าถึง 82% ในการทดสอบ Benchmark เมื่อนำโมเดล MedASR มาจับคู่กับ MedGemma ทำให้สามารถใช้งานหรือสั่ง prompt ผ่านเสียงได้เลย

ข้อดีของ MedGemma 1.5 คือเป็นโมเดลที่มีขนาด 4B ซึ่งเล็กพอที่จะรันแบบออฟไลน์ได้ ซึ่งสำคัญมากในวงการแพทย์ที่ข้อมูลด้านสุขภาพถือว่าเป็นข้อมูลส่วนตัวที่มีความสำคัญ และยังทำให้หน่วยงานทางการแพทย์ fine-tune ด้วยข้อมูลของตัวเองได้ โดยไม่ต้องส่ง PHI เข้า cloud ของ Google

ที่มา Aihola