
Google Research ได้เปิดตัว MedGemma 1.5 ซึ่งมีจุดเด่นที่เป็นโมเดล AI ตัวแรกของโลกที่สามารถอ่านผล MRI และ CT Scan ได้ โดยก่อนหน้านี้ MedGemma รุ่นแรกที่เปิดตัวในงาน Google I/O เมื่อเดือนพฤษภาคม 2025 สามารถอ่านภาพ X-ray ปอด ภาพผิวหนัง หรือภาพจอประสาทตา ได้ดีอยู่แล้ว
ข้อมูลจาก Google ได้เผยตัวเลขที่น่าสนใจเอาไว้ดังนี้
แม้ว่าตัวเลขข้างต้นนี้อาจไม่ได้ดูหวือหวามาก แต่โจทย์เดิมในการพัฒนาโมเดล AI เหล่านี้ก็ถือว่าไม่ง่ายอยู่แล้ว ส่วนที่พัฒนาแบบก้าวกระโดดคือจุลพยาธิวิทยา คะแนนการสรุปผลจากสไลด์เนื้อเยื่อเพิ่มจากแทบใช้ไม่ได้ หรือ 0.02 เป็น 0.49 ซึ่งเทียบเท่าโมเดลเฉพาะทางระดับงานวิจัย

นอกจาก MesGemma 1.5 แล้ว Google ยังปล่อยโมเดล MedASR หรือโมเดลที่สามารถฟังเสียงที่เป็นศัพท์ทางเทคนิคได้ โมเดล ASR ทั่ว ๆ ไปเมื่อฟังเจอศัพท์เทคนิคหรือศัพท์เฉพาะทางมักไปต่อไม่ได้ แต่ MedASR ไม่ใช่แบบนั้น
ตัวเลขการทดสอบเมื่อเทียบกับโมเดลยอดนิยมในตลาดอย่าง Whisper large-V3 พบว่า MedASR มี error ที่น้อยกว่า 58% เมื่อฟังผลเอกซ์เรย์หน้าอก และมี error ที่น้อยกว่าถึง 82% ในการทดสอบ Benchmark เมื่อนำโมเดล MedASR มาจับคู่กับ MedGemma ทำให้สามารถใช้งานหรือสั่ง prompt ผ่านเสียงได้เลย
ข้อดีของ MedGemma 1.5 คือเป็นโมเดลที่มีขนาด 4B ซึ่งเล็กพอที่จะรันแบบออฟไลน์ได้ ซึ่งสำคัญมากในวงการแพทย์ที่ข้อมูลด้านสุขภาพถือว่าเป็นข้อมูลส่วนตัวที่มีความสำคัญ และยังทำให้หน่วยงานทางการแพทย์ fine-tune ด้วยข้อมูลของตัวเองได้ โดยไม่ต้องส่ง PHI เข้า cloud ของ Google
ที่มา Aihola





