เปิดตัว Gemini 3.5 Live Translate แปลเสียงสดกว่า 70 ภาษา รักษาสำเนียงเหมือนต้นฉบับ

THE SUMMARY:

Google เปิดตัว Gemini 3.5 Live Translate โมเดล AI เสียงรุ่นใหม่ที่สามารถแปลบทสนทนาแบบเรียลไทม์ได้มากกว่า 70 ภาษา พร้อมรักษาน้ำเสียง สำเนียง จังหวะการพูด และเอกลักษณ์ของผู้พูดไว้ได้อย่างเป็นธรรมชาติ

Gemini 3.5 Live Translate ต่างจากระบบแปลภาษาแบบเดิมที่ต้องรอให้ผู้พูดพูดจบก่อนจึงค่อยแปล โดยที่สามารถสร้างเสียงแปลได้อย่างต่อเนื่องระหว่างการสนทนา ทำให้การสื่อสารลื่นไหลมากขึ้น และมีความหน่วงเพียงไม่กี่วินาที

โมเดลรองรับการตรวจจับภาษาอัตโนมัติมากกว่า 70 ภาษา ทำงานได้ดีแม้ในสภาพแวดล้อมที่มีเสียงรบกวน เหมาะสำหรับการใช้งานหลากหลายรูปแบบ ไม่ว่าจะเป็นการประชุมออนไลน์ การโทรข้ามภาษา การเรียนการสอน การถ่ายทอดสด หรือการสื่อสารระหว่างผู้ใช้จากหลายประเทศ

Google เริ่มเปิดให้ใช้งาน Gemini 3.5 Live Translate แล้วในหลายผลิตภัณฑ์ ได้แก่ Gemini Live API และ Google AI Studio สำหรับนักพัฒนา, Google Meet สำหรับลูกค้าองค์กรบางส่วนในรูปแบบ Private Preview และ Google Translate บน Android และ iOS สำหรับผู้ใช้ทั่วไปทั่วโลก

ใน Google Meet ความสามารถใหม่นี้จะช่วยยกระดับการประชุมหลายภาษาอย่างมาก โดยรองรับมากกว่า 70 ภาษา จากเดิมเพียง 5 ภาษา และสามารถแปลการสนทนาได้มากกว่า 2,000 คู่ภาษาในการประชุมเดียว พร้อมปรับปรุงอินเทอร์เฟซให้เข้าถึงฟีเจอร์แปลเสียงได้ง่ายขึ้น

ด้าน Google Translate ผู้ใช้สามารถเชื่อมต่อหูฟังเพื่อรับฟังคำแปลแบบเรียลไทม์ได้อย่างเป็นธรรมชาติ และบน Android ยังมี “โหมดการฟัง” ใหม่ ที่ให้ผู้ใช้ฟังเสียงแปลผ่านลำโพงหูฟังของโทรศัพท์ได้ทันที เพียงถือเครื่องแนบหูเหมือนการโทรศัพท์ปกติ เหมาะสำหรับสถานการณ์ที่ต้องการฟังคำแปลอย่างรวดเร็วโดยไม่รบกวนคนรอบข้าง

Google ระบุว่าเสียงทั้งหมดที่สร้างโดย Gemini 3.5 Live Translate จะมีการฝังลายน้ำดิจิทัล SynthID ลงในสัญญาณเสียง เพื่อให้สามารถตรวจสอบได้ว่าเป็นเนื้อหาที่สร้างโดย AI ช่วยลดความเสี่ยงจากการปลอมแปลงเสียงและการเผยแพร่ข้อมูลเท็จในอนาคต

ที่มา blog.google

นักเขียนสาย Introvert ที่ชื่นชอบเรื่องนวัตกรรมและความคิดสร้างสรรค์ ใช้เวลาว่างกับ มังงะ, เสียงเพลงและ idol

Sidebar Search
Popular Now
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...