นี่คือหุ่นยนต์ที่เรียนรู้การพูดเหมือนมนุษย์จากคลิปบน YouTube

ตลอดหลายทศวรรษที่ผ่านมา หุ่นยนต์มีปัญหาในการเลียนแบบการพูดให้สมจริงเหมือนกับมนุษญ์ แม้แต่หุ่นยนต์ฮิวแมนนอยด์ที่ล้ำหน้าที่สุดก็ยังมีการขยับของปากที่ไม่เนียน แข็งทื่อ หรือบางทีก็เวอร์เกินจริงจนเหมือนการ์ตูน

มนุษย์ให้ความสำคัญกับสีหน้าเป็นอย่างมาก โดยเฉพาะบริเวณปาก ผู้คนอาจไม่ให้ความสำคัญกับก้าวเดินที่ดูแปลกหรือการเคลื่อนไหวของมือที่แข็ง แต่หากการแสดงของสีหน้ามีดูแปลกแม้แต่นิดเดียว จะเป็นสิ่งที่สังเกตได้ง่ายมาก ซึ่งนักวิจัยเรียกว่า Uncanny Valley ซึ่งเป็นสิ่งที่หุ่นยนต์ยังทำได้ไม่ดีเลย การเคลื่อนไหวของปากที่ดูไม่เป็นธรรมชาติ ทำให้หุ่นยนต์จำนวนมากดูไร้อารมณ์ ซึ่งปัญหานี้ก็กำลังถูกปรับปรุงให้ดีขึ้นเหมือนกัน

หุ่นยนต์เรียนรู้การเคลื่อนไหวของปาก

นักวิจัยจาก Columbia Engineering ได้ประกาศว่าสามารถพัฒนาหุ่นยนต์ที่สามารถเรียนรู้การขยับริมฝีปากเพื่อพูดและร้องเพลงได้โดยไม่อาศัยการตั้งโปรแกรมเอาไว้ล่วงหน้า ทีมวิจัยระบุว่า หุ่นยนต์สามารถขยับปาก สร้างคำพูดได้ในหลายภาษา และยังร้องเพลงที่สร้างด้วย AI เองในชื่อว่า “hello world_”

หุ่นยนต์ตัวดังกล่าวเรียนรู้การขยับปากผ่านการสังเกตริมฝีปากของมนุษย์ โดยเริ่มจากการควบคุมใบหน้าของตัวเองก่อนด้วยการมองกระจกเพื่อเรียนรู้การเคลื่อนไหวของใบหน้า หลังจากนั้น ตัวมันเองก็เรียนรู้การเคลื่อนไหวของริมฝีปากของมนุษย์ผ่านคลิปใน YouTube โดย ฮ็อด ลิปสัน (Hod Lipson) เจมส์ (James) และแซลลี่ สกาปา (Sally Scapa) ศาสตราจารย์ด้านนวัตกรรมประจำภาควิชาวิศวกรรมเครื่องกล และผู้อำนวยการ Creative Machines Lab ของมหาวิทยาลัยโคลัมเบียกล่าวว่า ยิ่งหุ่นยนต์มีปฏิสัมพันธ์กับมนุษย์มากเท่าไร มันก็จะยิ่งเก่งขึ้นเท่านั้น

หุ่ยนต์พูดเหมือนมนุษย์ได้ยังไง?

การจะสร้างหุ่นยนต์ที่มีริมฝีปากที่พูดได้เหมือนกับมนุษย์ได้นั้นเป็นเรื่องที่ไม่ง่าย ต้องใช้ต้องใช้ฮาร์ดแวร์ขั้นสูงที่มีวัสดุใบหน้าที่ยืดหยุ่นและมอเตอร์ขนาดเล็กจำนวนมาก โดยต้องทำงานร่วมกันอย่างรวดเร็วและเงียบ ไม่เพียงเท่านั้น ยังต้องมีการทำงานที่แม่นยำระหว่างเสียงและการเคลื่อนไหว เนื่องจากการขยับริมฝีปากขึ้นอยู่กับเสียงพูดและหน่วยเสียงที่เปลี่ยนแปลงอย่างรวดเร็ว

ใบหน้าของมนุษย์อาศัยกล้ามเนื้อหลายสิบมัดที่เคลื่อนไหวได้อย่างเป็นธรรมชาติ ซึ่งแตกต่างจากหุ่นยนต์ที่ไม่มีชิ้นส่วนที่มีความซับซ้อนมากขนาดน้ัน การเคลื่อนไหวจึงดูทื่อและไม่เป็นธรรมชาติ ทำให้ทีมวิจัยได้ออกแบบใบหน้าของหุ่นยนต์ใหม่ที่มีความยืดหยุ่นและมีมอเตอร์ควบคุมอย่างละเอียด จากนั้นก็ให้หุ่นยนต์เรียนรู้การเคลื่อนไหวของใบหน้าและการพูดอย่างเป็นธรรมชาติ โดยหุ่นยนต์จะถูกวางไว้หน้ากระจกและเรียนรู้การเคลื่อนไหวของปากแบบสุ่มนับพันครั้ง

เมื่อหุ่นยนต์เรียนรู้และเข้าใจการทำงานของใบหน้าของตัวเองแล้ว นักวิจัยก็ให้หุ่นยนต์เรียนรู้การขยับของริมฝีปากคนที่กำลังพูดและร้องเพลงผ่าน YouTube โดย AI ที่ขับเคลื่อนตัวหุ่นยนต์นั้น จะสังเกตว่ารูปทรงของปากเปลี่ยนไปอย่างไรตามเสียงแบบต่าง ๆ เมื่อผสานข้อมูลนี้เข้ากับการควบคุมใบหน้าที่มันเรียนรู้ด้วยตนเอง หุ่นยนต์จึงสามารถพูดให้สอดคล้องกับริมฝีปากที่ขยับได้

อย่างไรก็ตาม นักวิจัยพบว่ายังมีความยากลำบากในรูปแบบเสียงบางแบบ เช่น เสียง B รวมถึงเสียงที่ต้องห่อปาก เช่น W แต่หากฝึกฝนไปเรื่อย ๆ ก็จะดีขึ้นเรื่อย ๆ

ที่มา Scitechdaily

Advertisement

Sidebar Search
Popular Now
Loading

Signing-in 3 seconds...

Signing-up 3 seconds...