Home
Tech & Innovation
AI
Gemini Omni เขย่าวงการ AI เสกวิดีโอได้จากทุกอินพุต ปรับแต่งได้ยืดหยุ่นขึ้น

Gemini Omni เขย่าวงการ AI เสกวิดีโอได้จากทุกอินพุต ปรับแต่งได้ยืดหยุ่นขึ้น

หัวข้อในเนื้อหานี้

THE SUMMARY:

Google เปิดตัว Gemini Omni โมเดล AI สร้างวิดีโอ ชูวามสามารถคิดวิเคราะห์ควบคู่ไปกับ พลังแห่งการสร้างสรรค์ เสกวิดีโอได้จากทุกอินพุต ข้อความ ภาพ เสียง วิดีโอ พร้อมปรับแต่งได้ยืดหยุ่นขึ้น

พลิกโฉมการทำวิดีโอ

Gemini Omniถูกออกแบบให้เป็นโมเดลที่สามารถ “สร้างอะไรก็ได้ จากข้อมูลป้อนเข้าทุกรูปแบบ” โดยเริ่มต้นจากงานวิดีโอเป็นหลัก ผู้ใช้สามารถผสมผสานข้อความ ภาพ เสียง และวิดีโอ เข้าเป็นอินพุตเดียวกัน เพื่อสร้างวิดีโอคุณภาพสูงที่อ้างอิงความเข้าใจโลกจริงของ Gemini ได้ทันที

จุดเด่นสำคัญคือ ผู้ใช้สามารถแก้ไขวิดีโอผ่านการสนทนาแบบธรรมชาติได้ เหมือนกำลังพูดคุยกับผู้ช่วยสร้างสรรค์ AI แบบเรียลไทม์โดยเปิดตัว “Gemini Omni Flash” รุ่นแรกในตระกูล Omni สำหรับใช้งานบนแอป Gemini, Google Flow และ YouTube Shorts โดยในอนาคตจะขยายการรองรับไปยังรูปแบบเอาต์พุตอื่น ๆ ทั้งภาพนิ่งและวิดีโอเพิ่มเติม

ไฮไลต์เด่น

สั่งตัดต่อวิดีโอด้วยการ “คุย” (Conversational Video Editing): บอกลาโปรแกรมตัดต่อที่ซับซ้อน ผู้ใช้สามารถพิมพ์สั่ง AI ให้แก้ไขวิดีโอด้วยภาษาธรรมชาติได้ทันที เช่น สั่งให้เปลี่ยนวัตถุในคลิป, เปลี่ยนมุมกล้อง หรือปรับแสง โดยที่ตัวละครและฟิสิกส์ของภาพยังคงเนียนตาและต่อเนื่อง

สร้างสิ่งใหม่จากจินตนาการที่สมจริง: ด้วยความเข้าใจด้านฟิสิกส์ วิทยาศาสตร์ และบริบททางวัฒนธรรมที่ฝังอยู่ในสมองของ Gemini ทำให้คลิปที่สร้างขึ้นมามีความสมจริงสูง ไม่ว่าจะเป็นการเคลื่อนที่ของของเหลว แรงโน้มถ่วง หรือแม้แต่การทำคลิปอธิบายเรื่องยากๆ ให้เข้าใจง่ายในรูปแบบสตอปโมชัน
ผสมผสานทุกอินพุต (Multi-Input Reference): Omni Flash สามารถรับข้อมูลขาเข้าได้หลากหลายพร้อมกัน ทั้งภาพ, ข้อความ, วิดีโอ หรือเสียง เพื่อนำมาประมวลผลและสร้างออกมาเป็นวิดีโอชิ้นใหม่ที่รวมทุกไอเดียเข้าด้วยกันอย่างลงตัว
สร้าง “ร่างอวตาร” ของตัวเอง (Digital Avatar): ผู้ใช้สามารถสร้างวิดีโอจำลองที่เป็นหน้าและเสียงของตัวเอง เพื่อใช้ในการสื่อสารหรือสร้างคอนเทนต์ได้อย่างรับผิดชอบและปลอดภัย

Google ยังให้ความสำคัญเรื่องความปลอดภัยต้องมาก่อน วิดีโอทุกตัวที่ถูกสร้างขึ้นด้วยโมเดลนี้ จะมีการฝังลายน้ำดิจิทัล SynthID ที่มองไม่เห็นด้วยตาเปล่า เพื่อให้สามารถตรวจสอบและยืนยันความโปร่งใสได้ง่ายผ่าน Google Search และแอป Gemini

การเปิดใช้งาน

ผู้ใช้ทั่วไป: เริ่มทยอยเปิดให้ใช้งานแล้วตั้งแต่วันนี้ โดยไม่มีค่าใช้จ่ายบน YouTube Shorts และแอป YouTube Create
สมาชิกบริการ: สำหรับผู้สมัครสมาชิก Google AI Plus, Pro และ Ultra สามารถเข้าใช้งานผ่านแอป Gemini และ Google Flow ได้ทันทีทั่วโลก
นักพัฒนาและองค์กร: Google เตรียมเปิดให้ใช้งานผ่านระบบ API ในอีกไม่กี่สัปดาห์ข้างหน้า

ที่มา blog.google