เริ่มแล้วกับ Google I/O 2025 งานใหญ่ฝั่งนักพัฒนาของ Google โดยปีนี้นั้นจะเน้นไปที่เรื่องของ AI โดยเฉพาะ เนื่องจากแยกจัดงาน The Android Show ไปตั้งแต่สัปดาห์ก่อน ลองไปดูว่าปีนี้มีไฮไลต์อะไรน่าสนใจบ้าง
Google ได้พัฒนา AI อย่างต่อเนื่อง โดยวัดความก้าวหน้าได้จากคะแนน Elo ซึ่งตอนนี้มากกว่า 300 คะแนนนับตั้งแต่การพัฒนา โมเดล Gemini Pro รุ่นแรก มาวันนี้ Gemini 2.5 Pro นั้นทำคะแนนนำในเกือบทุกด้าน
หนึ่งในความสำเร็จคือการพัฒนา TPU ซึ่งตอนนี้เป็นรุ่นที่ 7 ในชื่อว่า Ironwood ด้วยพลังประมวลผล 42.5 exaflops ออกแบบให้มีพลังในการใช้ความคิดและการอนุมาน ประสิทธิภาพการทำงานดีขึ้น 10 เท่าเมื่อเทียบกับรุ่นก่อนหน้า ในขณะที่ค่าบริการก็ลดลงอยู่ในระดับที่คุ้มค่าในการใช้งาน
ธีมงานหลักของปีนี้คือ การผลักดันงานวิจัยให้กลายเป็นผลิตภัณฑ์หรือบริการที่ใช้งานได้จริง
เมื่อหลายปีก่อน Google ได้เปิดตัวงานวิจัยชื่อว่า Project Starline ที่ใช้ AI สร้างวิดีโอสามมิติสำหรับการประชุมทางไกลบนแผ่นกระจก เพื่อให้รู้สึกเหมือนว่าบุคคลนั้นอยู่ตรงหน้า ซึ่งโครงการนี้ได้กลายเป็นผลิตภัณฑ์จริงในชื่อว่า Google Beam
แพลตฟอร์มการสื่อสารที่เปลี่ยนวิดีโอ 2 มิติให้กลายเป็นภาพ 3 มิติที่สมจริงผ่านการแสดงผลบนจอไลท์ฟิลด์ 3D ได้แบบ Realtime ผสานการทำงานกับกล้อง 6 ตัวและ AI พร้อมเทคโนโลยีติดตามการเคลื่อนไหวของศีรษะ ด้วยอัตราเฟรม 60 เฟรมต่อวินาทีทำให้ได้การสนทนาที่เป็นธรรมชาติมากขึ้น ทาง Google ร่วมมือกับ HP มาช่วยผลิตอุปกรณ์ Google Beam คาดว่ารุ่นแรกจะพร้อมวางจำหน่ายในช่วงปลายปีนี้
ด้านของ Google Meet มีการเพิ่มเทคโนโลยีแปลภาษาจากเสียงพูดได้ใกล้เคียงเกือบจะ Realtime แถมยังจับคู่เสียงและน้ำเสียงของผู้พูด รวมถึงการแสดงออกของสีหน้าของพวกเขาได้ เพื่อให้น้ำเสียงและอารมณ์ที่แปลออกมาสมจริงยิ่งขึ้น เริ่มใช้งานกับภาษาอังกฤษและสเปนก่อนสำหรับผู้ใช้ Google AI Pro และ Ultra ภาษาอื่นๆจะตามมาในอีกไม่กี่สัปดาห์ข้างหน้า ส่วนฝั่งของลูกค้าธุรกิจ Workspace จะเปิดทดสอบใช้งานในปีนี้
โครงการ Project Astra เปิดตัวครั้งแรกเมื่อปีที่แล้ว ด้วยการเป็นผู้ช่วย AI ที่สามารถเข้าใจสิ่งที่อยู่รอบตัวเราด้วยการใช้กล้องและการแชร์สิ่งที่อยู่บนหน้าจอ ซึ่งความสามารถเหล่านี้ได้กลายเป็นส่วนหนึ่งของ Gemini Live เปิดให้ผู้ใช้เปิดกล้องหรือแชร์หน้าจอเพื่อถามข้อมูลและโต้ตอบได้แบบ Realtime
เปิดให้ใช้งานได้อย่างหลากหลายตั้งแต่การเตรียมตัวสัมภาษณ์ไปจนถึงการฝึกซ้อมมาราธอน พร้อมเปิดให้ผู้ใช้ iOS ได้ใช้งานหลังจากที่ Android สามารถใช้งานได้ไปก่อนหน้านี้
Project Mariner คือ งานวิจัยที่พัฒนา AI Agent ที่สามารถใช้งานคอมพิวเตอร์แทนเราได้ซึ่งเปิดตัวไปเมื่อเดือนธันวาคมปีที่แล้ว เช่น เปิดเว็บ ค้นหาข้อมูล ทำงานกรอกข้อมูลเบื้องต้น ซึ่งตอนนี้ก็มีการเพิ่มความสามารถให้ทำงานแบบมัลติทาสก์ ทำหลายๆ อย่างพร้อมกันได้ รวมถึงเพิ่มการฝึกสอนด้วยวิธี “teach and repeat” เราสอน AI ด้วยการทำงานให้มันดู จากนั้นในอนาคตถ้า AI เจองานแบบเดียวกันก็จะทำงานนั้นเองได้
ด้านนักพัฒนาเองใช้ความสามารถนี้ได้ผ่าน Gemini API ซึ่งตอนนี้ Automation Anywhere และ UiPath ได้นำไปทดสอบใช้งานจริงแล้ว คาดจะพร้อมเปิดใช้งานในวงกว้างได้ในช่วงฤดูร้อนนี้
ฝั่งของ Google ยังวางระบบนิเวศให้รองรับ AI Agent ด้วย
สิ่งที่ Google เน้นย้ำ คือ การทำให้ AI มีประโยชน์ในชีวิตจริง ด้วยการทำให้ AI รู้จักบริบทของแต่ละบุคคล เพื่อปรับการใช้งานให้เข้ากับแต่ละคนจากการใช้งานแอปต่างๆ ของ Google โดยเน้นความเป็นส่วนตัวและควบคุมได้ ผู้ใช้ต้องอนุญาตให้เข้าถึงและควบคุมการใช้งานได้
ยกตัวอย่างเช่น Smart Replies ใน Gmail ช่วยตอบกลับได้เหมือนเราพิมพ์ตอบจริงๆ เช่น เพื่อนส่งอีเมลขอคำแนะนำเกี่ยวกับท่องเที่ยวที่เราเคยไปมาแล้ว Gemini จะไปค้นหาอีเมลและไฟล์ที่ผ่านมาทั้งในอีเมล รวมถึงแผนเดินทางบน Google Drive ตอบกลับด้วยรายละเอียดครบถ้วน ตรงประเด็นคำถาม แถมยังเลียนแบบสไตล์การเขียนของเราได้ด้วยให้เหมือนเราพิมพ์ตอบเอง ซึ่งฟีเจอร์นี้จะเปิดให้งานในช่วงปลายปีนี้ จากนั้นจะขยายไปยังบริการอื่นๆอย่าง Google Search และ Gemini
Google Search เสริมความสามารถของ Gemini ให้ฉลาดยิ่งขึ้น นับตั้งแต่เปิดตัว AI Overviews เมื่อปีที่แล้วส่งผลให้ตอนนี้มีผู้ใช้มากกว่า 1,500 ล้านคนใน 200 ประเทศ ในงานนี้ Google ได้เพิ่มแท็บใหม่ AI Mode ใน Search สร้างประสบการณ์การค้นหาแบบใหม่รองรับการถามคำถามที่ยาวและซับซ้อนขึ้น 2-3 เท่า ถามคำถามต่อเนื่องได้ เปิดให้ใช้งานในสหรัฐก่อน
Gemini 2.5 Flash ปรับปรุงประสิทธิภาพในเกณฑ์มาตรฐานสำคัญสำหรับการใช้เหตุผล มัลติโมดัล โค้ด และบริบทที่ยาวขึ้น เป็นรองแค่ Gemini 2.5 Pro
Gemini 2.5 Pro ทำงานดียิ่งขึ้นด้วยโหมดการใช้เหตุผลที่ปรับปรุงใหม่ที่มีชื่อเรียกว่า Deep Think ซึ่งใช้การวิจัยล่าสุดเกี่ยวกับการคิดและการใช้เหตุผล รวมถึงเทคนิคการคิดแบบคู่ขนาน
เแอป Gemini ปรับการทำงานของฟีเจอร์ Deep Research ให้เป็นส่วนตัวมากขึ้น เปิดให้เราอัปโหลดไฟล์ของตัวเองเพื่อให้ AI วิเคราะห์ได้ ในอนาคตจะเชื่อมต่อกับ Google Drive และ Gmail ดึงข้อมูลมาสร้างรายงานการวิจัยแบบกำหนดเองได้
นอกจากนี้ Google ยังผสานการทำงานกับ Canvas ทำให้สร้างอินโฟกราฟิกแบบไดนามิก, แบบทดสอบ จนไปถึงพอดแคสต์ในหลายภาษาได้ด้วยการคลิกเพียงครั้งเดียว รวมถึงนำการเข้ารหัส Vibe มาใช้ใน Canvas ช่วยสร้างแอปที่มีใช้งานได้จริงเพียงแค่แชทกับ Gemini
รวมถึงเพิ่มความสามารถ Gemini Live แชร์กล้องและหน้าจอเพื่อสอบถามและวิเคราะห์ข้อมูลผ่านกล้องหรือการแชร์หน้าจอให้ใช้งานได้ฟรีสำหรับทุกคนทั้งบนแอนดรอยด์และ iOS พร้อมเชื่อมต่อกับแอป Google เพื่อให้กลายเป็นผู้ช่วยที่ฉลาดยิ่งขึ้น
Google ได้อัปเดต Veo โมเดล AI สำหรับสร้างวิดีโอให้เป็นรุ่น 3 อัปเกรดคุณภาพให้เป็นระดับเดียวกับภาพยนตร์ รองรับสร้างเสียงประกอบวิดีโอได้แล้ว หลังจากที่รุ่นก่อนหน้าสร้างได้แค่วิดีโออย่างเดียว
นอกจากนี้ยังเปิดตัว Imagen 4 เป็นโมเดลสำหรับสร้างภาพล่าสุดที่มีความสามารถมากที่สุดของ Google ทำงานเร็วขึ้น 10 เท่าเมื่อเทียบกับรุ่นก่อนหน้า ให้องค์ประกอบและรายละเอียดที่สมจริงที่ 2K สื่อสารอารมณ์ได้ดีขึ้น ทั้งสองโมเดลเปิดใช้งานในแอป Gemini
ฝั่งผู้สร้างภาพยนตร์มีการเปิดตัวเครื่องมือใหม่ที่เรียกว่า Flow ที่ใช้ความสามารถของ Veo 3 เปิดให้ผู้ใช้สามารถสร้างคลิปภาพยนตร์และขยายคลิปสั้นๆ ให้เป็นฉากที่ยาวขึ้นได้ พร้อมความสามารถในการการควบคุมมุมกล้อง, สร้างและแก้ไขฉากหลัง รวมถึงให้คำแนะนำและเทคนิคที่ใช้ เพื่อกระตุ้นให้เกิดเรียนรู้และปรับใช้เทคนิครูปแบบใหม่ๆ
ต้องบอกว่า AI นั้นสร้างประโยชน์มหาศาล ซึ่งถือเป็นโจทย์สำคัญของทั้งนักพัฒนา ผู้สร้างเทคโนโลยี และผู้ใช้ว่าจะนำไปใช้ให้เกิดประโยชน์อย่างไรที่จะส่งผลดีกับคนหมู่มาก เพราะสิ่งนี้กำลังเป็นรากฐานสำคัญของเทคโนโลยีใหม่ๆที่จะตามมาในอนาคต ตั้งแต่ระบบอัตโนมัติ, หุ่นยนต์ รถยนตืไร้คนขัย ไปจนถึงควอนตัม
ที่มา google