Light Dark

Now Reading: สรุปงาน Google I/O 2025 งานที่เอ่ยถึง Gemini มากกว่าคำว่า AI ชูโมเดลใหม่ทำงานฉลาดขึ้น ผลักดันงานวิจัยให้ใช้งานได้จริง

01
สรุปงาน Google I/O 2025 งานที่เอ่ยถึง Gemini มากกว่าคำว่า AI ชูโมเดลใหม่ทำงานฉลาดขึ้น ผลักดันงานวิจัยให้ใช้งานได้จริง

Light Dark

Home
Tech & Innovation
AI
สรุปงาน Google I/O 2025 งานที่เอ่ยถึง Gemini มากกว่าคำว่า AI ชูโมเดลใหม่ทำงานฉลาดขึ้น ผลักดันงานวิจัยให้ใช้งานได้จริง

สรุปงาน Google I/O 2025 งานที่เอ่ยถึง Gemini มากกว่าคำว่า AI ชูโมเดลใหม่ทำงานฉลาดขึ้น ผลักดันงานวิจัยให้ใช้งานได้จริง

หนุ่ย แซ่แต้AI1 year ago111 Views

หัวข้อในเนื้อหานี้

เริ่มแล้วกับ Google I/O 2025 งานใหญ่ฝั่งนักพัฒนาของ Google โดยปีนี้นั้นจะเน้นไปที่เรื่องของ AI โดยเฉพาะ เนื่องจากแยกจัดงาน The Android Show ไปตั้งแต่สัปดาห์ก่อน ลองไปดูว่าปีนี้มีไฮไลต์อะไรน่าสนใจบ้าง

การพัฒนา AI อย่างต่อเนื่อง

Google ได้พัฒนา AI อย่างต่อเนื่อง โดยวัดความก้าวหน้าได้จากคะแนน Elo ซึ่งตอนนี้มากกว่า 300 คะแนนนับตั้งแต่การพัฒนา โมเดล Gemini Pro รุ่นแรก มาวันนี้ Gemini 2.5 Pro นั้นทำคะแนนนำในเกือบทุกด้าน

หนึ่งในความสำเร็จคือการพัฒนา TPU ซึ่งตอนนี้เป็นรุ่นที่ 7 ในชื่อว่า Ironwood ด้วยพลังประมวลผล 42.5 exaflops ออกแบบให้มีพลังในการใช้ความคิดและการอนุมาน ประสิทธิภาพการทำงานดีขึ้น 10 เท่าเมื่อเทียบกับรุ่นก่อนหน้า ในขณะที่ค่าบริการก็ลดลงอยู่ในระดับที่คุ้มค่าในการใช้งาน

โลกปรับใช้ AI มากขึ้น

Google ประมวลผลโทเค็นได้มากขึ้น 50 เท่า เพิ่มจาก 9.7 ล้านล้านโทเคนเป็น 480 ล้านล้านโทเคนเมื่อเทียบกับช่วงเวลาเดียวกันของปีที่แล้ว
นักพัฒนาเพิ่มขึ้น 5 เท่าตัว ส่งผลให้ตอนนี้มีนักพัฒนาซอฟต์แวร์กว่า 7 ล้านคน
แอป Gemini มีผู้ใช้งานรายเดือนมากกว่า 400 ล้านคน โมเดล 2.5 Pro มีการใช้งานเพิ่มขึ้น 45%

จากงานวิจัยสู่ความเป็นจริง

ธีมงานหลักของปีนี้คือ การผลักดันงานวิจัยให้กลายเป็นผลิตภัณฑ์หรือบริการที่ใช้งานได้จริง

Project Starline กลายเป็น Google Beam และ speech translation

เมื่อหลายปีก่อน Google ได้เปิดตัวงานวิจัยชื่อว่า Project Starline ที่ใช้ AI สร้างวิดีโอสามมิติสำหรับการประชุมทางไกลบนแผ่นกระจก เพื่อให้รู้สึกเหมือนว่าบุคคลนั้นอยู่ตรงหน้า ซึ่งโครงการนี้ได้กลายเป็นผลิตภัณฑ์จริงในชื่อว่า Google Beam

แพลตฟอร์มการสื่อสารที่เปลี่ยนวิดีโอ 2 มิติให้กลายเป็นภาพ 3 มิติที่สมจริงผ่านการแสดงผลบนจอไลท์ฟิลด์ 3D ได้แบบ Realtime ผสานการทำงานกับกล้อง 6 ตัวและ AI พร้อมเทคโนโลยีติดตามการเคลื่อนไหวของศีรษะ ด้วยอัตราเฟรม 60 เฟรมต่อวินาทีทำให้ได้การสนทนาที่เป็นธรรมชาติมากขึ้น ทาง Google ร่วมมือกับ HP มาช่วยผลิตอุปกรณ์ Google Beam คาดว่ารุ่นแรกจะพร้อมวางจำหน่ายในช่วงปลายปีนี้

ด้านของ Google Meet มีการเพิ่มเทคโนโลยีแปลภาษาจากเสียงพูดได้ใกล้เคียงเกือบจะ Realtime แถมยังจับคู่เสียงและน้ำเสียงของผู้พูด รวมถึงการแสดงออกของสีหน้าของพวกเขาได้ เพื่อให้น้ำเสียงและอารมณ์ที่แปลออกมาสมจริงยิ่งขึ้น เริ่มใช้งานกับภาษาอังกฤษและสเปนก่อนสำหรับผู้ใช้ Google AI Pro และ Ultra ภาษาอื่นๆจะตามมาในอีกไม่กี่สัปดาห์ข้างหน้า ส่วนฝั่งของลูกค้าธุรกิจ Workspace จะเปิดทดสอบใช้งานในปีนี้

Project Astra กลายเป็น Gemini Live

โครงการ Project Astra เปิดตัวครั้งแรกเมื่อปีที่แล้ว ด้วยการเป็นผู้ช่วย AI ที่สามารถเข้าใจสิ่งที่อยู่รอบตัวเราด้วยการใช้กล้องและการแชร์สิ่งที่อยู่บนหน้าจอ ซึ่งความสามารถเหล่านี้ได้กลายเป็นส่วนหนึ่งของ Gemini Live เปิดให้ผู้ใช้เปิดกล้องหรือแชร์หน้าจอเพื่อถามข้อมูลและโต้ตอบได้แบบ Realtime

เปิดให้ใช้งานได้อย่างหลากหลายตั้งแต่การเตรียมตัวสัมภาษณ์ไปจนถึงการฝึกซ้อมมาราธอน พร้อมเปิดให้ผู้ใช้ iOS ได้ใช้งานหลังจากที่ Android สามารถใช้งานได้ไปก่อนหน้านี้

Project Mariner ต่อยอดสู่ Agent Mode

Project Mariner คือ งานวิจัยที่พัฒนา AI Agent ที่สามารถใช้งานคอมพิวเตอร์แทนเราได้ซึ่งเปิดตัวไปเมื่อเดือนธันวาคมปีที่แล้ว เช่น เปิดเว็บ ค้นหาข้อมูล ทำงานกรอกข้อมูลเบื้องต้น ซึ่งตอนนี้ก็มีการเพิ่มความสามารถให้ทำงานแบบมัลติทาสก์ ทำหลายๆ อย่างพร้อมกันได้ รวมถึงเพิ่มการฝึกสอนด้วยวิธี “teach and repeat” เราสอน AI ด้วยการทำงานให้มันดู จากนั้นในอนาคตถ้า AI เจองานแบบเดียวกันก็จะทำงานนั้นเองได้

ด้านนักพัฒนาเองใช้ความสามารถนี้ได้ผ่าน Gemini API ซึ่งตอนนี้ Automation Anywhere และ UiPath ได้นำไปทดสอบใช้งานจริงแล้ว คาดจะพร้อมเปิดใช้งานในวงกว้างได้ในช่วงฤดูร้อนนี้

ฝั่งของ Google ยังวางระบบนิเวศให้รองรับ AI Agent ด้วย

สร้างโปรโตคอล Agent2Agent แบบเปิด เพื่อให้ AI Agent สามารถพูดคุยกันได้
โปรโตคอล Model Context จาก Anthropic เพื่อให้ AI Agent สามารถเข้าถึงบริการอื่นๆ ได้
เพิ่มสามารถของ AI Agent ไปยังบริการอื่นๆ เช่น Chrome, การค้นหา และแอป Gemini

AI ที่รู้จักตัวเราเป็นรายบุคคล

สิ่งที่ Google เน้นย้ำ คือ การทำให้ AI มีประโยชน์ในชีวิตจริง ด้วยการทำให้ AI รู้จักบริบทของแต่ละบุคคล เพื่อปรับการใช้งานให้เข้ากับแต่ละคนจากการใช้งานแอปต่างๆ ของ Google โดยเน้นความเป็นส่วนตัวและควบคุมได้ ผู้ใช้ต้องอนุญาตให้เข้าถึงและควบคุมการใช้งานได้

ยกตัวอย่างเช่น Smart Replies ใน Gmail ช่วยตอบกลับได้เหมือนเราพิมพ์ตอบจริงๆ เช่น เพื่อนส่งอีเมลขอคำแนะนำเกี่ยวกับท่องเที่ยวที่เราเคยไปมาแล้ว Gemini จะไปค้นหาอีเมลและไฟล์ที่ผ่านมาทั้งในอีเมล รวมถึงแผนเดินทางบน Google Drive ตอบกลับด้วยรายละเอียดครบถ้วน ตรงประเด็นคำถาม แถมยังเลียนแบบสไตล์การเขียนของเราได้ด้วยให้เหมือนเราพิมพ์ตอบเอง ซึ่งฟีเจอร์นี้จะเปิดให้งานในช่วงปลายปีนี้ จากนั้นจะขยายไปยังบริการอื่นๆอย่าง Google Search และ Gemini

AI Mode ใน Search

Google Search เสริมความสามารถของ Gemini ให้ฉลาดยิ่งขึ้น นับตั้งแต่เปิดตัว AI Overviews เมื่อปีที่แล้วส่งผลให้ตอนนี้มีผู้ใช้มากกว่า 1,500 ล้านคนใน 200 ประเทศ ในงานนี้ Google ได้เพิ่มแท็บใหม่ AI Mode ใน Search สร้างประสบการณ์การค้นหาแบบใหม่รองรับการถามคำถามที่ยาวและซับซ้อนขึ้น 2-3 เท่า ถามคำถามต่อเนื่องได้ เปิดให้ใช้งานในสหรัฐก่อน

Gemini 2.5 โมเดล AI ที่ฉลาดที่สุดของ Google

Gemini 2.5 Flash ปรับปรุงประสิทธิภาพในเกณฑ์มาตรฐานสำคัญสำหรับการใช้เหตุผล มัลติโมดัล โค้ด และบริบทที่ยาวขึ้น เป็นรองแค่ Gemini 2.5 Pro

Gemini 2.5 Pro ทำงานดียิ่งขึ้นด้วยโหมดการใช้เหตุผลที่ปรับปรุงใหม่ที่มีชื่อเรียกว่า Deep Think ซึ่งใช้การวิจัยล่าสุดเกี่ยวกับการคิดและการใช้เหตุผล รวมถึงเทคนิคการคิดแบบคู่ขนาน

แอป Gemini ที่ทรงพลังขึ้น

เแอป Gemini ปรับการทำงานของฟีเจอร์ Deep Research ให้เป็นส่วนตัวมากขึ้น เปิดให้เราอัปโหลดไฟล์ของตัวเองเพื่อให้ AI วิเคราะห์ได้ ในอนาคตจะเชื่อมต่อกับ Google Drive และ Gmail ดึงข้อมูลมาสร้างรายงานการวิจัยแบบกำหนดเองได้

นอกจากนี้ Google ยังผสานการทำงานกับ Canvas ทำให้สร้างอินโฟกราฟิกแบบไดนามิก, แบบทดสอบ จนไปถึงพอดแคสต์ในหลายภาษาได้ด้วยการคลิกเพียงครั้งเดียว รวมถึงนำการเข้ารหัส Vibe มาใช้ใน Canvas ช่วยสร้างแอปที่มีใช้งานได้จริงเพียงแค่แชทกับ Gemini

รวมถึงเพิ่มความสามารถ Gemini Live แชร์กล้องและหน้าจอเพื่อสอบถามและวิเคราะห์ข้อมูลผ่านกล้องหรือการแชร์หน้าจอให้ใช้งานได้ฟรีสำหรับทุกคนทั้งบนแอนดรอยด์และ iOS พร้อมเชื่อมต่อกับแอป Google เพื่อให้กลายเป็นผู้ช่วยที่ฉลาดยิ่งขึ้น

AI สร้างสื่อที่ล้ำหน้าขึ้น ภาพ เสียงและวิดีโอ

Google ได้อัปเดต Veo โมเดล AI สำหรับสร้างวิดีโอให้เป็นรุ่น 3 อัปเกรดคุณภาพให้เป็นระดับเดียวกับภาพยนตร์ รองรับสร้างเสียงประกอบวิดีโอได้แล้ว หลังจากที่รุ่นก่อนหน้าสร้างได้แค่วิดีโออย่างเดียว

นอกจากนี้ยังเปิดตัว Imagen 4 เป็นโมเดลสำหรับสร้างภาพล่าสุดที่มีความสามารถมากที่สุดของ Google ทำงานเร็วขึ้น 10 เท่าเมื่อเทียบกับรุ่นก่อนหน้า ให้องค์ประกอบและรายละเอียดที่สมจริงที่ 2K สื่อสารอารมณ์ได้ดีขึ้น ทั้งสองโมเดลเปิดใช้งานในแอป Gemini

ฝั่งผู้สร้างภาพยนตร์มีการเปิดตัวเครื่องมือใหม่ที่เรียกว่า Flow ที่ใช้ความสามารถของ Veo 3 เปิดให้ผู้ใช้สามารถสร้างคลิปภาพยนตร์และขยายคลิปสั้นๆ ให้เป็นฉากที่ยาวขึ้นได้ พร้อมความสามารถในการการควบคุมมุมกล้อง, สร้างและแก้ไขฉากหลัง รวมถึงให้คำแนะนำและเทคนิคที่ใช้ เพื่อกระตุ้นให้เกิดเรียนรู้และปรับใช้เทคนิครูปแบบใหม่ๆ

ต้องบอกว่า AI นั้นสร้างประโยชน์มหาศาล ซึ่งถือเป็นโจทย์สำคัญของทั้งนักพัฒนา ผู้สร้างเทคโนโลยี และผู้ใช้ว่าจะนำไปใช้ให้เกิดประโยชน์อย่างไรที่จะส่งผลดีกับคนหมู่มาก เพราะสิ่งนี้กำลังเป็นรากฐานสำคัญของเทคโนโลยีใหม่ๆที่จะตามมาในอนาคต ตั้งแต่ระบบอัตโนมัติ, หุ่นยนต์ รถยนตืไร้คนขัย ไปจนถึงควอนตัม

ที่มา google

หนุ่ย แซ่แต้

นักเขียนสาย Introvert ที่ชื่นชอบเรื่องนวัตกรรมและความคิดสร้างสรรค์ ใช้เวลาว่างกับ มังงะ, เสียงเพลงและ idol

สรุปงาน Google I/O 2025 งานที่เอ่ยถึง Gemini มากกว่าคำว่า AI ชูโมเดลใหม่ทำงานฉลาดขึ้น ผลักดันงานวิจัยให้ใช้งานได้จริง

สรุปงาน Google I/O 2025 งานที่เอ่ยถึง Gemini มากกว่าคำว่า AI ชูโมเดลใหม่ทำงานฉลาดขึ้น ผลักดันงานวิจัยให้ใช้งานได้จริง

Share

การพัฒนา AI อย่างต่อเนื่อง

โลกปรับใช้ AI มากขึ้น

จากงานวิจัยสู่ความเป็นจริง

Project Starline กลายเป็น Google Beam และ speech translation

Project Astra กลายเป็น Gemini Live

Project Mariner ต่อยอดสู่ Agent Mode

AI ที่รู้จักตัวเราเป็นรายบุคคล

AI Mode ใน Search

Gemini 2.5 โมเดล AI ที่ฉลาดที่สุดของ Google

แอป Gemini ที่ทรงพลังขึ้น

AI สร้างสื่อที่ล้ำหน้าขึ้น ภาพ เสียงและวิดีโอ

Share

Related Posts