
OpenAI เปิดตัว ChatGPT Images 2.0 โมเดลสร้างภาพ AI รุ่นใหม่ ฉลาดขึ้นด้วย Reasoning สร้างได้ 8 ภาพจากคำสั่งเดียว แถมได้ผลงานและตัวอักษรเนี๊ยบขึ้น

แนวคิดสำคัญของโมเดลนี้คือ “ภาพคือภาษาสากล” ไม่ใช่แค่ของตกแต่ง แต่เป็นเครื่องมือสื่อสารที่อธิบายแนวคิด สร้างอารมณ์ หรือถ่ายทอดข้อมูลเชิงลึกได้ จากเดิมที่ ChatGPT Images 2.0 คือ การต่อยอดสู่ความแม่นยำและการใช้งานระดับมืออาชีพ
จุดเปลี่ยนใหญ่ของ Images 2.0 คือ เพิ่มความสามารถในการ “คิด” ก่อนสร้าง สามารถค้นหาข้อมูลล่าสุดจากอินเทอร์เน็ต สร้างภาพหลายเวอร์ชันจากคำสั่งเดียว และตรวจสอบความถูกต้องของผลงานตัวเองได้ ส่งผลให้ภาพที่ได้มีทั้งความละเอียด ความสอดคล้อง และความแม่นยำสูงขึ้น โดยเฉพาะในงานที่ต้องใช้ข้อมูลอัปเดตหรือมีรายละเอียดซับซ้อน
โมเดลใหม่นี้สามารถจัดวางองค์ประกอบได้ดีขึ้น ควบคุมรายละเอียดเล็กๆ อย่างข้อความ ไอคอน หรือ UI ได้แม่นยำ และรองรับความละเอียดสูงถึงระดับ 2K ที่สำคัญยังรองรับการภาษาที่หลากหลายขึ้น สร้างข้อความที่ไม่ใช่ภาษาอังกฤษได้ดีขึ้นมาก ไม่ว่าจะเป็นจีน ญี่ปุ่น เกาหลี ฮินดี หรือเบงกาลี แถมยังจัดวางข้อความให้กลมกลืนเป็นส่วนหนึ่งของงานออกแบบได้อย่างเป็นธรรมชาติ

โมเดลนี้ยังสามารถถ่ายทอดงานได้หลากหลายสไตล์ยิ่งขึ้น ตั้งแต่ภาพถ่ายแบบสมจริง งานพิกเซลอาร์ต มังงะ ไปจนถึงภาพสไตล์ภาพยนตร์ พร้อมรายละเอียดด้านแสง พื้นผิว และองค์ประกอบที่แม่นยำยิ่งขึ้น เหมาะสำหรับงานสร้างสรรค์อย่างสตอรี่บอร์ด เกม หรือการตลาด
แถมยังรองรับอัตราส่วนภาพที่หลากหลาย ตั้งแต่ตั้งแต่แนวนอน 3:1 ไปจนถึงแนวตั้ง 1:3 ครอบคลุมการใช้งานตั้งแต่แบนเนอร์ โปสเตอร์ ไปจนถึงคอนเทนต์โซเชียลมีเดีย

โมเดลนี้เข้าใจข้อมูลที่อัปเดตถึงปลายปี 2025 ทำให้สามารถสร้างภาพที่อ้างอิงข้อมูลจริงได้แม่นยำขึ้น เหมาะกับงานอย่างอินโฟกราฟิก การศึกษา หรือคอนเทนต์ข้อมูล
เมื่อใช้งานในโหมดการคิด Images 2.0 จะทำหน้าที่เสมือน “ผู้ช่วยออกแบบ” ที่ช่วยตั้งแต่การตีความไอเดีย ไปจนถึงสร้างผลงานที่สมบูรณ์ และยังสามารถสร้างภาพหลายชิ้นที่มีความต่อเนื่องกันได้ในครั้งเดียว เช่น ชุดการ์ตูน โปสเตอร์ หรือกราฟิกทั้งแคมเปญ

แต่โมเดลนี้ก็ยังมีข้อจำกัดในงานบางประเภทที่ต้องการความแม่นยำสูง เช่น การพับโอริกามิ ปริศนา หรือรายละเอียดซับซ้อนบางประเภท ซึ่งยังต้องพัฒนาเพิ่มเติมในอนาคต
สำหรับคนที่สนใจตอนนี้ ChatGPT Images 2.0 เปิดให้ใช้งานแล้ววันนี้สำหรับผู้ใช้ ChatGPT และ Codex ทั่วโลก ส่วนฟีเจอร์ขั้นสูงจะจำกัดเฉพาะผู้ใช้ที่จ่ายแพ็กเกจแบบชำระเงิน ฝั่งนักพัฒนา โมเดล gpt-image-2 เปิดให้ใช้งานผ่าน API เพื่อนำไปต่อยอดในผลิตภัณฑ์ต่างๆ เช่น งานโฆษณา อินโฟกราฟิก หรือเครื่องมือออกแบบได้แล้ว
ที่มา openai





