
สรุป Use Case ใช้งานจริง “4o Image Generation” สร้างรูปภาพด้วย ChatGPT ทำอะไรได้บ้าง ?
30 มี.ค. 2025
เมื่อไม่นานมานี้ OpenAI เพิ่งประกาศปล่อยอัปเดตฟีเชอร์ “4o Image Generation” ซึ่งก็คือเครื่องมือสร้างรูปภาพจากการพิมพ์สั่ง (Prompt) ให้กับผู้ใช้งาน ChatGPT
อธิบายง่าย ๆ ก็คือ ฟีเชอร์ที่ผู้ใช้งานสามารถสั่งสร้างรูปภาพใน ChatGPT ได้ทันที โดยที่ไม่ต้องดาวน์โหลดหรือติดตั้งอะไรเพิ่มเติม
อย่างไรก็ตาม หลายคนอาจมองว่า ไม่ได้น่าตื่นเต้นหรือมีอะไรให้น่าตกใจ เพราะเครื่องมือ AI อื่น ๆ อย่าง Gemini หรือ Copilot ก็ทำได้นานแล้ว
แต่ที่น่าสนใจคือ 4o Image Generation สามารถสร้างรูปภาพออกมาได้ค่อนข้างสมจริง และมีดีเทลที่เราสามารถกำหนดได้ในแต่ละจุด ขึ้นอยู่กับการพิมพ์สั่ง
เรียกได้ว่า ภาพที่ออกมาจะสมบูรณ์มากแค่ไหน ก็ขึ้นอยู่กับชุดคำสั่งที่ผู้ใช้งานพิมพ์ลงไปนั่นเอง
แล้วเครื่องมือ 4o Image Generation ใช้งานจริงแบบไหนได้บ้าง ?
MarketThink สรุปมาให้เป็นข้อ ๆ
1. สร้างรูปภาพจากภาพวาดขาวดำในกระดาษธรรมดา ให้ออกมาสมบูรณ์แบบ ผ่านชุดคำสั่งที่แต่งเติมเข้าไป
ยกตัวอย่างเช่น วาดการ์ตูนง่าย ๆ ลงบนกระดาษ และถ่ายภาพส่งเข้า ChatGPT แล้วสั่งให้ ChatGPT เปลี่ยนเนื้อหาภาพวาดที่ถ่ายลงไป ให้กลายเป็นการ์ตูนที่ดูสมจริง ซึ่งจะช่วยประหยัดเวลาในการทำงาน และยังสั่งให้ลงสีได้อีกด้วย
นอกจากนี้ยังสามารถอัปโหลดรูปภาพวัตถุอื่น ๆ ลงไป เพื่อเปลี่ยนแปลงบางส่วนของรูปภาพได้ เช่น เราต้องการเปลี่ยนฉากพื้นหลังของการ์ตูนจากเดิมที่เป็นลายไม้ ให้กลายเป็นลายสัตว์เลี้ยงของเราก็ได้
2. สร้างภาพตัดปะ เพื่อนำไปใช้งานได้อย่างอิสระ
เมื่อต้องการภาพตัดปะ เช่น “รูปแมวส้มใส่หมวก” ก็สามารถพิมพ์ชุดคำสั่ง เพื่อสร้างรูปภาพตัดปะ สำหรับนำไปใช้งานต่อได้ทันที ไม่ว่าจะเป็น สไลด์นำเสนอ หรือทำเป็นสติกเกอร์เพื่อแปะบนเครื่องใช้ไฟฟ้าต่าง ๆ
ที่น่าสนใจคือ สามารถกำหนดเพิ่มเติมได้ด้วยว่า ในหนึ่งรูป ต้องการให้มีภาพตัดปะกี่ชิ้น และมีรูปอะไรบ้าง
นอกจากนี้ยังสามารถกำหนดให้ไม่มีฉากหลัง หรือพูดง่าย ๆ ก็คือ ดึงวัตถุออกจากฉาก เพื่อนำไปใช้งานกับงานประเภทอื่น ๆ ได้ง่าย ๆ เพียงแค่สั่งให้ตัดพื้นหลัง
เพียงแค่นี้ ก็จะได้รูปวัตถุที่ต้องการแบบไร้ฉากหลัง เพื่อนำไปใช้งานต่อได้ทันที
3. สร้างคาแรกเตอร์ได้อย่างละเอียด และสมบูรณ์
ยกตัวอย่างง่าย ๆ เมื่อต้องการสร้างคาแรกเตอร์ “แมวส้ม” ก็สามารถกำหนดได้เลยว่า
- Texture ผิวเป็นแบบไหน เช่น มีขน, คริสตัล, หิน และอื่น ๆ
- มีฉากหลังเป็นแบบไหน เช่น ไร้ฉากหลัง, อยู่ในห้อง, ฉากสีขาว, อยู่กลางถนน
- กำหนดแสงไฟได้ตามต้องการ เช่น มีแสงไฟด้านหน้า, ด้านข้าง, รอบ ๆ
ซึ่งทั้งหมดที่กล่าวมาเป็นเพียงแค่ตัวอย่างเท่านั้น เรายังสามารถกำหนดเงื่อนไขอื่น ๆ เพิ่มเติม เพื่อให้ถูกต้องและตรงตามความต้องการของเรามากที่สุด
4. สร้างอินโฟกราฟิก ในรูปแบบต่าง ๆ
ยกตัวอย่างง่าย ๆ เช่น ต้องการนำเสนองาน “ฤดูในประเทศไทยในช่วงเดือนต่าง ๆ” เราสามารถพิมพ์ชุดคำสั่งลงไปได้ทันที โดยที่ไม่จำเป็นต้องให้ข้อมูล
เนื่องจาก ChatGPT จะไปค้นหาข้อมูลด้วยตนเองบนเว็บไซต์
แต่สิ่งที่สำคัญคือ เราจำเป็นต้องเช็กข้อมูลอีกทีว่า ข้อมูลที่ ChatGPT ออกแบบมานั้น ถูกต้องหรือไม่
ทั้งหมดนี้ จะเห็นได้ว่า เครื่องมือ 4o Image Generation ไม่ได้เป็นเพียงเครื่องมือสร้างรูปภาพจากชุดคำสั่งธรรมดา เพราะสามารถทำได้อย่างละเอียด จนนำไปใช้งานต่อได้ทันที
ซึ่งตัวอย่างที่แสดงให้เห็นข้างต้น ก็เป็นเพียงการสร้างคำสั่งอย่างเจาะจงว่าต้องการชิ้นงานแบบไหน
เพราะนอกจากนี้ ยังสามารถกำหนดรายละเอียดรูปแบบอื่น ๆ ได้ เช่น
- ทำออกมาในรูปแบบวิดีโอเกม
- ทำออกมาในรูปแบบวิดีโอเกม
- สร้างรูปภาพจากโคดที่สั่ง
- สร้างรูปภาพให้ออกมาในมุมมองของกล้องรุ่น Leica Q1 ที่ติดกับเลนส์ระยะ 85mm
- สร้างรูปภาพให้ออกมามีโทนสีของภาพยนตร์เรื่องต่าง ๆ
ที่สำคัญ ChatGPT ได้ใส่มาตรการด้านความปลอดภัยในการสร้างรูปภาพ คือ จะไม่อนุญาตให้สร้างรูปภาพที่มีเนื้อหารุนแรง หรือคอนเทนต์ติดเรต
เพราะฉะนั้น 4o Image Generation ก็น่าจะเป็นเครื่องมือที่มีความปลอดภัยต่อผู้ใช้งานทุกวัย
อย่างไรก็ตาม จากการทดลองใช้งาน ยังพบว่า การสร้างรูปภาพยังมีข้อจำกัดอยู่บ้าง เช่น ภาพที่สร้างได้ถูกครอปหายไปบางส่วน, ตัวอักษรโดนตัดหาย ซึ่งปัญหาเหล่านี้อาจแก้ได้ ผ่านการสั่งงานที่ละเอียดมากขึ้น
ตัวอย่างการใช้งานด้วยชุดคำสั่งภาษาไทย ซึ่งแสดงให้เห็นว่าสามารถสั่งงานได้อย่างสมบูรณ์