สรุป 9 ข้อ AI ตัวใหม่ชื่อ “Sora” สร้างวิดีโอยาว 1 นาที ด้วยข้อความ จากเจ้าของ ChatGPT

สรุป 9 ข้อ AI ตัวใหม่ชื่อ “Sora” สร้างวิดีโอยาว 1 นาที ด้วยข้อความ จากเจ้าของ ChatGPT

16 ก.พ. 2024
เมื่อไม่กี่ปีที่ผ่านมา เราพึ่งจะว้าวกับการสร้างรูปด้วยข้อความ บนแพลตฟอร์มต่าง ๆ เช่น Gemini ที่สามารถสร้างรูปภาพจากข้อความได้
หลังจากนั้นไม่นานก็มีสิ่งที่ทำให้เกิดความประทับใจขึ้นอีก
เนื่องจากในปี 2022 มีการกำเนิดขึ้นของ Generative Video Model รุ่นแรก ๆ ที่สามารถสร้างวิดีโอจากข้อความสั้น ๆ
ซึ่งเราอาจเคยเห็นผ่านตากันบ้างกับสตาร์ตอัปที่ชื่อว่า Runway
แต่ก็ยังมีข้อผิดพลาดต่าง ๆ เช่น การให้ภาพที่มีรายละเอียดไม่ชัดเจน และวิดีโอที่สั้นเกินไป
ล่าสุด Open AI เจ้าของ ChatGPT เพิ่งเปิดตัว Generative Video Model ชื่อว่า “Sora”
ความเจ๋งของ Sora คือ สามารถสร้างวิดีโอที่มีความยาวมาก 1 นาที ได้ด้วยการพิมพ์ Keywords เพียงไม่กี่คำ
สรุปจุดเด่นของ Sora 9 ข้อ คือ
1. สามารถสร้างวิดีโอความละเอียดสูงถึง Full HD 1080p ที่มีความยาวสูงสุด 1 นาที
2. สามารถนำรูปภาพ หรือ วิดีโอที่มีอยู่ไปสร้างสรรค์ใหม่ได้
เช่น ป้อนคำสั่งให้สร้างวิดีโอแบบวนซ้ำ สร้างวิดีโอที่มาจากรูปภาพที่ส่งเข้าไป สร้างวิดีโอส่วนก่อนหน้าหรือส่วนปิดท้ายจากวิดีโอเดิมที่ส่งเข้าไป
3. สามารถเปลี่ยนสภาพแวดล้อมของวิดีโอได้
เช่น เรามีคลิปต้นฉบับเป็นรถยนต์วิ่งบนถนนที่มีการจราจรแออัด ก็สามารถป้อนคำสั่งให้ Sora ทำการเปลี่ยนสภาพแวดล้อมเป็นในป่าดิบชื้นได้
4. สามารถเชื่อมหรือผสม วัตถุในคลิปวิดีโอเข้าด้วยกันได้
เช่น คลิปแรกเป็นคลิปม้าลาย คลิปต่อมาเป็นคลิปเสือ เมื่อนำสองคลิปมาเชื่อมกันเราก็จะได้สัตว์ที่มีหน้าตาแปลกใหม่ขึ้นมาได้ คือจะเป็นม้าลายก็ไม่ใช่ เสือก็ไม่เชิง
ซึ่งเป็นการเสริมสร้างจินตนาการของเราให้พัฒนาขึ้นไปอีกขั้น
5. สามารถสร้างรูปภาพได้เพื่อซัปพอร์ตวิดีโอได้เลย ทำให้เราไม่จำเป็นต้องสลับไปใช้เครื่องมืออื่น ๆ ในการสร้างภาพจาก AI
6. สามารถจำลองสถานที่ในรูปแบบ 3 มิติ ในมุมมองต่าง ๆ ซึ่งจะให้ความรู้สึกเหมือนวิดีโอเกิดจากการบินโดรน ไปในสถานที่ต่าง ๆ
7. สามารถเข้าใจมุมมองต่าง ๆ ของวัตถุ เช่น แม้ว่า ผู้คน สัตว์ และวัตถุ จะถูกบังหรือออกจากฉาก แต่ก็ยังสามารถสร้างฉากที่ต่อเนื่องและลื่นไหลได้
รวมถึงฉากที่มีตัวละครเดียวกันในหลาย ๆ มุม โดยสามารถคงรูปลักษณ์ตัวละครไว้ได้ตลอดทั้งวิดีโอ
8. สร้างรายละเอียดที่เกิดขึ้นจริงได้อย่างเหมาะสม
เช่น น้ำที่ซึมผ้า การกัดวัตถุต่าง ๆ แล้วมีรอยฟัน
9. สามารถจำลองโลกในเกมได้
เช่น การจำลองภาพในเกม Minecraft ซึ่งจะต่างจากภาพในเกมตรงที่ ภาพจาก Sora จะให้ภาพก้อนเมฆและให้แสงเงา สมจริงกว่าภาพจากเกม
แม้ว่า Sora จะมีความสามารถที่หลากหลาย จนเหมือนจะพร้อมให้ทุกคนได้ใช้งานแล้ว
แต่ในปัจจุบันทีมพัฒนา ยังอนุญาตให้เข้าถึงการใช้งานเพียงแค่ ศิลปิน นักออกแบบ ผู้ผลิตภาพยนตร์ เพื่อรับฟังความคิดเห็นจากผลลัพธ์ที่ได้จากผู้เชี่ยวชาญก่อน
เนื่องจาก Sora ยังอยู่ในขั้นตอนวิจัยและพัฒนา เพราะยังมีข้อจำกัดอยู่หลายอย่าง
เช่น ไม่สามารถจำลองฟิสิกส์ของปฏิกิริยาพื้นฐานหลายอย่างได้แม่นยำ เช่น กระจกแตก น้ำหก
หรือการรับประทานอาหาร ก็ยังไม่สามารถแสดงการเปลี่ยนแปลงของอาหารที่ถูกต้อง 100%
พูดง่าย ๆ คือ Sora ยังไม่สมบูรณ์ 100% และยังต้องการที่จะพัฒนาต่อไปอีกหลายสเต็ป
แต่เท่าที่ทำได้ในตอนนี้ และจากกระแสเปิดตัว ก็เรียกเสียงฮือฮาในโซเชียลได้มาก ๆ แล้ว..
อ้างอิง:
-https://openai.com/sora#safety
© 2024 Marketthink. All rights reserved. Privacy Policy.