แชร์

ปรับขนาดตัวอักษร - ก+ก

Google เปิดตัวฟีเจอร์ใหม่บนแอปพลิเคชัน Gemini ชูโรงด้วย Lyria 3 โมเดลปัญญาประดิษฐ์สร้างเสียงดนตรีล่าสุดจาก Google DeepMind ที่ช่วยให้ผู้ใช้งานสามารถเนรมิตบทเพลงต้นฉบับความยาว 30 วินาทีได้ง่ายๆ จากการป้อนคำสั่งข้อความ รูปภาพ หรือวิดีโอ พร้อมเผยแนวทางปฏิบัติและเทคนิคสำคัญที่จะช่วยรีดประสิทธิภาพการแต่งเพลงให้สมบูรณ์แบบยิ่งขึ้น

การเริ่มต้นใช้งานนั้นเรียบง่าย เพียงผู้ใช้งานเลือกโหมดสร้างเสียงดนตรีภายในแอปพลิเคชัน Gemini จากนั้นสามารถเริ่มต้นป้อนคำสั่งได้ทันที โดย Google ได้แนะนำเทคนิค 6 ประการเพื่อช่วยให้โมเดลสามารถสร้างสรรค์บทเพลงได้ตรงใจผู้ใช้งานมากที่สุด ดังนี้

  • เริ่มต้นด้วยข้อความบอกเล่าเรื่องราว: ผู้ใช้สามารถป้อนคำสั่งอธิบายบรรยากาศหรือเรื่องราวเฉพาะตัว เช่น การสั่งให้สร้างเพลงพังก์ร็อกยุค 90 จังหวะกลองเร็วๆ เพื่อบอกให้เพื่อนร่วมห้องไปล้างจาน หรือเพลงแนวแอฟโฟรบีตเกี่ยวกับอาหารจานโปรด
  • ใช้ภาพและวิดีโอเป็นแรงบันดาลใจ: นอกเหนือจากข้อความ Lyria 3 ยังรองรับการอัปโหลดสื่อทางสายตา ไม่ว่าจะเป็นภาพถ่ายสุนัขตัวโปรด ทริปท่องเที่ยว หรือแม้แต่งานศิลปะ โดยระบบจะวิเคราะห์องค์ประกอบ เสื้อผ้า และฉากหลัง เพื่อรังสรรค์ท่วงทำนองที่สอดคล้องกับภาพนั้น
  • กำหนดแนวเพลงและยุคสมัยให้ชัดเจน: สามารถระบุแนวเพลงพื้นฐานอย่างฮิปฮอปยุค 90 หรือป็อปยุค 2000 ไปจนถึงการผสมผสานแนวเพลงที่แตกต่างกันในแทร็กเดียว เช่น เพลงเคป็อปที่มีกลิ่นอายโมทาวน์ หรือเพลงฟังก์ที่ผสานเสียงไวโอลินคลาสสิก
  • ลงลึกถึงรายละเอียดเครื่องดนตรีและเสียงร้อง: ผู้ใช้สามารถกำหนดทิศทางของเพลงได้ละเอียดขึ้น ตั้งแต่การเลือกเครื่องดนตรีเฉพาะชิ้น จังหวะการไล่ระดับเสียงจากเปียโนนุ่มๆ ไปสู่ท่อนฮุกที่หนักหน่วง รวมถึงระบุลักษณะเสียงนักร้อง ไม่ว่าจะเป็นเสียงทุ้มลึก เสียงโซปราโน คณะประสานเสียง หรือแม้แต่สไตล์การร้องแบบแหบเสน่ห์
  • แต่งเนื้อร้องเองหรือมอบหน้าที่ให้ AI: หากมีเนื้อเพลงในใจ สามารถพิมพ์คำว่า Lyrics นำหน้าข้อความที่ต้องการได้ทันที และหากต้องการให้มีเสียงร้องประสานหรือคอรัส ก็สามารถพิมพ์ข้อความท่อนนั้นใส่ไว้ในเครื่องหมายวงเล็บเพื่อสั่งงานระบบ ในขณะเดียวกันก็สามารถสั่งให้ระบบคิดเนื้อเพลงให้ทั้งหมดโดยกำหนดเพียงแค่ธีมหลักของเพลง
  • บันทึกและแบ่งปันผลงาน: เมื่อได้แทร็กที่ถูกใจ ผู้ใช้งานสามารถดาวน์โหลดไฟล์ออกมาในรูปแบบ MP3 หรือ MP4 เพื่อนำไปแชร์ต่อบนโซเชียลมีเดียหรือส่งให้เพื่อนได้อย่างสะดวก

การเปิดตัว Lyria 3 บนแพลตฟอร์ม Gemini สะท้อนให้เห็นถึงพัฒนาการของ Generative AI ที่ขยับจากการสร้างข้อความและภาพนิ่ง เข้าสู่พื้นที่ของโสตสัมผัสอย่างเต็มรูปแบบ การที่โมเดลสามารถเข้าใจและวิเคราะห์สื่อข้ามรูปแบบทั้งภาพและวิดีโอเพื่อแปลงเป็นเสียงดนตรีได้นั้น ถือเป็นความก้าวหน้าทางเทคโนโลยีแบบมัลติโมดัลที่จะเข้ามาพลิกโฉมวงการสร้างสรรค์คอนเทนต์ ทำให้ผู้ที่ไม่มีพื้นฐานทางดนตรีสามารถผลิตผลงานเสียงระดับมืออาชีพได้ด้วยตนเอง

ก้าวต่อไปที่น่าจับตามองคือการปรับตัวของอุตสาหกรรมดนตรีและครีเอเตอร์ต่อเครื่องมือเหล่านี้ รวมถึงพัฒนาการของ Lyria ในอนาคตที่จะขยายขีดความสามารถให้สร้างบทเพลงได้ยาวนานและซับซ้อนมากยิ่งขึ้น ซึ่งจะเปิดประตูสู่ความเป็นไปได้ใหม่ๆ ในการเล่าเรื่องผ่านเสียงเพลงบนโลกดิจิทัล

แหล่งที่มา blog.google

ติดตามข่าวสารมือถือได้ที่
www.facebook.com/siamphonedotcom

ทำนายเบอร์มือถือ เบอร์สวย เบอร์มงคล
รับซื้อมือถือ รับเครื่องถึงบ้าน
บูลอาเมอร์ ฟิล์มกระจกกันรอยมือถือ

ไฮไลท์ข่าวเด่น

อ่าน

แบ่งปันบทความ

มือถือออกใหม่