मेटा ओपन-सोर्स जेनरेटिव AI टूल MusicGen जो टेक्स्ट प्रॉम्प्ट से संगीत बना सकता है - TechCult
अनेक वस्तुओं का संग्रह / / June 13, 2023
विभिन्न महत्वपूर्ण नवाचारों के पीछे प्रसिद्ध प्रौद्योगिकी कंपनी, मेटा ने हाल ही में आर्टिफिशियल इंटेलिजेंस के क्षेत्र में अपनी नवीनतम उपलब्धि का खुलासा किया है क्योंकि यह ओपन-सोर्स है। MusicGen पाठ संकेतों से संगीत बनाने के लिए। इस ओपन-सोर्स एआई-पावर्ड म्यूजिक जनरेटर में टेक्स्ट प्रॉम्प्ट के आधार पर अनूठी रचनाएं बनाने की उल्लेखनीय क्षमता है।
विषयसूची
MusicGen कैसे काम करता है
MusicGen अत्याधुनिक सुविधाओं का लाभ उठाकर संचालन करता है एआई मॉडल लाइसेंस प्राप्त संगीत के व्यापक डेटासेट पर प्रशिक्षित। प्रशिक्षण प्रक्रिया में एक विशाल संग्रह का विश्लेषण शामिल था 20,000 घंटे मेटा के आंतरिक डेटासेट के साथ-साथ ट्रैक से प्राप्त ट्रैक सहित उच्च-गुणवत्ता वाले संगीत ट्रैक शटरस्टॉक और तालाब5. संगीत शैलियों और शैलियों का यह विविध कोष MusicGen को रचनात्मक संभावनाओं की एक विस्तृत श्रृंखला की पेशकश करने के लिए सशक्त बनाता है।
प्रदर्शन का अनुकूलन करने के लिए, मेटा ने उनका उपयोग किया
32Khz एनकोडेक ऑडियो टोकनाइज़र, जो संगीत को छोटे टुकड़ों में तोड़ देता है. यह समानांतर प्रसंस्करण को सक्षम बनाता है, जिसके परिणामस्वरूप तेज और अधिक कुशल संगीत निर्माण होता है। उपयोगकर्ता विभिन्न इनपुट कर सकते हैं पाठ संकेत देता है, जैसे कि एक विशिष्ट शैली या राग, MusicGen को उनकी वांछित संगीत दिशा के साथ संरेखित एक रचना बनाने में मार्गदर्शन करने के लिए।इसके अलावा, MusicGen उपयोगकर्ताओं को अनुमति देता है एक संदर्भ ऑडियो फ़ाइल प्रदान करें, जो नया संगीत उत्पन्न करने के लिए एक खाका के रूप में कार्य करता है। संदर्भ ट्रैक के साथ उत्पन्न रचना को संरेखित करके, MusicGen सामंजस्यपूर्ण टुकड़े बनाने का एक अनूठा अवसर प्रदान करता है जो स्थापित धुनों या गीतों के साथ प्रतिध्वनित होता है।
MusicGen की विशेषताएं क्या हैं
- पाठ संकेतों के आधार पर संगीत निर्माण: MusicGen उपयोगकर्ता द्वारा प्रदान किए गए पाठ संकेतों के आधार पर मूल संगीत रचनाएँ बनाने के लिए AI की शक्ति का उपयोग करता है। एक शैली निर्दिष्ट करने से लेकर एक राग की रूपरेखा तैयार करने तक, उपयोगकर्ता रचनात्मक संभावनाओं की एक सरणी का पता लगा सकते हैं।
- व्यापक संगीत डेटासेट पर प्रशिक्षण: MusicGen चलाने वाले AI मॉडल को लाइसेंस प्राप्त संगीत के विशाल संग्रह पर प्रशिक्षित किया गया था, जिसमें 10,000 शामिल थे मेटा के आंतरिक डेटासेट से उच्च-गुणवत्ता वाले ट्रैक, साथ ही शटरस्टॉक और से ट्रैक किए गए ट्रैक तालाब5. यह विविध प्रशिक्षण डेटासेट सुनिश्चित करता है कि MusicGen संगीत शैलियों और शैलियों की एक विस्तृत श्रृंखला को पूरा कर सकता है।
- त्वरित और आसान संगीत निर्माण: MusicGen उपयोगकर्ता के अनुकूल इंटरफेस और सहज नियंत्रण प्रदान करके नया संगीत बनाने की प्रक्रिया को सरल करता है। संगीतकार और निर्माता तेजी से विभिन्न विचारों और अवधारणाओं के साथ प्रयोग कर सकते हैं, जिससे उनके रचनात्मक कार्यप्रवाह में तेजी आ सकती है।
- रचनात्मक प्रयोग को सुगम बनाता है: MusicGen के साथ, कलाकार नए संगीत विचारों के साथ प्रयोग करके अपनी रचनात्मकता की सीमाओं को आगे बढ़ा सकते हैं। अन्वेषण के लिए एक मंच प्रदान करके, MusicGen उपन्यास की धुनों, सामंजस्य और लय की खोज को प्रोत्साहित करता है।
हम MusicGen प्रस्तुत करते हैं: एक सरल और नियंत्रणीय संगीत जनरेशन मॉडल। MusicGen को पाठ और माधुर्य दोनों द्वारा प्रेरित किया जा सकता है।
हम खुले अनुसंधान, पुनरुत्पादन और संगीत समुदाय के लिए कोड (MIT) और मॉडल (CC-BY NC) जारी करते हैं: https://t.co/OkYjL4xDN7pic.twitter.com/h1l4LGzYgf- फेलिक्स क्रुक (@FelixKreuk) 9 जून, 2023
मेटा का MusicGen बनाम Google का MusicLM
Google ने भी Google I/O 2023 में म्यूजिक जेनरेटर MusicLM के लिए अपना टेक्स्ट लॉन्च किया तो आइए इन उत्पादों की तुलना करें:
विशेषता | MusicGen | MusicLM |
मॉडल प्रकार | सिंगल-स्टेज (एक बार में संगीत निर्माण) | श्रेणीबद्ध (भागों में संगीत निर्माण) |
प्रशिक्षण जानकारी | संगीत अंक | ऑडियो रिकॉर्डिंग |
उपलब्धता | खुला स्त्रोत | खुला स्रोत नहीं |
ताकत | त्वरित और उपयोग में आसान, विभिन्न शैलियों में संगीत उत्पन्न कर सकता है | उच्च-गुणवत्ता वाला संगीत जो वास्तविक दुनिया की रिकॉर्डिंग जैसा लगता है |
कमजोरियों | MusicLM से कम सटीक हो सकता है, सभी शैलियों में संगीत उत्पन्न करने में सक्षम नहीं हो सकता है | Google के कर्मचारियों और चुनिंदा भागीदारों तक सीमित। |
MusicGen के लाभ
संगीतकारों और संगीत निर्माताओं के लाभ के लिए MusicGen का उपयोग कैसे किया जा सकता है, इसके कुछ विशिष्ट उदाहरण यहां दिए गए हैं:
- ए शुरुआती संगीतकार विभिन्न संगीत शैलियों और तकनीकों के बारे में जानने के लिए MusicGen का उपयोग कर सकते हैं। वे अलग-अलग संकेतों के साथ प्रयोग कर सकते हैं और देख सकते हैं कि MusicGen कैसे अलग-अलग नतीजे देता है। इससे उन्हें अपनी खुद की संगीत शैली विकसित करने और नई तकनीक सीखने में मदद मिल सकती है।
- एक अनुभवी संगीतकार MusicGen का उपयोग विभिन्न धुनों, तालों और सामंजस्य के साथ प्रयोग करने के लिए कर सकते हैं। इससे उन्हें गानों के लिए नए विचार लाने में मदद मिल सकती है, जिसके बारे में उन्होंने खुद नहीं सोचा होगा।
- ए संगीत निर्माता बैकिंग ट्रैक की विभिन्न शैलियों को उत्पन्न करने के लिए MusicGen का उपयोग कर सकते हैं, जिसका उपयोग विभिन्न प्रकार के विभिन्न मूड और वातावरण बनाने के लिए किया जा सकता है।
MusicGen की सीमाएँ
परिवर्तनीय आउटपुट गुणवत्ता: जबकि MusicGen उच्च-गुणवत्ता उत्पन्न करने का प्रयास करता है संगीतएआई सिस्टम का आउटपुट हमेशा उपयोगकर्ताओं की अपेक्षाओं को पूरा नहीं कर सकता है। संगीत रचना की जटिल प्रकृति और व्यक्तिगत प्राथमिकताओं के कारण, कुछ उत्पन्न टुकड़े कथित गुणवत्ता के मामले में कम हो सकते हैं।
टेक्स्ट प्रॉम्प्ट से संगीत बनाने के लिए मेटा ओपन-सोर्स म्यूजिकजेन के रूप में, यह संगीत निर्माण के लिए जनरेटिव एआई टूल्स के दायरे में एक महत्वपूर्ण मील का पत्थर दर्शाता है। जैसे-जैसे संगीतकार और निर्माता एआई-संचालित तकनीकों को तेजी से अपना रहे हैं, MusicGen अन्वेषण और नवाचार के लिए एक आशाजनक अवसर प्रदान करता है।
स्रोत: फ़ेलिक्स क्रुक ट्वीट
एलेक्स क्रेग
एलेक्स प्रौद्योगिकी और गेमिंग सामग्री के जुनून से प्रेरित है। चाहे वह नवीनतम वीडियो गेम खेलने के माध्यम से हो, नवीनतम तकनीकी समाचारों के साथ बने रहना, या आकर्षक होना ऑनलाइन अन्य समान विचारधारा वाले व्यक्तियों के साथ, तकनीक और गेमिंग के लिए एलेक्स का प्यार इस सब में स्पष्ट है करता है।
एलेक्स प्रौद्योगिकी और गेमिंग सामग्री के जुनून से प्रेरित है। चाहे वह नवीनतम वीडियो गेम खेलने के माध्यम से हो, नवीनतम तकनीकी समाचारों के साथ बने रहना, या आकर्षक होना ऑनलाइन अन्य समान विचारधारा वाले व्यक्तियों के साथ, तकनीक और गेमिंग के लिए एलेक्स का प्यार इस सब में स्पष्ट है करता है।