मेटा ने वॉइसबॉक्स को स्पीच जेनरेशन टूल - टेककल्ट के लिए एक बहुमुखी एआई पेश किया
अनेक वस्तुओं का संग्रह / / June 17, 2023
मेटा एक बहुमुखी उपकरण के साथ जनरेटिव एआई और स्पीच-टू-टेक्स्ट जनरेशन टेक्नोलॉजी में एक सफलता पेश करता है आवाज बॉक्स. नया AI मॉडल एडिटिंग, सैंपलिंग और स्टाइलिंग जैसे काम कर सकता है।
शीर्ष पायदान ऑडियो क्लिप उत्पन्न करने और पहले से रिकॉर्ड किए गए ऑडियो को संशोधित करने की क्षमता वॉयसबॉक्स की एक उल्लेखनीय विशेषता है। यह ऑडियो के मूल सार और टोन को बनाए रखते हुए कार के हॉर्न या भौंकने वाले कुत्तों जैसी विघटनकारी आवाज़ों को प्रभावी ढंग से समाप्त कर सकता है। इसके अलावा, यह मॉडल कई भाषाओं में कुशल है, जिससे यह समान दक्षता के साथ छह अलग-अलग भाषाओं में भाषण देने में सक्षम हो जाता है।
जनरेटिव एआई मॉडल वॉयसबॉक्स की तरह मेटावर्स के भीतर आभासी सहायकों और गैर-खिलाड़ी पात्रों को सजीव आवाजें प्रदान करने की क्षमता है। कंपनी ने अपने विजन को एक ब्लॉग में साझा किया जिसमें उसने नए टूल की घोषणा करते हुए साझा किया, “भविष्य में, वॉइसबॉक्स जैसे बहुउद्देश्यीय जनरेटिव एआई मॉडल मेटावर्स में आभासी सहायकों और गैर-खिलाड़ी-पात्रों को प्राकृतिक-ध्वनि देने वाली आवाज़ें दे सकते हैं। वे दृष्टिबाधित लोगों को एआई द्वारा उनकी आवाज में पढ़े गए मित्रों के लिखित संदेशों को सुनने की अनुमति दे सकते हैं, वीडियो के लिए आसानी से ऑडियो ट्रैक बनाने और संपादित करने के लिए रचनाकारों को नए टूल दे सकते हैं, और भी बहुत कुछ।
मेटा का नया टूल आपके लिए निम्नलिखित कार्य कर सकता है:
- संदर्भ में टेक्स्ट-टू-स्पीच संश्लेषण: वॉइसबॉक्स में ऑडियो नमूनों का विश्लेषण और प्रतिकृति करने की उल्लेखनीय क्षमता है, भले ही नमूना दो सेकंड जितना छोटा हो। इसका अर्थ है कि वॉयसबॉक्स उत्पन्न करने के लिए पहचानी गई ऑडियो शैली को प्रभावी ढंग से नियोजित कर सकता है भाषण के पाठ परिणाम जो वांछित ध्वनि और स्वर के साथ निकटता से संरेखित होते हैं।
- भाषण संपादन और शोर में कमी: वॉइसबॉक्स भाषण के उन हिस्सों को फिर से बना सकता है जो शोर से बाधित हो गए हैं या गलत बोले गए शब्दों को बदल सकते हैं, बिना पूरे भाषण की पूरी तरह से रिकॉर्डिंग की आवश्यकता के। यह कुशल और सटीक सुधार करने की अनुमति देता है, जिससे प्रक्रिया में समय और प्रयास की बचत होती है।
- क्रॉस-लिंगुअल स्टाइल ट्रांसफर: वॉइसबॉक्स विभिन्न भाषाओं को आसानी से अपनाकर अपनी उल्लेखनीय बहुमुखी प्रतिभा प्रदर्शित करता है। अंग्रेजी, फ्रेंच, जर्मन, स्पेनिश, पोलिश, या पुर्तगाली में एक भाषण नमूना और एक पाठ मार्ग का उपयोग करके, उपकरण इनमें से किसी भी भाषा में पाठ का ऑडियो पठन उत्पन्न कर सकता है।
- विविध भाषण नमूनाकरण: विविध डेटासेट के व्यापक प्रदर्शन के लिए धन्यवाद, वॉइसबॉक्स ने भाषण उत्पन्न करने की क्षमता हासिल कर ली है जो वास्तविक दुनिया के इंटरैक्शन में पाए जाने वाले प्राकृतिक संवादात्मक पैटर्न का बारीकी से अनुकरण करता है।
जैसा जनरेटिव एआई तकनीक प्रगति जारी है, कई निगम उपयोगकर्ताओं को बेहतर अनुभव देने के लिए नए और बेहतर उपकरण ला रहे हैं। अब जब मेटा वॉयसबॉक्स स्पीच जेनरेशन एआई टूल पेश करता है, तो कंपनी को उम्मीद है कि इसकी बहुमुखी विशेषताएं इसे क्रांतिकारी तकनीक में एक कदम रखने की अनुमति देंगी।
स्रोत: मेटा न्यूज़रूम
एलेक्स क्रेग
एलेक्स प्रौद्योगिकी और गेमिंग सामग्री के जुनून से प्रेरित है। चाहे वह नवीनतम वीडियो गेम खेलने के माध्यम से हो, नवीनतम तकनीकी समाचारों के साथ बने रहना, या आकर्षक होना ऑनलाइन अन्य समान विचारधारा वाले व्यक्तियों के साथ, तकनीक और गेमिंग के लिए एलेक्स का प्यार इस सब में स्पष्ट है करता है।
एलेक्स प्रौद्योगिकी और गेमिंग सामग्री के जुनून से प्रेरित है। चाहे वह नवीनतम वीडियो गेम खेलने के माध्यम से हो, नवीनतम तकनीकी समाचारों के साथ बने रहना, या आकर्षक होना ऑनलाइन अन्य समान विचारधारा वाले व्यक्तियों के साथ, तकनीक और गेमिंग के लिए एलेक्स का प्यार इस सब में स्पष्ट है करता है।