تقدم Meta Voicebox ، وهو عبارة عن ذكاء اصطناعي متعدد الاستخدامات لأداة إنشاء الكلام - TechCult
منوعات / / June 17, 2023
ميتا تقدم طفرة في مجال الذكاء الاصطناعي التوليدي وتكنولوجيا توليد الكلام إلى نص باستخدام أداة متعددة الاستخدامات صندوق صوت. يمكن لنموذج الذكاء الاصطناعي الجديد أداء مهام مثل التحرير وأخذ العينات والتصميم.
![تقدم Meta Voicebox ، وهو عبارة عن ذكاء اصطناعي متعدد الاستخدامات لأداة توليد الكلام](/f/6ddab5f3542f929782c23613c35f51fe.png)
تعد القدرة على إنشاء مقاطع صوتية من الدرجة الأولى وتعديل الصوت المسجل مسبقًا ميزة بارزة في Voicebox. يمكن أن يقضي بشكل فعال على الأصوات المزعجة مثل أبواق السيارات أو نباح الكلاب مع الحفاظ على الجوهر الأصلي ونغمة الصوت. علاوة على ذلك ، يتقن هذا النموذج عدة لغات ، مما يمكّنه من إلقاء الكلام بست لغات مختلفة بكفاءة متساوية.
نماذج الذكاء الاصطناعي التوليدية مثل Voicebox لديه القدرة على توفير أصوات نابضة بالحياة للمساعدين الافتراضيين والشخصيات غير المشغلة داخل metaverse. شاركت الشركة رؤيتها في مدونة نشرتها معلنة فيها عن الأداة الجديدة ، في المستقبل ، يمكن لنماذج الذكاء الاصطناعي التوليدية متعددة الأغراض مثل Voicebox أن تعطي أصواتًا طبيعية لمساعدين افتراضيين وشخصيات من غير اللاعبين في metaverse. يمكن أن تسمح للأشخاص المعاقين بصريًا بسماع رسائل مكتوبة من الأصدقاء يقرأها الذكاء الاصطناعي بأصواتهم ، ومنح المبدعين أدوات جديدة لإنشاء وتحرير المقاطع الصوتية لمقاطع الفيديو بسهولة ، وغير ذلك الكثير ".
يمكن للأداة الجديدة من Meta تنفيذ المهام التالية نيابة عنك:
- تركيب تحويل النص إلى كلام في السياق: يتمتع Voicebox بقدرة رائعة على تحليل عينات الصوت وتكرارها ، حتى عندما تكون العينة صغيرة مثل ثانيتين. هذا يعني أن Voicebox يمكنه استخدام نمط الصوت المحدد بشكل فعال في الإنشاء النص إلى الكلام نتائج تتوافق بشكل وثيق مع الصوت والنغمة المرغوبة.
- تحرير الكلام وتقليل الضوضاء: يمكن لـ Voicebox إعادة بناء أقسام الكلام التي تعطلت بسبب الضوضاء أو تغيير الكلمات المنطوقة بشكل خاطئ ، كل ذلك دون الحاجة إلى إعادة تسجيل كامل للكلام. وهذا يسمح بإجراء تصحيحات فعالة ودقيقة ، مما يوفر الوقت والجهد في العملية.
- نقل النمط عبر اللغات: يُظهر Voicebox تعدد استخداماته الرائع من خلال التكيف بسهولة مع اللغات المختلفة. من خلال استخدام عينة كلام ومقطع نصي باللغات الإنجليزية أو الفرنسية أو الألمانية أو الإسبانية أو البولندية أو البرتغالية ، يمكن للأداة إنشاء قراءة صوتية للنص بأي من هذه اللغات.
- أخذ عينات الكلام المتنوعة: بفضل التعرض المكثف لمجموعات البيانات المتنوعة ، اكتسب Voicebox القدرة على توليد الكلام الذي يحاكي عن كثب أنماط المحادثة الطبيعية الموجودة في تفاعلات العالم الحقيقي.
مثل تقنية الذكاء الاصطناعي التوليدية يواصل تقدمه ، حيث تقدم العديد من الشركات أدوات جديدة ومحسنة لتقديم تجارب أفضل للمستخدمين. الآن بعد أن قدمت Meta أداة الذكاء الاصطناعي لتوليد الكلام من Voicebox ، تأمل الشركة أن تسمح ميزاتها المتنوعة بأن تصبح نقطة انطلاق في التكنولوجيا الثورية.
مصدر: غرفة الأخبار ميتا
![أليكس كريج](/f/82c0af5dbedfba7e1fc95a8d7136c74d.jpg)
أليكس كريج
أليكس مدفوع بشغف بالتكنولوجيا ومحتوى الألعاب. سواء كان ذلك من خلال لعب أحدث ألعاب الفيديو أو مواكبة آخر أخبار التكنولوجيا أو المشاركة مع الأفراد الآخرين المتشابهين في التفكير عبر الإنترنت ، فإن حب Alex للتكنولوجيا والألعاب واضح في كل ذلك يفعل.
أليكس مدفوع بشغف بالتكنولوجيا ومحتوى الألعاب. سواء كان ذلك من خلال لعب أحدث ألعاب الفيديو أو مواكبة آخر أخبار التكنولوجيا أو المشاركة مع الأفراد الآخرين المتشابهين في التفكير عبر الإنترنت ، فإن حب Alex للتكنولوجيا والألعاب واضح في كل ذلك يفعل.