Η Meta παρουσιάζει το Voicebox ένα ευέλικτο εργαλείο τεχνητής νοημοσύνης για τη δημιουργία ομιλίας – TechCult
Miscellanea / / June 17, 2023
Μετα εισάγει μια σημαντική ανακάλυψη στη γενετική τεχνολογία AI και παραγωγής ομιλίας σε κείμενο με ένα ευέλικτο εργαλείο Φωνητικό κουτί. Το νέο μοντέλο AI μπορεί να εκτελέσει εργασίες όπως επεξεργασία, δειγματοληψία και στυλιζάρισμα.
Η δυνατότητα δημιουργίας κορυφαίων κλιπ ήχου και τροποποίησης προηχογραφημένου ήχου είναι ένα αξιοσημείωτο χαρακτηριστικό του Voicebox. Μπορεί να εξαλείψει αποτελεσματικά ενοχλητικούς ήχους, όπως κόρνες αυτοκινήτου ή γαβγίσματα σκύλων, ενώ διατηρεί την αρχική ουσία και τον τόνο του ήχου. Επιπλέον, αυτό το μοντέλο είναι ικανό σε πολλές γλώσσες, επιτρέποντάς του να εκφέρει ομιλία σε έξι διαφορετικές γλώσσες με ίση επάρκεια.
παραγωγικά μοντέλα AI όπως το Voicebox έχουν τη δυνατότητα να παρέχουν ζωντανές φωνές σε εικονικούς βοηθούς και χαρακτήρες που δεν παίζουν μέσα στο metaverse. Η εταιρεία μοιράστηκε το όραμά της σε ένα blog που μοιράστηκε ανακοινώνοντας το νέο εργαλείο δηλώνοντας, «Στο μέλλον, τα μοντέλα πολλαπλών χρήσεων παραγωγής τεχνητής νοημοσύνης όπως το Voicebox θα μπορούσαν να δίνουν φωνές με φυσικό ήχο σε εικονικούς βοηθούς και χαρακτήρες που δεν είναι παίκτες στο μετασύμπαντο. Θα μπορούσαν να επιτρέψουν σε άτομα με προβλήματα όρασης να ακούν γραπτά μηνύματα από φίλους που διαβάζονται από την τεχνητή νοημοσύνη στη φωνή τους, να δώσουν στους δημιουργούς νέα εργαλεία για να δημιουργούν και να επεξεργάζονται εύκολα κομμάτια ήχου για βίντεο και πολλά άλλα».
Το νέο εργαλείο της Meta μπορεί να εκτελέσει τις ακόλουθες εργασίες για εσάς:
- Σύνθεση κειμένου σε ομιλία σε πλαίσιο: Το Voicebox έχει την αξιοσημείωτη ικανότητα να αναλύει και να αναπαράγει τα δείγματα ήχου, ακόμη και όταν το δείγμα είναι τόσο μικρό όσο δύο δευτερόλεπτα. Αυτό σημαίνει ότι το Voicebox μπορεί να χρησιμοποιήσει αποτελεσματικά το αναγνωρισμένο στυλ ήχου για τη δημιουργία κείμενο σε ομιλία αποτελέσματα που ευθυγραμμίζονται στενά με τον επιθυμητό ήχο και τόνο.
- Επεξεργασία ομιλίας και μείωση θορύβου: Το Voicebox μπορεί να ανακατασκευάσει τμήματα της ομιλίας που έχουν διαταραχθεί από το θόρυβο ή να αλλάξει τις λανθασμένες λέξεις, όλα αυτά χωρίς να απαιτείται πλήρης επανεγγραφή ολόκληρης της ομιλίας. Αυτό επιτρέπει αποτελεσματικές και ακριβείς διορθώσεις, εξοικονομώντας χρόνο και προσπάθεια στη διαδικασία.
- Διαγλωσσική μεταφορά στυλ: Το Voicebox επιδεικνύει την αξιοσημείωτη ευελιξία του προσαρμόζοντας εύκολα σε διάφορες γλώσσες. Χρησιμοποιώντας ένα δείγμα ομιλίας και ένα απόσπασμα κειμένου στα Αγγλικά, Γαλλικά, Γερμανικά, Ισπανικά, Πολωνικά ή Πορτογαλικά, το εργαλείο μπορεί να δημιουργήσει ηχητική ανάγνωση του κειμένου σε οποιαδήποτε από αυτές τις γλώσσες.
- Διάφορη δειγματοληψία ομιλίας: Χάρη στην εκτεταμένη έκθεση σε διάφορα σύνολα δεδομένων, το Voicebox έχει αποκτήσει την ικανότητα να δημιουργεί ομιλία που μιμείται στενά τα φυσικά μοτίβα συνομιλίας που βρίσκονται στις αλληλεπιδράσεις στον πραγματικό κόσμο.
Οπως και γενετική τεχνολογία AI συνεχίζει να προοδεύει, πολλές εταιρείες φέρνουν νέα και βελτιωμένα εργαλεία για να προσφέρουν καλύτερες εμπειρίες στους χρήστες. Τώρα που η Meta παρουσιάζει το εργαλείο AI γενιάς ομιλίας Voicebox, η εταιρεία ελπίζει ότι τα ευέλικτα χαρακτηριστικά του θα του επιτρέψουν να γίνει ένα σκαλοπάτι στην επαναστατική τεχνολογία.
Πηγή: Meta Newsroom
Άλεξ Κρεγκ
Ο Alex οδηγείται από ένα πάθος για την τεχνολογία και το περιεχόμενο gaming. Είτε παίζετε τα πιο πρόσφατα βιντεοπαιχνίδια, παρακολουθείτε τα πιο πρόσφατα νέα τεχνολογίας είτε συμμετέχετε με άλλους ομοϊδεάτες στο διαδίκτυο, η αγάπη του Alex για την τεχνολογία και τα παιχνίδια είναι εμφανής σε όλα όσα κάνει.
Ο Alex οδηγείται από ένα πάθος για την τεχνολογία και το περιεχόμενο gaming. Είτε παίζετε τα πιο πρόσφατα βιντεοπαιχνίδια, παρακολουθείτε τα πιο πρόσφατα νέα τεχνολογίας είτε συμμετέχετε με άλλους ομοϊδεάτες στο διαδίκτυο, η αγάπη του Alex για την τεχνολογία και τα παιχνίδια είναι εμφανής σε όλα όσα κάνει.