Skip to content Skip to footer

Εντυπωσιακός αριθμός υποστήριξης γλωσσών από την AI ομιλίας της Meta!

Ένα εντυπωσιακό ορόσημο για την Meta

Η Meta δημιούργησε ένα γλωσσικό μοντέλο τεχνητής νοημοσύνης που (σε μια αναζωογονητική αλλαγή ρυθμού) δεν είναι ένας κλώνος του ChatGPT. Το έργο Massively Multilingual Speech (MMS) της εταιρείας μπορεί να αναγνωρίσει πάνω από 4.000 ομιλούμενες γλώσσες και να παράγει ομιλία (text-to-speech) σε πάνω από 1.100. Όπως και τα περισσότερα από τα άλλα δημοσίως ανακοινωθέντα έργα τεχνητής νοημοσύνης της, η Meta ανοίγει σήμερα το MMS για να βοηθήσει στη διατήρηση της γλωσσικής ποικιλομορφίας και να ενθαρρύνει τους ερευνητές να βασιστούν στα θεμέλιά του. “Σήμερα, μοιραζόμαστε δημόσια τα μοντέλα και τον κώδικά μας, ώστε άλλοι στην ερευνητική κοινότητα να μπορούν να βασιστούν στο έργο μας”, έγραψε η εταιρεία. “Μέσω αυτού του έργου, ελπίζουμε να συμβάλουμε σε μικρό βαθμό στη διατήρηση της απίστευτης γλωσσικής ποικιλότητας του κόσμου”.

Τα μοντέλα αναγνώρισης ομιλίας και μετατροπής κειμένου σε ομιλία απαιτούν συνήθως εκπαίδευση σε χιλιάδες ώρες ήχου με συνοδευτικές ετικέτες μεταγραφής. (Οι ετικέτες είναι ζωτικής σημασίας για τη μηχανική μάθηση, επιτρέποντας στους αλγορίθμους να κατηγοριοποιούν σωστά και να “κατανοούν” τα δεδομένα). Αλλά για γλώσσες που δεν χρησιμοποιούνται ευρέως στα βιομηχανικά κράτη – πολλές από τις οποίες κινδυνεύουν να εξαφανιστούν τις επόμενες δεκαετίες – “αυτά τα δεδομένα απλώς δεν υπάρχουν”, όπως λέει η Meta.

Η Meta χρησιμοποίησε μια αντισυμβατική προσέγγιση για τη συλλογή ηχητικών δεδομένων: αξιοποιώντας ηχογραφήσεις μεταφρασμένων θρησκευτικών κειμένων. “Στραφήκαμε σε θρησκευτικά κείμενα, όπως η Βίβλος, τα οποία έχουν μεταφραστεί σε πολλές διαφορετικές γλώσσες και των οποίων οι μεταφράσεις έχουν μελετηθεί ευρέως για την έρευνα γλωσσικής μετάφρασης με βάση το κείμενο”, αναφέρει η εταιρεία. “Αυτές οι μεταφράσεις διαθέτουν δημόσια διαθέσιμες ηχογραφήσεις ανθρώπων που διαβάζουν αυτά τα κείμενα σε διάφορες γλώσσες”. Ενσωματώνοντας τις μη επισημασμένες ηχογραφήσεις της Βίβλου και παρόμοιων κειμένων, οι ερευνητές της Meta αύξησαν τις διαθέσιμες γλώσσες του μοντέλου σε πάνω από 4.000.

Facebook
Twitter
LinkedIn
Tumblr
Reddit

Leave a comment

Μπείτε στην παρέα μας

Μπορείτε να μπείτε στην παρέα μας στο Discord όπου μπορείτε να συζητάτε με όλους και να κάνουμε την οικογένεια των Playsiders ακόμα πιο ζεστή.

Ακολουθήστε μας