Buongiorno cari lettori di Tecnogalaxy, quest’oggi vi andremo a parlare di SeamlessM4T, il modello che permetterà di tradurre le conversazioni in tempo reale.  

Meta ha rilasciato un nuovo modello di sintesi vocale in grado di tradurre quasi 100 lingue chiamato SeamlessM4T. 

SeamlessM4T, che sta per Massively Multilingual and Multimodal Machine Translation, che secondo la società può tradurre da voce a testo e da testo a testo per quasi 100 lingue. Per le azioni di sintesi vocale e di sintesi vocale, riconosce 100 lingue di input e le converte in 35 lingue di output. 

È rilasciato sotto una licenza Creative Commons CC BY-NC 4.0, che consente ai ricercatori di iterare su di esso. Insieme a SeamlessM4T, Meta ha anche rilasciato i metadati per il suo set di dati di traduzione aperta SeamlessAlign.  

“Costruire un traduttore linguistico universale, è impegnativo perché i sistemi di sintesi vocale e di sintesi vocale esistenti coprono solo una piccola frazione delle lingue del mondo”, ha affermato Meta.  

Meta ha affermato che SeamlessM4T rappresenta “un passo avanti significativo” perché questo nuovo modello esegue l’intera attività di traduzione in una volta sola, a differenza di altri modelli di traduzione di grandi dimensioni che dividono la traduzione su diversi sistemi.

Caratteristiche più importanti di SeamlessM4T

Una delle caratteristiche più interessanti di SeamlessM4T, se può funzionare correttamente, è la sua presunta capacità di riconoscere quando chi parla sta cambiando lingua. Ad esempio, Meta ha dimostrato in un video che il modello distingue immediatamente tra hindi, telugu e inglese.  

SeamlessM4T si basa sui precedenti modelli di traduzione di Meta. L’anno scorso, Meta ha rilasciato il suo modello di traduzione automatica da testo a testo No Language Left Behind , che supportava 200 lingue. Ha sviluppato SpeechMatrix, un set di dati per la traduzione vocale multilingue e Massively Multilingual Speech per il riconoscimento vocale. Meta ha presentato lo scorso anno una dimostrazione del suo Universal Speech Translator, convertendo l’hokkien parlato, una lingua ampiamente utilizzata in Cina che non ha un sistema di scrittura ufficiale, in inglese.  

La traduzione linguistica è importante per aziende come Meta, che impiegano migliaia di persone per moderare un’ondata di post su Facebook e Instagram in diverse lingue. Molto spesso, le lingue meno importanti hanno team più piccoli e finiscono per fare affidamento sulla moderazione automatizzata che funziona male con quelle lingue. L’intelligenza artificiale, se ha accesso a un set di dati di queste lingue più piccole, può essere uno strumento per aziende come Meta per migliorare la moderazione. 

Per costruire SeamlessM4T, Meta ha affermato di aver riprogettato il suo toolkit di modellazione di sequenze Fairseq per creare modelli più leggeri e gestire più informazioni.  

Durante lo sviluppo di SeamlessM4T, Meta ha affermato di aver creato un sistema che identifica le parole sensibili o insulti. Meta definiscegli insulti come casi in cui “la traduzione può incitare all’odio, alla violenza, al linguaggio volgare o all’abuso”. L’obiettivo è essere in grado di rilevare quando la traduzione di output introduce tossicità che non era presente nel materiale originale. 

“Abbiamo filtrato la “tossicità” nei dati di addestramento. Se l’input o l’output contenevano quantità diverse di tossicità, rimuovevamo la sequenza di addestramento”, ha affermato Meta.  

Meta afferma di riconoscere anche i pregiudizi di genere nelle lingue e afferma che il modello può quantificare i pregiudizi di genere nelle traduzioni. SeamlessM4T può verificare se la frase utilizza una forma di genere di una parola, ad esempio doctora in spagnolo, e, se necessario, assegnare un pronome femminile in una lingua di destinazione senza una grammatica di genere equivalente.

Inoltre, Meta ha detto che SeamlessM4T conta quante volte una traduzione aggiunge parole di genere a termini che non avevano un genere specifico nella lingua originale, cioè presupponendo automaticamente che il medico sia maschio quando non c’è distinzione di genere nella lingua inglese. 

Meta ha rilasciato molti dei suoi modelli di intelligenza artificiale a sviluppatori e ricercatori in modo più o meno open source. Recentemente ha pubblicato AudioCraft, un codice che consente la generazione da testo in suono.   

Leggi anche:

Ti è stato di aiuto questo articolo? Aiuta questo sito a mantenere le varie spese con una donazione a piacere cliccando su questo link. Grazie!

Seguici anche su Telegram cliccando su questo link per rimanere sempre aggiornato sugli ultimi articoli e le novità riguardanti il sito.

Se vuoi fare domande o parlare di tecnologia puoi entrare nel nostro gruppo Telegram cliccando su questo link.

© Tecnogalaxy.it - Vietato riprodurre il contenuto di questo articolo.