
OpenAI ha sviluppato Whisper!
Buongiorno cari lettori di Tecnogalaxy, oggi vi andremo a parlare del modello Whisper di OpenAI e di come le verrà applicato sulle AI.
OpenAI ha rilasciato Whisper, un modello di deep learning open source per il riconoscimento vocale. I test di OpenAI su questo modello mostrano risultati promettenti nella trascrizione dell’audio non solo in inglese, ma anche in diverse altre lingue.
Anche sviluppatori e ricercatori che hanno sperimentato Whisper sono rimasti colpiti da ciò che il modello può fare. Tuttavia, ciò che forse è ugualmente importante è ciò che il comunicato di Whisper ci dice sulla cultura mutevole nella ricerca sull’intelligenza artificiale (AI) e sul tipo di applicazioni che possiamo aspettarci in futuro.
Un ritorno?
OpenAI è stato molto criticato per non aver reso open source i suoi modelli. GPT-3 e DALL-E, due dei modelli di deep learning più impressionanti di OpenAI, sono disponibili solo dietro i servizi API a pagamento e non c’è modo di scaricarli ed esaminarli.
Al contrario, Whisper è stato rilasciato come modello open source preaddestrato che tutti possono scaricare ed eseguire su una piattaforma informatica a loro scelta. Quest’ultimo sviluppo arriva quando negli ultimi mesi si è assistito a una tendenza verso una maggiore apertura tra i laboratori di ricerca sull’IA commerciale.
Meta ha reso open source OPT-175B, un Large Language Model (LLM) che corrisponde alle dimensioni di GPT-3. Hugging Face ha rilasciato BLOOM, un altro LLM open source di scala GPT-3. Stability.ai ha rilasciato Stable Diffusion, un modello di generazione di immagini open source che rivaleggia con DALL-E di OpenAI.
Whisper di OpenAI abbraccia la diversità dei dati
Una delle caratteristiche importanti di Whisper è la diversità dei dati utilizzati per addestrarlo. Whisper è stato formato su 680.000 ore di dati multilingue e multitasking raccolti dal web. Un terzo dei dati di addestramento è composto da esempi audio non in inglese.
“Whisper può trascrivere in modo robusto il parlato ed esibirsi a un livello all’avanguardia con circa 10 lingue, oltre a tradurre da quelle lingue in inglese”, ha detto un portavoce di OpenAI.
Esegui il tuo modello
Poiché Whisper è open source, gli sviluppatori e gli utenti possono scegliere di eseguirlo sulla piattaforma di calcolo di loro scelta, che si tratti del loro laptop, workstation desktop, dispositivo mobile o server cloud. OpenAI ha rilasciato cinque diverse dimensioni di Whisper, ciascuna scambiando la precisione con la velocità in modo proporzionale, con il modello più piccolo che è circa 60 volte più veloce del più grande.
“Poiché la trascrizione che utilizza il modello Whisper più grande funziona più velocemente, ci sono dei casi d’uso pratici per eseguire modelli più piccoli su sistemi mobili o desktop, una volta che i modelli sono stati portati correttamente nei rispettivi ambienti ”, ha affermato il portavoce di OpenAI. Gli sviluppatori che hanno provato questo servizio sono soddisfatti delle opportunità che può offrire. E può porre sfide ai servizi ASR basati su cloud che sono stati l’opzione principale fino ad ora.
“A prima vista, Whisper sembra essere molto meglio di altri prodotti SaaS [software-as-a-service] in termini
Crea le tue applicazioni
Esistono già diverse iniziative per rendere Whisper più facile da usare per le persone che non hanno le competenze tecniche per configurare ed eseguire modelli di machine learning. Un esempio è un progetto congiunto del giornalista Peter Sterne e dell’ingegnere GitHub Christina Warren per creare un’app di trascrizione gratuita, sicura e facile da usare per i giornalisti” basata su Whisper.
Questo è tutto riguardo Whisper, ad un prossimo articolo.
Leggi anche:
- Cos’è il SubReddit r\Place
- L’IA sta cambiando il nostro mondo
- Il Phishing Wireless
- Consigli per far crescere l’eCommerce attraverso le strategie digitali
- Meta ha creato uno strumento che permette di analizzare le foto
Ti è stato di aiuto questo articolo? Aiuta questo sito a mantenere le varie spese con una donazione a piacere cliccando su questo link. Grazie!
Seguici anche su Telegram cliccando su questo link per rimanere sempre aggiornato sugli ultimi articoli e le novità riguardanti il sito.
Se vuoi fare domande o parlare di tecnologia puoi entrare nel nostro gruppo Telegram cliccando su questo link.
© Tecnogalaxy.it - Vietato riprodurre il contenuto di questo articolo.
I PIÙ LETTI
ARTICOLI RECENTI