Salta al contenuto principale

Ecco Moshi, il primo assistente vocale AI per tutti (con accento francese)

Immagina di chiacchierare con qualcuno che non solo ti capisce, ma ti risponde con 70 diverse sfumature emotive, il tutto con un accento francese che ti fa sentire come se fossi seduto in un café parigino. Tutto ciò è possibile grazie a Moshi, il nuovo assistente vocale francese che in poco tempo ha catturato l'interesse di molti perché rappresenta una vera innovazione nell'ambito dell'intelligenza artificiale, nonché un'alternativa open-source e gratuita all'assistente vocale di OpenAI basato su GPT-4o (ne abbiamo parlato qui).


Moshi, assistente vocale francese

Moshi è un assistente vocale prodotto dal laboratorio di ricerca parigino Kyutai con il sostegno del miliardario Xavier Niel. Sviluppato in soli sei mesi da un team di otto persone, il modello di AI è stato presentato il 3 luglio (qui il link alla presentazione). Come GPT-4o, Moshi non è un assistente vocale qualunque: essendo un'AI multimodale, può sostenere conversazioni complesse con un umano in modo naturale e fluido senza nessuna voce robotica e con la straordinaria capacità di esprimere 70 diverse sfumature di emozioni. Le possibili applicazioni di una simile tecnologia, ça va sans dire, sono infinite e spaziano dall'educazione all'assistenza clienti fino alla terapia digitale, campi in cui è richiesta una certa comprensione emotiva. Senza contare come Moshi è naturalmente utilizzabile come semplice strumento di compagnia o chatbot vocale (come un Claude 3.5 parlante).

Il CEO di Kyutai, Patrick Pérez, ha descritto Moshi come un assistente progettato per "parlare come pensa", sostenendo che il modello di AI potrebbe apportare cambiamenti significativi nell'interazione uomo-macchina. In effetti, l'assistente vocale francese promette importanti innovazioni tecniche rispetto alla controparte di OpenAI: interrompe addirittura l'interlocutore umano grazie al fatto che può elaborare due flussi audio contemporaneamente. In breve, Moshi può ascoltare e parlare allo stesso tempo, abilità che rende le conversazioni estremamente simili all'interazione umana.

Moshi AI vocal assistant

La vera innovazione: il primo assistente vocale AI Open-Source 

La caratteristica forse più importante di Moshi è la sua natura open-source. Contrariamente alla tendenza di mantenere riservate le tecnologie proprietarie, Kyutai ha deciso di rendere Moshi accessibile a ricercatori e sviluppatori di tutto il mondo. Questa scelta potrebbe accelerare l'innovazione nel campo dell'AI in Europa, creando una sana competizione con i giganti tecnologici globali. Inoltre, una demo di Moshi è attualmente disponibile gratuitamente sul sito di Kytuai (basta inserire la propria mail e si avrà accesso a 5 minuti di conversazione con l'AI).

how to access Moshi's demo

Sicurezza e privacy dell'AI Vocale

Kyutai ha affrontato i dubbi sollevati in merito alla sicurezza e alla privacy implementando strumenti di indicizzazione e filigrane per monitorare l'audio generato da Moshi, assicurando un utilizzo responsabile della tecnologia. Questa è una sfida che ha dovuto affrontare anche l'AI vocale di OpenAI, il cui lancio è stato posticipato in autunno proprio a causa della proprietà della voce. Sebbene Moshi sia ancora in fase sperimentale, il suo potenziale è evidente. Il suo lancio, previsto nel prossimo futuro, potrebbe ridefinire il panorama dell'intelligenza artificiale e rafforzare la posizione dell'Europa in questo settore in rapida evoluzione. 

Qui il link alla presentazione di Moshi.

 

Case Studies D&R