Microsoft: raggiunta la precisione umana nel riconoscimento vocale

0
Cortana adesso può impostare da sola i promemoria leggendo la tua e-mail!
Cortana adesso può impostare da sola i promemoria leggendo la tua e-mail!

Nello scorso anno, la tecnologia di riconoscimento vocale del CSRS (Conversational Speech Recognition System) Microsoft, aveva raggiunto un livello di errore del 5.9%; arrivando al 5.1% quest’anno.

Il risultato dello scorso anno era già un ottimo traguardo per Microsoft, ricompensando a pieno gli sforzi fatti per implementare al meglio questo tipo di tecnologia. Da poco giunge la notizia di una nuova riduzione dell’errore, comportando un livello di accuratezza estremamente preciso.

Tecnologie di Riconoscimento con CSRS

La tecnologia di riconoscimento vocale è sfruttata da Microsoft nel campo delle AI, in particolare quindi nel core di Cortana, Microsoft Cognitive Service e Presentation Translator. Il livello di accuratezza attualmente raggiunto porta questa tecnologia al pari della precisione umana; ma con tutti i benefici di un software.

Se, di norma, un trascrittore necessita di una seconda revisione o di più ascolti per comprendere al meglio il testo, il software necessita solamente del primo ascolto.

Stando a quanto rilascia il Colosso di Redmond:

“Microsoft’s willingness to invest in long-term research is now paying dividends for our customers in products and services such as Cortana, Presentation Translator, and Microsoft Cognitive Services. It’s deeply gratifying to our research teams to see our work used by millions of people each day.”

L’utilizzo di questa tecnologia può comportare un miglioramento delle attività in vari campi; spaziando dall’ambito pubblico a quello privato. L’idea dietro questa tecnologia è di rendere certi processi accessibili a tutti, dando la possibilità di creare un sistema adattativo.

Conclusioni

L’impegno di Microsoft in questo particolare ramo sembra aver dato i frutti desiderati. Il raggiungimento di questo grado di accuratezza permetterà di sviluppare successive tecnologie. Un esempio pratico di applicazione è il riconoscimento vocale per tono e contesto, che prima non potevano essere attuati. I dispositivi saranno, presto, in grado di decifrare il contesto e il tono; adattando quindi il registro linguistico e il riconoscimento.

Cosa ne pensate? Fatecelo sapere nei commenti.

Per restare sempre aggiornato sulle ultime novità scarica la nostra APP ufficiale oppure iscriviti alle nostre notifiche istantanee oppure seguici su Facebook, Twitter, Telegram e Instagram!