Xiaomi dezvoltă o tehnologie de redare a vocii pentru a ajuta oamenii cu tulburări de vorbire
Share
Share the post "Xiaomi dezvoltă o tehnologie de redare a vocii pentru a ajuta oamenii cu tulburări de vorbire"
Xiaomi a prezentat o aplicație de algoritmi avansați și tehnologie proprietară de redare a vocii, destinate publicului larg. Tehnologia Text-To-Speech în stil spontan este dezvoltată de Xiaomi AI Labs și folosită pentru a genera o voce unică și personalizată pentru un utilizator cu tulburări de vorbire.
Pentru a genera vocea cea mai potrivită și personalizată pentru beneficiar, echipa proiectului a recrutat peste 200 de voluntari din cadrul Xiaomi care și-au donat vocile. S-a folosit algoritmul de corelare al amprentei vocale pentru a sincroniza caracteristicile vocilor donate de voluntari cu cele ale destinatarului. Prin această abordare, s-au identificat cele mai potrivite sunete de bază ca sistem de referință pentru destinatar. S-a ținut cont și de reglementările de protecție a vieții private și, prin urmare, vocea aleasă a fost modificată printr-un procedeu acustic complex pentru a dezvolta un sunet nou și original.
Mai departe, s-a folosit tehnologia Text-To-Speech în stil spontan pentru a realiza modelul AI, iar noua voce a căpătat gradual ritm și intonație naturale pentru a exprima emoțiile și tonul uman.
Proiectul “Own My Voice” combină o varietate de algoritmi avansați cu tehnologia proprietară Xiaomi de viteză a discursului pentru a asigura specificitatea, siguranța și autenticitatea ridicată a vocii sintetizate. S-a creat astfel o nouă viziune asupra unui discurs personalizat pentru utilizatorii cu tulburări de vorbire.
Tehnologia Text-To-Speech în stil spontan face ca vocea sintetică să sune ca cea a unui om, din punct de vedere al intonației, pauzelor, vitezei și altor caracteristici. Cu ajutorul ei se înlocuiește vocea electronică monotonă și nenaturală. În prezent, această tehnologie se aplică mai multor dispozitive inteligente, echipate cu Xiaoai, asistentul vocal AI al Xiaomi. Proiectul “Own My Voice” demonstrează că tehnologia Text-To-Speech în stil spontan poate fi adoptată pe scară largă în zonele de accesabilitate și poate îmbunătăți experiența utilizatorilor.