Mund të quhej edhe The Voice. Por emri i saj është Tacotron 2: bëhet fjalë për një sistem të ri të sintezës së të folurit, i vënë në jetë nga Google, për të cilin është punuar me kaq shumë kujdes dhe është aq i saktë sa është praktikisht e pamundur ta dallosh nga një zë “i vërtetë” njerëzor.
Tacotron 2, siç tregojnë ekspertë nga Google në një artikull në ArXiv, serveri që mirëpret studimet shkencore para se të publikohen në revistë, është një algoritëm i Inteligjencës Artificiale, i cili mbështetet në dy rrjete nervore.
Sistemi do të përdoret për të përmirësuar Google Assistant, sekretarin dixhital të Android.
Nga teksti te spektri, nga spektri te zëri
Tacotron 2, teknikisht, është një sistem text-to-speech, ose siç shkruajnë autorët e grupit të punës, “një arkitekturë e cila bazohet në rrjete nervore për sintezën e fjalës direkt nga teksti”.
Kjo ndodh në dy hapa: rrjeta e parë nervore lexon tekstin dhe e përkthen në një spektrogram, grafiku që përfaqëson evolucionin e përkohshëm të frekuencave të zërit. Më pas, spektrogrami i përcillet WaveNet, një algoritëm i vënë në jetë nga Google vitin e kaluar, i cili është në gjendje të lexojë frekuenca dhe të gjenerojë tingullin me një shkallë shumë të lartë saktësie. Aq i saktë sa mund të riprodhojë tingullin e zbehtë të frymës njerëzore nga një fjalë tek tjetra.
Fjalë të ndërlikuara, pikësimi, theksimi
Sipas asaj që thonë krijuesit e saj, Tacotron 2 është i gjithanshëm. Rrjetet nervore në bazë të sistemit, janë në gjendje të kuptojnë thelbin e tekstit që lexojnë dhe më pas të vendosin, në autonomi, për shembull se cilat fjalë të theksojnë. Ato u japin rëndësi të veçantë edhe pikësimit dhe u japin më shumë forcë fjalëve që janë të shkruar me të mëdha.
Aktualisht, sistemi është zhvilluar për të riprodhuar një zë specifik femëror, por nuk përjashtohet mundësia që në të ardhmen, gjiganti teknologjik të trajnohet me shumë zëra të tjerë.