Računalništvo, telefonija
19.06.2018 14:16

Deli z drugimi:

Share

Umetna inteligenca priljubljenemu radijskemu voditelju povrnila glas

Umetna inteligenca priljubljenemu radijskemu voditelju povrnila glas
Umetna inteligenca priljubljenemu radijskemu voditelju povrnila glas

Jamie Dupree, 54-letni radijski novinar pri atlantski medijski družbi Cox Media, je pred dvema letoma zaradi redke nevrološke bolezni ostal brez glasu, vendar se sedaj pogumno vrača za mikrofone, zahvaljujoč se umetni inteligenci. Škotsko tehnološko podjetje CereProc je za Dupreeja ustvarilo nov glas. CereProc je natreniralo nevrološko omrežje, da je to sposobno predvidevati, kako g. Dupree govori. To jim je uspelo s pomočjo starih posnetkov njegovega glasu.


“To je rešilo moje življenje in družino pred finančno negotovostjo”, je povedal Dupree za BBC. “Za radijske voditelje, ki ne morejo govoriti prihodnost ni najbolj svetla kajne?”. Po podatkih podjetja CereProc je za to, da lahko nekomu povrneš glas, potrebnih 30 ur branja, da lahko prideš do dovolj podatkov. Potem pride na vrsto umetne inteligenca, ki lahko po meri združuje besede, ali pa predvidi ter imitira govor osebe. Obe izmed metod sta pregrešno dragi in lahko trajata cele mesece, da na koncu pridemo do rezultata.


Živčna omrežja

Za pospešitev procesa, ki je povrh vsega še cenovno bolj dostopen, je CereProc leta 2006 začel z razvojem lastnih nevroloških omrežij. Danes je umetna inteligenca sposobna generirati glasv vsega nekaj dneh in to za ceno £500. Postopek se začne tako, da uporabnik bere nek tekst na spletu in vse skupaj se seveda snema. Nevrološka omrežja, ki vsebujejo med 6 in 10 plasti, delujejo na principu lomljenja avdio posnetkov do fonetične ravni.


Potem lahko omrežje ustvari lastne zvoke in predvidi, kako bi glas osebe zvenel v nekem pogovoru recimo. Številni znanstveniki po svetu skušajo replicirati človeške možgane s treniranjem nevroloških omrežij, da bi ta bila sposobna prepoznavanja podob, vendar CereProc pravi, da je veliko lažje prilagoditi umetno inteligenco za zvok. Vsaj za zdaj.


“Tehnike umetne inteligence delujejo dobro v reševanju manjših problemov, učenje posnemanja govora pa je nekaj precej bolj globokega”, pravi Chris Pidcock iz podjetja CereProc. Tehnologija, ki jo izpostavljeno podjetja uporablja, je trenutno ena najbolj naprednih na tem področju in ostali konkurenti že iščejo načine, kako se postaviti ob bok.


Utišala ga je bolezen

Jamie Dupree je bil zadnjih 35 let na radiu politični novinar, ki je pokrival predvsem dogajanje v ameriškem kongresu, poleg tega pa je ustvarjal vsebino za 6 radijskih postaj. Glas je torej njegov ključni del življenja. Na žalost ga je leta 2016 začel izgubljati, vendar z njegovimi glasilkami ali grlom ni bilo nič narobe.


Po dolgotrajnem postopku diagnosticiranja so mu postavili zelo redko diagnozo – jezkovna distonija. Gre za nevrološko bolezen, kjer se jezik vedno, ko oseba želi govoriti, postavi nekoliko naprej, grlo pa se hrkati stisne. Tako človek ne moremo iz sebe spraviti nobenega glasu, ko želi povedati dve ali tri besede naenkrat.


Dupree ni obupal, temveč je še naprej intervjuval politike s pomočjo eWriter tablice, ali pa je uporabljal posnetke za odgovore skupinam novinarjev. Kljub temu, da je še vedno pisal in produciral zgodbe, se je skoraj v celoti umaknil iz radia, kajti enostavno ni moral prezentirati zgodb, ki jih je napisal.


Njegov trud in strast do dela je izpostavila senatorka Južne Floride, Ileana Ros-Lehtinen, v govoru v predstavniškem domu. S tem je Dupreeju močno pomagala na poti k vrnitvi, saj je na tak način dobila veliko medijske pozornosti in spodbudila njegove zaposlovalce, da so začeli iskati možnosti, kako Jamieja vrniti v eter.


Nov glas

Zahvaljujoč se računalniško generiranem glasu, ki so ga ustvarili pri CareProc, bo od ponedeljka, 25. junija, Dupree ponovno spregovoril na radiu. Glede na to, da je Dupree pravi ljubljenec poslušalcev, bi lahko prva oddaja bila zelo čustvena tako za njega kot za vse zveste poslušalce. S svojim novim glasom bo g. Dupree lahko pisal tekst in potem uporabil brezplačno “text-to-speech” programsko opremo Balabolka, s katerim tekst spremeni v avdio posnetek.


Če se mu bo zdelo, da beseda ali fraza ne zveni čisto naravno, lahko prilagaja širine in dolžine samoglasnikov ter soglasnikov, zamenja besedo ali pa spremeni višino tona. V vsega sedmih minutah lahko pripravi celoten prispevek, ki je pripravljen na objavo.


“Ja, to sem jaz, o tem ni nobenega dvoma. Že res, da je moj glas sedaj malce robotski, vendar mi ni nihče obljubil, da bo perfekten”, je za BBC povedal Dupree. Če recimo Dupree z nekom govori v živo, pa naj bo to z družino ali kolegi, se mora Dupree zanesti na tablico eWriter, ali pa izgovoriti besede zelo počasi. Kljub temu pa mu je novi glas odprl novo poglavje v življenju. “To je čudovito”, je še dodal. S tem je ne samo izrazil veliko hvaležnost podjetju, ampak je svetu poslal jasno sporočilo, da takšna tehnologija postaja vse bolj napredna in dostopna.


Prijavi napako v članku

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

TMSA.PINTAR d.o.o.

Podsabotin 47, 5211 Kojsko, Tel: 041 695 667
Zlati partner

SIDERA d.o.o.

Ulica Gradnikove brigade 11, 1000 Ljubljana, Tel: 031 777 790
O PODJETJU Sidera, ki v latinskem jeziku pomeni zvezda in je nastala v želji, da bi njena ustanoviteljica Urška Ambrož svoje dolgoletno delo v medijih združila s kreativno žilico, ... Več

MIKRONIS IT, Boštjan Rudl s.p.

Jezdarska ulica 3, 2000 Maribor, Tel: 02 429 27 82
Kot lastnik podjetja, še posebej manjšega, imate številne odgovornosti in vloge. Ne ostane vam veliko časa za obvladovanje tehnoloških delovnih okolij, kjer se zahteva specializirano ... Več
Zlati partner

Sony Europe B.V., podružnica v Sloveniji

Dunajska cesta 156, 1000 Ljubljana, Tel: 01 888 8761
Sony Europe B.V. je multinacionalno podjetje za elektroniko s sedežem v Tokiu na Japonskem. V Evropi deluje prek svoje evropske podružnice Sony Europe B.V., ki je prisotna v več ... Več