Računalništvo, telefonija
24.11.2016 10:00
Posodobljeno 7 let nazaj.

Deli z drugimi:

Share

Umetna inteligenca obvlada branje z ustnic

Umetna inteligenca obvlada branje z ustnic
Umetna inteligenca obvlada branje z ustnic

“Mini-gibi” ustnic so med govorjenjem zelo težko zaznavni in razumljeni, še posebej, če branje z njih poteka na določeni razdalji ali človek morda nekoliko nerazločno govori. Branje z ustnic ni neka znanstvena fantastika, temveč je ključno orodje za razumevanje sveta v primeru takšne ali drugačne okvare sluha. Ob morebitni avtomatizaciji, bi to pomagalo milijonom ljudi po vsem svetu.

Pred kratkim je University of Oxford objavila poročilo (raziskava je bila podprta s strani Alphabetovega DeepMinda) o sistemu umetne inteligence LipNet, ki spremlja video govora osebe in preko branja z ustnic ugotavlja povedano – s 93,4-odstotno natančnostjo.

Prejšnji podoben sistem je deloval na principu “word-by-word” in je imel 79,6-odstotno natančnost. Raziskovalci na University of Oxford pravijo, da je glavna razlika med starim in novim pristopom ta, da so začeli drugače razmišljati o problemu. Namesto učenja umetne inteligence vsakega giba ustnic, pri čemer so uporabljali sistem vizualnih fonemov, so sedaj v sistem vgradili celotne stavke. To je umetni inteligenci omogočilo, da se nauči katera črka spada k še tako majhnemu premiku ustnic.

Za to, da so raziskovalci natrenirali sistem, so sistemu LipNet pokazali preko 29.000 videov s pravilnim tekstom, vsak video pa je bil dolg le tri sekunde. Za primerjavo so raziskovalci vključili človeške bralce z ustnic, ki so imeli kar 47,7-odstotno stopnjo napak, medtem ko je imel sistem zgolj 6,6-odstotno.

Kljub uspešni izvedbi projekta, je ta pokazal na nekatere pomanjkljivosti modernega raziskovanja umetne inteligence. Videi so bili močno standardizirani, vsi sodelujoči so gledali naprej, imeli mirno držo in govorili jasno in brez mašil. Vprašanje je kako bi umetna inteligenca reagirala na bolj naravno okolje in dejavnike, ki vplivajo na človeški govor v vsakdanjem življenju.

Na primer: “Place blue in m 1 soon”. To je bila ena standardnih trisekundnih fraz, ki je bila uporabljena med testiranjem sistema. Barva, predlog, črka, številka in pridevnik, vsak stavek je sledil temu vzorcu. Umetna inteligenca je bila preizkušena v nenavadnih pogojih in zato je dala tudi nenavadno natančne rezultate. Če bi LipNet bral z ustnic naključnim ljudem na naključnih YouTube videih, bi rezultati oz. natančnost sistema brez dvoma padla.

Po mnenju Jacka Clarka iz neprofitnega podjetja OpenAI, je uresničitev takšnega sistema na ravni vsakdanje rabe možna pod tremi pogoji: ogromna količina videov, kjer ljudje govorijo v povsem naravnih situacijah; izboljšanje umetne inteligence do ravni, kjer bi ta bila sposobna branja z ustnic iz različnih kotov; povečanje vrst fraz, ki jih umetna inteligenca lahko predvidi. Tovrstna tehnologija branja z ustnic bi ljudem, ki ne slišijo ali slabše slišijo pomenila ogromno, saj bi lahko bila uporabljena v nešteto situacijah. Razumevanje pogovorov, predstavljanje sveta itd.


Prijavi napako v članku

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

COPIGRAF FAGANELJ d.o.o.

Ulica tolminskih puntarjev 4, 5000 Nova Gorica, Tel: 05 333 34 56
V digitalnem svetu se poraja pomembno vprašanje. Je digitalna prisotnost vse, kar potrebuje podjetje? Je digitalna identiteta dovolj za krepitev prepoznavnosti blagovne znamke? Ne, ... Več

ALTERNA DISTRIBUCIJA d.o.o.

Litostrojska cesta 56, 1000 Ljubljana, Tel: 01 520 28 00
S svojimi dolgoletnimi izkušnjami in poslovno zrelostjo poznana kot ena vodilnih in najtrdnejših tovrstnih družb v Sloveniji. Osnovna dejavnost družbe je distribucija računalniške ... Več

Koenergija d.o.o.

Ilichova 21, 2000 Maribor, Tel: 040 730 010
Večina se zaveda, da je vključitev neke oblike industrijske avtomatizacije v njihov proizvodni obrat ali podjetje koristna. Lahko zmanjša proizvodne stroške, poveča učinkovitost, ... Več

MITS d.o.o.

Butari 20a, 6272 Gračišče, Tel: 040 895 342
Bodite pozorni pri izbiri pravega ponudnika programskih rešitev za gostinstvo, hotelirstvo in druge storitvene dejavnosti. Večina ponuja le generične oblike rešitev, ki ne zadostujejo ... Več