Balso atpažinimas vs. kalbos atpažinimas: kuo šios technologijos skiriasi ir kaip jos veikia?
|Kalbos ir balso atpažinimo technologijos reikalingos bene kasdien: naudojantis virtualiais asistentais, balsu valdant įvairiausius buities prietaisus, netgi atsakinėjant į elektroninius laiškus. Visgi, ar žinote kokie yra pagrindiniai balso ir kalbos atpažinimo technologijų skirtumai? Anot eksperto, paprastai tariant, balso atpažinimo technologija atpažįsta unikalų kalbėtojo balsą, o kalbos atpažinimo technologija atskiria ir geba transkribuoti konkrečius žodžius.
Skirtumus įžvelgti nesudėtinga
„Nors kalbos ir balso atpažinimo technologijos veikia skirtingai, jos abi yra gana glaudžiai susipynusios, todėl nenuostabu, kad jas paprasta supainioti. Juolab, kad abi šios technologijos veikia naudojant garso atpažinimo principą. Visgi, balso ir kalbos atpažinimo technologijos atlieka visiškai skirtingus vaidmenis. Pavyzdžiui, balso atpažinimas naudoja konkretaus balso biometrinius duomenis, o kalbos atpažinimas yra įrankis, leidžiantis balso įrašus paversti tekstu“, – sako Arnoldas Lukošius, „Tele2“ inovacijų ekspertas.
Anot jo, dažniausiai vartotojai naudojasi abiem šiais įrankiais neskirdami, kur yra kuris. Visgi, šiek tiek pasidomėjus – šias technologijas atpažinsite itin paprastai. Pagrindinis skirtumas tarp balso atpažinimo ir automatinio kalbos atpažinimo technologijų yra tai, kaip jie apdoroja garsą ir reaguoja į jį. Kalbos atpažinimo funkcija, užuot atpažinusi balsus, atpažįsta kalbą, o balso atpažinimo technologija veikia atvirkščiai ir atpažįstą konkretų vartotojo balsą.
Sustiprino prisijungimo prie banko sąskaitų saugumą
Anot A. Lukošiaus, balso atpažinimas yra procesas, leidžiantis dirbtiniam intelektui atpažinti ir iššifruoti žmogaus kalbos modelius. Iš esmės tai leidžia jūsų kompiuteriui, išmaniajam telefonui ar virtualiam asistentui suprasti, ką sakote ir atpažinti jūsų balsą. Ši technologija – itin populiari. Bendrovės „UpCity“ duomenimis, 2022 m. pabaigoje ja kasdien naudojosi 50 proc. JAV gyventojų.
Balso atpažinimo technologija turi ir dar daugiau patogių funkcijų. Pavyzdžiui, nuo 2016-ųjų ši technologija naudojama kaip apsaugos priemonė prisijungiant prie banko sąskaitų. Sakoma, kad dėl jos gerokai susistiprėjo apsauga nuo sukčių, kadangi technologija atpažįsta tik konkretaus vartotojo balsą.
Skambinimas naudojant laisvų rankų įrangą – dar vienas balso atpažinimo pavyzdys. Naudojantis balso atpažinimo funkcija vartotojai gali valdyti išmaniuosius įrenginius savo namuose: apšvietimą, garsiakalbius, kondicionierius ir kitus įrenginius.
Palengvino įvairių gebėjimų žmonių kasdienybę
Pasak A. Lukošiaus, vieni paprasčiausių kalbos atpažinimo funkcijos pavyzdžių, kuriuos dauguma žmonių naudoja kasdieniame gyvenime, yra „Apple“ „Siri“, „Microsoft“ „Cortana“ ar „Amazon“ „Alexa“ virtualieji asistentai.
„Ši technologija klausosi jūsų ir realiu laiku reaguoja į konkrečiai duotas užduotis. Naudodama natūralios kalbos apdorojimą kalbos atpažinimo technologija taip pat gali tiksliai generuoti garso įrašą ir jį realiuoju laiku versti į tekstą: šifruoti balso įrašus, rašyti el. laiškus, generuoti subtitrus. Ši technologija dar nėra 100 proc. tiksli – net ir tobulomis sąlygomis verčiant tekstus realiuoju laiku pasitaiko nemažai klaidų. Visgi, tai greitas ir pigus būdas kalbą konvertuoti į tekstą“, – teigia A. Lukošius.
Jis priduria, kad „Google“ vertėjas yra puikus pavyzdys, kaip kalbos atpažinimo technologija gali būti naudojama teksto vertimui – kalbėdami į savo įrenginio mikrofoną vartotojai gauna vertimus norima kalba, tekstine forma. Tiek balso, tiek kalbos atpažinimo technologijos yra labai svarbios ir įvairių gebėjimų žmonių kasdienybėje. Pavyzdžiui, automatiškai sugeneruoti subtitrai, tekstai, suteikia klausos sutrikimų ar negalią turintiems žmonėms turėti patogią technologijų naudojimo patirtį bei padeda bendraujant.
Pranešimą paskelbė: Gertrūda Stripeikytė, UAB „Publicum”