Edukira salto egin | Salto egin nabigazioara

Tresna pertsonalak

Eibarko peoria, San Blasa baino hobia
Hemen zaude: Hasiera / Blogak / e-gorblog / Irakurri beharrean, entzun

Irakurri beharrean, entzun

e-gor 2015/02/04 21:45
Gizakien arteko komunikazio modu zaharrena eta ohikoena hizketa bidezkoa den arren (komunikazio idatzia erlatiboki oso berria da), ordenagailuekiko elkarrekintza, tradizioz, idatzizkoa edo bisuala izan da eta ez ahozkoa: ordenagailuari inputa eskuen bidez eman izan diogu (teklatua, sagua…) eta emaitza bistaren bidez jaso (pantaila, inprimagailua…). Izan ere, ordenagailuek automatikoki tratatu dezaketen informazioa idatzizkoa izan da, ez hizketa. Azkenaldi honetan, baina, makinekiko ahots bidezko komunikazioa gero eta gehiago ari da hedatzen, eta hizketa automatikoki gero eta hobeto tratatzeko gai dira. Hori guztia ahots teknologiei esker gertatzen da. Hemen ere ari gara horretan lanean, eta Elhuyar aldizkaria, Zientzia.net eta EITB.eus, irakurri beharrean, entzun egin daitezke orain.
Irakurri beharrean, entzun

Irudia: Elhuyar

(Elhuyar aldizkariko 2014ko apirileko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)

Ahots-teknologiak berriki arte asko erabili ez badira, ez da izan beharrik ez zegoelako, baizik eta teknologia oraindik nahiko heldua eta aurreratua ez zegoelako. Beharrak eta aplikazio posibleak ugariak izan dira betidanik.

Erabilera posible horietatik burura lehenengo etortzen zaiguna gailu digitalekiko interakzioa da. Ordenagailu, telefono edo tabletari aginduak teklatuan idatziz edo saguaz klik eginez eman beharrean, erosoagoa eta azkarragoa izan daiteke, kasu askotan, ahoz esanda egitea. Eta makinaren emaitza jasotzeko ere, pantailan irakurri beharrean, maiz erosoagoa izan daiteke entzutea. Ahots bidezko interakzioaren adibide dira gailu mugikorretan gero eta gehiago ikusten diren Siri moduko elkarrizketa-agenteak (2012ko urtarrilean hitz egin genizuen horiei buruz).

Pertsonen arteko komunikazioan ere lagundu dezakete. Itzulpen automatikoarekin konbinatuta, ahots-teknologiekin ahots-itzultzaileak egin daitezke.

Beste aplikazio bat informazioaren kudeaketa da. Idatziz dagoen informazioa erraz eta azkar maneiatzen dute ordenagailuek, eta tresna oso baliagarriak egiten ahal dira, bilatzaileak esaterako. Baina informazioa audio-grabaketak direnean, makinak ez dira gai ulertzeko, eta transkribatu egin behar dira. Aldiz, ahots-teknologien bidez hizketa ulertzeko gai badira, makinek berek bihurtuko lukete ahotsa testu, eta audio-fitxategiak erraz indexatu ahal izango lirateke bilaketarako (horrela ari da, adibidez, BBC bere historia guztiko irratiko audio guztiak bilaketarako katalogatzen), edo filmak automatikoki azpititulatu.

Ahotsaren sorkuntza...

Horrelako gauzak egiteko, esan bezala, ahots teknologiak deritzen teknologiak erabiltzen dira. Eta mota ezberdin askotako teknologiak daude.

Ahots-sintesia da horietako bat, ingelesezko TTS (Text To Speech edo testutik hizketara) izenaz ere ezaguna. Teknologia horrek hizketa baten audioa sortzen du testu batetik, ahots sintetiko edo artifizialez, molde ahalik eta naturalean. Eta hori, neurri batean, nahiko lortua dago, intonazio neutro baterako behintzat. Bitxia bada ere, zientzia-fikziozko film zaharretan agertzen ziren robotak makina oso adimendunak ziren, eta ez zuten arazorik esaten zitzaiena ulertzeko; berek hitz egin, ordea, oso modu artifizial eta robotikoan (jakina) hitz egiten zuten. Baina errealitatean kontrakoa gertatu da: gaur egun nahiko ongi hitz egin dezakete makinek, ulertu, baina, ez hain ongi, eta adimendun izateko tarte handia falta da oraindik...

Ahots-sintesi emozioduna ere lantzen ari dira ikertzaileak, hau da, ahots sintetikoak haserrea, poza, harridura, pena eta horrelako emozioak ere adieraztea. Izan ere, kasu askotan ez da nahikoa gauzak intonazio neutroarekin esatea, adibidez, filmak-eta automatikoki bikoiztu nahi badira.

Sortzen den ahots sintetikoak naturala iduri dezan, benetako pertsonen grabaketa asko egin behar izaten dira, eta, hala, pertsona horren ahots bera duen hizketa lortzen da, benetako pertsona batek esandakoa dela ematen duena. Baina horrek badu arazo bat, ahots ezberdin asko behar direnean ez baitu balio (goian aipatutako filmen bikoizketarako, adibidez). Horregatik, ahotsen transformazioaren teknologia ere existitzen da, hau da, grabaketetan oinarritutako ahots sintetiko batek beste norbaitena dela eman dezan lortzeko teknologia. Hori erabiltzen da, adibidez, hitz egiteko gaitasuna galdu duen jendearentzat bere ahotsaren antza izango duen ahots-sintetizadoreak egiteko.

... eta ezagutza

Ahots teknologien beste familia handia kontrako norabidekoa da, hau da, ahotsaren ezagutzakoa. Hemen sartzen da, esate baterako, biometriarako erabiltzen den hizlariaren ahots bidezko identifikazioa. Hala ere, teknologia hau ahots baten ezaugarriak detektatzean eta horren bidez pertsona zein den jakin edo egiaztatzean datza soilik.

Zailagoa da esaten dena ezagutzea, hau da, benetako ahots ezagutza. Horregatik, ahotsaren ezagutzako sistemetan mota ezberdinetakoak daude, konpontzen duten problematikaren arabera, eta emaitzen kalitatea ere ezberdina dute. Adibidez, diktaketa-sistemak hizketa jarraia eta edozelakoa ezagutzeko pentsatuta daude. Hori lortzea oso zaila da eta hori dela eta, pertsona bakoitzaren hizkerara entrenatu behar izaten dira eta emaitzak ez dira hain onak ere.

Ahots ezagutzako beste sistema batzuk komandoen ezagutzakoak dira. Hauetan, ezagutu beharrekoa mugatua egoten da. Hauen adibideak dira call-centerak edota aipatutako elkarrizketa agenteak. Ezagutu beharrekoa unean uneko testuinguruaren araberakoa da (zenbakiak, aukera multzo batetik bat, gure agendako pertsonetako bat...), eta horregatik emaitza hobeak lor daitezke, hobeak ezagutu beharrekoaren aukera ezberdinak zenbat eta gutxiago izan.

Azkenik, edukien indexazio eta bilaketarako erabiltzen diren ezagutza teknologiak daude. Diarizazioa deritzonak, adibidez, audioko fitxategi baten dauden atal ezberdinak identifikatzeko balio du: noiz den elkarrizketa, noiz isilunea, noiz musika, noiz zarata… Horrela, ahots ezagutzailea zein zatiri aplikatu jakiten da, hizketarik ez dagoenean ezagutzailea pasatu eta zaborra indexatu beharrean. Hizlariaren identifikazioa ere interesgarria izaten da indexazio helburutarako. Eta ohiko ahots ezagutza ere erabiltzen da indexaziorako. Gainera, honelako erabileretan maiz ez du axola ezagutza perfektua ez izateak: sarri ez da transkribapen zehatza behar, bilaketarako hitz edo termino esanguratsuen eta errepikakorrenak harrapatzea nahikoa izan daiteke.

Euskarazko ahots-sintesia Elhuyar aldizkaria, Zientzia.net eta EITB.eus entzuteko!

Arestian esan dugu ahots-teknologiak gaur egun nahikoa aurreratuta daudela eta gero eta gehiago erabiltzen direla. Teknologia horiek, baina, hizkuntzaren araberakoak dira (beharbada hizlariaren detekzioaren salbuespenarekin), eta ez daude garapen-maila berean hizkuntza guztietarako. Beti bezala, teknologiok oso garatuta daude hizkuntza gutxi batzuetarako (betikoak: ingelesa, gaztelania, alemana, txinera...), eta gainerako gehienetarako askoz atzerago.

Garapen onena duten hizkuntza horien mailan ez badago ere, euskara ez da, zorionez, azkeneko bagoian doazen horietakoa. Urteak daramatzagu euskararentzako ahots-teknologiak lantzen. Eta lan horretan aitzindari eta erreferente EHUko Aholab ikerketa-taldea dugu. Aipatutako teknologia guztiak landu dituzte eta lantzen ari dira.

Aholabek euskararentzat aurreratuen daukan teknologia, jakina, ahots-sintesiarena da. Oso kalitate oneko ahots sintetiko neutroa lortzen dute, aplikazioetan erabiltzeko modukoa. Horregatik, Aholabekin elkarlanean, Elhuyarreko Hizkuntza eta Teknologia unitateak webguneak irakurri beharrean entzuteko teknologia garatu du ahots-sintesi bidez.

Izan ere, jada ez dugu soilik mahai gaineko ordenagailuetatik nabigatzean webean. Gero eta gehiago ibiltzen gara Interneten gure smartphone eta tabletetatik. Eta horietan, webguneak irakurtzeko baldintzak ez dira sarri oso egokiak: pantaila txikia da (batez ere, telefonoetan), mugimenduan joaten gara maiz (oinez, trenean, autobusean...) eta abar. Aldiz, horrelako gailuetan, oso ohituta gaude edukia (musika, podcast-ak...) entzungailuez entzuten. Horregatik, oso interesgarria iruditu zitzaigun webguneak entzun ahal izateko teknologia hori garatzea. Erabiltzailea ordenagailu edo gailu mugikorrean edukia irakurri ordez entzuten joan ahal izango da, bitartean beste zerbait egiten duelarik.

Oraingoz, Elhuyar aldizkariaren webgunean, Zientzia.net-en eta EITB.eus-en jarri dugu teknologia hori. Bertako eduki batean gaudela (artikulu bat, erreportaje bat...), barra bat agertuko zaigu, eta han “play” itxurako botoi tipiko bat. Hori sakatuta, artikulua entzuten hasiko gara. Entzuketa esaldiz esaldi egiten da, eta entzuten ari garen esaldia markatuta agertzen da. Era berean, entzuketan nabigatu ahal izateko botoiak ere badaude (aurreko edo ondoko esaldira, aurreko edo ondoko paragrafora, edo nahi dugun tokira joateko). Gainera, ahotsa (emakumezko eta gizonezko baten artean), bolumena zein abiadura alda ditzakegu. Horrez gain, aldizkariko zenbaki batean bagaude, entzuteko botoia sakatuta, zenbaki horretako artikulu guztiak entzun ahal izango ditugu bata bestearen atzetik; hori oso interesgarria izan daiteke kotxean gidatzen-edo bagoaz bidaia luze samar batean, irratia entzun beharrean aldizkari osoa entzun baitezakegu. Azkenik, elkarrizketetan, aukeratutakoa ez beste ahots batekin irakurtzen dizkigu galderak, galderak eta erantzunak bereiz ditzagun. Eta hori guztia, HTML5 teknologia estandarra erabiliz egin da (HTML5ez 2010eko otsailean hitz egin genizuen).

Aukera ederra, beraz, euskarazko ahots-teknologiak ezagutu eta baliatzen hasteko. Probatu, eta ikusi!

Alex
Alex dio:
2015/02/05 00:33
Noizko edozein web orriko testua entzuteko plugina?
e-gor
e-gor dio:
2015/02/05 09:07
Badugu gogoan, ea laster...
Iruzkina gehitu

Erantzuna formulario hau betez utzi dezakezu. Formatua testu arruntarena da. Web eta e-posta helbideak automatikoki klikagarri agertuko dira.

Galdera: Idatzi zortzi zenbakiak erabiliz
Erantzuna:
e-gorblog

e-gorblog

Egunez, Igor Leturia Azkarate pertsona arrunta da. Errenterian bizi den arrasatearra, 8etatik 17etara Elhuyarren lan egiten du eta arratsaldeak neskalagunarekin eta bere bi umeekin pasatzen ditu.

Baina gaua iritsi eta umeak lotara joaten direnean, e-gor bihurtzen da, interneteko bere alter-egoa, ziberespazioko informatikaririk komikizaleena eta komikizalerik informatikariena! Bere superbotereekin (interneteko kable-konexioa, bloglines, informatika aldizkariak, gadget-ak, komiki-bilduma, Errenteriko liburutegiko komikien atala eta batez ere bere jakinmin aseezina) eta bere superlaguntzaileak ondoan dituela (Patxi Lurra, DabilenHarria...), euskaldunon teknofobiaren eta komikiei buruzko aurreiritzien aurka burrukatzen du etengabe! Hemen duzu bere bloga: e-gorblog!

Bai, hor goiko aurkezpena superheroi batena da (ezin aproposagoa honelako blog batentzat, ezta?). Superheroia banintz zein izango nintzatekeen jakiteko the Superhero Personality Test egin nuen eta hona emaitzak:

You are Spider-Man
You are intelligent, witty, a bit geeky and have great power and responsibility.

Spider-Man
80%
Superman
70%
Green Lantern
65%
Robin
65%
The Flash
60%
Supergirl
55%
Hulk
55%
Iron Man
45%
Wonder Woman
35%
Catwoman
25%
Batman
0%
Lizentzia

Creative Commons-en baimena
Blog honetako edukia, Igor Leturiak eta beste kolaboratzaile batzuek egiten dutena, Creative Commons Aitortu-PartekatuBerdin 3.0 Unported baimen baten mende dago (irudiak salbu).

Harpidetza
Erantzunen harpidetza
Artxiboa
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024
Artikulu aipagarriak

MythTV sorta
2004/11

"Pololoak" sorta
2004/11-12 - 2006/10-12 - 2007/02-03

Monoblogoa
2005/01/11

"Persepolis", xalotasunaren sakontasuna
2005/01/25

Elgetako Blogs&Beers 2005: nire inpresioa eta moblogging kontuak
2005/04/18

Firefox eta bere plugin zoragarriak
2005/05/11

"El País"-en komiki bilduma
2005/05/15

Euskarazko bi blog berri (bai, beste bi, baina hauek bereziak dira!)
2005/05/25

"Watchmen" sorta
2005/09-11 - 2006/10 - 2007/10 - 2008/07

"La cárcel de papel"-eko "Mis tebeos favoritos" saila I: 1etik 20ra
2005/11/08

"Goienkaria"-n agertu naiz
2005/12/08

Komikiak eta euskal rock-a
2005/12/14

Ruben Arozena "Ruben" komikigilea hil da
2006/01/02

Zope-rako DTML Calendar Tag produktua, euskaraz
2006/02/01

"Joyas Literarias Juveniles" bilduma, osorik eMule-n
2006/08/05

Argazkigintza eta DRM-a
2006/10/09

Paul Auster eta Euskararen Herria
2006/10/29

Angoulême sorta
2007/01-02

Gaur duela 25 urte nire bizitza aldatu zen
2007/04/23

Hergé-ren defentsan
2007/05/22

Ubuntu-ren bertsio berria, hobekuntza askorekin
2007/07/02

OLPC sorta
2007/12 - 2008/01

Guillermo Zubiaga, Marvel-eko komikilari euskalduna
2008/02/05

Asus EEE PC, ordenagailu txiki eta merkeen hurrengo sorta
2008/03/11

Agur, Ipurbeltz, agur... :-(
2008/08/04

"Café Budapest", gizatasuna eta bizikidetzaren aldeko aldarria
2008/08/25

"Arturo Erregea" serie mitikoa, Euskal Encodings-en! (beste askorekin batera)
2008/09/17

"Gazteak", beste serie mitiko bat euskaraz eskuragai!
2008/10/14

Pottokiek 50 urte!
2008/10/22

Europan ere OLPC-ren XO ordenagailuak erosteko aukera!
2008/11/12

Microsoft-en web zerbitzuetako gehienak, euskaraz!
2008/12/04

"Heroes"-en 2. denboraldia: ETB kirtenkeria errepikatzera, eta Euskal Encodings konpontzera
2009/01/23

I. Euskal OLPC Party-a, apirilaren 23an Donostiako Doka kafe antzokian
2009/04/16

Elkarrizketa egin didate 7K-n
2009/06/03

Azpiriren Spectrum-entzako jokoen azalak liburu batean
2009/10/06

Asterix, heroi garaitua
2009/10/29

"Ihes ederra", euskarazko komikigintzaren heldutasunaren konfirmazioa
2009/11/13

Pololoak 3: The making of
2009/11/22

5 urte 5!
2009/12/15

Nobela grafikoa, komikien prestigiorako ala mespretxurako?
2009/12/20

"Pololoak 3 - Atxeritoko balada", trilogiaren amaiera borobila
2010/01/13

Sinclair ZX Spectrum bat oparitu didate!
2010/01/19

Zergatik ez dudan liburu elektronikorik erosiko (gauzak aldatzen ez diren artean)
2010/01/27

Errealitate areagotua: munduaren pertzepzioa aberasten
2010/02/09

e-gorblog, "Nick dut nik" telebista saioan
2010/05/20

Sarearen neutraltasunari erasoak: Interneten izaera arriskuan
2010/06/02

"Avatar, azken aire maisua" osoa eta "Heroiak"-en lehen bi denboraldiak, Euskal Encodings-en
2010/07/22

Sistema eragileen guda berria
2010/12/14

Anubis 3.0 albumarentzat 3D animazio ederra
2010/12/27

Telebistaren benetako iraultza hemen da, eta ez da LTDa
2011/01/10

"Asterix galiarra" eta "Urrezko igitaia" berrargitaratu ditu Salvatek
2011/01/13

Euskarazko komikigintza digitalizazioaren aurrean
2011/01/27

"Ihes ederra"ren gaztelaniazko eta katalanezko bertsioak eta "Alokairuan", kalean
2011/02/20

Star Wars jatorrizko trilogia, euskaraz
2011/03/21

Sare sozialetan preso
2011/04/06

Zer dudan Steve Jobsen, edo Appleren, aurka
2011/10/14

Gaur 100 urte Adèle Blanc-Sec-en abenturak hasi zirela
2011/11/04

Euskarazko 8 komiki berri
2011/12/02

Social networks killed the RSS star?
2012/06/10