Webaren etorkizunerako joerak
- (Elhuyar aldizkariko 2012ko uztaileko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)
Normala den bezala, gai teknikoek presentzia handia dute WWW2012n: nola lortzea testu eta multimedia kopuru ikaragarri hori egoki eta azkar kudeatu ahal izatea, segurtasuna bermatzeko moduak... Halaber, badute presentzia konpainiek webari etekin ekonomikoa ateratzeko teknika eta esperientziek (website monetization deritzona), iragarki- eta publizitate-sistemek... Baina hauek webaren barne funtzionamenduari edo webeko enpresei eragiten diten arloak dira; artikulu honetan, gehiago interesatzen zaizkigu erabiltzaileoi berrikuntza edo aldaketa ekarriko dizkiguten gaiek, eta horietan zentratuko gara.
Norberari egokitutako weba
Gai izarretako bat, ez soilik kongresu honetan baizik eta baita Internet edo bilatzaileen inguruko besteetan, aurten bezala baita azken urteetan ere, personalization delakoa da, hau da, webeko erabiltzaile bakoitzari bere gustuen, ideien eta zaletasunen araberako edukia erakustea. Toki askotan aplikatzen da hori jada. Adibidez, hainbat bilatzailek norberari egokitutako emaitzak erakusteko aukera ematen dute, gure nabigazioko historialetan oinarrituta: aurrez egindako bilaketak, bilaketa horietako emaitzetatik zeinetan egin dugun klik, zein eduki aukeratu dugun sare sozialetan elkarbanatzeko... Musika entzuteko webgune eta zerbitzuek ere, guk edo gure lagunek aurrez entzun ditugun abestietan oinarrituta, gustuko izango dugula uste duten kanta berriak iradokitzen dizkigute. Berdintsu saiatzen dira gustuko izango duguna asmatzen on line dendak ere, aurreko gure erosketetan oinarrituta edo guk erositakoen berdinak erosi dituzten beste bezero batzuen erosketei kasu eginez. Komunikabide batzuk ere hasi dira azal ezberdina erakusten erabiltzaile bakoitzari, aurretik irakurri ditugun artikuluen informazioa erabiliz. Eta Facebook bezalako sareen funtsa da pertsonalizazioa, gure lagunen araberako edukia ikusten dugu.
Printzipioz pertsonalizazioak ideia ona badirudi ere, badago haren egokitasuna zalantzan jartzen duenik ere. TED hitzaldi benetan gomendagarri batean, Eli Pariserek ohartarazten du bakoitza bere burbuilan bertan goxo gelditzeko arriskua dagoela, munduan dagoen guztiaren informazio mugatu eta partziala soilik jasotzearen benetako arriskua. Lehen komunikabideek eta telebista-kateek iragazten zuten informazioa guretzat, eta mota bateko egunkariak eta telebista-kateak soilik irakurri eta ikusten bagenituen, alde bakarreko informazioa soilik jasotzen genuen. Internetek ikuspegia zabaldu zigun, baina, orain, pertsonalizazio-iragazkiek aniztasuna kaltetu dezakete berriz.
Bestalde, eduki pertsonalizatua erakutsi ahal izateko, enpresa erraldoi horiek guri buruzko informazioa biltzen dute, eta horrek pribatutasunaren kezka sortzen dio jende ugariri. Honen inguruan, oso interesgarria iruditzen zait Tim Berners-Lee webaren asmatzaile eta W3Cko sortzaile eta zuzendariak horren inguruan duen iritzia, WWW2012ko sarrera-hitzaldian adierazi zuena. Neurri bateraino soilik kezkatzen du horrek Berners-Lee. Haren ustez, enpresek guri buruz duten informazioa beste batzuei saltzeko edo beste erabilera oker batzuetarako erabiltzea ez da zuzena eta ez litzateke egin beharko, baina ez du uste hori hain praktika ohikoa denik, azken finean ez baita hori izaten enpresa gehienen negozioaren muina, eta hori egiten dutenak luzera merkatuak zigortzen ditu. Baina ez du partekatzen batzuek duten kezka, enpresek guri buruzko informazioa erabiltzeari buruzkoa, guri zerbitzu hobe bat emateko erabiltzera mugatzen bada. Arropa-denda baten adibidea jarri zuen: prakak erosten dituen dendako saltzaileak haren praken neurria aurreko alditik gogoratzea ondo dago, beti probatzen ibiltzeko beharrik gabe (zerbitzu ona ematearen betiko maxima bat izan da "ezagutu zure bezeroa").
Edonola ere, enpresek beren informazioa ezertarako ere ez gorde eta erabiltzea nahi dutenek ere horretarako eskubidea dutela deritzo, eta enpresek hori errespetatu behar dutela; horretarako, W3Ck proposatu du HTTP protokoloan aukerako "do not track" goiburu bat sartzea: webgune batek hori duen eskaera bat jasotzen duenean, ez luke gorde beharko bezeroaren inongo daturik, ezta zerbitzu hobea emateko ere; ezingo luke inongo pertsonalizaziorik egin, beraz. Nabigatzaile ia guztiek inplementatu dute jada aukera hori, baina ikusi egin behar ea enpresek errespetatuko duten...
Pribatutasunaren defentsa gehiegizkoa, baina, kalterako ere izan daiteke. Europar Batasunean, adibidez, lege batek debekatu egiten du cookieak (erabiltzailearen preferentziak eta bestelakoak gordetzeko erabiltzen den sistema) gordetzea erabiltzailearen baimenik gabe. Cookierik gabe, ez da soilik webgune batek ezin duela pertsonalizazioa egin: logeatu ere ezin zaitezke egin! Lege horren arabera, legez kanpo daude webguneen % 90etik gora. Orain arte ez dute Estatuek legea betearazi, baina Britainia Handian milioi erdi libra arterainoko isunak jartzea ahalbidetu dute berriki, eta bertako webgune batzuk hasi dira cookien baimen eskaera gogaikarria egiten.
Web semantikoa
Azken urteotan asko entzuten den beste gai bat web semantikoarena da, eta hala izan da aurtengo kongresuan ere. 2009ko maiatzeko eta ekaineko zenbakietan idatzi genuen horri buruz. Testuz beharrean informazio egituratu esanahidunez osatutako web paralelo bat da, testuzkoa ez bezala, makinek ulertzeko eta egoki tratazeko errazagoa dena. Haren gainean osatutako zerbitzu aurreratu adimendunak, testutik eduki egituratua erauzteko proiektuak... Halako aurkezpen ugari izan ziren.
Googlek berriki aurkeztu duen Knowledge Graph produktuak ere web semantikoan du oinarria. Pertsona, toki edo gauza konkretu bat bilatu badugu, ohiko web-orrien zerrendaz gain, informazio egituratu eta erlazionatua duen taula bat ere erakusten du.
Modako gaia da, eta zalantzarik ez datozen hilabete eta urteetan halako zerbitzu asko agertuko direla. Nahiz eta, egia zor, aspaldi ari diren esaten hurrengoa izango dela web semantikoa lehertuko den urtea, eta leherketa hori ez da iristen; baina egia da, halaber, poliki-poliki eta banan-banan ari direla gero eta halako zerbitzu gehiago agertzen.
Lengoaia naturalaren prozesamendua
Aurtengo kongresuan berritasun bat izan da Lengoaia Naturalaren Prozesamenduaren eta Hizkuntza-teknologien presentzia handia. Elhuyarko I+G Taldean duela hamarkada batetik lantzen ditugun teknologia horiek, zeinei buruz sarritan hitz egin dizuegun atal honetan (corpusak, itzulpen automatikoa, bilatzaile hobeak egiteko teknologiak, galderak erantzuteko sistemak, elkarrizketa-agenteak...), tradizionalki toki gutxi izan dute webaren eta bilatzaileen inguruko kongresuetan. Halako gaiak hizkuntzaren inguruko kongresuetan lantzen ziren (hizkuntzalaritza aplikatua, corpus hizkuntzalaritza, hizkuntzalaritza konputazionala...) edo hizkuntza-teknologien ingurukoetan (lengoaia naturalaren prozesamendua, itzulpen automatikoa...), baina orain artean webaren eta bilatzaileen munduak ez du haien beharrik ikusi. Oso azaletik tratatu izan dute hizkuntza: stemming edo sasilematizaio sinple bat, hitzen bilaketa hutsa...
Zergatik orduan bapateko interes hau teknologia hauengatik? Tira, ez da hain bapatekoa izan, azken bizpahiru urteetan gutxinaka emandako igoera baizik. Arrazoi nagusietako bat da aurreko metodo sinpleek goia jo dutela eta emaitzak hobetzeko hizkuntza sakonago aztertzeko beharra ikusi dutela. Bilatzaileen kasuan, adibidez, jabetu dira emaitza hobeak itzultzeko beharrezkoak direla hizkuntzaren araberako bilaketa, bilaketa eleanitza, sinonimoen edo antzeko hitzen bilaketa, jendearen iritziaren analisi automatikoa haren araberako rankinak egiteko, laburpen automatikoa, galderak erantzutea eta halako teknika sakonagoak, hizkuntza teknologien munduan aspalditik landutakoak.
Beste arrazoietako bat web semantikoa da, paradoxikoa badirudi ere. Teorian, web semantikoarekin, makina gai da bertan dagoen informazio egituratua ulertzeko, hizkuntza ulertzeko beharrik gabe. Baina problema jakin batzuk ebazteko (erabiltzaileak lengoaia naturalean egindako galderak erantzuteko, adibidez), beharrezkoa da desanbiguazioa (galdera web semantikoko zein objektu konkreturi buruz den jakitea, edo zein propietate konkreturen ingurukoa), lengoaia naturalaren prozesamenduko edozein etapatan aspaldidanik landutako gauza. Edo testuetatik automatikoki web semantikoko eduki egituratua erauzi nahi bada, beharrezkoak dira hizkuntza-teknologiak.
Aipatutako hiru gai nagusi horiez gain, asko hitz egin zen sare sozialei buruz ere. Eta web mugikorra, HTML 5, bideoa, 3D... Eboluzionatzeko aukera eta bide ugari ditu oraindik webak, eta datozen urteotan izango gara eboluzio harrigarri horren lekuko, ziur.