e-gorren blog pertsonala (komikiak, informatika eta beste)
Web-corpusen Ataria: Elhuyar I+Gk egindako euskarazko webeko testuen biltegi erraldoia
- (Elhuyar aldizkariko 2013ko martxoko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)
Hizkuntza batentzat oso garrantzitsua da testu-corpusak edukitzea (azterketa linguistikoak egiteko balio duten testu-bildumak). Hizkuntzalaritza-ikerketetarako, edo hizkuntza-estandarizazioan erabakiak hartzeko datuak lortzeko ezinbestekoak dira. Eta oso baliagarriak dira testu sorkuntzan edo itzulpengintzan ere: hiztegietan agertu ez edo adibide nahikorik ez duten hitzak nola erabili edo nola itzuli izan diren argitu diezagukete.
Baina, horrez gain, corpusek berebiziko garrantzia dute hizkuntza-teknologien munduan. Gaur egungo telefono mugikor adimendunek ekartzen duten ahots-ezagutzako sistemetan, adibidez, corpusak erabiltzen dira guztiz ongi ulertu ez den hitz bat asmatzen saiatzeko, aukeren artean testuinguru horretan probableena zein den corpusetan begiratuta; edo itzulpen automatikoko sistemek, esaterako, corpus paraleloak (elkarren itzulpen diren testuez osatutako corpusak) erabiltzen dituzte ikasteko, 2009ko azaroko zenbakian kontatzen genizuenez.
Zenbat eta corpus handiagoak, hobe
Artikulu hartan bertan azpimarratzen genuen corpus hauek zenbat eta handiagoak izan hobe dela. Hitz arraro baten erabilera kontsultatzeko, agerpen ezberdin gehiago, edo agertzeko aukera gehiago egongo dira corpusa handiagoa bada. Itzulpen automatikorako ere tamaina ahalik eta handieneko corpusak behar dira; horregatik da erreferentzia Google hizkuntza askotako itzulpen automatikoan, bilatzailerako indexatzen dituen testuekin corpus paralelo ikaragarriak osatzen dituelako.
Beste arlo askotan bezala, corpusenean ere baliabide gehiagoko beste hizkuntza batzuen oso atzetik dabil euskara, bai tamainan, bai denboran. Errepara diezaiogun ingelesaren egoerari: corpusgintza modernoaren abiapuntutzat jotzen den ingelesezko Brown corpusa 1964an sortu zen eta milioi bat hitz zituen; 100 milioi hitzeko British National Corpus 1995ekoa da; eta gaur egun, badaude ingelesezko milaka milioi hitzeko corpusak. Ingelesa barne hartzen duten corpus paraleloei dagokienez, Googlek 2005ean abiatutako itzulpen automatikoko sistema 200.000 milioi hitzeko corpus baten gainean entrenatu zen.
Euskaraz, aldiz, lehen corpusa (Euskaltzaindiaren Orotariko Euskal Hiztegiaren testu-corpusa) 1984an egin zen eta 4,6 milioi hitz ditu. Euskaltzaindiak berak egindako XX. Mendeko Euskararen Corpus Estatistikoa 2002an amaitu zen, 6 milioi hitzekin. Elhuyar Fundazioak eta Euskal Herriko Unibertsitateko IXA Taldeak Zientzia eta Teknologiaren Corpusa atera zuten 2006an, 9 milioi hitzekoa. EHUk ere urte horretan egin zuen Ereduzko Prosa Gaur deituriko corpusa, gaur egun 25,1 milioi hitzez osatua. Euskaltzaindiaren Lexikoaren Behatokia 2010ean abiarazi zen, eta egun 26,5 milioi hitz ditu. Corpus paraleloei dagokienez, itzulpen-enpresek dituzte ziurrenik horrelako handienak euren itzulpen-memorietan. Baina publikoarentzat eskuragarri eta hizkuntza-teknologietan erabiltzeko moduan oso gutxi daude; erakunde publiko (HAEEren Itzulpen Zerbitzu Ofiziala, Gipuzkoako Foru Aldundia, Bizkaiko Foru Aldundia...) edo bokazio sozialeko elkarte (EIZIE, Librezale) batzuetako itzulpen-zerbitzuen itzulpen-memoriak eta Eroskiren Consumer aldizkariko corpusa dira erreferentzia bakarrak, baina denak 5 milioi hitzen azpitik daude.
Konponbidea, weba
Arazo hori konpontzeko errezeta Adam Kilgarriff corpusetan adituak ematen zuen lehen aipatutako artikuluan: weba da corpus handiak modu erraz, merke eta azkarrean osatzeko modurik onena. Izan ere, ingelesezko aipatu ditugun azken urteotako corpus erraldoi horiek ere horrela osatu dira, ikusita corpusak era klasikoan osatzea (argitaletxeetara edo komunikabideetara joz) askoz garestiago eta neketsuagoa dela.
Corpusak webetik automatikoki osatzeak baditu bere aurkakoak ere. Haien objekzio nagusia da bertan kalitate eskaseko testu asko aurki daitezkeela. Baina beste ikuspegi batetik ikusita, hori da gaur egungo hizkuntzaren erabilera erreala, eta hori aztertzeko sortu ziren corpusak. Gainera, baliabide askoz gehiago dituzten hizkuntzek webera jo badute, euskararentzat ere hori da bidea atzean gelditu nahi ez badu.
Euskarazko Web-corpusen Ataria
Elhuyar Fundazioko hizkuntza-teknologien I+G taldekook badaramatzagu urte batzuk web-corpusen —hau da, webeko testuekin metodo automatikoak erabiliz eraikitako corpusen— arloa jorratzen. Mota askotako corpusak biltzeko metodoak landu ditugu: euskarazko corpus espezializatuak (jakintza-arlo jakin bateko testuz osatuak), corpus eleaniztun konparagarriak (jakintza-arlo bereko testuz osatuak), corpus paraleloak (elkarren itzulpen diren testuz osatuak), corpus orokor erraldoiak... Horrelakoak egiteko, beharrezkoa da hizkuntza-teknologietako beste teknika batzuk garatzea: bilatzaileen APIetatik hitz jakin batzuk dituzten web-orriak eskuratzekoak, testu baten hizkuntza ezagutzekoak, testu errepikatuak edo oso antzekoak detektatzekoak, web-orriak garbitzekoak (oinak, goiburuak, nabigazio-menuak, copyright-oharrak eta horrelakoak kentzeko eta testuaz soilik gelditzeko), spama apartatzekoak, testu baten jakintza-arloa detektatzekoak, itzulpenak ezagutzekoak...
Tresna horien bidez, aipatutako mota horietako guztietako corpus asko osatu ditugu. Eta orain, corpus horietako batzuk on line jarri ditugu Web-corpusen Atarian: 125 milioi hitzeko euskarazko corpus orokor handi bat (mota horretako orain arteko handiena zen, alde handiz; geroztik atera da handiago bat, EHUren Egungo Testuen Corpusa) eta 18 milioi hitzeko euskara-gaztelania corpus paralelo bat (corpus paralelo publikoen artean handiena). Corpus horien gainean hainbat bilaketa-mota egitea ahalbidetzen da webgunean. Lema edo forma jakin bat edo haien hasiera edo bukaera emanda galde daitezke, gehienez 5 hitzeko distantziara dauden hiru hitz arterainoko konbinaziotan. Paraleloan bi hitz arterainoko konbinazioak galde daitezke, baina hizkuntza batean, bestean edo bietan izan daitezela eska daiteke. Oso baliagarriak dira, biak, hitzak nola erabili edo itzuli izan diren ikusteko.
Horrez gain, corpus elebakarraren gainean teknika linguistiko eta estatistikoak aplikatuta, gehien erabiltzen diren hiru motatako konbinazioak kalkulatu dira (izen-izen, izen-aditz eta izen-adjektibo) eta kontsultagai jarri da. Hala, sistemari galdetu diezaiokegu hitz jakin bat zein aditzekin konbinatu ohi den, edo zein adjektiborekin, eta abar.
Web-corpus elebakarra
Corpus elebakarraren kontsulta-interfazea. Irudia: Elhuyar I+G
Bildu eta online jarri dugun web-corpus elebakarra euskarazko web-corpus bat da, 124.625.420 testu-hitz dituena. Interneten dauden mota eta arlo guztietako testuak biltzen ditu, eta gaur arte eratu den euskarazko corpusik handiena da. Linguistikoki etiketatuta dago.
Esan bezala, web-corpus hau guztiz automatikoki eratu da, Elhuyar Fundazioaren Hizkuntza eta Teknologia unitateko I+G taldeak garatutako teknologiak erabilita. Web-corpusa biltzeko tresnak ondoko gauzak egiten ditu:
- Interneteko euskarazko orriak lokalizatu
- Orri ez-egokiak iragazi
- Orri errepikatuak edo ia berdinak ezabatu
- Orritik edukizkoak ez diren atalak kendu (izenburuak, menuak, nabigazio-aukerak, oin-oharrak), testu nagusia baino ez corpuseratzeko.
Corpusaren osaera dela eta, 6.202 domeinutako 82.542 dokumentu ditu. Web-corpusen webguneko eranskina (elebakarra) atalean, domeinuen zerrenda eta bakoitzetik corpuseratutako dokumentuen eta hitzen kopuruak kontsulta daitezke.
Bilketa-metodoari buruz gehiago jakin nahi izanez gero, bibliografian aipatzen den [Leturia, 2012] artikulura jo dezakezu.
Webgune honetan kontsultagai jartzeko, testu guztiak linguistikoki prozesatu eta etiketatu dira. Horretarako, Euskal Herriko Unibertsitateko IXA taldeak garatutako Eustagger etiketatzailea erabili da. Tresna horrek testu-hitz edo token bakoitzari analisi linguistiko bat edo batzuk esleitzen dizkio, eta, atal honetako kontsulta antolatzeko, analisi bakoitzetik lema- eta kategoria-etiketak erabili dira (hitz-konbinazioen atalean eskaintzen den bigrama-erauzketa egiteko eta prozesatzeko, bi horiez gain, kasu- eta mugatasun-etiketak ere erabili dira). Informazio horren bidez, hitzak, beren lema, forma edo kategoriaren arabera bila daitezke. Hori ez ezik, lema edo forma batetik halako distantziara forma, lema edo kategoria jakin bateko hitzak dauden ere kontsulta daiteke. Hainbat aukera daude emaitzak ordenatzeko, eta datu estatistikoak aukeratzeko (ikus webguneko laguntza).
Web-corpus paraleloa
Corpus paraleloaren kontsulta-interfazea. Irudia: Elhuyar I+G
Atari honetan kontsultagai dagoen bigarren corpusa euskara-gaztelania corpus paraleloa da. Corpus hau automatikoki osatu da, Elhuyar Fundazioaren Hizkuntza eta Teknologia unitateko I+G taldeak garatutako PaCo2 [San Vicente & Manterola, 2012] tresna erabiliz. Tresna horrek erabiltzaileak aukeratutako bi hizkuntzetan eduki elebiduna duten domeinuak bilatzen ditu Interneten, eta domeinu horietatik elkarren itzulpen diren esaldiak erauzten ditu. 1. taulak corpusaren tamainaren inguruko datuak azaltzen ditu.
eu | es | guztira | |
---|---|---|---|
Dokumentuak | 87.253 | 87.253 | 174.506 |
Corpus gordinak (dokumentu-mailako parekatzea) | 34.902.457 | 42.183.563 | 77.086.020 |
Segmentuak (esaldi-mailako parekatzea) | - | - | 659.630 |
Hitzak (esaldi-mailako parekatzea) | 7.891.104 | 10.862.509 | 18.753.613 |
Corpus paraleloaren datu orokorrak
85 domeinutako testuak bildu dira corpusera. Web-corpusen webguneko eranskina (paraleloa) atalean, domeinuen zerrenda eta bakoitzetik corpuseratutako dokumentuen eta hitzen kopuruak kontsulta daitezke.
Gerora, corpusa hazten joango dela aurreikusten dugu. Une honetan, guk dakigula, automatikoki sortutako euskara-gaztelania corpus paralelo elebidunik handiena da.
Bildutako dokumentu elebidunak esaldi-mailan parekatzeko eta segmentuak sortzeko, Hunalign tresna erabili dugu. Ondoren, corpusa linguistikoki prozesatu da, eta etiketatuta dago. Corpus elebakarrean bezala, Euskal Herriko Unibertsitateko IXA taldeak garatutako Eustagger tresna erabili da euskarazko etiketatze linguistikoa egiteko. Gaztelaniazko testuak TreeTagger etiketatzailearen bidez prozesatu dira. Testuko hitz bakoitzari esleitutako informazio linguistikoari esker, corpusaren kontsulta-interfazean lema eta kategoriaren araberako hainbat bilaketa-mota egin daitezke (ikus webguneko laguntza).
Esan beharra dago bilketa automatikoa izateak abantaila argiak dituela, baina arazoak ere bai. Batetik, corpus hau eskuz biltzeak eskatuko lukeen denborak eta ahaleginak bideraezina egingo lukete proiektua. Bestetik, prozesu automatikoa izateak berekin dakar amaierako corpusaren kalitatea optimoa edo erabatekoa ez izatea. Izan ere, ezin dugu bermatu lortutako segmentu guztiak, hau da, esaldi guztien parekatzea, zuzenak direnik. Hainbat arrazoi daude horretarako: dokumentu batzuek itzulpen partzialak besterik ez dituzte, zenbait dokumentu paralelo gisa aurkezten diren arren, hizkuntza batean eta bestean agertzen den edukia ez da berdina... Bestetik, parekatze automatikoa egiten duten tresnen doitasuna ez da % 100koa. Nolanahi ere, gure corpus paraleloak eskaintzen dituen segmentuetatik % 90 zuzenak dira, hau da, elkarren itzulpen diren esaldiak dituzte. Une honetan, bozka-sistema bat lantzen ari gara, erabiltzaileak segmentu bat zuzena ala okerra den adierazteko aukera izan dezan. Horretara, corpusaren kalitatea hobetuz joango da.
Hitz-konbinazioak
Hitz-konbinazioen kontsulta-adibidea. Irudia: Elhuyar I+G
Euskarazko web-corpus elebakarretik hiru eratako hitz-konbinazioak erauzi dira, automatikoki: izen+aditz, izen+izen eta izen+izenondo. Fraseologia konputazionaleko lan honetan erabilitako metodologia Elhuyar Fundazioaren Hizkuntza eta Teknologia unitateko I+G taldean diseinatu eta inplementatu da, Euskal Herriko Unibertsitateko IXA taldeko Iñaki Alegria lankide izanik [Gurrutxaga & Alegria, 2011]. Eustagger bidez prozesatutako web-corpus elebakar etiketatutik abiatuta egin dugu lan, eta, hortik aurrerako urratsetako batzuetan, erabilera libreko bi tresna erabili ditugu: Ted Pedersenen Ngram Statistics Package (NSP), bigrama-sorkuntzarako; eta Stefan Everten UCS toolkit, elkartze-neurri estatistikoak kalkulatzeko. Metodologiaren eta ebaluazioaren informazio zehatza du eskura erabiltzaileak bibliografian erreferentziatzen den artikuluan.
Hona hemen aipatu hiru konbinazio-motetako adibide batzuk:
- izen+aditz konbinazioak: gerrikoa estutu, adarretatik heldu, zubiak eraiki, loa galdu, atentzioa eman, adostasuna lortu, aktari erantsi, kalitateaz arduratu, egunkaria irakurri...
- izen+izen konbinazioak: arrain-sarda, mahai-jolas, elur-maluta, eguzki-haize, administrazio-kontseilu, energia-eraginkortasun, liburutegi-zerbitzu...
- izen+izenondo konbinazioak: ardi beltz, aita santu, zulo beltz, ardo ondu, haize fin, aldapa piko, lagun min, xedapen gehigarri, erregai fosil, nobela historiko, liburu interesgarri, partikula kargatu...
Horiek aztertuta, argi ikus daiteke erauzitako konbinazioak edo bigramak ez direla denak idiomatikotasun-maila berekoak: batzuk esapide idiomatikoak (edo lokuzioak) dira, beste batzuk kolokazioak, eta, azkenik, konbinazio libreak ere badaude. Egiten ari garen lanaren helburua da erauzitako konbinazioak idiomatikotasunaren arabera ordenatzeko teknikak garatzea. Izan ere, erabiltzailearentzat esapide idiomatikoak (gerrikoa estutu, adarretatik heldu, zubiak eraiki, aita santu) eta kolokazioak (atentzioa eman, arrain-sarda, lagun min) izaten dira interes handienekoak. izen+izen eta izen+izenondo konbinazioen kasuan, termino teknikoak ere erauzten dira, horietako batzuk idiomatikotasun-maila nabaria dutenak (eguzki-haize, zulo beltz).
Bada, lehen urrats honetan, bigramaren osagaien agerkidetzaren neurketa izan da idiomatikotasuna karakterizatzeko bidea. Egin dugun ikerketan, independenteki eskuz landutako erreferentzia bat erabili da ebaluaziorako, eta emaitza onenak t neurria (t-score) delakoak lortu ditu. Dena den, kontsulta-interfazean, erabiltzaileak, t neurriaz eta maiztasun absolutuaz gain, beste bost neurri estatistiko ditu aukeran, datuak bistaratzeko eta bigramak ordenatzeko.
Kontsulta-interfazeak eskaintzen dituen aukeren berri jakiteko, ikus webguneko laguntza.
Erabilera
Egia da jende gehienak ez duela ohiturarik corpusak erabiltzeko, aipatu ditugun hizkuntzaren espezialistak edo hizkuntza lan-tresnatzat duen jendea dira batez ere corpusen erabiltzaile. Jende gehienak hiztegiak erabiltzen ditu… Baina hiztegietan zerbait ez dagoenean, corpus hauek oso baliagarriak suerta dakizkieke; existitzen direla jakin behar, eta horiek erabiltzeko ohitura hartu behar...
Gainera, corpusek badituzte ezberdintasunak hiztegiekiko. Batetik, hiztegiek helburu preskriptibo edo arauemailea izaten dute; corpusek, aldiz, deskriptiboa. Honek esan nahi du corpusetan hizkuntza nola erabili izan den ikus daitekeela, eta ez soilik nola erabili beharko litzatekeen. Bestetik, hiztegiak egiteak kostu bat dauka eta mugatuak dira halabeharrez, hitz-kopuru zehatz bat eta adibide-kopuru mugatu bat dute soilik. Corpusetan, nahiko handiak izanik, hitz askoz gehiago ager daitezke eta erabilera-adibide gehiago.
Gainera, web-corpus hauek berezitasun batzuk dituzte beste corpusekiko: hain handiak izanik, aukera handiagoa dago beste corpusetan ez dauden hitzak aurkitzeko; hitz berriak ere aurki daitezke, weba etengabe eguneratzen baita; eta webeko erabilera informalaren (blogak, foroak...) berri ere ematen dute, ez soilik argitaletxe edo komunikabideak bezalako iturri editatuenak.
Edonola ere, nahiz eta jende askok zuzenean corpus hauek (edo beste edozein corpus) ez erabili, corpus hauei eta berauek biltzeko garatutako teknologiei esker etorkizunean garatuko diren hizkuntza-teknologiak (ahots-ezagutza, itzulpen automatikoa...) ziur erabiliko direla.
Web-corpusen Atariaren argitaratzea jauzi kualitatibo bat da, lehen aldia baita webetik automatikoki erauzitako corpusak publikoaren eskura jartzen direna, eta baita kuantitatiboa ere, corpusen tamainan aurrerakuntza esanguratsua baita. Koldo Mitxelenak zioen euskararen benetako misterioa ez dela jatorria, iraupena baizik. Misterio handiagoa da etorkizunean iraungo ote duen. Guk ez dugu horren erantzunik, baina iraungo badu zalantzarik gabe hizkuntza-teknologietan presente egon behar du euskarak. Web-corpusen Atariarekin norabide horretan beste pausu bat eman dugula sinetsita gaude Elhuyarren.
Bibliografia
- Leturia, Igor (2012). “Evaluating different methods for automatically collecting large general corpora for Basque from the web”. In Proceedings of the 24th International Conference on Computational Linguistics – CoLing 2012. Mumbai, India.
- San Vicente, Iñaki & Iker Manterola (2012). “PaCo2: A Fully Automated tool for gathering Parallel Corpora from the Web”. In Proceedings of the 8th international conference on Language Resources and Evaluation, LREC’12. 23-25 May, Istanbul, Turkia.
- Gurrutxaga, Antton & Iñaki Alegria (2011). “Automatic extraction of NV expressions in Basque: basic issues on cooccurrence techniques”.. In Proceedings of the Workshop on Multiword Expressions: from Parsing and Generation to the Real World (MWE 2011). ACL/HLT conference. Portland, AEB.
Interneteko komunikazioen segurtasuna I: Konfidentzialtasuna
- (Elhuyar aldizkariko 2013ko otsaileko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)
E-mailean, webean nabigatzen, nahiz Interneten beste zerbaitetan ari garela, informazioa bidaltzen dugu; abiapuntutik helburura iristeko informazio hori puntu askotatik pasatzen da: gure ordenagailu edo bestelako gailu digitaletik ateratzen da, bideragailuren batetik pasatuko da (enpresako sareko routerretik, etxeko edo tabernako wifikotik...), gero Internet-hornitzailearengana iritsiko da, eta handik oraindik beste nodo asko pasatuko ditu helmugara iritsi arte. Tarteko puntu horietako edozeinen kontrola duenak, dela enpresako informatikaria, tabernako jabea edo Interneteko hornitzailearekin elkar hartuta dagoen polizia -edo, wifiaren kasuan, baita wifidun ordenagailu bat hurbil duen edozeinek ere-, erraz atzeman dezake informazioa.
Sareko komunikazioen zati handi bat (webeko nabigazio gehiena, posta-jasotze eta -bidaltze asko) irekian doa, edozeinek atzemateko moduan. Baina Internetek baditu mekanismoak informazio sentibera -adibidez, pasahitzak, kreditu txartelen datuak edo posta elektroniko sekretuak- modu seguruan eta konfidentzialtasuna bermatuz garraiatzeko. Kriptografiaz baliatzen da horretarako, hau da, mezuak enkriptatuz (kodetuz edo zifratuz) jasotzailea ez den edozeinentzat ulertezin bihurtzen dira. Zehazki, kriptografia-mota berezi bat erabiltzen da Interneten: gako publiko bidezko kriptografia edo kriptografia asimetrikoa.
Kriptografia klasikoaren arazoak Interneten
Mezuak enkriptatzeko sistemak asko erabili izan dira historian zehar, batez ere errege, jeneral eta bestelako agintarien arteko komunikazio garrantzitsuetarako, baina baita maitaleen arteko amodio-mezu sekretuentzat ere. Hasieran metodo sinpleak zirenak gero eta konplexuago bihurtu dira, teknologiak horretarako bidea eman ahala eta aurreko sistemak hausteko teknikak aurkitu ahala. Historiako enkriptatze-metodo ezagun eta erabilienen artean, aipa genitzake Zesarren zifra, Vigènere-ren zifra eta errotore-makinak (Lorenz-ena eta Enigma, esaterako).
Funtsean, enkriptazio-sistema horiek denak printzipio berean oinarritzen dira: mezua funtzio baten bidez eraldatzen da, gako bat erabiliz, eta jasotzaileak gero alderantzizko funtzioa aplikatzen du gako berarekin jatorrizko mezua lortzeko. Adibiderik sinpleenean, funtzioa kenketa izan daiteke eta gakoa 1 zenbakia. Hala, "IBM" mezua "HAL" bihurtuko litzateke (Stanley Kubricken 2001: A Space Odyssey filmeko ordenagailu gaiztoa bezala) letra bakoitzari "-1" funtzioa aplikatuz aurreko letrarekin ordezten badugu, eta jasotzaileak, gakoa (1 zenbakia) jakinda mezu zifratuari "+1" funtzioa aplikatuta, "IBM" lortuko luke berriro. Honi kriptografia simetriko deitzen zaio, gako bera erabiltzen duelako enkriptatzeko eta desenkriptatzeko.
Sistema hauek gero eta hauskaitzago bihurtu dira, zifratze-funtzioa gero eta konplikatuago egin dutelako, garai bakoitzeko teknologiaren laguntzarekin. Gaur egun, kriptografia egiteko ordenagailuak erabiltzen dira; haiei esker, aipatutako funtzioak oso konplexuak eta gakoak oso luzeak izan daitezke, sistema erabat hautsezinak garatzeko modukoak. Hala, AEBko Gobernuak (beste askoren artean) erabiltzen duen AES (Advanced Encryption Standard) zifraketa, kriptografia simetrikoko sistema da.
Baina horrelako sistemek arazo bat dute Interneten jende guztiak nabigatzeko, online erosteko edo e-mail pribatuak bidaltzeko erabiltzeko orduan: bi aldeek ezagutu behar dute gakoa eta beste inork ez. Beraz, ezin da beti gako bera erabili, gako ezberdin bat behar da jasotzaile eta bidaltzaile bakoitzeko; eta gako hori beste inork jakin ez dezan, ezin da Internet bidez bidali, jakina, lehen esan bezala, atzeman egin baitaiteke. Horiek horrela, kasu batzuetan, gobernuenetan esaterako, mezulari bidez bidal dakioke gakoa komunikatu nahi den erakunde bakoitzari, baina Interneteko komunikazioentzat? Denda eta bezero bakoitzeko, webgune eta bisitari bakoitzeko, posta elektronikoaren bidaltzaile eta jasotzaile bakoitzeko, lehenago gako bat aurrez aurre partekatu behar izatea edo mezulari bidez bidali behar izatea ezinezkoa da praktikan: oso garestia litzateke eta ez segurua gainera (mezulariak ustelduta egon daitezke edo gakoa lapurtu egin diezagukete bidean).
Gako publiko bidezko kriptografia
Merkataritza elektronikoak eta Internet bidez informazio konprometitua bidaltzeak aurrera egin badu, 1970eko hamarkadan zifratze-sistema berri bat asmatu zelako izan da, ordura arteko sistemen aldean erabat ezberdin eta apurtzailea, intuizioaren guztiz aurkakoa eta aldi berean oso segurua: gako publiko bidezko kriptografia edo kriptografia asimetrikoa.
Gako publiko bidezko kriptografian, zifratzeko funtzio bat eta gako bat erabiltzen dira, baina funtzio horrek ez du alderantzizkorik (noranzko bakarreko funtzio deitzen zaie hauei); beraz, gakoa jakinda ere ezin da mezua deszifratu; deszifratzeko beste funtzio bat eta beste gako bat behar dira (horregatik deritzo kriptografia asimetrikoa). Orduan, norbaitek ahalbidetu nahi badie beste batzuei modu pribatuan berarekin komunikatzea (esaterako, saltzaileak erosleei, haiek kreditu-txartelaren datuak bidali ahal izateko), publiko egiten du enkriptatzeko gakoa. Edozeinek erabili ahal izango du gako publiko hori hari mezu zifratu bat bidaltzeko, baina gako publiko hori mundu guztiak ezagututa ere, mezua hark bakarrik deszifratu dezake, hark bakarrik ezagutzen baitu deszifratzeko gakoa (gako pribatua deritzona).
Sistema honek funtziona dezan, beharrezkoa da existitzea gako baten araberako funtzio bat alderantzizkorik ez duena, alderantzikatzea beste funtzio eta beste gako baten bidez lortzen dena, eta bigarren gakoa lehenengoa jakinda kalkulatu ezin daitekeena. Guztiz intuizioaren aurkakoa da horrelako funtzio eta gako batzuen existentzia, baina izan badaude, aritmetika modularrari, zenbaki lehenei eta faktorizazioari esker.
Ron Rivest, Adi Shamir eta Leonard Adleman MIT (Massachusetts Institute of Technology) entzutetsuko ikertzaileek aurkitu zituzten horrelako lehenengoak 1977an. Hauek dira zehazki (M zifratu beharreko mezua, ASCII edo UTF bezalako kodeketa baten bidez aurrez zenbaki bihurtua, eta C mezu zifratua direlarik):
- Zifratzeko gakoa: N eta e zenbakiak, p eta q zenbaki lehenen arabera kalkulatuak, honela:
- N = p x q
- 1 < e < (p - 1) x (q - 1) eta z.k.h. (e,(p - 1) x (q - 1)) = 1, non z.k.h. zatitzaile komunetako handiena den
- Zifratzeko funtzioa: C = Me (mod N), non mod modulu operazioa den
- Deszifratzeko gakoa: aipatutako p eta q zenbaki lehenak
- Deszifratzeko funtzioa: M = Cd (mod N), non d honela kalkultzen den:
- e x d (mod(p - 1) x (q - 1)) = 1
Esan dugu sistemak funtzionatzeko baldintzetako bat dela deszifratzeko gakoa ezin kal kulatu ahal izatea zifratzeko gakotik abiatuta. Baina, logikoa denez, biak erlazionatuta daude eta kalkulatu daiteke bigarrena lehenetik abiatuta: faktorizazioa egitea besterik ez da, hau da, zenbaki horren zatitzaileak ateratzea. Kontua da hori egin ahal izateko ez dagoela formula azkarrik; zenbaki guztiak probatuta besterik ezin da egin momentuz. Beraz, zenbaki horiek nahikoa handiak badira (eta ehunka digitukoak erabiltzen dira), gaur egungo teknologiarekin ezinezko problema bihurtzen da faktorizazioa, eta zifratze-sistema hautsezina da praktikan. RSA izena du metodoak, asmatzaileen omenez; nahiz eta geroago jakin zen metodo hori Clifford Cocks GCHQ (Government Communications Headquarters, edo Britainia Handiko Inteligentzia Zerbitzua) erakundeko langileak asmatu zuela 1973an, hau da, lau urte lehenago, baina erakunde horren informazio guztia sekretua zen eta 1997ra arte ez zen hori jakinarazi.
RSAren ondoren asmatu dira gako publiko bidezko beste kriptografia-sistema batzuk, hala nola DSA edo ElGamal.
Konfidentzialtasuna Interneten
Interneteko komunikazioak OSI ereduaren arabera mailatan antolatuta daude, aurreko zenbakian kontatzen genizuenez. Eta komunikazio horien konfidentzialtasuna bermatzeko, garraio-mailarako TLS protokoloa (Transport Layer Security) definitu da (lehen SSL edo Secure Sockets Layer gisa ezagutzen zena). Honetan, bidaltzaileak eta jasotzaileak gako publiko bidezko kriptografia erabiltzen dute (RSA normalean, baina besteren bat izan daiteke, biek inplementatuta badute) beste gako bat adosteko (ausazkoa), eta gero benetako komunikazioa gako horrekin eta kriptografia simetriko bidezko metodo batekin egiten da (AESekin, adibidez), konputazionalki ez delako hain garestia eta segurtasun parekoa eskaintzen duelako.
Interneteko aplikazio-mailako protokolo bakoitzerako (weberako HTTP, postarako SMTP eta IMAP, fitxategiak igotzeko FTP, urruneko ordenagailuetan saioak irekitzeko Telnet...), haien bertsio seguruak sortu dira (HTTPS, SMTPS, IMAPS, SFTP eta SSH hurrenez hurren). Horietako batzuk, adibidez HTTPS, SMTPS edo IMAPS, jatorrizko protokoloari garraio-mailan TLS gehitzean eta protokolo berriari beste portu bat esleitzean besterik ez dautza (orain, STARTTLS protokolo berriaren bidez, aplikazioek portu bera erabili dezakete konexio seguruentzat, alde biek inplementatuta duten kasuetan). Beste batzuk, SFTP eta SSH kasu, funtzio berdina dute baina protokolo ezberdinak dira, gako publiko bidezko enkriptazioa erabiltzen dutenak. Protokolo horiek erabiltzen direnean, gure komunikazioen konfidentzialtasuna bermatutzat jo dezakegu. Eta nola jakin protokolo horiek erabiltzen ari garen?
Webean nabigatzen ari garenean, helbidean giltzarrapo bat eta beronen hasieran "https://" ikusten badugu, esan nahi du HTTPS protokoloa erabiltzen ari garela eta, beraz, komunikazioa segurua dela. Merkataritza elektronikoko guneetan ordaintzean, web bidezko posta bezalako zerbitzuetan eta beste toki askotan normalean erabiltzen da.
Posta-programen kasuan, gure kontuaren ezarpenetan begiratu beharko dugu ea zein protokolo onartzen dituen posta bidali eta jasotzeko. Edonola ere, nahiz eta posta programak SMTPS eta IMAPS protokoloak erabili, esan nahi du gu eta gure posta-hornitzailearen arteko komunikazioa inork ezingo duela irakurri, baina ez bidalketaren ondorengo faseetan beste inork ez duenik irakurriko. Hori ekiditea nahi badugu, gure posta-programan PGP programa (Pretty Good Privacy) integratu dezakegu (Phil Zimmermannek 1991n sortua eta oso ezagun eta erabilia bihurtu dena) edo GPG (GNU Privacy Guard) haren bertsio librea; biek azken hartzailearen gako publikoa erabiliz zifratzen dute informazioa, eta, beraz, hark baino ezingo du irakurri.
Urruneko ordenagailuetan saioak irekitzeko edo fitxategiak igotzeko, SSH edo SFTP protokoloak erabiltzen direla ziurtatu beharko dugu konfidentzialtasuna mantendu nahi badugu. Bestelako programetan (VNC, VPN edo Sare Pribatu Birtualak...), ezarpenetan begiratu beharko dugu ea enkriptaziodun protokoloak edo enkriptazio-sistemak erabiltzen dituzten. Gauza hauek kontuan izanez gero, gure informazio pribatuak hala izaten jarraituko du Internet bidez bidalita ere.
Segurtasunaren, konfidentzialtasunaren eta kriptografiaren gaia interesatzen bazaizu, informazio gehiago aurkituko duzu Elhuyar Fundazioak euskaraz argitaratu duen Simon Singh-en Kodeen liburua interesgarrian.
SPDY, weba azkartzeko protokoloa
- (Elhuyar aldizkariko 2013ko urtarrileko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)
SPDY ez dira ezeren siglak, abiadura adierazteko hitz-joko bat baizik: lehen bi letrak euren ingelesezko izenarekin pronuntziatuz eta azken biak silaba normal gisa esanez, speedy hitza ateratzen zaigu, “arina” edo “azkarra” esan nahi duena hain zuzen. Gogoratzen Speedy Gonzales sagua?
SPDYk asko azkartzen omen ditu webeko orri, dokumentu eta bestelako fitxategien transferentziak. Googlek laborategian egindako proben arabera, errendimendua % 64raino hobe daiteke. Eta mugikorretan egindako lehen probetan, orriak % 23 azkarrago kargatzea lortu dutela diote. Baina nola lortzen da hobekuntza hori?
Webeko komunikazioen oinarriak
OSI ereduaren 7 mailak
Irudia: Elhuyar aldizkaria
Azkartzea nola erdiesten den ulertzeko, beharrezkoa da aurrez HTTP protokoloak eta webak berak nola funtzionatzen duen ezagutzea. Webeko komunikazioa, datuen edozein telekomunikazio-mota bezala, zazpi mailatan antolatuta dago OSI ereduaren arabera (Open Systems Interconnection reference model, ISOren estandar bat), non maila bakoitzean sistema edo protokolo bat erabiltzen den.
Internet elkarri konektatutako milioika sarek osatutako sare erraldoi deszentralizatua da. Komunikazioaren mailarik oinarrizkoenean, hau da, maila fisikoan, teknologia oso ezberdinak erabiltzen dira bitak (0ak eta 1ak) transmititzeko (tentsio ezberdinak kable elektrikoan, edo argi-intentsitate ezberdinak zuntz optikoan, edo frekuentzia-modulazioa irrati uhinetan...). Hurrengo mailan, lotura-mailan, transmisioan gertatutako errore eta interferentziak detektatu eta zuzentzen dira, kontrolerako bit erredundanteez baliatuz, eta hemen erabiltzen den metodo zehatza maila fisikoaren araberakoa da. Bien konbinazioekin osatzen dira oinarrizko komunikazio-protokoloak, hala nola Bluetooth, WiFi eta abar, eta Internetek horietako asko erabiltzen ditu sarearen hainbat puntutan. Baina goragoko maila logikoetan, Internetek protokolo berberak erabiltzen ditu beti, praktikan sare bakar bat bezala funtzionatuz.
Goragoko maila, sare-maila, datuak paketetan antolatzeaz eta helbideraketaz arduratzen da, eta Interneten IP protokoloa (Internet Protocol) erabiltzen da horretarako (Internetera konektatutako gailuen IP helbideak, zeintzuez aurreko batean hitz egin genizuen, honen parte dira). Ondorengo maila garraio-maila da, eta konexioen ezarpenaz eta mezuen fidagarritasunaz arduratzen da, besteren artean; Internetek TCP protokoloa (Transmission Control Protocol) darabil maila honetan.
Gero datoz saio-maila, autentikazioaz eta horrelakoez arduratzen dena, eta aurkezpen-maila, datuak konprimatu edota zifratzeaz arduratzen dena. Baina Interneten azken bi horiek azken mailarekin, aplikazio-mailarekin, nahasita ageri dira eta haren araberakoak dira. Interneten dauden aplikazio-mailako zerbitzuen adibide dira posta elektronikoa, weba, FTP zerbitzua, txata... Eta weberako HTTP da erabiltzen den protokoloa.
OSI ereduaren inplementazioa Interneten
Irudia: Elhuyar aldizkaria
OSI ereduaren inplementazioa Interneten
Irudia: http://www.cybernet-security.com
HTTP protokoloan bezero batek (gure ordenagailuko web-nabigatzaileak, adibidez) zerbitzari batekin (webguneak ostatatzen dituen web-zerbitzari bat, normalean) konexio bat ezartzen du eta web orri baten eskaera bat bidaltzen dio (bertan hainbat informazio doalarik; adibidez, zein orri nahi den, edo bezeroaren sistema eragilea eta nabigatzailea, edo hizkuntza lehenetsia). Zerbitzariak eskatutako orria itzuliz edo errore-kode batez (404 famatua, esaterako) erantzuten du, eta konexioa amaitzen da.
HTTP konexioa
SPDYren hobekuntzak
HTTP protokoloa egokia da weba sortu zen garaiko webaren ezaugarrientzat, hau da, orri estatikoak besterik ez zituen webarentzat. Baina egungo weba oso bestelakoa da, eta honentzat HTTP protokoloa ez da batere eraginkorra.
Adibidez, gaur egun webgune batean gaudela gure hobespenak ezar ditzakegu, eta horiek gure ordenagailuko cookieetan gordetzen dira; ezarpen horiek webgune horretako orri berri bat eskatzen dugun bakoitzean birbidali behar izaten dira; eta hori informazio asko izan daiteke, alferrik berriz bidaltzen ari garena, komunikazioa mantsotuz. Bestalde, orri berri bat behar dugun bakoitzean konexioa berriz ezarri beharrak ere geldotzen du nabigazioa. Azkenik, orri batean gaudela eguneraketak ikusteko (adibidez, web bidez posta elektronikoa ikusten ari garela mezu berririk dagoen jakiteko), modu bakarra nabigatzaileak maiztasun jakin batekin zerbitzariari galdetzea da, ez dago modurik zerbitzariak berak bezeroari abisatzeko zerbait berria dagoenean.
SPDY protokoloak HTTPren ez-eraginkortasun hauek konpondu nahi ditu, baina HTTP protokoloa bera ordeztu gabe. Saio- eta aplikazio-mailetan inplementatzen den protokoloa da, eta bezeroak eta zerbitzariak, biek, inplementatuta dituzten kasuan jartzen da martxan; bestela, komunikazioa HTTP normalarekin gertatuko da.
SPDYk zerbitzariarekiko konexio bakarra erabiltzen du egiten zaizkion eskaera guztientzat; hau da, bezeroak zerbitzari berari beste orri bat eskatu behar dionean ez dago konexioa berriz ezarri beharrik, eta horrela abiadura azkartu egiten da. Gainera, konexio hori erabilita zerbitzariak ere bidal diezaioke informazioa bezeroari honek eskatu gabe, horrela orrien eguneraketak behar diren unean bertan eta behar direnean soilik egitea ahalbidetuz. Bestalde, bezeroak aurreko eskaeretan bidali duen informazioaren arrastoa gordetzen du zerbitzariak (sistema eragilea, nabigatzailea, preferentziak, hizkuntza...), eta ez dago dena aldiro bidali beharrik; ezberdina edo berria dena soilik bidaltzen da, eta gainera konprimatuta. Azkenik, enkriptazioa eta konpresioa une oro erabiltzen dira.
Historia eta zabalkundea
Googlek sortu zuen SPDY protokoloa, 2009an. 2011n, Chrome bere nabigatzailean inplementatu zuen, eta bere bilaketa eta Gmail zerbitzuetan. Beraz, nabigatzaile horretatik zerbitzu horietara sartzean SPDYren abantailez baliatzen zen erabiltzailea. Gero Googlek bere inplementazio horren kodea ireki zuen, eta geroztik Firefox eta Opera nabigatzaileetan ere inplementatu dute, gehiago bidean direla.
Zerbitzarien softwareari dagokionez, Apache (munduko web-zerbitzari erabiliena), Nginx eta Jetty web-zerbitzarien azken bertsioek jada badute SPDY protokoloa. Twitter eta WordPressek ere eskaintzen dute SPDY euskarria, eta Facebookek iragarri du laster jartzeko asmoa duela.
Agi denez, SPDY hedatze handia izaten ari da. Eta are handiagoa izango dela dirudi, orain lantzen ari diren HTTP protokoloaren hurrengo bertsioak, HTTP 2.0 izenekoak, SPDY izango baitu oinarritzat. Beraz, laster web osoa azkarragoa izango da SPDYri esker. Ándele, ándele! Arriba, arriba! Epa, epa! Yeehaw!
Basauri Komik jaio da
Basaurin hainbat urtetan zehar komikiaren inguruko ekitaldiak bultzatzen ibili ondoren, ofizialki jaio Basauri Komik ekimena. Bere jarduna honelako ekintzen inguruan zentratu nahi du:
- Ganorabako komiki-lehiaketa
- Bigarren eskuko, okasiozko, bildumagai eta autoeditatuen azoka bat
- Erakusketak
- Hitzaldiak
- Irakurle klubak
Eta 2013ko udaberri honetarako programa zehatz hau aurkeztu dute:
- Ganorakako 2013 lehiaketa. Martxoaren 31ra arte dago irekita epea.
- Rober Garayren Del comic al arte bruto hitzaldia, Infame & Co.-k moderatua. Arizko dorretxean, martxoaren 6an 19:00tan.
- Bigarren eskuko, okasiozko, bildumagai eta autoeditatuen Basauri Komik azoka. Arizko dorretxean, apirilaren 28an 11:00etatik 14:30etara arte eta 17:00etatik 20:00etara arte.
- Ganorabako lehiaketaren irabazleen erakusketa. Pozokoetxe Kultur Etxean, maiatzaren 2tik 30era.
- Astiberriko editore Fernando Tarancon-en Astiberri, pasado y futuro de la editorial hitzaldia, Infame & Co.-k moderatua. Arizko dorretxean, maiatzaren 8an 19:00tan.
Ongi etorria bedi ekimen berri hau! Ea euskarazko ekitaldiak ere antolatzen dituzten!
Xabiroi 28 kalean da!
Ikastolen Elkarteak Xabiroi komiki-aldizkariaren 28. zenbakia, 2013ko otsailari dagokiona, atera du, ondoko edukiekin:
- Guillermo Gonzalezen azala
- Nik neuk egiten dudan Albisteen txokoa
- Adur Larrearen Xabiroienea umorezko zinta
- Sanviren Auzomorro umorezko orri bikoitza
- Haur besoetakoa sailaren 6 orri, Unai Iturriagaren gidoia eta Sanviren irudiekin
- Ikastolen Elkarteko "Re-Creating History" lehiaketaren istorio irabazlea, Garazi Balbasen Charlesen egunkaria, Alex Orbek 5 orriko komiki egina
- Asiskoren Hor Konpost banda
- Manu Ortegaren Haizea zinta
- Exprairen Pertza ustelaren gogoeta antzuak banda
- KomikITAUN elkarrizketen orri bikoitza: Kini eta Santi Orue TMEOren 25 urteez
- ZaldiEroaren Arranotxuren beste bi orri
- Iñaki G. Holgadoren irudiak eta Harkaitz Canoren gidoia duen Museo bilduma sailaren 6 orri
- Patxi Gallegoren komikirako itzulera! Lau orriko Basque Culinary umorezko istorioa
- Egoitz Lasaren gidoia eta Loperen irudiak dituen Zonbiñe umorezko sail berriaren 3 orri
Irudia: Patxi Gallego / Lope
On egin!
Jantzita eramateko informatika
- (Elhuyar aldizkariko 2012ko abenduko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)
Wearable computing terminoak, jantzita edo soinean eramateko informatika esan nahi du. Ordenagailu berriok arropan bertan edo janzteko osagarri gisa (betaurrekoak, erlojuak...) eramango ditugu. Honezkero hasi dira erakusten horrelakoen prototipo eta iragarkiak, eta gailuren bat edo beste jada merkatuan ere badago.
Betaurreko adimendunak
Beharbada ezagunena Googleren Project Glass da. Oraindik garapenean dauden betaurreko hauek mundu teknologikoaren arreta erakarri zuten apirilean kontzeptu gisa aurkeztu zituztenean. Egin nahi duten gailuak kristalean une bakoitzean baliagarri izan dakigukeen informazioa proiektatuko luke (gure agenda, joan behar dugun tokira iristeko argibideak, egingo duen eguraldia eta abar), horretarako hainbat informazio-iturri erabilita: adibidez, gure posizioa, orientazioa, Interneteko konexioa edo irudien ezagutza. Horrez gain, ahots bidez emandako aginduak ezagutu eta horien araberako ekintzak gauzatzeko ahalmena izango luke: e-mailak bidali, Interneten informazioa bilatu edo erosketak egin...
Kontzeptu horren bideoa ikusgarria da benetan, baina bertan erakusten dena ez da zientzia-fikzioa. Izan ere, edozein smartphonek egin ditzake gauza horiek. Denek dute errealitate areagotua erakusteko ahalmena (kamerak hartzen duen irudiari informazioa gehitzea da hau, duela hiru urte kontatzen genizuenez), GPSa, iparrorratza eta Interneterako konexioa baitute. Eta aurtengo urtarrileko zenbakian esaten genizuen bezala, ahots-ezagutza ere badute. Ziur aski erronka handiena teknologia hori guztia betaurreko batzuetan sartzea izango da, bateria batez ere; Ruperrenak txiki utziko dituzten pastadun betaurrekoak ikusiko dira berriz ere!
Googlek jada badu bere betaurrekoen prototipo bat, eta urte bat edo bitan kaleratuko dituztela esaten da. Eta Microsoftek ere berriki eskuratu du errealitate areagotudun betaurreko batzuen patentea. Bestalde, egun erabilera eta jarduera konkretuetarako badaude antzerako gailuak, behintzat horietako gauza batzuk egiten dituztenak. Adibidez, snowboardingaren profesionalek erabiltzen dituzte horrelako betaurreko batzuk, ahots-ezagutzarik ez dutenak baina beste gauza asko bai: posizioa, abiadura, jauzien altuera eta horrelakoak neurtzen dituzte, eta betaurrekoetan proiektatu eta beste gailu batzuetara bidal ditzakete.
Erlojuak, botoiak...
Erlojuak ere ordenagailu txikiak izateko bidean doaz. Aspaldi erabiltzen dira hainbat kirol-jardueratan erlojuak distantzia, abiadura eta bestelako estatistikak neurtu, gorde eta ordenagailura pasatzeko gaitasuna dutenak. Baina gero eta sentsore, funtzio eta ahalmen gehiago dituzte, eta smartwatch izena eman zaie, hau da, erloju adimendunak. Oraintsu erabilera ohikorako Android sistema eragiledun erlojuak ere atera dira, Sony Smartwatch edo WIMM One adibidez. Hauek hainbat aplikazio instalatuta dakartzate eta berriak instalatzen ahal zaizkie. Bestalde, berriki Googlek errealitate areagotudun erloju baten ideia patentatu du, zeinari kristala altxatzen zaion eta bertan ikusten dugunaren inguruko informazio gehigarria proiektatzen duen.
Botoi baten antzeko tamaina duten eta botoi baten gisan arropan erantsita (klip baten bidez edo) eraman daitezkeen gailu gero eta ahaltsuagoak ere badaude. Appleren iPod Shuffle musika-entzungailu ezaguna da horien aitzindari. Eta laster aterako dute Memoto, paparrean jartzen den gailu oso txiki bat, automatikoki 30 segundotik behin argazki bat atera eta geolokalizatuta gure ordenagailura edo web zerbitzu batera bidaltzen dituena; lifelogging deritzona egiteko balio du, hau da, gure bizitza osoaren erregistroa gordetzen joateko eta gero egun edo toki jakin baten egin genuena kontsultatu ahal izateko.
Soineko interfazeak
Bestalde, beren-beregi ordenagailuak izan gabe, haiekiko interfaze izateko funtzioa duten soinean eramateko gailuak ere ari dira ateratzen. Halakoak erabilita, beti soinean ditugunez, gailu mugikor bat (smartphone , tableta edo dena delakoa) erabil dezakegu sakelatik edo poltsatik atera beharrik gabe. Adibidez, badaude eskularru batzuk hatz txikian mikrofonoa eta erpuruan bozgorailua dutenak, eta Bluetooth bidez mugikorrarekin konektatzen direnak; hala, telefonoz hitz egitea adierazteko erabiltzen den zeinua imitatuz benetan hitz egingo genuke. Edo gailuak gogoarekin maneiatu ahal izateko diadema ere ateratzekotan dira.
Informatika gure eguneroko bizitzan sartzen joan zaigu etengabe azken urteotan; laster, gure janzkera eta gorputzen parte izango da. Agian, modaren munduan ere gailu informatikoek markatuko dituzte tendentziak, eta Google eta Appleren azken nobedadeak izango dira irrika bizienez itxaroten direnak, ez teknologiaren munduan soilik, baita Cibeles pasarelan ere!
"Arima lapurrak", euskarazko komiki berri bat
Mikel Begoñaren Komikeri blogean (komikeri.wordpress.com) izan nuen 2012ko ondarrean argitaratutako euskarazko komiki honen berri.
Arima lapurrak du izenburua Pablo Herranzen gidoia eta José Luis Povoren irudiak dituen komiki honek, NetCom2 Kataluniako argitaletxeak gaztelaniaz eta katalanez gain euskaraz ere atera duena. Miquel Mena pertsonaiaren abenturetan lehen albuma da.
Hala ere, eta komiki bat euskaraz ateratzea eskertzekoa bada ere, esan beharra dago itzulpena oso-oso txarra dela. Ez naiz ari diskurtsoaz, komikietan erabili beharreko hizkuntzaz, Euskaltzaindiaren azken arau gutxi batzuen hausteaz... ez, euskara benetan negargarria da, euskararen zuzentasun oinarrizkoena betetzen ez duten esaldiz beteta dago komiki guztia. Pena bat. Hurrengoan (espero dezagun hurrengorik egotea) konpondu beharreko akatsa.
Abian dauden komiki-lehiaketak
Portugaleteko Udalak Portugalete Uri Urena Komiki Lehiaketaren XXVII. edizioa antolatu du. Bi kategoria daude, komikia eta komiki-banda, sari apartekin: komiki kategorian, 2000, 1450 eta 900 euro lehen hiru sailkatuentzat, 325 euroko akzesitak euskarazko eta Portugaleteko egile onenei eta 250 euroko akzesita 16 urtetik beherakoen lan onenari; komiki-banda kategorian, 325 euro irabazleari eta 110 euroko akzesita 18 urte baino gutxiagoen arteko irabazlearentzat; eta gainera 325 euro daude gidoirik onenarentzat. Aurkezteko epea martxoaren 8an amaitzen da. Arauak hemen irakur ditzakezue.
Horrez gain, abian da urtero legez Basauriko Kultur Etxeak antolatutako Ganorabako 2013 komiki-lehiaketa, sari ugari eta onekin hau ere: 900, 450 eta 300 euro hurrenez hurren lehen hiru sarituentzat eta 300 euroko akzesit bana euskarazko lanik onenarentzat eta Basauriko lanik onenarentzat. Lanak martxoaren 31 baino lehenago bidali behar dira. Eta arauak, esteka honetan: http://www.euskalnet.net/pozokoetxe/oinarri.htm.
Animatu eta bidali zuen lanak lehenbailehen!
Markok "Les Godillots" saileko 2. albuma atera du
Duela urte eta erdi kontatu genizuen Xabiroi aldizkariko kolaboratzaile Marko Armspachek album sail berri bat hasi zuela Frantziako merkatuan, Les Godillots, Bamboo argitaletxearekin eta Olier gidoilariarekin.
Lehen album hark Le Plateau du Croquemitaine zuen izenburua. Orain bigarrena atera da eta L'oreille coupée deitzen da. Marko promozio betean dago orain, harat-honat sinatzen eta dedikatzen. Zorte on albumarekin, Marko!
Digitalizazioaren ajeak
- (Elhuyar aldizkariko 2012ko azaroko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)
Digitalizazioak ekarri duen aldaketa ia oharkabean pasatu zaigu, gutxika gertatu delako, baina azken hogei urteetan edukia erosi, gorde eta kontsumitzeko modua erabat aldatu da. Lehen gure dokumentuak, argazkiak, audioak eta bideoak paperean edo zintetan izaten genituen, baina gaur egun digitalizatuta sortu eta gordetzen ditugu. Eta musika, filmak eta liburuak ere gero eta gehiago formatu digitalean erosi eta kontsumitzen ditugu.
Abantaila asko dituzte eduki digitalek, zalantzarik ez. Tokirik apenas okupatu eta oso gutxi pisatzen duen gailu batean asko sartzen da (disko gogor eramangarri batean gure eduki guztia eraman daiteke), online zuzenean kontsumitu dezakegu, erabilera edo denborarekin ez doa degradatzen, kopiak kalitate-galerarik gabe egitea oso erraza da... Baina guztia ez da hain polita ere.
Erositako edukien gaineko eskubide murrizketak
Irailaren hasieran komunikabide ugarik eman zuten albistea: Bruce Willis aktorea Apple enpresa auzitara eramatea pentsatzen ari zen, urteetan zehar iTunes-en erositako musika bilduma bere hiru alabei oinordetzan ezin zielako utzi. Izan ere, Appleren edukia erosten denean lizentziak argi dio erosten duen pertsonak soilik kontsumitzeko dela. Azkenean, berria faltsua suertatu zen; baina azpiko arazoa benetakoa da.
Ez da Apple soilik horrelako praktikak aurrera eramaten dituena. Eduki digitalak online erosi eta kontsumitzea ahalbidetzen duten enpresa eta webgune ia guztiek egiten dute: Amazonek eta e-bookak saltzen dituzten argitaletxeek, film eta serieak ikusteko webguneek... Abesti, liburu edo film bat erostean, gure gailura jaisten dugu fitxategia, baina DRM edo kopien aurkako babesarekin egoten da, gailu horretan (edo gureak direla egiaztatu dugun gutxi batzuetan) soilik funtzionatzen du eta ezin diogu beste norbaiti utzi.
Eszenatoki digital berrian, enpresa handiek beren baldintzak inposatu nahi dizkigute, baina eskubide-murrizketa onartezinak dira. Paperezko liburuekin edo audio- edo bideo-zintekin askatasuna dugu gauza ugari egiteko: lagunei utzi, saldu, liburutegi batean alokatu... Baina eduki digitalekin, ez ditugu erosten eta jabetza eta eskubideak eskuratzen; softwarearen erabilera-lizentzien antzera, entzuteko, ikusteko edo irakurtzeko lizentzia pertsonal bat da ematen digutena. Oso panorama kezkagarria da, (ikusi horren inguruan 2009ko irailean eta 2010eko martxoan idatzitakoak).
Bada dioenik kezka horrek ez duela zentzurik izango etorkizun hurbilean. Izan ere, gero eta arrakasta handiagoa dute musika eta filmak tarifa lauarekin online kontsumitzea ahalbidetzen duten zerbitzuak, eta ziurrenik liburuentzat ere sortuko dira antzekoak luze gabe. Halakoetan, harpidetza izanik, nahi adina eduki kontsumi dezakegu katalogo oso zabal batetik. Beraz, nahi dugun guztia nahi dugunean eskura badugu, zer axola du edukia gurea izan edo ez?
Beno, ez dakit hori etorkizuneko eredua izango den, baina nik desabantaila handiak ikusten dizkiot behintzat: edukirako atzipena harpidetza mantentzen dugun bitartean soilik daukagu, haien prezio eta katalogoetara mugatuta gaude, konexioa behar da edukiok kontsumitzeko, tarifa pertsona bakoitzak ordaindu behar du, ezin duzu edukia elkarbanatu lagunekin (horra harpidetuta ez badaude)... Familia bateko kide guztiak egongo dira tarifa lauak ordaintzen Amazonen, Spotifyn, serieentzako webguneren batean eta euskarazko musikarentzako zerbitzu batean? Jabego pribatuak izan ditzakeen gauza oker guztiekin ere, nahiago dut eduki kulturalen jabegoa eta kontrola guk geuk edukitzea eta ez enpresa handiek (honen inguruko nire iritzia eta jarrera zabalago azaldu nituen iazko martxoko zenbakian).
Formatu eta euskarrien zaharkitzea
Digitalizazioaren beste arazo handi bat ederki azaldu zuen Cosima Dannoritzer Comprar, tirar, comprar filmaren egileak ekaineko zenbakian. Gauzak formatu digitalean eta euskarri elektroniko batean ditugulako betiko seguru gordeta ditugulakoan gaude eta ez da horrela, euskarri eta formatu horiek zaharkituta gelditzen direlako.
Euskarriei dagokienez, disketetan gordeta dituzun dokumentuak agian jada ezingo dituzu errekuperatu ez baduzu diskete-irakurgailurik, eta etorkizunean berdin gerta daiteke CD edo DVDtan gordeta dituzun gauzekin edo, zergatik ez, kanpoko disko gogor edo pendrivetan dituzunekin, USB konexioa desagertzen bada. Hori gerta ez dakigun, euskarri bat zaharkituta gelditzen eta beste berri bat indarra hartzen ari dela ikusten dugun bakoitzean, dugun eduki guztia euskarri berrira pasatzea da soluzioa, baina ez da erraza izaten konturatzea eta gainera lan handia ekar dezake.
Formatuekin, kontua are okerragoa izan daiteke. Denoi gertatu izan zaigu dokumentuak testu-prozesagailu baten bertsio batean idatzita edukitzea, eta handik urte batzuetara testu-prozesagailu horren bertsio berriagoak hori ulertzeko gai ez izatea, ezta? Ba pentsa hori gertatzen bazaigu gure argazki, musika, bideo eta liburuekin, formatua (AVI, EPUB...) edo konpresiorako codec-a (MP3, DivX, JPEG...) etorkizunean zaharkituta gelditu eta softwarea horiek irekitzeko gai ez delako! Kasu honetan, konponbidea agian errazago aurkitu ahal izango dugu software librearen munduan. Bertan oso errotuta dago gauzak zaharkituta ez gelditzearen kultura: sistema eragileak eta programek ez dute hardware-eskakizun handiegirik, eta, makina zaharretan ere ongi ibili ahal izateko, atzeranzko konpatibilitatea mantentzen saiatzen dira, eta formatu ahalik eta gehien maneiatzeko gai den softwarea egiten da. Ikusi izan dut ofimatikako software libre bat gai dena formatu propietario baten bertsio zaharragoak irekitzeko formatu propietario horren sortzailearen ofimatika paketeak baino! Software librea erabiliz, batzuetan posible izango dugu formatu zaharkituak irekitzea eta berriagoetara bihurtzea, baina lan ikaragarria izan daiteke hau ere.
Lortu beharko dugu digitalizazioak eskubide-murrizketarik ez ekartzea, eta asmatu beharko dugu modua euskarri eta formatuen zaharkitzearen kausaz edukiak ez galtzeko (formatu estandarrak atzeranzko konpatibilitatearekin gailentzea bultzatuz, adibidez). Bestela, bidaia honetarako ez genuen horrelako alportxen beharrik...