Edukira salto egin | Salto egin nabigazioara

Tresna pertsonalak

Eibarko peoria, San Blasa baino hobia
Hemen zaude: Hasiera / Blogak / e-gorblog

e-gorren blog pertsonala (komikiak, informatika eta beste)

Informatikako ikasketez

e-gor 2013/07/17 18:20
Mondragon Unibertsitatean informatika lerroa bultzatzeko sortu duten blogerako idatzi nuen artikulua
Informatikako ikasketez

Irudia: Elhuyar Fundazioa

Blog honen jarraitzaileok jakingo duzuenez, informatikaria naiz ofizioz, afizioz, bizioz eta definizioz. Eta ikasketez ere bai, nire herrian egin bainituen, Mondragon Unibertsitatean, informatika-ingeniari ikasketak.

Ikasketa horietara jendea animatu nahian, Estudiar informática bloga sortu dute Mondragon Unibertsitatekoek, non, besteren artean, hainbat ikasle ohik beraien laneko esperientziak kontatzen dituzten, informatika-ikasketak izan ditzaketen lan-irteerak erakutsi asmoz. Niri ere eskatu zidaten eta egin nuen, baina nire laneko esperientziaz gain, informatika hautatzeko izan nituen arrazoiak eta informatikari eta informatika ikasteari buruzko hausnarketatxo bat ere gehitu nituen. Interesgarria izan daitekeelakoan, hona ekartzen dut. Hemen behean duzue.

Ingeniari informatikaria hizkuntza-teknologien ikerketan

Nire izena Igor Leturia Azkarate da eta 42 urteko arrasatearra naiz. Egin ditudan ikasketen artean lehenengoa eta, esango nuke, garrantzitsuena, Arrasateko Eskola Politeknikoan (gaur egun Mondragon Unibertsitateko Goi Eskola Politeknikoa) egindako informatikako ingeniaritza izan da. Lerro hauen bitartez azaldu nahiko nuke lan munduan zein gauza egin ditudan eta egiten ari naizen. Bukaeran, erreflexio txiki batzuk: zergatik egin nituen ikasketa horiek?

Nire lan esperientzia

Eskola Politeknikoan ingeniaritza informatikoko ikasketak egin ondoren, Goier programaren bidez Toulousen informatikako lizentziaturaren azken urtea egin nuen, eta gero elektronikako ingeniaritza sortu berri zen Mondragon Unibertsitatean. Baina nire burua informatikaritzat dut eta horretan egin izan dut beti lan. Informatikako ikasketek irtenbide asko izan ditzakete. Ordenagailu sareen administrazioa, webguneak eta web aplikazioak egitea, bideojokoak egitea, programak eta aplikazioak egitea, ikerketa (robotika, adimen artifiziala eta horrelako arloetan)... Ni horietako askotatik pasatu naiz.

Mondragon Unibertsitatean Ikasketak egiten nituen bitartean egun erdiz Ikerlanen aritu nintzen lanean. Lehenengo etapan 3 urtez Elektronika sailean, besteren artean sare neuronalekin ikertzen, eta bigarren etapan 2 urtez Adimen Artifiziala sailean, makinen autodiagnostikorako programak idazten.

Ikasketak amaitu ondoren, beste bi lagunekin batera SOME Software Innovation enpresa sortu genuen, enpresentzako neurrirako software garapena egiten duena. Zuzendari Teknikoa izan nintzen han. Hiru urtez aritu nintzen bertan utzi nuen arte. Hori egiteko arrazoia nire euskararengatiko zaletasuna izan zen. Euskararen normalizazioan jarduten duen EMUN Kooperatiba Elkartea sortu berria zen eta beraien informatika kontuak eramango zituen norbait behar zuten. Bost urtez izan nintzen bertako IKT Zuzendari, informatikarekin zerikusia zuen guztiaz arduratuz: sistemen administrazioa (sarea, ordenagailuak...), aplikazioak programatzea, webgunea egitea, intraneta...

Elhuyar
Irudia: Elhuyar Fundazioa

Gaur egungo lana, Elhuyar Fundazioan hizkuntza-teknologietan ikertzen. Geroztik eta gaur arte Usurbilen dagoen Elhuyar Fundazioan dihardut lanean. Bere jarduera ezagunenak hiztegigintza eta zientziaren dibulgazioa (Teknopolis telebistako programa, Norteko Ferrokarrilla irratsaioa, Zientzia.net webgunea...) badira ere, hizkuntza-teknologien sail bat ere badu eta bertan egiten dut lan nik.

Zer dira hizkuntza-teknologiak?

Hizkuntzen ordenagailu bidezko tratamendua da, makinek hizkuntzak “ulertzea” azken finean. Hizkuntza-teknologiak adimen artifizialaren azpiarlo bat dira, robot edo makina adimendunak egiteko beharrezkoa baitira. Oso erabiliak bihurtzen ari dira (Google-ren itzulpen automatikoa, telefono mugikorretako ahots-ezagutza...) eta etorkizunean garrantzi are handiagoa izango dute, mundu geroz eta globalizatuago, gailuz beteago eta interkonektatuago baterantz baikoaz. Horregatik, Elhuyar Fundazioak apustu egiten du euskarak ere bere tokia izan dezan teknologia hauetan. Gure sailean hizkuntza-teknologien prozesu osoa egiten dugu, ikerketatik hasi, garapenarekin jarraitu eta komertzializazioraino. Batez ere euskararentzat egiten dugu lan baina ez soilik, teknologia batzuk hizkuntzartekoak baitira. Hizkuntza-teknologien barruan Elhuyarko gure sailean lantzen ditugun arloak ondokoak dira:

  • Hiztegien eraikuntzaren automatizazioa: terminologia erauzketa automatikoa testu-corpusetatik (elebakarra nahiz elebiduna), hiztegi berriak eraikitzea bi hiztegi eta zubi-hizkuntza baten bidez, definizio eta adibideen erauzketa automatikoa testu-corpusetatik...
  • Testu-corpusak eraikitzea: eskuz edo automatikoki Internetetik, elebakarrak zein elebidunak, alor jakinetakoak nahiz orokorrak...
  • Informazio bilaketa: euskarazko bilaketa, eleanitza hizkuntza bakarretik abiatuta, galderen erantzute automatikoa, bilaketa semantikoa...
  • Informazio erauzketa: iritzia asmatzea, laburpen automatikoa...
  • Itzulpen automatikoa: gaztelaniatik euskarara, beste hizkuntzak...
  • Semantika: ontologia (edo datu-base lexikal hierarkiko) espezializatuen eraikuntza, eskuz nahiz automatikoki testuetatik...
  • Zuzentzaile ortografikoak: gailu ezberdinetzat, euskara batua edo euskalkiak...
  • Ahots-teknologiak: ahotsaren sorkuntza, ahotsaren ezagutza...

Hizkuntza-teknologien inguruan karreran ez da gehiegi ematen, baina horretan trebatzeko EHUko Hizkuntzaren Azterketa eta Prozesamendua masterra dago (master horren lehenengo promoziokoa naiz ni).

Nik 10 urte daramatzat sail honetan lanean. Ikerketako fasean aritu naiz gehienbat, edozein ikerketa-zentrotan egiten diren moduko lanak egiten: hipotesi bat edo teknologia bat probatu edo garatzeko, esperimentuak diseinatu, programak idatzi eta esperimentua aurrera eraman, emaitzak ebaluatu eta kongresu edo aldizkari espezializatuetan emaitzak argitaratu. Elhuyarren egin ditudan ikerketekin lotuta, nire tesia amaitzen ari naiz “Web-a euskarazko corpus gisa” gaia hartuta. Gaur egun hizkuntza-teknologien saileko arduraduna naiz.

Nire lanak nire bi pasio uztartzen ditu, informatika eta euskara. Baina informatika oso arlo zabala da eta arlo askotan dauka aplikazioa, edonork bere gustuko arloa aurkitzeko modukoa: webguneak, bideojokoak, robotika, industria... Eta alor gutxi egongo dira informatika bezain aldakorrak, beraz beti gauza berriak ikasten eta probatzen aritzea maite dutenentzako oso egokia da. Apur bat hacker izanez gero (zentzurik zabalenean, hau da, beti posible denaren mugak esploratzen aritzen dena eta arazoei konponbideak aurkitzen aritzea atsegin duena), informatika da irtenbiderik onena.

Zergatik aukeratu nuen informatika ikastea?

Nire garaian Arrasateko jende asko sartu ohi zen Eskola Politeknikoan ikasketak egitera ia inertziaz. Azken finean, etxean bertan ikasten zen, izen ona zuen zentro batean, eta inguruko kooperatibetan lana egiteko aukera ematen zuen. Beraz, bestelako bokazio argirik izan ezean, errazena, normalena eta logikoena hori egitea zen, nahiz eta kasu batzuetan argi ez izan zer den ingeniari izatea (ez da mediku, abokatu edo horrelako lanbideetan bezain argi ikusten zer den ingeniari baten lana, are gutxiago kontuan hartuta zenbat espezialitate ezberdin zeuden...).

Hori ez zen nire kasua izan. 13 urte nituenean gurasoek Sinclair ZX Spectrum 48K ordenagailu bat erosi ziguten, aurreko udan Ingalaterran oporretan ezagutu genuena. Herriko lehenengotako etxeko ordenagailua izango zen. Ezin da hura konparatu gaur egungo ordenagailuekin ezaugarriei eta ahalmenari dagokionez (16 KB ROM zituen, 25KB RAM, 256x192ko bereizmeneko eta 8 koloreko pantaila memoria telebista bati konektatzeko, disko gogorraren ordez kasetea erabiltzen zen...), baina garai hartarako kristorena zen. Haur batentzat harekin programatzen eta, azken finean, hackeatzen ikastea (benetako hackeatzea baitzen hain ahalmen gutxiko makina bati ateratzen zitzaion errendimendua ateratzea) ikaragarria zen, ni markatu egin ninduen. 20 urte ingururekin lehen PCa izan genuen arte milaka ordu egin nituen harekin, jolasten eta programatzen. Adibidez, batxilergoan informatikako klaseetan PCetan ikasten genuen Karel robota programazio-lengoaiaren editore, konpilatzaile eta simulatzailea egin nituen Spectrum-arentzat! Tira, kontua da 13 urte nituenetik argi nuela informatikari izan nahi nuela, eta Arrasateko Eskolan bertan hori egin zitekeenez, hori aukeratu nuen.

Zer ikasten da informatikako ikasketetan?

Ez naiz inoiz damutu informatika-ikasketak egitea aukeratu izanaz. Edozein ikasketa araututan bezala, beti daude ikasgai batzuk ongi ez daudenak edo ongi ematen ez direnak, baina orokorrean ikasten dena oso interesgarria da. Ordenagailuek nola funtzionatzen duten ikasten da, berauek nola programatu eta nola probetxua atera.

Uste okerra dago informatika-ikasketen inguruan. Azken bi urteetan parte hartu izan dut Eureka! Zientzia Museoak gazteak zientzia-ikasketetara bideratzeko orientazio-jardunaldietan, eta bertan gazte asko hurbildu izan zaizkit esanez ordenagailuak atsegin dituztela baina informatikako ikasgaian eman izan dutena ez. Izan ere, ofimatika ematen dute, edo blog bat egiten ikasten dute eta horrelako gauzak, hau da, ordenagailuak erabiltzen irakasten diete. Hau aspergarria zaie (bestela ere ikasten baita hori) eta beldur dira karreran ere hori egingo ote den... Informatika ez da ordenagailuak erabiltzen ikastea; informatika ordenagailuek nola funtzionatzen duten eta berauek programatzen ikastea da. Nire ustez lehen eta bigarren hezkuntzan oker egiten da horrela jokatzean. Erresuma Batuan bezala egin beharko litzateke, batxilergoan programatzen ikastea derrigorrezko ikasgaia da. Hori komentatu izan dudanetan, askok esan didate programatzea etorkizunean ez zaiola baliagarria izango ia inori, ez badu informatika karrera egiten behintzat. Baina berdin gertatzen da fisika, kimika, biologia eta beste askorekin, eta ematen dira...

Informatikako ingeniaritzan ikasten diren gaietara itzuliz, hauek dira, besteren artean:

  • Ordenagailuen funtzionamendua, arkitektura, egitura...
  • Datu-egiturak, datu-baseak...
  • Sistema eragileak...
  • Algoritmika, programazioa...
  • Sareak, komunikazioak, sistema banatuak...
  • Segurtasuna...

Azken batean, esan bezala, ordenagailuak menperatzen, programatzen eta berauei zukua ateratzen ikasten da. Eta ordenagailuz inguratuta bizi garen mundu honetan (ia edozein gailu elektroniko baita ordenagailu bat gaur egun), hori superbotere bat izatea bezalakoa da! ;-)

Pottokiak liburu ilustratuan? Zoazte pikutara!

e-gor 2013/06/22 11:40
Madarikatuak haurrentzako komikigintza baztertu dutenak
Pottokiak liburu ilustratuan? Zoazte pikutara!

Irudia: Grupo Correo

Gu txikiak ginela (duela ez hainbeste, hogeita hamapiko urte), haurrentzako komiki mordoa existitzen ziren. Liburudendetan ere baziren, baina kioskoak komikiz beteta egoten ziren. Orduko umeontzat irakurtzen hasteko modurik naturalena eta ohikoena komikiak ziren (edo behintzat mutilentzat bai), horrela sortzen zitzaigun irakurzaletasuna, eta hortik pasatzen ginen geroxeago bestelako literatura irakurtzera.

Baina poliki-poliki haurrentzako komikiak desagertzen joan ziren. Pedagogoek, argitaletxeek edo nik al dakit nortzuk erabaki zuten haurrentzat ez zirela egokiak, ez zirela nahikoa jasoak edo edukatiboak, hobe zirela ipuin eta liburu ilustratuak. Eta gaur egun Espainian (zorionekoak Frantzian, komikia oraindik instituzio bat da adin eta gizarte-klase guztientzat) ez da haurrentzako komikirik egiten. Egia da garai hartako komiki asko txarrak zirela eta frankismoaren reminiszentzia ugari zituztela, baina gauza on asko ere bazeuden; azken finean, beste edozein medio edo espresiotan bezala gertatzen zen, ezin da generalizatu eta komiki-formatua horregatik kondenatu. Hala ere, egin da, eta pintura eta literatura batzen dituen baina bien arteko batura baino askoz gehiago den arte honetan gaur egun helduentzako eta gazteentzako gauzak egiten dira soilik. Alde horretatik prestigioa eta kontsiderazioa irabazi dituela esango nuke, baina haurren mundutik erabat baztertuta gelditu da.

Komikiaren harra gure seme-alabengan haz dadin nahi dugun guraso frikiei geratzen zaigun aukera bakarra noizbehinka berreditatzen diren klasikoak dira: Asterix (euskaraz berrargitaratzen ari direna, zorionez, baina bakarra da), Tintin... eta nire erreakzio-artikulu hau bultzatu duten Pottokiak (edo Los Pitufos, ETBk marrazki bizidunetan bota aurretik ezagutu genituen izenez, edo Les Schtroumpfs, jatorrian).

Peyok 60ko hamarkadan sortutako komiki hau aparta zen bere lehen aleetan. Haurrentzat dibertigarria eta oso entretenigarria, baina helduontzako beste irakurketa bat ere baduena: beraien aparteko mundu txiki horren bitartez, gure gizarteko arlo asko erretratatu edo kritikatzen dira ironia finez. Geroztik frankizia eta negozio bihurtu dira, Peyoren heriotza eta gero editatzen jarraitu dute eta beste formatu askotara pasatu dute, horren azken espresioa zineetan duela bi urte estreinatutako filma delarik, eta orain uztailean estreinatuko da bigarren zatia.

Zalantzarik gabe, horren tiroia aprobetxatzeko asmoz atera du Grupo Correok Pottokien liburuen promozio hau. Baina bere jatorrizko formatu naturalean argitaratu beharrean, liburu ilustratu formatuan egin dute. Zer behar zegoen horretarako? Esan bezala, komikiok ederrak dira eta umeentzat oso erakargarriak. Filmaren eta promozio honen bidez komikitara iritsiko lirateke haur ugari eta ziurrenik mordoa atsegingo lituzkete, beste askori aurretik gertatu zitzaigun moduan. Aukera aparta zitekeen haurren belaunaldi batek komikia zer den lehen aldiz ezagutzeko. Aldiz, umeentzako komikiei geratzen zitzaien azken espazioari, klasikoen berreditatzearenari, bidearen amaiera seinalatu diote.

Ez dakit erabaki horren atzean zer dagoen, ezjakintasuna, diru-gosea, gutxiagotasun-konplexua, ala denak batera. Eta ez dakit noren ideia izan den, periodiko-saltzaileena, komikiaren eskubideen jabeena, argitaletxearena... Baina denen artean haurrentzako komikigintzari sastada makurra egin diote, beharbada behin-betikoa. Nire gorroto guztia beraientzat, betirako.

Asterixen beste bi album atera dira euskaraz

e-gor 2013/06/12 19:50
Salvat-ek Bilduma handiarekin jarraitzen du, orain "Buruzagien borroka" eta "Britainian" argitaratuz
Asterixen beste bi album atera dira euskaraz

Irudia: Uderzo

Duela urte batzuk Salvat argitaletxea René Goscinny eta Albert Uderzoren Asterixen komikiak berrargitaratzen hasi zen hizkuntza askotan Bilduma Handia izeneko sailaren barruan, euskaraz ere bai. Zorionez, komiki klasiko bikain honen euskarazko edizio zaharrak deskatalogatuta baitzeuden.

Gaztelaniaz 14 album atera dira jada eta euskaraz apur bat atzetik doa, orain arte 6 atera baitziren. Baina beste bi kaleratu berri dituzte, Buruzagien borroka eta Britainian.

Berri ona, klasiko eder hau euskaraz ateratzen jarraitzea!

Ganorabako 2013 lehiaketako irabazleak jakinarazi dira

e-gor 2013/06/05 21:55
Lan guztiak, ohikoa denez, online daude
Ganorabako 2013 lehiaketako irabazleak jakinarazi dira

Irudia: Andrés Valdovinos

Ganorabako komiki-lehiaketak, Basauriko Pozokoetxe Kultur Etxeak antolatzen duena Basauri Komik ekimenaren barruan, 2013ko edizioaren irabazleak ezagutarazi ditu:

  • Lehenengo saria, 900 eurokoa, Andrés Valdovinosek eraman du La niña on faier from the espeis lanagatik.
  • Bigarren saria, 450 eurorekin hornitua, Juan Manuel Hinojosarentzat izan da Wellow Creekengatik.
  • Hirugarren saria, 300 eurokoa, Aroha Travérentzat De baratillo lanagatik.
  • Euskarazko lanik onenari ematen dioten saririk gabeko accesita David Sarasketaren Lapurreta lanarentzat izan da.
  • Basauriko egile baten lanarentzako saririk gabeko accesita hutsik geratu da.
  • Azkenik, epaimahaiak aipamen berezia egin dio Domingo Pozankoren Malasangre lanari.

Aurtengo eta aurreko lan irabazle guztiak online daude ikusgai lehiaketaren webgunean, goiko estekei jarraituz heldu zaitezkete beraietara.

Google: lagun zintzoa, gaiztotzen

e-gor 2013/06/02 21:43
Googlek, enpresa erraldoi bat izan arren, jator-fama izan du hasieratik: garaje batean bi lagunen artean sortutako enpresa, software librearen erabiltzaile eta laguntzailea, protokolo irekien bultzatzailea... Hala ere, azkenaldian hartutako neurri batzuekin, edozein multinazionalen diruzalekeriaz betetako jokaera erakutsi du, bere jatorrizko printzipioen aurkakoa, eta, poliki-poliki, irudi on hori galtzen ari da.
(Elhuyar aldizkariko 2013ko maiatzeko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)

Googlek oso produktu onak egin izan ditu beti. Haren lehen produktua (eta oraindik ere haren aktibo nagusia dena), bilatzailea, iraultzailea izan zen bere garaian; ordura arte zeudenen aldean, webaren zati askoz handiago bat indexatzen zuen, askoz azkarragoa zen eta, Page Rank algoritmoaren bidez, emaitza askoz hobeak itzultzen zituen. GMail posta elektronikoak ere erraz gainditu zituen antzeko beste zerbitzuak, bai ezaugarritan, bai edukieran. Eta ateratzen joan den beste zerbitzu ugarirekin ere, antzera: Maps, Translate, Docs, Reader, Analytics... Horregatik guztiagatik, enpresa mirestua izan da teknozaleen artean; baina ez da hori izan arrazoi bakarra.

Ezaguna da Google-n “don’t be evil” eslogan informala, “ez gaiztoa izan” esan nahi duena. Esaldi horren bidez adierazten zuen bere intentzioa gutxieneko printzipio etiko batzuk betetzeko eta erabiltzailea edozeren aurretik jartzeko. Jakina, Google enpresa bat da, eta dirua irabazteko asmoa ere badu (eta baita lortu ere, alajaina!), baina filosofia baten barruan. Eta filosofia horrek eragin handia izan du jende baten artean (informatikariak, software librearen zaleak, hacker mugimendukoak, jende alternatiboa...) erdietsi duen miresmena eta fideltasuna lortzeko orduan.

Enpresa ezberdin eta jatorra...

Software librearen aldeko jende asko oso Googlezalea izan da beti, Google bera software librearen erabiltzaile handia izan delako. Google barruan asko erabiltzen dituzte, esaterako, Linux sistema eragilea eta Python programazio-lengoaia, biak libreak. Googleren mugikorretarako Android sistema eragilea ere Linuxen oinarrituta dago (2010eko urrian hitz egin genizuen Android-i buruz). Baina erabitzaile izateaz gain (edo horregatik beragatik), software librearen garapenean asko lagundu izan du: haren plantillako jendeak software libreari ekarpenak egin izan dizkio, Summer of Code bekak ematen ditu software librea garatzeko...

Halaber, protokolo eta estandar irekiak erabili eta bultzatu izan ditu betidanik. Adibidez, Google Talk txateko bere zerbitzuan ez du erabiltzen bere protokolo propietario bat, lehiakideek bezala (Facebook, Messenger, Skype...); XMPP estandar irekia erabiltzen du, eta, hala, protokolo hori erabiltzen duten programa, zerbitzu eta erabiltzaileekin komunika daiteke, ez soilik Google Talk erabiltzaileekin. Eta Google Wave ere sortu zuen, posta elektronikoaren eboluzioa izango zena, posta elektronikoa, wikiak eta mezularitza konbinatuz; protokolo ireki gisa argitaratu zuen, eta hura erabiltzeko softwarea libre egin (2009ko urrian egin genizuen berba honi buruz).

Tradizionalki, erabiltzaileen pribatutasunaren babeslea ere izan da. Gutaz dakien guztia dela-eta (gure e-mailak, bilaketak, kontaktuak, agenda, ikusten ditugun bideoak...) jende askok errezeloz begiratzen badu ere, orain artean ez du kezkatzeko arrazoirik eman: poliziak, federalek edo gobernuak erabiltzaileen datuak eskatzen dizkiotenean ukatu egiten dizkie, beste batzuek ez bezala; soilik epaileek eskatuta ematen dituzte, halabeharrez.

Eta antzeko gauzak egiten dituzten enpresen aldean, askatasunen defendatzaile gisa ere agertzen da. Apple-k, adibidez, erabat kontrolatu eta mugatzen du iPhone eta iPad-etan instala daitekeen softwarea; Android sistema eragilea duten telefonoetan, aldiz, edozein aplikazio legezko onartzen dute.

Azkenik, Googleren lan-baldintzek ere enpresa cool-aren irudia ematen diote. Bertako langileek ostiraletan beren ekimeneko proiektuetan lan egiten dute, hango jantokietan doan jaten da, zerbitzu- eta aisia-aukera asko daude langileentzat egoitzan bertan... Informatikari askoren ametsa da bertan lan egitea!

... oraindik ere bai?

Azken aldian, baina, Googleren irudi hori aldatzen ari da jende askoren begietan. Izan ere, jarreran aldaketa nabaria izan duela uste du jende anitzek, eta, edozein enpresak bezala, dirua irabaztea eta bere burua edozeren aurretik jartzen hasi dela, printzipioak ahaztuta.

Kexa ugari jaso ditu Googlek lehen doan eskaintzen zituen hainbat zerbitzu kobratzen hasi delako: Google Maps eta Google Translate zerbitzuen APIak, enpresentzako Google Apps suite-a... Hala ere, nire ustez, hori zilegi da; azken finean, Google enpresa bat da, eta dirua irabazi beharra du. Ulergarria ez dena zerbitzuak besterik gabe ixtea da, errentagarritasun edo erabilera falta argudiatuz, ordainpeko zerbitzuak izatera pasatuta jarraitzeko aukerarik eman gabe. Eta, neurri batean, aldarrikatzen duen filosofiagatik, errentagarriak ez diren zerbitzu batzuk mantendu beharko lituzke...

Itxitako zerbitzu horietako bat Google Wave izan zen. Hain iraultzailetzat aurkeztu zuten teknologia bat-batean itxi zuten urtebete eskasera, adopzio urriaren aitzakian. Egia da ez zuela espero zen adinako zabalkunderik izan, baina zergatik gertatu zen hori, hain potentzial handiko tresna izanik? Google-k berak utzi zuen Wave poliki-poliki hiltzen. Norbaitekin komunikazioan jarri nahi zenuenean, ez zen erosoa Wave-ra joatea ikusteko ea hartzaileak hor konturik bazuen eta, hala ez bazen, postaz bidaltzea; modu berean, komunikaziorako edozein tresnatan bezala, noizean behin begiratu behar zenuen ea zerbait iritsi zitzaizun, eta bi tokietan (postan eta Wave-n) begiratzea ez zen praktikoa. Eta gertatzen zen norbaiti wave bat bidali eta ondoren e-mailez abisatu behar izatea wave bat bidali zeniola, ez zuelako erantzuten... Google Wave hedatuko zatekeen Google-k Wave GMail-en interfazean integratu izan balu: GMail-eko interfazean norbaiti idaztean hartzaileak Wave kontua duela ikusita, Wave bidez komunikatzeko aukera eman zezakeen; era berean, jasotzen genituen Wave berriak Gmail-en erakuts zitzaketen. Jokaldi logikoa zen benetan Wave bultzatu nahi bazen, baina ez zuen egin. Protokolo irekiekiko jarrera-aldaketaren lehen zantzua izan zen. Google Buzz eta Google+ bere produktu sozial itxiak, aldiz, bai integratu zituen GMail-ekin…

Google Reader ere itxiko duela iragarri dute. Inoiz ez da izan publiko zabalarentzako produktu bat, eta ziurrenik ez zion dirurik ematen, baina erabiltzaile sorta ez baztergarria eta fidela du, eta zerbitzu mota hori beharrezkoa da gutako askorentzat, iaz kontatu genizuenez. Zorionez, badira alternatibak, baina albisteak haserrea piztu zuen.

Protokolo irekien eta sistema ezberdinen interkonexioaren arloan ere atzera egin du. Google Talk-ek, adibidez, kanpoko beste XMPP erabiltzaileen konexio-eskaerak onartzea galarazi zuen, nahiz eta jasotako kexengatik gero atzera egin zuen. Beranduago, bere txat eta bideokonferentziarako produktu berria Google+ zerbitzuko Hangouts izango zela iragarri zuen, bere protokolo propioa duena eta besteekin konektatu ezin dena. Software libreari dagokionez, Google-k ez du Android-en azken bertsioen kodea libre egin.

Pribatutasunean ere atzerapausoa eman zuen Google-k bere zerbitzu guztietako erabiltzaileen informazioa bateratzean: orain, adibidez, Youtuben anuntzioak erakuts ditzake zure GMail-eko informazioa baliatuz. Ez da gure datuak beste bati ematea bezain larria, baina pribatutasunaren nolabaiteko haustea badago, jende askorentzat zilegi ez dena. Eta diru-irabaziak ere askatasunaren aurretik jarri ditu: mugikor eta tabletetarako aplikazioen Google Play bere dendatik ezabatu ditu nabigatzailean iragarkiak blokeatzen dituzten AdBlock moduko programak.

Aipatutako xehetasun horietako bakoitza anekdotikoa izan liteke Google-ren ibilbide osoarekin konparatzen bada, baina guztiak batera hain denbora gutxian gertatzea joera baten adierazle dira. Agian ez da oraingoz deabrutzat hartzeko adinakoa, akaso oraindik ere jokabide askoz hobea izango du Internet munduko beste enpresa handiek baino... Baina Google jada ez da aingerutxo bat, eta bere betiko jarraitzaile tradizionalen zati handi baten baldintzarik gabeko sostengua galdu du, zalantzarik gabe.

Komiki-gida atera du Arrasateko Udal Bibliotekak

e-gor 2013/05/28 18:05
Komiki-munduko 10 egile, aditu edo zaleren hamarna komiki kuttunenekin osatutako gida beren webgunetik deskargatu daiteke
Komiki-gida atera du Arrasateko Udal Bibliotekak

Irudia: Santiago Valenzuela

Arrasateko Udal Bibliotekak komiki-gida bat argitaratu du, Antonio Altarriba El arte de volar komiki ezagun eta sarituaren gidoigilearen koordinaziopean. Hamar komikigile, komiki-aditu edo komikizaletako bakoitzak bere 10 komiki gustukoenen zerrenda osatu du, kuttunenaren iruzkina gehituz. Hala, ehun komikiko zerrenda batek osatzen du gida, horietako hamarren komentarioekin.

Gida osatzen parte hartu duten komiki-munduko pertsona horiek Borja Crespo, J.M. Díaz de Guereñu, Mauro Entrialgo, Lola Lorente, Joaquín Reyes, Laura Pérez-Vernetti, Fernando Tarancón, Zaldieroa, Alfonso Zapico eta blog honen egile Igor Leturia dira.

Komiki-gida online dago deskargatzeko moduan, aprobetxatu beraz!

Horrelako dibulgazio lanak beti interesgarriak badira ere, nire ustez badago zer kritikatua ere, eta ez gutxi.

Batetik, gomendioak egiten ditugunen zerrendan Euskal Herrikoa edo euskalduna ez den jende asko dago, euskaraz egin den komikigintzaz ezer ez dakiena, eta alde horretatik euskarazko komikigintza nahiko baztertua gelditu dela iruditzen zait, hemen egindako gida baten presentzia handiagoa izan zezakeen... Gero euskaldunok ere ez dugu zertan euskarazko komikiak gomendatu, baliteke pertsonen aukeraketa bestelakoa izanda ere euskarako lan gutxi agertzea, baina euskalduna ez den jendea aukeratuz aukerarik ere ez zaio ematen.

Bestetik, gidaren beraren hizkuntza-tratamendua ez da batere egokia. Altarribaren sarrera bi hizkuntzatan dago, baina gero badirudi egile bakoitzak idatzitako hizkuntza errespetatu dutela, eta hala, 8 gomendio gaztelaniaz daude eta 2 euskaraz. Gutxienez %50aren kuota eman beharko zioketen euskarari, itzulita, edo dena elebitan egin.

Beno, gidarako aukeratu nituen nire 10 kuttunak eta lehenengoarentzat idatzitako testutxoa hemen eransten dizkizuet (gidarako dezente laburtu behar izan zen). Lehenengo postuko hori, jakina, Watchmen da, zein bestela?

1.- Watchmen, Alan Moore - Dave Gibbons

Beharbada Alan Moore britainiarra izango da dagoen komiki-gidoigilerik ezagunena. Maisulan ugariren gidoiak idatzi ditu, horietako askok zinemarako jauzia ere egin dutelarik (nahiz eta berak film horiez arnegatu duen; eskubideak argitaletxearenak direlako ezin du ekidin bere lanen filmak egitea, baina ez du onartzen bere izena filmetan agertzea eta berari dagokion dirua marrazkigileari ematen dio), eta superheroi ezagun askoren abenturarik onenetakoak sinatu ditu. From Hell, V de Vendetta, La Liga de los Hombres Extraordinarios, Lost Girls, Top 10, Batmanen La broma asesina, Supermanen ¿Qué le sucedió al hombre del mañana?, La cosa del pantano-ren sagarik goraipatuena... Baina bere lanetatik bat nabarmendu behar izatekotan, hori Watchmen litzateke.

Watchmen 12 ataletako grapadun comic book gisa argitaratu bazen ere 1986an, harrez gero nobela grafikoaren erakusgarri adierazgarrienetakotzat hartua da. Sari mordoa irabazia da (Kirby saria, Hugo saria, Eisner saria...); eta komikien mundutik aparte ere oso preziatua da, liburu onenen hainbat zerrendetan agertzen baita. Filma ere egin dute; txukuna da, baina ez da komikiaren mailara iristen.

Lehen begiratuan superheroien komiki bat badirudi ere, ezer ez urrunago errealitatetik. Superheroiek inspiratuta mozorro bat jantzi eta justizia banatzea euren esku hartzen duen jendea dagoen errealitate alternatibo batean kokatuta dago Watchmen. Horren zilegitasuna zalantzan jartzen du Moore-k, heroi ustezko horietako batzuk faxistak, indarkeriazaleak edo amoralak dira. Hala, Watchmen bera superheroien eta justizieroen inguruan hausnartzeko komikia da, superheroien komikiz mozorrotuta. “Quis custodiet ipsos custodet?” edo “Who watches the watchmen?” esaldia da istorioaren muina.

Baina hausnarrarazte hori era entretenigarrian egiten du, hiltzailea nor den asmatu behar den thriller baten bidez; izan ere, “heroi” ohi horietako baten hilketak abiarazten du istorioa, gero inplikazio handiagoak izango dituena, Gerra Hotzagatiko munduaren amaiera suposa lezakeen konplot batera baikaramatza. Pertsonaia, garai, azpiistorio eta, beraz, hari asko daude liburuan, ederki jositako oihal bat osatuz ezusteko amaiera bateraino. Gainera, gizartearen, filosofiaren, historiaren, zientziaren, kulturaren eta beste hainbat arloren erreferentzia ugari agertzen dira, Moore-ren jakinduria ia entziklopedikoaren erakusgarri.

Arlo grafikoan ere, Moore-k komikien munduan diren baliabide edo teknika guztiak erabiltzen ditu, esperimentatuz eta berriak ere asmatuz. Paralelismoak, maila ugaritako simetria (biñetan, orriaren konposizioan, kapitulu mailan, liburu mailan...), egituraren koplexutasuna... Eta superheroietan eta zientzia-fikzioan aritutako Dave Gibbons-en irudiak ederto doazkio kontakizunari. Lan borobila benetan.

2.- Thorgal, Jean Van Hamme - Grzegorz Rosinski

3.- Persepolis, Marjane Satrapi

4.- Corto Maltés, Hugo Pratt

5.- Las aventuras de Max Fridman, Vittorio Giardino

6.- Las Falanges del Orden Negro eta Partida de caza, Pierre Christin - Enki Bilal

7.- Pololoak, Patxi Gallego

8.- El Eternauta, Héctor G. Oesterheld - Francisco Solano López

9.- Maus, Art Spiegelman

10.- Blueberry, Jean Michel Charlier - Jean Giraud

  1. Watchmen

Alan Moore - Dave Gibbons


Beharbada Alan Moore britainiarra izango da dagoen komiki-gidoigilerik ezagunena. Maisulan ugariren gidoiak idatzi ditu, horietako askok zinemarako jauzia ere egin dutelarik (nahiz eta berak film horiez arnegatu duen; eskubideak argitaletxearenak direlako ezin du ekidin bere lanen filmak egitea, baina ez du onartzen bere izena filmetan agertzea eta berari dagokion dirua marrazkigileari ematen dio), eta superheroi ezagun askoren abenturarik onenetakoak sinatu ditu. From Hell, V de Vendetta, La Liga de los Hombres Extraordinarios, Lost Girls, Top 10, Batman-en La broma asesina, Superman-en ¿Qué le sucedió al hombre del mañana?, La cosa del pantano-ren sagarik goraipatuena... Baina bere lanetatik bat nabarmendu behar izatekotan, hori Watchmen litzateke.

Watchmen 12 ataletako grapadun comic book gisa argitaratu bazen ere 1986an, harrez gero nobela grafikoaren erakusgarri adierazgarrienetakotzat hartua da. Sari mordoa irabazia da (Kirby saria, Hugo saria, Eisner saria...); eta komikien mundutik aparte ere oso preziatua da, liburu onenen hainbat zerrendetan agertzen baita. Filma ere egin dute; txukuna da, baina ez da komikiaren mailara iristen.

Lehen begiratuan superheroien komiki bat badirudi ere, ezer ez urrunago errealitatetik. Superheroiek inspiratuta mozorro bat jantzi eta justizia banatzea euren esku hartzen duen jendea dagoen errealitate alternatibo batean kokatuta dago Watchmen. Horren zilegitasuna zalantzan jartzen du, heroi ustezko horietako batzuk faxistak, indarkeriazaleak edo amoralak dira. Hala, Watchmen bera superheroien eta justizieroen inguruan hausnartzeko komikia da, superheroien komikiz mozorrotuta. “Quis custodiet ipsos custodet?” edo “Who watches the watchmen?” esaldia da istorioaren muina.

Baina hausnarrarazte hori era entretenigarrian egiten du, hiltzailea nor den asmatu behar den thriller baten bidez; izan ere, “heroi” ohi horietako baten hilketak abiarazten du istorioa, gero inplikazio handiagoak izango dituena, Gerra Hotzagatiko munduaren amaiera suposa lezakeen konplot batera baikaramatza. Pertsonaia, garai, azpiistorio eta, beraz, hari asko daude liburuan, ederki jositako oihal bat osatuz ezusteko amaiera bateraino. Gainera, gizartearen, filosofiaren, historiaren, zientziaren, kulturaren eta beste hainbat arloren erreferentzia ugari agertzen dira, Moore-ren jakinduria ia entziklopedikoaren erakusgarri.

Arlo grafikoan ere, Moore-k komikien munduan diren baliabide edo teknika guztiak erabiltzen ditu, esperimentatuz eta berriak ere asmatuz. Paralelismoak, maila ugaritako simetria (biñetan, orriaren konposizioan, kapitulu mailan, liburu mailan...), egituraren koplexutasuna... Eta superheroietan eta zientzia-fikzioan aritutako Dave Gibbons-en irudiak ederto doazkio kontakizunari. Lan borobila benetan.


  1. Thorgal

Jean Van Hamme - Grzegorz Rosinski


  1. Persepolis

Marjane Satrapi


  1. Corto Maltés

Hugo Pratt


  1. Las aventuras de Max Fridman

Vittorio Giardino


  1. Las falanges del orden negro - Partida de caza

Pierre Christin - Enki Bilal


  1. Pololoak

Patxi Gallego


  1. El Eternauta

Héctor G. Oesterheld - Francisco Solano López


  1. Maus

Art Spiegelman


  1. Blueberry

Jean Michel Charlier - Jean Giraud

Interneteko komunikazioen segurtasuna II: Autentifikazioa

e-gor 2013/05/11 10:25
Interneteko komunikazioen segurtasunari buruzko aurreko artikuluan ikusi genuen badagoela modua konfidentzialtasuna bermatzeko (guk jasotzaile bati bidalitako mezu edo komunikazio bat hirugarrenek ez atzeman ahal izateko). Hala, hirugarrenek ezin badute mezua atzeman, guri jasotzailea direla sinetsaraztea da informazioa lortzeko modu bat. Hori ekiditeaz arituko gara artikulu honetan, autentifikazioaz hain zuzen ere.
(Elhuyar aldizkariko 2013ko apirileko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)

Mundu errealarekin analogia bat egite aldera, denda edo jatetxe batean txartelaren bidez ordaintzearen kasua har dezakegu kontuan. Aurreko artikuluan ikusi genuena izango litzateke txartelaren datuak eta tekleatzen dugun kodea besteen begiradetatik ezkutatu beharra eta hori egiteko modua; oraingoan, berriz, zerbitzaria, denda edo dena delakoa fidatzekoak direla ziurtatu beharraz eta hori egiteko moduaz arituko gara.

Izan ere, Interneten ere arazo bera dago: on line denda batean erosten ari garela, nola dakigu denda hori berak dioena dela, eta ez dela gure datuak lortzeko benetako dendaren itxura bereko webgunea muntatu duen lapur bat? Hori baita phishing delako iruzurra: banku edo denda baten antz handia duen webgune bat egiten da, URLa ere oso antzekoa duena, eta erabiltzaileak bertara erakartzen dira, normalean posta elektronikozko mezu baten bidez; han sartzen ditugun pasahitz edo txartelen datuak iruzurgilearen esku gelditzen dira. Antibirus batzuek badituzte phishing detektagailuak, baina ez dira % 100 seguruak. Onena URLa ongi begiratzea da, arrasto susmagarrien bila. Baina beti ez da erraza izaten iruzurrak atzematea. Ba al dago, bada, Interneten mekanismorik webgune bat esaten duena dela bermatzeko, hau da, webgunea autentifikatzeko?

Webguneen autentifikazioa, HTTPS bidez

Aurreko artikuluan aipatutako HTTPS protokoloak bermatzen du hori. Han ikusi genuenez, HTTPS protokoloak gako publiko bidezko kriptografia erabiltzen du, hau da, mezua zifratzen da jasotzailearen gako publikoa erabiliz, baina mezua ezin da deszifratu edozeinek ezagutzen duen gako publiko horren bidez, baizik eta jasotzaileak soilik ezagutzen duen gako pribatuaren bidez; horrela bermatzen da jasotzaileak soilik irakurriko duela gure mezua. Horrek, berez, ziurtatzen du gure datuak enkriptatuko direla eta ezingo dituela beste inork atzeman. Baina autentifikazioa HTTPS protokoloaren beste ezaugarri bati esker bermatzen da: gako publikoaren ziurtagiri digitalak.

Ziurtagiri digitalak entitate digital baten eta haren gako publikoaren arteko lotura bermatzen duten dokumentu digitalak dira, hirugarren pertsona fidagarri batzuek (ziurtagiri-jaulkitzaileek) jaulkitakoak. Hala, on line dendek HTTPS zerbitzari bat martxan jartzeko ziurtagiri bat lortu behar dute aurretik jaulkitzaile batekin (edo gehiagorekin). Eta nabigatzaile batek HTTPS konexio bat hasi behar duenean, egiten duen lehenengo gauza da ziurtagiri jaulkitzaileekin konektatu eta webgune horren ziurtagiri digitala eskatu, ziurtatzeko benetan esaten duen enpresarena dela eta gako publikoa zuzena dela.

Ziurtagiri digitalarekin dena ongi badago, ziurtagiriaren datuak ikus ditzakegu helbide-barran agertzen den giltzarrapoaren ikonoan klik eginda. Hala ez bada, ziurrenik behin baino gehiagotan ikusiko zenuen ohar bat erakusten digu nabigatzaileak, polizia bat dokumentazioa eskatzen agertzen den ikono batekin. Hori agertzen den guztietan ez du esan nahi iruzurrezko webgune baten aurrean gaudenik: baliteke gure nabigatzaileak ez izatea ziurtagiri-jaulkitzaile horren berri (zaharkitua dagoelako, esaterako), edo webgunea talde murriztu batentzat soilik izatea (enpresa bateko estraneta, adibidez) eta ziurtagiririk ez eskatu izana; ziur bagaude webgunea segurua dela, aurrera egiteko aukera ere ematen digu nabigatzaileak.

Beraz, datu pribaturen bat (pasahitz bat, dokumentu konfidentzial bat, kreditu-txartelaren datuak...) sartu behar badugu webguneren batean, HTTPS protokoloari dagokion giltzarrapoa ikusten badugu eta nabigatzaileak ez badigu oharrik egiten, lasai egin dezakegu, ziur egon baikaitezke jasotzailea esaten duena dela eta beste inork ezingo duela atzeman.

Posta-mezua bidaltzen duenaren autentifikazioa

Iruzurrak egiteko beste bide bat posta elektronikoa da. Ezagutzen dugun norbaiten izenean mezu bat irits dakiguke informazio bat eskatuz edo jarraibide batzuk emanez, eta dioena eginez gero datuak lapurtu diezazkigukete; izan ere, erraza da posta elektronikozko mezu bat beste norbaiten izenean bidaltzea. Ba al dago modurik, beraz, bidaltzailea autentifikatzeko? Bai, sinadura digitalaren bidez.

Sinadura digitala, funtsean, gako publiko bidezko kriptografiaren erabilera berezi bat da. Bidaltzaileak mezuaren kopia bat gako pribatua erabiliz enkriptatzen du eta jasotzaileak, desenkriptatzeko, bidaltzailearen gako publikoa erabiliko du, ziurtagiri-jaulkitzaile batengandik lortua; desenkriptatutakoa jatorrizko mezuaren berdina bada, horrek esan nahi du mezua ustezko bidaltzaileak bidalitakoa dela nahitaez, berak soilik baitu haren gako pribatua.

Posta elektronikoko programek (Outlook, Thunderbird...) izaten dute mezuak digitalki sinatzeko aukera, batzuek berezkoa eta beste batzuek PGP programa (Pretty Good Privacy) edo GPG (GNU Privacy Guard) haren bertsio librea instalatuta. Halako programei buruz ere aurreko artikuluan hitz egin genizuen, esanez gako publiko bidezko kriptografia erabiltzen dutela mezua enkriptatzeko eta jasotzaileak soilik desenkriptatu ahal izateko. Baina ez da hori halako programek egiten duten gauza bakarra: sinadura digitala ere inplementatzen dute bidaltzailea autentifikatzeko. Web bidezko postarekin (Gmail, Hotmail, Yahoo...), aldiz, ez da aukerarik digitalki sinatzeko. Izan ere, horrek eskatuko luke gure gako pribatua hornitzailearen esku uztea, eta hori ezin da egin, gako publiko bidezko kriptografia fidagarria izateko gako pribatua norberak soilik gorde behar baitu. Aukera bakarra izan daiteke nabigatzailearentzako plugin bat erabiltzea, enkriptazioa norberaren ordenagailuan egingo duena (Mailvelope adibidez).

Laburtuz, nabigatzean HTTPS protokoloa darabilten webguneetan ibilita eta postan PGP, GPG edo beste moduren baten bidezko sinadura digitala erabilita, ziur egon gaitezke ez soilik datuak beste inork ez dituela atzemango, baizik eta baita gure solaskidea berak dioena dela ere.

Segurtasunaren, konfidentzialtasunaren eta kriptografiaren gaia interesatzen bazaizu, informazio gehiago aurkituko duzu Elhuyar Fundazioak euskaraz argitaratu duen Simon Singh-en Kodeen liburua interesgarrian.

"Munduko bandarik txarrena" eta "Preso nago 2", bi komiki berri euskaraz

e-gor 2013/05/01 09:50
"Preso nago 2" komikia ostegunean aurkeztuko da goizeko 11etan Donostiako udal sotoan
"Munduko bandarik txarrena" eta "Preso nago 2", bi komiki berri euskaraz

Irudia: Jose Carlos Fernandes / Mikel Orbegozo

Zorionekoak gaude euskal komikizaleok, euskarazko bi komiki berri atera baitira Durangoko azoka eta Gabonen garaiaz kanpo.

Batetik, José Carlos Fernandes portugaldarraren Munduko bandarik txarrena komikia euskaratu du Txalaparta argitaletxeak. Bego Montoriok itzuli du eta Harkaitz Canok egin dio hitzaurrea. Kritika eta laudorio ugari jaso dituen lan hau sei liburukiz osatuta dago, eta Txalapartaren argitalpen honetan lehen hiruak batzen dira. Espero dezagun hurrengoak ere ateratzea!

Bestetik, Mikel Orbegozo presoak duela hiru urte kaleratu zuen Preso nago komikiaren jarraipena argitaratu du, Preso nago 2. Aurrekoa bezala, euskal preso eta errepresaliatuen lanak kaleratzen dituen Ataramiñe argitaletxearen eskutik atera da hau ere. Bietan Orbegozok kartzelako bizitza kontatzen du barrutik, umore ukituaz.

Preso nago 2 bihar osteguna, maiatzak 2, aurkeztuko dute goizeko 11etan, Donostiako udal sotoan. Bertan Ataramiñeko kideak, Mikel Orbegozoren senideak eta Ainara Azpiazu "Axpi" komikigilea izango dira.

Ongi etorriak bi komikiok!

Web-corpusen Ataria: Elhuyar I+Gk egindako euskarazko webeko testuen biltegi erraldoia

e-gor 2013/04/23 19:15
Elhuyar Fundazioko hizkuntza-teknologien I+G taldekook Web-corpusen Ataria jarri dugu on line. Bertan hiru baliabide jarri ditugu eskura: euskarazko corpus bat (125 milioi hitz ingurukoa), euskara-gaztelania corpus paralelo bat (18 milioi hitz ingurukoa), biak webetik automatikoki eraikiak, eta lehenetik automatikoki erauzitako hitz-konbinazioen kontsulta. Corpusak euskaraz dauden handienetakoak dira, bakoitza bere motakoen artean. Baliabide hauek aurrerapauso handia dira euskararentzat, erabilgarriak baitira ez soilik hizkuntzalaritzarako, baizik eta baita hizkuntza-teknologien garapenerako ere.
Web-corpusen Ataria: Elhuyar I+Gk egindako euskarazko webeko testuen biltegi erraldoia

Irudia: Elhuyar I+G

(Elhuyar aldizkariko 2013ko martxoko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)

Hizkuntza batentzat oso garrantzitsua da testu-corpusak edukitzea (azterketa linguistikoak egiteko balio duten testu-bildumak). Hizkuntzalaritza-ikerketetarako, edo hizkuntza-estandarizazioan erabakiak hartzeko datuak lortzeko ezinbestekoak dira. Eta oso baliagarriak dira testu sorkuntzan edo itzulpengintzan ere: hiztegietan agertu ez edo adibide nahikorik ez duten hitzak nola erabili edo nola itzuli izan diren argitu diezagukete.

Baina, horrez gain, corpusek berebiziko garrantzia dute hizkuntza-teknologien munduan. Gaur egungo telefono mugikor adimendunek ekartzen duten ahots-ezagutzako sistemetan, adibidez, corpusak erabiltzen dira guztiz ongi ulertu ez den hitz bat asmatzen saiatzeko, aukeren artean testuinguru horretan probableena zein den corpusetan begiratuta; edo itzulpen automatikoko sistemek, esaterako, corpus paraleloak (elkarren itzulpen diren testuez osatutako corpusak) erabiltzen dituzte ikasteko, 2009ko azaroko zenbakian kontatzen genizuenez.

Zenbat eta corpus handiagoak, hobe

Artikulu hartan bertan azpimarratzen genuen corpus hauek zenbat eta handiagoak izan hobe dela. Hitz arraro baten erabilera kontsultatzeko, agerpen ezberdin gehiago, edo agertzeko aukera gehiago egongo dira corpusa handiagoa bada. Itzulpen automatikorako ere tamaina ahalik eta handieneko corpusak behar dira; horregatik da erreferentzia Google hizkuntza askotako itzulpen automatikoan, bilatzailerako indexatzen dituen testuekin corpus paralelo ikaragarriak osatzen dituelako.

Beste arlo askotan bezala, corpusenean ere baliabide gehiagoko beste hizkuntza batzuen oso atzetik dabil euskara, bai tamainan, bai denboran. Errepara diezaiogun ingelesaren egoerari: corpusgintza modernoaren abiapuntutzat jotzen den ingelesezko Brown corpusa 1964an sortu zen eta milioi bat hitz zituen; 100 milioi hitzeko British National Corpus 1995ekoa da; eta gaur egun, badaude ingelesezko milaka milioi hitzeko corpusak. Ingelesa barne hartzen duten corpus paraleloei dagokienez, Googlek 2005ean abiatutako itzulpen automatikoko sistema 200.000 milioi hitzeko corpus baten gainean entrenatu zen.

Euskaraz, aldiz, lehen corpusa (Euskaltzaindiaren Orotariko Euskal Hiztegiaren testu-corpusa) 1984an egin zen eta 4,6 milioi hitz ditu. Euskaltzaindiak berak egindako XX. Mendeko Euskararen Corpus Estatistikoa 2002an amaitu zen, 6 milioi hitzekin. Elhuyar Fundazioak eta Euskal Herriko Unibertsitateko IXA Taldeak Zientzia eta Teknologiaren Corpusa atera zuten 2006an, 9 milioi hitzekoa. EHUk ere urte horretan egin zuen Ereduzko Prosa Gaur deituriko corpusa, gaur egun 25,1 milioi hitzez osatua. Euskaltzaindiaren Lexikoaren Behatokia 2010ean abiarazi zen, eta egun 26,5 milioi hitz ditu. Corpus paraleloei dagokienez, itzulpen-enpresek dituzte ziurrenik horrelako handienak euren itzulpen-memorietan. Baina publikoarentzat eskuragarri eta hizkuntza-teknologietan erabiltzeko moduan oso gutxi daude; erakunde publiko (HAEEren Itzulpen Zerbitzu Ofiziala, Gipuzkoako Foru Aldundia, Bizkaiko Foru Aldundia...) edo bokazio sozialeko elkarte (EIZIE, Librezale) batzuetako itzulpen-zerbitzuen itzulpen-memoriak eta Eroskiren Consumer aldizkariko corpusa dira erreferentzia bakarrak, baina denak 5 milioi hitzen azpitik daude.

Konponbidea, weba

Arazo hori konpontzeko errezeta Adam Kilgarriff corpusetan adituak ematen zuen lehen aipatutako artikuluan: weba da corpus handiak modu erraz, merke eta azkarrean osatzeko modurik onena. Izan ere, ingelesezko aipatu ditugun azken urteotako corpus erraldoi horiek ere horrela osatu dira, ikusita corpusak era klasikoan osatzea (argitaletxeetara edo komunikabideetara joz) askoz garestiago eta neketsuagoa dela.

Corpusak webetik automatikoki osatzeak baditu bere aurkakoak ere. Haien objekzio nagusia da bertan kalitate eskaseko testu asko aurki daitezkeela. Baina beste ikuspegi batetik ikusita, hori da gaur egungo hizkuntzaren erabilera erreala, eta hori aztertzeko sortu ziren corpusak. Gainera, baliabide askoz gehiago dituzten hizkuntzek webera jo badute, euskararentzat ere hori da bidea atzean gelditu nahi ez badu.

Euskarazko Web-corpusen Ataria

Elhuyar Fundazioko hizkuntza-teknologien I+G taldekook badaramatzagu urte batzuk web-corpusen —hau da, webeko testuekin metodo automatikoak erabiliz eraikitako corpusen— arloa jorratzen. Mota askotako corpusak biltzeko metodoak landu ditugu: euskarazko corpus espezializatuak (jakintza-arlo jakin bateko testuz osatuak), corpus eleaniztun konparagarriak (jakintza-arlo bereko testuz osatuak), corpus paraleloak (elkarren itzulpen diren testuz osatuak), corpus orokor erraldoiak... Horrelakoak egiteko, beharrezkoa da hizkuntza-teknologietako beste teknika batzuk garatzea: bilatzaileen APIetatik hitz jakin batzuk dituzten web-orriak eskuratzekoak, testu baten hizkuntza ezagutzekoak, testu errepikatuak edo oso antzekoak detektatzekoak, web-orriak garbitzekoak (oinak, goiburuak, nabigazio-menuak, copyright-oharrak eta horrelakoak kentzeko eta testuaz soilik gelditzeko), spama apartatzekoak, testu baten jakintza-arloa detektatzekoak, itzulpenak ezagutzekoak...

Tresna horien bidez, aipatutako mota horietako guztietako corpus asko osatu ditugu. Eta orain, corpus horietako batzuk on line jarri ditugu Web-corpusen Atarian: 125 milioi hitzeko euskarazko corpus orokor handi bat (mota horretako orain arteko handiena zen, alde handiz; geroztik atera da handiago bat, EHUren Egungo Testuen Corpusa) eta 18 milioi hitzeko euskara-gaztelania corpus paralelo bat (corpus paralelo publikoen artean handiena). Corpus horien gainean hainbat bilaketa-mota egitea ahalbidetzen da webgunean. Lema edo forma jakin bat edo haien hasiera edo bukaera emanda galde daitezke, gehienez 5 hitzeko distantziara dauden hiru hitz arterainoko konbinaziotan. Paraleloan bi hitz arterainoko konbinazioak galde daitezke, baina hizkuntza batean, bestean edo bietan izan daitezela eska daiteke. Oso baliagarriak dira, biak, hitzak nola erabili edo itzuli izan diren ikusteko.

Horrez gain, corpus elebakarraren gainean teknika linguistiko eta estatistikoak aplikatuta, gehien erabiltzen diren hiru motatako konbinazioak kalkulatu dira (izen-izen, izen-aditz eta izen-adjektibo) eta kontsultagai jarri da. Hala, sistemari galdetu diezaiokegu hitz jakin bat zein aditzekin konbinatu ohi den, edo zein adjektiborekin, eta abar.

Web-corpus elebakarra

Web corpus1
Corpus elebakarraren kontsulta-interfazea. Irudia: Elhuyar I+G

Bildu eta online jarri dugun web-corpus elebakarra euskarazko web-corpus bat da, 124.625.420 testu-hitz dituena. Interneten dauden mota eta arlo guztietako testuak biltzen ditu, eta gaur arte eratu den euskarazko corpusik handiena da. Linguistikoki etiketatuta dago.

Esan bezala, web-corpus hau guztiz automatikoki eratu da, Elhuyar Fundazioaren Hizkuntza eta Teknologia unitateko I+G taldeak garatutako teknologiak erabilita. Web-corpusa biltzeko tresnak ondoko gauzak egiten ditu:

  • Interneteko euskarazko orriak lokalizatu
  • Orri ez-egokiak iragazi
  • Orri errepikatuak edo ia berdinak ezabatu
  • Orritik edukizkoak ez diren atalak kendu (izenburuak, menuak, nabigazio-aukerak, oin-oharrak), testu nagusia baino ez corpuseratzeko.

Corpusaren osaera dela eta, 6.202 domeinutako 82.542 dokumentu ditu. Web-corpusen webguneko eranskina (elebakarra) atalean, domeinuen zerrenda eta bakoitzetik corpuseratutako dokumentuen eta hitzen kopuruak kontsulta daitezke.

Bilketa-metodoari buruz gehiago jakin nahi izanez gero, bibliografian aipatzen den [Leturia, 2012] artikulura jo dezakezu.

Webgune honetan kontsultagai jartzeko, testu guztiak linguistikoki prozesatu eta etiketatu dira. Horretarako, Euskal Herriko Unibertsitateko IXA taldeak garatutako Eustagger etiketatzailea erabili da. Tresna horrek testu-hitz edo token bakoitzari analisi linguistiko bat edo batzuk esleitzen dizkio, eta, atal honetako kontsulta antolatzeko, analisi bakoitzetik lema- eta kategoria-etiketak erabili dira (hitz-konbinazioen atalean eskaintzen den bigrama-erauzketa egiteko eta prozesatzeko, bi horiez gain, kasu- eta mugatasun-etiketak ere erabili dira). Informazio horren bidez, hitzak, beren lema, forma edo kategoriaren arabera bila daitezke. Hori ez ezik, lema edo forma batetik halako distantziara forma, lema edo kategoria jakin bateko hitzak dauden ere kontsulta daiteke. Hainbat aukera daude emaitzak ordenatzeko, eta datu estatistikoak aukeratzeko (ikus webguneko laguntza).

Web-corpus paraleloa

Web corpus 2
Corpus paraleloaren kontsulta-interfazea. Irudia: Elhuyar I+G

Atari honetan kontsultagai dagoen bigarren corpusa euskara-gaztelania corpus paraleloa da. Corpus hau automatikoki osatu da, Elhuyar Fundazioaren Hizkuntza eta Teknologia unitateko I+G taldeak garatutako PaCo2 [San Vicente & Manterola, 2012] tresna erabiliz. Tresna horrek erabiltzaileak aukeratutako bi hizkuntzetan eduki elebiduna duten domeinuak bilatzen ditu Interneten, eta domeinu horietatik elkarren itzulpen diren esaldiak erauzten ditu. 1. taulak corpusaren tamainaren inguruko datuak azaltzen ditu.

euesguztira
Dokumentuak 87.253 87.253 174.506
Corpus gordinak (dokumentu-mailako parekatzea) 34.902.457 42.183.563 77.086.020
Segmentuak (esaldi-mailako parekatzea) - - 659.630
Hitzak (esaldi-mailako parekatzea) 7.891.104 10.862.509 18.753.613

Corpus paraleloaren datu orokorrak

85 domeinutako testuak bildu dira corpusera. Web-corpusen webguneko eranskina (paraleloa) atalean, domeinuen zerrenda eta bakoitzetik corpuseratutako dokumentuen eta hitzen kopuruak kontsulta daitezke.

Gerora, corpusa hazten joango dela aurreikusten dugu. Une honetan, guk dakigula, automatikoki sortutako euskara-gaztelania corpus paralelo elebidunik handiena da.

Bildutako dokumentu elebidunak esaldi-mailan parekatzeko eta segmentuak sortzeko, Hunalign tresna erabili dugu. Ondoren, corpusa linguistikoki prozesatu da, eta etiketatuta dago. Corpus elebakarrean bezala, Euskal Herriko Unibertsitateko IXA taldeak garatutako Eustagger tresna erabili da euskarazko etiketatze linguistikoa egiteko. Gaztelaniazko testuak TreeTagger etiketatzailearen bidez prozesatu dira. Testuko hitz bakoitzari esleitutako informazio linguistikoari esker, corpusaren kontsulta-interfazean lema eta kategoriaren araberako hainbat bilaketa-mota egin daitezke (ikus webguneko laguntza).

Esan beharra dago bilketa automatikoa izateak abantaila argiak dituela, baina arazoak ere bai. Batetik, corpus hau eskuz biltzeak eskatuko lukeen denborak eta ahaleginak bideraezina egingo lukete proiektua. Bestetik, prozesu automatikoa izateak berekin dakar amaierako corpusaren kalitatea optimoa edo erabatekoa ez izatea. Izan ere, ezin dugu bermatu lortutako segmentu guztiak, hau da, esaldi guztien parekatzea, zuzenak direnik. Hainbat arrazoi daude horretarako: dokumentu batzuek itzulpen partzialak besterik ez dituzte, zenbait dokumentu paralelo gisa aurkezten diren arren, hizkuntza batean eta bestean agertzen den edukia ez da berdina... Bestetik, parekatze automatikoa egiten duten tresnen doitasuna ez da % 100koa. Nolanahi ere, gure corpus paraleloak eskaintzen dituen segmentuetatik % 90 zuzenak dira, hau da, elkarren itzulpen diren esaldiak dituzte. Une honetan, bozka-sistema bat lantzen ari gara, erabiltzaileak segmentu bat zuzena ala okerra den adierazteko aukera izan dezan. Horretara, corpusaren kalitatea hobetuz joango da.

Hitz-konbinazioak

Web corpus 3
Hitz-konbinazioen kontsulta-adibidea. Irudia: Elhuyar I+G

Euskarazko web-corpus elebakarretik hiru eratako hitz-konbinazioak erauzi dira, automatikoki: izen+aditz, izen+izen eta izen+izenondo. Fraseologia konputazionaleko lan honetan erabilitako metodologia Elhuyar Fundazioaren Hizkuntza eta Teknologia unitateko I+G taldean diseinatu eta inplementatu da, Euskal Herriko Unibertsitateko IXA taldeko Iñaki Alegria lankide izanik [Gurrutxaga & Alegria, 2011]. Eustagger bidez prozesatutako web-corpus elebakar etiketatutik abiatuta egin dugu lan, eta, hortik aurrerako urratsetako batzuetan, erabilera libreko bi tresna erabili ditugu: Ted Pedersenen Ngram Statistics Package (NSP), bigrama-sorkuntzarako; eta Stefan Everten UCS toolkit, elkartze-neurri estatistikoak kalkulatzeko. Metodologiaren eta ebaluazioaren informazio zehatza du eskura erabiltzaileak bibliografian erreferentziatzen den artikuluan.

Hona hemen aipatu hiru konbinazio-motetako adibide batzuk:

  • izen+aditz konbinazioak: gerrikoa estutu, adarretatik heldu, zubiak eraiki, loa galdu, atentzioa eman, adostasuna lortu, aktari erantsi, kalitateaz arduratu, egunkaria irakurri...
  • izen+izen konbinazioak: arrain-sarda, mahai-jolas, elur-maluta, eguzki-haize, administrazio-kontseilu, energia-eraginkortasun, liburutegi-zerbitzu...
  • izen+izenondo konbinazioak: ardi beltz, aita santu, zulo beltz, ardo ondu, haize fin, aldapa piko, lagun min, xedapen gehigarri, erregai fosil, nobela historiko, liburu interesgarri, partikula kargatu...

Horiek aztertuta, argi ikus daiteke erauzitako konbinazioak edo bigramak ez direla denak idiomatikotasun-maila berekoak: batzuk esapide idiomatikoak (edo lokuzioak) dira, beste batzuk kolokazioak, eta, azkenik, konbinazio libreak ere badaude. Egiten ari garen lanaren helburua da erauzitako konbinazioak idiomatikotasunaren arabera ordenatzeko teknikak garatzea. Izan ere, erabiltzailearentzat esapide idiomatikoak (gerrikoa estutu, adarretatik heldu, zubiak eraiki, aita santu) eta kolokazioak (atentzioa eman, arrain-sarda, lagun min) izaten dira interes handienekoak. izen+izen eta izen+izenondo konbinazioen kasuan, termino teknikoak ere erauzten dira, horietako batzuk idiomatikotasun-maila nabaria dutenak (eguzki-haize, zulo beltz).

Bada, lehen urrats honetan, bigramaren osagaien agerkidetzaren neurketa izan da idiomatikotasuna karakterizatzeko bidea. Egin dugun ikerketan, independenteki eskuz landutako erreferentzia bat erabili da ebaluaziorako, eta emaitza onenak t neurria (t-score) delakoak lortu ditu. Dena den, kontsulta-interfazean, erabiltzaileak, t neurriaz eta maiztasun absolutuaz gain, beste bost neurri estatistiko ditu aukeran, datuak bistaratzeko eta bigramak ordenatzeko.

Kontsulta-interfazeak eskaintzen dituen aukeren berri jakiteko, ikus webguneko laguntza.

Erabilera

Egia da jende gehienak ez duela ohiturarik corpusak erabiltzeko, aipatu ditugun hizkuntzaren espezialistak edo hizkuntza lan-tresnatzat duen jendea dira batez ere corpusen erabiltzaile. Jende gehienak hiztegiak erabiltzen ditu… Baina hiztegietan zerbait ez dagoenean, corpus hauek oso baliagarriak suerta dakizkieke; existitzen direla jakin behar, eta horiek erabiltzeko ohitura hartu behar...

Gainera, corpusek badituzte ezberdintasunak hiztegiekiko. Batetik, hiztegiek helburu preskriptibo edo arauemailea izaten dute; corpusek, aldiz, deskriptiboa. Honek esan nahi du corpusetan hizkuntza nola erabili izan den ikus daitekeela, eta ez soilik nola erabili beharko litzatekeen. Bestetik, hiztegiak egiteak kostu bat dauka eta mugatuak dira halabeharrez, hitz-kopuru zehatz bat eta adibide-kopuru mugatu bat dute soilik. Corpusetan, nahiko handiak izanik, hitz askoz gehiago ager daitezke eta erabilera-adibide gehiago.

Gainera, web-corpus hauek berezitasun batzuk dituzte beste corpusekiko: hain handiak izanik, aukera handiagoa dago beste corpusetan ez dauden hitzak aurkitzeko; hitz berriak ere aurki daitezke, weba etengabe eguneratzen baita; eta webeko erabilera informalaren (blogak, foroak...) berri ere ematen dute, ez soilik argitaletxe edo komunikabideak bezalako iturri editatuenak.

Edonola ere, nahiz eta jende askok zuzenean corpus hauek (edo beste edozein corpus) ez erabili, corpus hauei eta berauek biltzeko garatutako teknologiei esker etorkizunean garatuko diren hizkuntza-teknologiak (ahots-ezagutza, itzulpen automatikoa...) ziur erabiliko direla.

Web-corpusen Atariaren argitaratzea jauzi kualitatibo bat da, lehen aldia baita webetik automatikoki erauzitako corpusak publikoaren eskura jartzen direna, eta baita kuantitatiboa ere, corpusen tamainan aurrerakuntza esanguratsua baita. Koldo Mitxelenak zioen euskararen benetako misterioa ez dela jatorria, iraupena baizik. Misterio handiagoa da etorkizunean iraungo ote duen. Guk ez dugu horren erantzunik, baina iraungo badu zalantzarik gabe hizkuntza-teknologietan presente egon behar du euskarak. Web-corpusen Atariarekin norabide horretan beste pausu bat eman dugula sinetsita gaude Elhuyarren.

Bibliografia

Interneteko komunikazioen segurtasuna I: Konfidentzialtasuna

e-gor 2013/04/08 20:25
Gaur egunean informazio oso garrantzitsua ibiltzen da Interneten zehar: posta elektroniko pribatuak, dokumentu konfidentzialak, online zerbitzuetako kontuen pasahitzak, kreditu-txartelen datuak... Baina seguru al doa informazio hori guztia Internetetik?
Interneteko komunikazioen segurtasuna I: Konfidentzialtasuna

Irudia: Wikimedia Commons

(Elhuyar aldizkariko 2013ko otsaileko zenbakian argitaratutako artikuluaren jatorrizko extended bertsioa)

E-mailean, webean nabigatzen, nahiz Interneten beste zerbaitetan ari garela, informazioa bidaltzen dugu; abiapuntutik helburura iristeko informazio hori puntu askotatik pasatzen da: gure ordenagailu edo bestelako gailu digitaletik ateratzen da, bideragailuren batetik pasatuko da (enpresako sareko routerretik, etxeko edo tabernako wifikotik...), gero Internet-hornitzailearengana iritsiko da, eta handik oraindik beste nodo asko pasatuko ditu helmugara iritsi arte. Tarteko puntu horietako edozeinen kontrola duenak, dela enpresako informatikaria, tabernako jabea edo Interneteko hornitzailearekin elkar hartuta dagoen polizia -edo, wifiaren kasuan, baita wifidun ordenagailu bat hurbil duen edozeinek ere-, erraz atzeman dezake informazioa.

Sareko komunikazioen zati handi bat (webeko nabigazio gehiena, posta-jasotze eta -bidaltze asko) irekian doa, edozeinek atzemateko moduan. Baina Internetek baditu mekanismoak informazio sentibera -adibidez, pasahitzak, kreditu txartelen datuak edo posta elektroniko sekretuak- modu seguruan eta konfidentzialtasuna bermatuz garraiatzeko. Kriptografiaz baliatzen da horretarako, hau da, mezuak enkriptatuz (kodetuz edo zifratuz) jasotzailea ez den edozeinentzat ulertezin bihurtzen dira. Zehazki, kriptografia-mota berezi bat erabiltzen da Interneten: gako publiko bidezko kriptografia edo kriptografia asimetrikoa.

Kriptografia klasikoaren arazoak Interneten

Mezuak enkriptatzeko sistemak asko erabili izan dira historian zehar, batez ere errege, jeneral eta bestelako agintarien arteko komunikazio garrantzitsuetarako, baina baita maitaleen arteko amodio-mezu sekretuentzat ere. Hasieran metodo sinpleak zirenak gero eta konplexuago bihurtu dira, teknologiak horretarako bidea eman ahala eta aurreko sistemak hausteko teknikak aurkitu ahala. Historiako enkriptatze-metodo ezagun eta erabilienen artean, aipa genitzake Zesarren zifra, Vigènere-ren zifra eta errotore-makinak (Lorenz-ena eta Enigma, esaterako).

Funtsean, enkriptazio-sistema horiek denak printzipio berean oinarritzen dira: mezua funtzio baten bidez eraldatzen da, gako bat erabiliz, eta jasotzaileak gero alderantzizko funtzioa aplikatzen du gako berarekin jatorrizko mezua lortzeko. Adibiderik sinpleenean, funtzioa kenketa izan daiteke eta gakoa 1 zenbakia. Hala, "IBM" mezua "HAL" bihurtuko litzateke (Stanley Kubricken 2001: A Space Odyssey filmeko ordenagailu gaiztoa bezala) letra bakoitzari "-1" funtzioa aplikatuz aurreko letrarekin ordezten badugu, eta jasotzaileak, gakoa (1 zenbakia) jakinda mezu zifratuari "+1" funtzioa aplikatuta, "IBM" lortuko luke berriro. Honi kriptografia simetriko deitzen zaio, gako bera erabiltzen duelako enkriptatzeko eta desenkriptatzeko.

Sistema hauek gero eta hauskaitzago bihurtu dira, zifratze-funtzioa gero eta konplikatuago egin dutelako, garai bakoitzeko teknologiaren laguntzarekin. Gaur egun, kriptografia egiteko ordenagailuak erabiltzen dira; haiei esker, aipatutako funtzioak oso konplexuak eta gakoak oso luzeak izan daitezke, sistema erabat hautsezinak garatzeko modukoak. Hala, AEBko Gobernuak (beste askoren artean) erabiltzen duen AES (Advanced Encryption Standard) zifraketa, kriptografia simetrikoko sistema da.

Baina horrelako sistemek arazo bat dute Interneten jende guztiak nabigatzeko, online erosteko edo e-mail pribatuak bidaltzeko erabiltzeko orduan: bi aldeek ezagutu behar dute gakoa eta beste inork ez. Beraz, ezin da beti gako bera erabili, gako ezberdin bat behar da jasotzaile eta bidaltzaile bakoitzeko; eta gako hori beste inork jakin ez dezan, ezin da Internet bidez bidali, jakina, lehen esan bezala, atzeman egin baitaiteke. Horiek horrela, kasu batzuetan, gobernuenetan esaterako, mezulari bidez bidal dakioke gakoa komunikatu nahi den erakunde bakoitzari, baina Interneteko komunikazioentzat? Denda eta bezero bakoitzeko, webgune eta bisitari bakoitzeko, posta elektronikoaren bidaltzaile eta jasotzaile bakoitzeko, lehenago gako bat aurrez aurre partekatu behar izatea edo mezulari bidez bidali behar izatea ezinezkoa da praktikan: oso garestia litzateke eta ez segurua gainera (mezulariak ustelduta egon daitezke edo gakoa lapurtu egin diezagukete bidean).

Gako publiko bidezko kriptografia

Merkataritza elektronikoak eta Internet bidez informazio konprometitua bidaltzeak aurrera egin badu, 1970eko hamarkadan zifratze-sistema berri bat asmatu zelako izan da, ordura arteko sistemen aldean erabat ezberdin eta apurtzailea, intuizioaren guztiz aurkakoa eta aldi berean oso segurua: gako publiko bidezko kriptografia edo kriptografia asimetrikoa.

Gako publiko bidezko kriptografian, zifratzeko funtzio bat eta gako bat erabiltzen dira, baina funtzio horrek ez du alderantzizkorik (noranzko bakarreko funtzio deitzen zaie hauei); beraz, gakoa jakinda ere ezin da mezua deszifratu; deszifratzeko beste funtzio bat eta beste gako bat behar dira (horregatik deritzo kriptografia asimetrikoa). Orduan, norbaitek ahalbidetu nahi badie beste batzuei modu pribatuan berarekin komunikatzea (esaterako, saltzaileak erosleei, haiek kreditu-txartelaren datuak bidali ahal izateko), publiko egiten du enkriptatzeko gakoa. Edozeinek erabili ahal izango du gako publiko hori hari mezu zifratu bat bidaltzeko, baina gako publiko hori mundu guztiak ezagututa ere, mezua hark bakarrik deszifratu dezake, hark bakarrik ezagutzen baitu deszifratzeko gakoa (gako pribatua deritzona).

Sistema honek funtziona dezan, beharrezkoa da existitzea gako baten araberako funtzio bat alderantzizkorik ez duena, alderantzikatzea beste funtzio eta beste gako baten bidez lortzen dena, eta bigarren gakoa lehenengoa jakinda kalkulatu ezin daitekeena. Guztiz intuizioaren aurkakoa da horrelako funtzio eta gako batzuen existentzia, baina izan badaude, aritmetika modularrari, zenbaki lehenei eta faktorizazioari esker.

Ron Rivest, Adi Shamir eta Leonard Adleman MIT (Massachusetts Institute of Technology) entzutetsuko ikertzaileek aurkitu zituzten horrelako lehenengoak 1977an. Hauek dira zehazki (M zifratu beharreko mezua, ASCII edo UTF bezalako kodeketa baten bidez aurrez zenbaki bihurtua, eta C mezu zifratua direlarik):

  • Zifratzeko gakoa: N eta e zenbakiak, p eta q zenbaki lehenen arabera kalkulatuak, honela:
  • Zifratzeko funtzioa: C = Me (mod N), non mod modulu operazioa den
  • Deszifratzeko gakoa: aipatutako p eta q zenbaki lehenak
  • Deszifratzeko funtzioa: M = Cd (mod N), non d honela kalkultzen den:
    • e x d (mod(p - 1) x (q - 1)) = 1

Esan dugu sistemak funtzionatzeko baldintzetako bat dela deszifratzeko gakoa ezin kal kulatu ahal izatea zifratzeko gakotik abiatuta. Baina, logikoa denez, biak erlazionatuta daude eta kalkulatu daiteke bigarrena lehenetik abiatuta: faktorizazioa egitea besterik ez da, hau da, zenbaki horren zatitzaileak ateratzea. Kontua da hori egin ahal izateko ez dagoela formula azkarrik; zenbaki guztiak probatuta besterik ezin da egin momentuz. Beraz, zenbaki horiek nahikoa handiak badira (eta ehunka digitukoak erabiltzen dira), gaur egungo teknologiarekin ezinezko problema bihurtzen da faktorizazioa, eta zifratze-sistema hautsezina da praktikan. RSA izena du metodoak, asmatzaileen omenez; nahiz eta geroago jakin zen metodo hori Clifford Cocks GCHQ (Government Communications Headquarters, edo Britainia Handiko Inteligentzia Zerbitzua) erakundeko langileak asmatu zuela 1973an, hau da, lau urte lehenago, baina erakunde horren informazio guztia sekretua zen eta 1997ra arte ez zen hori jakinarazi.

RSAren ondoren asmatu dira gako publiko bidezko beste kriptografia-sistema batzuk, hala nola DSA edo ElGamal.

Konfidentzialtasuna Interneten

Interneteko komunikazioak OSI ereduaren arabera mailatan antolatuta daude, aurreko zenbakian kontatzen genizuenez. Eta komunikazio horien konfidentzialtasuna bermatzeko, garraio-mailarako TLS protokoloa (Transport Layer Security) definitu da (lehen SSL edo Secure Sockets Layer gisa ezagutzen zena). Honetan, bidaltzaileak eta jasotzaileak gako publiko bidezko kriptografia erabiltzen dute (RSA normalean, baina besteren bat izan daiteke, biek inplementatuta badute) beste gako bat adosteko (ausazkoa), eta gero benetako komunikazioa gako horrekin eta kriptografia simetriko bidezko metodo batekin egiten da (AESekin, adibidez), konputazionalki ez delako hain garestia eta segurtasun parekoa eskaintzen duelako.

Interneteko aplikazio-mailako protokolo bakoitzerako (weberako HTTP, postarako SMTP eta IMAP, fitxategiak igotzeko FTP, urruneko ordenagailuetan saioak irekitzeko Telnet...), haien bertsio seguruak sortu dira (HTTPS, SMTPS, IMAPS, SFTP eta SSH hurrenez hurren). Horietako batzuk, adibidez HTTPS, SMTPS edo IMAPS, jatorrizko protokoloari garraio-mailan TLS gehitzean eta protokolo berriari beste portu bat esleitzean besterik ez dautza (orain, STARTTLS protokolo berriaren bidez, aplikazioek portu bera erabili dezakete konexio seguruentzat, alde biek inplementatuta duten kasuetan). Beste batzuk, SFTP eta SSH kasu, funtzio berdina dute baina protokolo ezberdinak dira, gako publiko bidezko enkriptazioa erabiltzen dutenak. Protokolo horiek erabiltzen direnean, gure komunikazioen konfidentzialtasuna bermatutzat jo dezakegu. Eta nola jakin protokolo horiek erabiltzen ari garen?

Webean nabigatzen ari garenean, helbidean giltzarrapo bat eta beronen hasieran "https://" ikusten badugu, esan nahi du HTTPS protokoloa erabiltzen ari garela eta, beraz, komunikazioa segurua dela. Merkataritza elektronikoko guneetan ordaintzean, web bidezko posta bezalako zerbitzuetan eta beste toki askotan normalean erabiltzen da.

Posta-programen kasuan, gure kontuaren ezarpenetan begiratu beharko dugu ea zein protokolo onartzen dituen posta bidali eta jasotzeko. Edonola ere, nahiz eta posta programak SMTPS eta IMAPS protokoloak erabili, esan nahi du gu eta gure posta-hornitzailearen arteko komunikazioa inork ezingo duela irakurri, baina ez bidalketaren ondorengo faseetan beste inork ez duenik irakurriko. Hori ekiditea nahi badugu, gure posta-programan PGP programa (Pretty Good Privacy) integratu dezakegu (Phil Zimmermannek 1991n sortua eta oso ezagun eta erabilia bihurtu dena) edo GPG (GNU Privacy Guard) haren bertsio librea; biek azken hartzailearen gako publikoa erabiliz zifratzen dute informazioa, eta, beraz, hark baino ezingo du irakurri.

Urruneko ordenagailuetan saioak irekitzeko edo fitxategiak igotzeko, SSH edo SFTP protokoloak erabiltzen direla ziurtatu beharko dugu konfidentzialtasuna mantendu nahi badugu. Bestelako programetan (VNC, VPN edo Sare Pribatu Birtualak...), ezarpenetan begiratu beharko dugu ea enkriptaziodun protokoloak edo enkriptazio-sistemak erabiltzen dituzten. Gauza hauek kontuan izanez gero, gure informazio pribatuak hala izaten jarraituko du Internet bidez bidalita ere.

Segurtasunaren, konfidentzialtasunaren eta kriptografiaren gaia interesatzen bazaizu, informazio gehiago aurkituko duzu Elhuyar Fundazioak euskaraz argitaratu duen Simon Singh-en Kodeen liburua interesgarrian.

e-gorblog

e-gorblog

Egunez, Igor Leturia Azkarate pertsona arrunta da. Errenterian bizi den arrasatearra, 8etatik 17etara Elhuyarren lan egiten du eta arratsaldeak neskalagunarekin eta bere bi umeekin pasatzen ditu.

Baina gaua iritsi eta umeak lotara joaten direnean, e-gor bihurtzen da, interneteko bere alter-egoa, ziberespazioko informatikaririk komikizaleena eta komikizalerik informatikariena! Bere superbotereekin (interneteko kable-konexioa, bloglines, informatika aldizkariak, gadget-ak, komiki-bilduma, Errenteriko liburutegiko komikien atala eta batez ere bere jakinmin aseezina) eta bere superlaguntzaileak ondoan dituela (Patxi Lurra, DabilenHarria...), euskaldunon teknofobiaren eta komikiei buruzko aurreiritzien aurka burrukatzen du etengabe! Hemen duzu bere bloga: e-gorblog!

Bai, hor goiko aurkezpena superheroi batena da (ezin aproposagoa honelako blog batentzat, ezta?). Superheroia banintz zein izango nintzatekeen jakiteko the Superhero Personality Test egin nuen eta hona emaitzak:

You are Spider-Man
You are intelligent, witty, a bit geeky and have great power and responsibility.

Spider-Man
80%
Superman
70%
Green Lantern
65%
Robin
65%
The Flash
60%
Supergirl
55%
Hulk
55%
Iron Man
45%
Wonder Woman
35%
Catwoman
25%
Batman
0%
Lizentzia

Creative Commons-en baimena
Blog honetako edukia, Igor Leturiak eta beste kolaboratzaile batzuek egiten dutena, Creative Commons Aitortu-PartekatuBerdin 3.0 Unported baimen baten mende dago (irudiak salbu).

Harpidetza
Erantzunen harpidetza
Artxiboa
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024
Artikulu aipagarriak

MythTV sorta
2004/11

"Pololoak" sorta
2004/11-12 - 2006/10-12 - 2007/02-03

Monoblogoa
2005/01/11

"Persepolis", xalotasunaren sakontasuna
2005/01/25

Elgetako Blogs&Beers 2005: nire inpresioa eta moblogging kontuak
2005/04/18

Firefox eta bere plugin zoragarriak
2005/05/11

"El País"-en komiki bilduma
2005/05/15

Euskarazko bi blog berri (bai, beste bi, baina hauek bereziak dira!)
2005/05/25

"Watchmen" sorta
2005/09-11 - 2006/10 - 2007/10 - 2008/07

"La cárcel de papel"-eko "Mis tebeos favoritos" saila I: 1etik 20ra
2005/11/08

"Goienkaria"-n agertu naiz
2005/12/08

Komikiak eta euskal rock-a
2005/12/14

Ruben Arozena "Ruben" komikigilea hil da
2006/01/02

Zope-rako DTML Calendar Tag produktua, euskaraz
2006/02/01

"Joyas Literarias Juveniles" bilduma, osorik eMule-n
2006/08/05

Argazkigintza eta DRM-a
2006/10/09

Paul Auster eta Euskararen Herria
2006/10/29

Angoulême sorta
2007/01-02

Gaur duela 25 urte nire bizitza aldatu zen
2007/04/23

Hergé-ren defentsan
2007/05/22

Ubuntu-ren bertsio berria, hobekuntza askorekin
2007/07/02

OLPC sorta
2007/12 - 2008/01

Guillermo Zubiaga, Marvel-eko komikilari euskalduna
2008/02/05

Asus EEE PC, ordenagailu txiki eta merkeen hurrengo sorta
2008/03/11

Agur, Ipurbeltz, agur... :-(
2008/08/04

"Café Budapest", gizatasuna eta bizikidetzaren aldeko aldarria
2008/08/25

"Arturo Erregea" serie mitikoa, Euskal Encodings-en! (beste askorekin batera)
2008/09/17

"Gazteak", beste serie mitiko bat euskaraz eskuragai!
2008/10/14

Pottokiek 50 urte!
2008/10/22

Europan ere OLPC-ren XO ordenagailuak erosteko aukera!
2008/11/12

Microsoft-en web zerbitzuetako gehienak, euskaraz!
2008/12/04

"Heroes"-en 2. denboraldia: ETB kirtenkeria errepikatzera, eta Euskal Encodings konpontzera
2009/01/23

I. Euskal OLPC Party-a, apirilaren 23an Donostiako Doka kafe antzokian
2009/04/16

Elkarrizketa egin didate 7K-n
2009/06/03

Azpiriren Spectrum-entzako jokoen azalak liburu batean
2009/10/06

Asterix, heroi garaitua
2009/10/29

"Ihes ederra", euskarazko komikigintzaren heldutasunaren konfirmazioa
2009/11/13

Pololoak 3: The making of
2009/11/22

5 urte 5!
2009/12/15

Nobela grafikoa, komikien prestigiorako ala mespretxurako?
2009/12/20

"Pololoak 3 - Atxeritoko balada", trilogiaren amaiera borobila
2010/01/13

Sinclair ZX Spectrum bat oparitu didate!
2010/01/19

Zergatik ez dudan liburu elektronikorik erosiko (gauzak aldatzen ez diren artean)
2010/01/27

Errealitate areagotua: munduaren pertzepzioa aberasten
2010/02/09

e-gorblog, "Nick dut nik" telebista saioan
2010/05/20

Sarearen neutraltasunari erasoak: Interneten izaera arriskuan
2010/06/02

"Avatar, azken aire maisua" osoa eta "Heroiak"-en lehen bi denboraldiak, Euskal Encodings-en
2010/07/22

Sistema eragileen guda berria
2010/12/14

Anubis 3.0 albumarentzat 3D animazio ederra
2010/12/27

Telebistaren benetako iraultza hemen da, eta ez da LTDa
2011/01/10

"Asterix galiarra" eta "Urrezko igitaia" berrargitaratu ditu Salvatek
2011/01/13

Euskarazko komikigintza digitalizazioaren aurrean
2011/01/27

"Ihes ederra"ren gaztelaniazko eta katalanezko bertsioak eta "Alokairuan", kalean
2011/02/20

Star Wars jatorrizko trilogia, euskaraz
2011/03/21

Sare sozialetan preso
2011/04/06

Zer dudan Steve Jobsen, edo Appleren, aurka
2011/10/14

Gaur 100 urte Adèle Blanc-Sec-en abenturak hasi zirela
2011/11/04

Euskarazko 8 komiki berri
2011/12/02

Social networks killed the RSS star?
2012/06/10