Hemen zaude: Hasiera Blogak Teknosexua Artxiboa 2006 Urria 26 Euskara hutsezko bilaketak Googlen
Dokumentu Akzioak

Teknosexua

Euskara hutsezko bilaketak Googlen

Atzo, Google-ren Co-Op zerbitzu berria aurkitu eta di-da (ordu erdi) batean Euskara hutsezko bilatzailea sortu genuen Sustatun. Horrelako boteprontoko gauzekin (sarritan egiten ditugu) inoiz ez dut jakiten lotsatu behar garen ala harrotu, hain esfortzu txikiarekin hain emaitza onak ateratzean (Izan ere sistemaren mugak kontutan hartuta, uste dut emaitza oso onak ematen dituela).

Kontua da lan txiki horrek azaleratzen duela hainbeste urteren buruan daukagun beharra: Googlek euskarazko orriak identifikatzeko modua izatea.

Izan ere, guk martxan jarritako sistema oso mugatua da, euskarazko webguneak eskuz identifikatu eta sartu behar bait ditugu sisteman, eta pertsonengan oinarritutako sistema hauek ez dute luzarora balio. Egunen batean aspertuko gara sistema mantentzeaz, eta orduan segituan hasiko da emaitza okerrak ematen.

Irakurri nuenez gai hau azaleratu zuen Vicent Partalek E.H. 2.0 jardunaldietan

Nik badakit gure webgune guztietako HTML-a ongi etiketatuta emango bagenu euskarazko edukiak direla esanez ( lang="eu" atributua erabiliz) asko aurreratuko genukeela.

Baina uste dut pauso nagusia Googlerengan dagoela. Googlek kontutan hartu behar gaitu, euskarazko orriak identifikatuz. Testu bat hartuta euskarazkoa den ala ez erabakitzeko algoritmoak informatikarientzat ezagunak dira, eta badaude horretarako sortutako tresnak, hemengo hau bezalakoa

Orduan, Googlek euskara identifikatu ahal izatea ez da arazo teknikoa, lehentasun kontua baizik. Googlerentzat ez da lehentasuna euskarazko edukiak identifikatzea, euskal eduki eta internauta gutxi daudela iruditzen zaiolako. Nola konpon genezake hau? Egin beharreko lan batzuk (eta sentitzen dut, baina pilota bueltan datorkigu)

  • Entitate esanguratsuek (dela Jaurlaritza, Kontseilua edo denok) Google EspaƱarekin (sentitzen dut baina gauza horrela da) kontaktua egin eta behar eta interes hau adierazi.
  • Gure nabigatzaileen hizkuntza lehenetsi moduan euskara konfiguratzeko esfortzu txikia egin, estatistiketan masa kritikoa lor dezagun. Euskaratu zure nabigatzailea
  • Sortzen ditugun euskarazko eduki eta webgune guztietan, lang="eu" atributua ongi jarri. Normalean hau hemen azaltzen den moduan honela:
       <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="eu" lang="eu"> 

Azkenik, uste dut Vicent Partalek azpimarratu zuen txindurri lana izango dela efektiboena, baina horretarako denok helburua garbi izan behar genuke.

Gari Araolaza 2006/10/26
Erantzuna gehitu

Beheko formularioa betez erantzun bat utzi dezakezu

(Beharrezkoa)
Esaiguzu zure izena
(Beharrezkoa)
(Beharrezkoa)
(Beharrezkoa)
(Beharrezkoa)
Erantzun galderari aurrera jarraitzeko:

Zenbat dira hiru gehi bi? (idatzi zenbakiekin)

Azken erantzunak
Ezustekabe atsegina Txus Ordorika, 2012/02/07
In the ghetto asier sarasua, 2012/02/05
gora ghetta oier g, 2012/02/04
erdaldunak eta euskara Patxo, 2012/02/04
Baina lana guk egiten diegu Oier A., 2011/09/03
Etiketa lainoa
CodeSyntax administrazioa aldundia analytics ap-1 apache ardoa argazkiak audientziak audio autoa basque bidebarrieta bideoak bilatzaileak bittorrent bizikleta bizitza blogak brikolajea buletina codesyntax copyleft copyright creativecommons curriculum debabarrena dokumentalak donostia drm e-gizartea e-posta egile eskubidea egunkaria eguraldia eibar eibarorg elektronika elgeta elgoibar elurra espaloia estatistika estatistikak etb etb2 euskadiko kutxa euskal aberia euskal-herria euskaltel euskara eusko-jaurlaritza exif facebook gabonak games gatibu gaztelera geek geo geocaching gimp gitarra google gps haurrak hezkuntza hifi hitzaldia howto ikastaroak informatika ingurugiroa internet iratxe_molinuevo irratia irteera istripua itoiz itsasoa itunes japonia jatetxea jatetxeak jokoak kontzertuak kuriositateak lana lau truku mapa mapak mapping microformats microsoft mondragon motorra mqp multimedia music musika mutriku negozioak obrak openstreetmap oporrak ordenagailua osasuna osm p2p papel papera parte-hartzea partehartzea pdf photos photoshop plano plone politika posizionamentua pribatutasuna publizitatea python radio_euskadi rss san-sebastian sare-sozialak sarea script segurtasuna semantic-web seo software librea software-librea spam sysadmin tagzania telebista telebista tv p2p telemarketing tomtom turismoa tv twitter txangoa txinatarrak txistea txoriak ueu umeak umeekin umorea unibertsitatea vizcaino webgintza where2007 wikipedia worldploneday worldploneday2008 youtube zuzenbidea