Hemen zaude: Hasiera Blogak Teknosexua Artxiboa 2008 Maiatza 16 Robotak: maitasuna eta gorrotoa
Dokumentu Akzioak

Teknosexua

Robotak: maitasuna eta gorrotoa

Bilatzaileen robotetaz ari naiz, sareko web orri guztiak bisitatzen dituzten horietaz. Beharrezkoak dira, baina arazo asko sortzen dituzte ere.

Azken bi egunetan webgune hau askoz hobeto dabil, ez dakit nabaritu duzuen. Plonera pasatu ginenetik errendimendu arazo handiak izan ditugu. Kontua da lehendik eduki asko zegoela, blog asko, sarrera asko, eta blog bakoitzak etiketa asko. Horrek orri kopuruan eragiten du. Googlek 18.000 orri baino gehiago indexatuta ditu eibar.org webgunean eta hori, sarbidea mugatuta dugula toki askotara!

Eta Google ez da bakarra. Yahoo dago, eta MSN, eta Nsyght, Yodao, Gigablast, Kilomonkey eta ezagutzen ez ditugun beste ehundaka bilatzaile. Bakoitzak bere BOT-a (roBOT) dauka, etengabe webguneetan nabigatzen ari diren programa batzuk, dena irakurri eta indexatzeko. Klik egile nekaezinak dira robot hauek. Googleren robotak Googlebot izena du adibidez, eta Yahoorenak Slurp.

Denek jakin nahi dute zer dagoen Eibar.org-en, beraien emaitzetan erakusteko. Horrek ikaragarrizko karga eragiten du webgunean, jo ta su ari bait da zerbitzaria, edukia bilatzaileentzat prestatzen. Kontutan izan webguneko elementu guztiak direla dinamikoak, eskatzen diren momentuan sortzen direnak.

Soluzioak badaude eta Erralek martxan jarrita ditu, Squid bezalako katxe kudeatzaileak adibidez. Squid-ek webguneko elementuak gordetzen ditu, berriz sortu beharrik ez izateko. Kontua da bilatzaile hauek ez dabiltzala orri bisitatuenetan, portadan erakusten direnetan bakarrik. Barru-barruan sartzen dira, lotura absurduenean ere klik eginez, eta hori absurdua denez, inork ez du lehenago bisitatu, eta ez da katxean egoten.

robots.txt, soluzio radikala

Herenegun erabaki genuen modu tenporalean behintzat robotei sarrera debekatzea. Horretarako robots.txt fitxategia erabiltzen da. Fitxategi horretan robotei esaten diegu webgunearen zein zatitan sartu daitezkeen eta zeinetan ez. Hau ez da erabiltzaile arrunten aukera bat, webguneen administratzaileen esku dagoena baizik. robots.txt fitxategiak egiten ikasi hemen

Azkar nabaritu dugu eragina. Atzo eta gaur ondo nabigatu daiteke webgune honetan. Hau beste gauza bat da.

Baina, bizi gaitezke robotik gabe?

Ez dut uste. Beharrezkoak dira. Jendea Googlera joan eta bilaketa egiten du, eta zure webgunea ez badu aurkitzen, ez zara existitzen. Beraz, robots.txt-a aldatu eta gaurtik aurrera Googleri sartzen utzi diogu. Izan ere Google bidez dator webgune honetako bisitarien erdia, eta beste webgune batzuetan ehuneko hau oraindik handiagoa da.

Ez zaigu neurria gustatzen, Interneten neutralitatearen aurka doa eta. Baina momentu honetan beste soluziorik ez dugu, eta hau ere nahikoa izango den ezin dugu jakin. Ikusiko dugu egun pare batean nola doan gauza, eta epe ertainean jarraitu beharko dugu soluzio bila.

Bisitariok nabaritu duzue aldaketa?

Gari Araolaza 2008/05/16

oso hezigarria

jolaus — 2008/05/16 09:38
Aupa Gari

Oso ekarpen ona Gari. Betidanik entzun izan ditut robot.txt inguruko komentarioak baina sekula ez dut garbi izan zer egiten duten eta zertarako diren. Artikulu honekin nituen zalantzak argitu zaizkit. Eskerrik asko.

Sindikazioa

Txus — 2008/05/16 10:07
Ez dut uste gehiegi balioko dizuen, baina google reader-ek feedburner erabiltzen duenez ez dauka inolako arazorik.

Nik igarri dut aldaketa

Joxe Aranzabal — 2008/05/16 10:51
Aupa, Gari! Nik izugari igarri dut aldaketa: orain askoz ere bizkorrago datoz Eibar.org-eko kontuak. Lehen, berriz, nekagarria zen, oso. Zorionak, beraz.

Robotak

Jozulin — 2008/05/16 15:37
Robotak diozu? Kontuz robotekin:

http://www.flickr.com/photos/51035610542@N01/sets/72157594291346788/

Eta bai, askoz ere arinago dabil orain eibar.org.

Eskerrik asko!

Gari — 2008/05/17 06:40
Eskerrik asko erantzun duzuenoi. Ez nuke aditzera eman nahi robotak galeraztea denik soluzioa eta horrela geldituko garela. Robotei bidea ixtea soluzio azkarrena eta erradikalena da, baina webgune honen errendimendua hobetzen jarraitu behar dugu pixkanaka.

Apachek berak ere baditu tresnak

tolon — 2008/05/17 17:37
Aupa Gari !!

Guk horrelako arazoak eduki izan ditugu, eta apachek berak ere ematen du katxea kudeatzeko aukera.

Delicious-en sarrera dexente dauzkat gai honekin (apache tag-arekin), hemen adibide pare bat:

http://plone.org/documentation/tutorial/optimizing-plone/tutorial-all-pages
http://mnm.uib.es/gallir/posts/2006/09/26/819/

Seguru hau ere probatu dezuela, baina bueno, badaezpada ere.

Hontaz aparte, guk arazo bat genuen memoria ia guztia erabiltzen zuelako (zerbitzaria zahar xamarra da), eta swap partizioa ez genuen ondo eskalatuta. Hau konpontzeko swap memoria gehitu genion partizioko swap-ari fitxategi baten bidez swap gehiago sortuz.

Ondo segi.


Erantzuna gehitu

Beheko formularioa betez erantzun bat utzi dezakezu

(Beharrezkoa)
Esaiguzu zure izena
(Beharrezkoa)
(Beharrezkoa)
(Beharrezkoa)
(Beharrezkoa)
Erantzun galderari aurrera jarraitzeko:

Zenbat dira hiru gehi bi? (idatzi zenbakiekin)

Azken erantzunak
Ezustekabe atsegina Txus Ordorika, 2012/02/07
In the ghetto asier sarasua, 2012/02/05
gora ghetta oier g, 2012/02/04
erdaldunak eta euskara Patxo, 2012/02/04
Etiketa lainoa
CodeSyntax administrazioa aldundia analytics ap-1 apache ardoa argazkiak audientziak audio autoa basque bidebarrieta bideoak bilatzaileak bittorrent bizikleta bizitza blogak brikolajea buletina codesyntax copyleft copyright creativecommons curriculum debabarrena dokumentalak donostia drm e-gizartea e-posta egile eskubidea egunkaria eguraldia eibar eibarorg elektronika elgeta elgoibar elurra espaloia estatistika estatistikak etb etb2 euskadiko kutxa euskal aberia euskal-herria euskaltel euskara eusko-jaurlaritza exif facebook gabonak games gatibu gaztelera geek geo geocaching gimp gitarra google gps haurrak hezkuntza hifi hitzaldia howto ikastaroak informatika ingurugiroa internet iratxe_molinuevo irratia irteera istripua itoiz itsasoa itunes japonia jatetxea jatetxeak jokoak kontzertuak kuriositateak lana lau truku mapa mapak mapping microformats microsoft mondragon motorra mqp multimedia music musika mutriku negozioak obrak openstreetmap oporrak ordenagailua osasuna osm p2p papel papera parte-hartzea partehartzea pdf photos photoshop plano plone politika posizionamentua pribatutasuna publizitatea python radio_euskadi rss san-sebastian sare-sozialak sarea script segurtasuna semantic-web seo software librea software-librea spam sysadmin tagzania telebista telebista tv p2p telemarketing tomtom turismoa tv twitter txangoa txinatarrak txistea txoriak ueu umeak umeekin umorea unibertsitatea vizcaino webgintza where2007 wikipedia worldploneday worldploneday2008 youtube zuzenbidea