Teknosexua
Robotak: maitasuna eta gorrotoa
Bilatzaileen robotetaz ari naiz, sareko web orri guztiak bisitatzen dituzten horietaz. Beharrezkoak dira, baina arazo asko sortzen dituzte ere.
Azken bi egunetan webgune hau askoz hobeto dabil, ez dakit nabaritu duzuen. Plonera pasatu ginenetik errendimendu arazo handiak izan ditugu. Kontua da lehendik eduki asko zegoela, blog asko, sarrera asko, eta blog bakoitzak etiketa asko. Horrek orri kopuruan eragiten du. Googlek 18.000 orri baino gehiago indexatuta ditu eibar.org webgunean eta hori, sarbidea mugatuta dugula toki askotara!
Eta Google ez da bakarra. Yahoo dago, eta MSN, eta Nsyght, Yodao, Gigablast, Kilomonkey eta ezagutzen ez ditugun beste ehundaka bilatzaile. Bakoitzak bere BOT-a (roBOT) dauka, etengabe webguneetan nabigatzen ari diren programa batzuk, dena irakurri eta indexatzeko. Klik egile nekaezinak dira robot hauek. Googleren robotak Googlebot izena du adibidez, eta Yahoorenak Slurp.
Denek jakin nahi dute zer dagoen Eibar.org-en, beraien emaitzetan erakusteko. Horrek ikaragarrizko karga eragiten du webgunean, jo ta su ari bait da zerbitzaria, edukia bilatzaileentzat prestatzen. Kontutan izan webguneko elementu guztiak direla dinamikoak, eskatzen diren momentuan sortzen direnak.
Soluzioak badaude eta Erralek martxan jarrita ditu, Squid bezalako katxe kudeatzaileak adibidez. Squid-ek webguneko elementuak gordetzen ditu, berriz sortu beharrik ez izateko. Kontua da bilatzaile hauek ez dabiltzala orri bisitatuenetan, portadan erakusten direnetan bakarrik. Barru-barruan sartzen dira, lotura absurduenean ere klik eginez, eta hori absurdua denez, inork ez du lehenago bisitatu, eta ez da katxean egoten.
robots.txt, soluzio radikala
Herenegun erabaki genuen modu tenporalean behintzat robotei sarrera debekatzea. Horretarako robots.txt fitxategia erabiltzen da. Fitxategi horretan robotei esaten diegu webgunearen zein zatitan sartu daitezkeen eta zeinetan ez. Hau ez da erabiltzaile arrunten aukera bat, webguneen administratzaileen esku dagoena baizik. robots.txt fitxategiak egiten ikasi hemen
Azkar nabaritu dugu eragina. Atzo eta gaur ondo nabigatu daiteke webgune honetan. Hau beste gauza bat da.
Baina, bizi gaitezke robotik gabe?
Ez dut uste. Beharrezkoak dira. Jendea Googlera joan eta bilaketa egiten du, eta zure webgunea ez badu aurkitzen, ez zara existitzen. Beraz, robots.txt-a aldatu eta gaurtik aurrera Googleri sartzen utzi diogu. Izan ere Google bidez dator webgune honetako bisitarien erdia, eta beste webgune batzuetan ehuneko hau oraindik handiagoa da.
Ez zaigu neurria gustatzen, Interneten neutralitatearen aurka doa eta. Baina momentu honetan beste soluziorik ez dugu, eta hau ere nahikoa izango den ezin dugu jakin. Ikusiko dugu egun pare batean nola doan gauza, eta epe ertainean jarraitu beharko dugu soluzio bila.
Bisitariok nabaritu duzue aldaketa?
oso hezigarria
Oso ekarpen ona Gari. Betidanik entzun izan ditut robot.txt inguruko komentarioak baina sekula ez dut garbi izan zer egiten duten eta zertarako diren. Artikulu honekin nituen zalantzak argitu zaizkit. Eskerrik asko.
Sindikazioa
Nik igarri dut aldaketa
Robotak
http://www.flickr.com/photos/51035610542@N01/sets/72157594291346788/
Eta bai, askoz ere arinago dabil orain eibar.org.
Eskerrik asko!
Apachek berak ere baditu tresnak
Guk horrelako arazoak eduki izan ditugu, eta apachek berak ere ematen du katxea kudeatzeko aukera.
Delicious-en sarrera dexente dauzkat gai honekin (apache tag-arekin), hemen adibide pare bat:
http://plone.org/documentation/tutorial/optimizing-plone/tutorial-all-pages
http://mnm.uib.es/gallir/posts/2006/09/26/819/
Seguru hau ere probatu dezuela, baina bueno, badaezpada ere.
Hontaz aparte, guk arazo bat genuen memoria ia guztia erabiltzen zuelako (zerbitzaria zahar xamarra da), eta swap partizioa ez genuen ondo eskalatuta. Hau konpontzeko swap memoria gehitu genion partizioko swap-ari fitxategi baten bidez swap gehiago sortuz.
Ondo segi.