Edukira salto egin | Salto egin nabigazioara

Tresna pertsonalak

Eibarko peoria, San Blasa baino hobia
Hemen zaude: Hasiera / Blogak / e-gorblog / Nola hobetu zure COREBlog bloga V: Erantzun eta trackback-etako spam-a nola ekidin

Nola hobetu zure COREBlog bloga V: Erantzun eta trackback-etako spam-a nola ekidin

e-gor 2005/08/22 23:01
eibar.org eta goiena.net-eko blogetan aplikatzeko

Spam-a, gaur egungo informazioaren gizartearen gaitz handi hori, blogetara ere iristen da aurtengo otsailaz geroztik. Blogetako erantzunetan eta, batez ere, trackback-etan sartzen dizkigute propaganda mezu zikin horiek, gure blogak erabat kakaztuz, eta horiek garbitzeak ematen duten lana oso nekagarria da. Nik nire blogean spam-a automatikoki inoiz publikatzera ailegatu gabe ezabatzeko modua inplementatu dut, e-mail bidezko jakinarazpen eta guzti, eta artikulu honetan azalduko dut nola egin dudan Zope eta CoreBlog produktuak erabiltzen dituzten beste blogek (gutxienez Eibar.org eta Goiena.net-ekoak) erabili nahi badute.

Azken aldian blogariok (edo nik bai behintzat) erantzunetan eta trackback-etan spam asko jasotzen ari gara. Gure blogak ia egunero publizitate-mezuz betetzen dira. Horrek lan gehigarria eskatzen digu blogarioi, mezuok ezabatzen ibili behar baitugu.

Bloga ostatatuta dagoen plataforma batzuk spam-aren aurkako neurri edo produktuak dituzte. Eibar.org eta Goiena.net-eko blogek CoreBlog produktua erabiltzen dute eta honek, librea eta pertsona bakarrak garatutakoa izanik, ez du spam-aren aurkako ezer inplementatuta, eta norbera moldatu behar!

Batzuek blogean spam-a agertu eta gero ezabatzen ibiliko dira, lan haundia eskatzen duena. Beste batzuk erantzunak eta trackback-ak moderaziopean jarriko zituzten; hau txukunagoa da, bloga inoiz ez baita "zikin" agertuko, baina moderatze-lana ia ezabatzearena bestekoa da. Beste batzuk zuzenean trackback edo/eta erantzun aukerak kenduko zituzten, baina pena da spam-aren erruagatik bloga mugatzen ibili beharra...

Nik inplementatu dudan soluzioa oso garbia eta erosoa iruditzen zait:

  • Erantzun edo trackback bat publikatu ahala, automatikoki begiratzen da spam-a den ala ez.
  • Horretarako, izenburua hutsik dagoen edo bertan hitz jakin batzuk ote dauden begiratzen da (hitz zerrenda hau orain arte jaso dudan spam-arekin osatu dut, baina kontuan izanda ez dela komeni positibo faltsurik ematea). Metodoa oso efektiboa dela iruditzen zait: orain arte inoiz ez dit positibo faltsurik eman, eta mezu mota berri bat agertzen delako ez detektatzea hilean behin-edo gertatzen zait soilik (eta orduan, hitz berriren bat gehitzen dut zerrendan eta kitto).
  • Erantzun edo trackback-a spam dela uste bada, automatikoki ezabatzen da.
  • E-mailez abisua iristen zait norbait erantzun edo trackback bat bidaltzen saiatu dela, spam-tzat hartu dela eta ezabatu egin dela, mezuaren datu guztiak erantsiz. Horrela, positibo faltsua izan bada, beti dago aukera berriz publikatzeko. Norbaitek pentsa lezake spam horiek gure postontzian jasotzea "rollo" bat dela, horrela bada aukera hori ken daiteke; niri ez zait hain gogorra egiten, Google-n GMail posta dudalako eta spam mezu horiek guztiak konbertsazio bakarrean pilatzen dizkidalako (norbaitek GMail posta kontu bat eduki nahi badu, niri idaztea besterik ez du, gonbidapenak ditut emateko).
  • Egia esan, e-maila bidaltzearena spam-a izan nahiz ez egiten du, horrela bide batez norbaitek erantzunen bat publikatzen duenean segituan enteratzen naiz postaren bidez, blogean sartzen ibili beharrik gabe.

Jarraian erakutsiko dizuet nola egin daitekeen hau. Hasteko, "spamstrings" izeneko Script (Python) bat sortu behar dugu gure blogean, eduki honekin:

spam_strings=[
"adipex",
"alprazolam",
"ambien",
"bankruptcy",
"betting",
"biaxin",
"black",
"blackjack",
"care",
"cash",
"carisoprodol",
"casino",
"casinos",
"celebrex",
"cialis",
"cipro",
"construction",
"craps",
"credit",
"crestor",
"debt",
"diet",
"diets",
"gambling",
"health",
"hold",
"holdem",
"hydrocodone",
"jack",
"keno",
"levitra",
"loan",
"loans",
"lose",
"mortgage",
"mortgages",
"naproxen",
"omaha",
"partypoker",
"paxil",
"pharmacy",
"pharmacies",
"phentermine",
"pill",
"pills",
"plavix",
"poker",
"pokers",
"prescription",
"prescriptions",
"prilosec",
"refinance",
"roulette",
"rules",
"skin",
"slot",
"slots",
"strip",
"stud",
"texas",
"tournaments",
"training",
"tramadol",
"viagra",
"weight",
"wellbutrin",
"wsop",
"xenical",
"zithromax"]
return spam_strings

Nabarituko zenutenez, hemen gordetzen dira spam mezuek normalean izaten dituzten hitzak.

Gero, "methods" karpetan "addCommentHook" izeneko Script (Python) bat sortuko dugu (hau erantzun bat publikatzen denero exekutatzen da automatikoki, CoreBlog-en FAQ-ean azaltzen den bezala), "d" parametroa jasoko duena, eta hau idatziko dugu barruan:

spam_strings=context.spamstrings()
found=0
if d["title"]=="":
    found=1
words=d["title"].split()
for word in words:
    if word.lower() in spam_strings:
        found=1
if found==1:
    context.get_entry(int(d["parent_id"])).deleteComment(int(d["id"]))
    spammezua="Spam-tzat hartu eta ezabatu egin da\n"
else:
    spammezua=""
try:
    mailhost=getattr(context, context.superValues("Mail Host")[0].id)
except:
    raise AttributeError, "Mail Host object cant be found."
to_addr="gureposta@guredomeinua.com"
from_addr="gurebloga@guredomeinua.com"
mMsg="""To: %s
From: %s
Mime-Version: 1.0
Content-Type: text/plain;
Egilea %s
E-posta %s
URLa %s
Izenburua %s
IDa %s
Mamia
%s
%s
Kudeatzeko %s/%s/manage_comments
""" % (to_addr , from_addr , d["author"] , d["email"] , d["url"] , d["title"] , str(d["parent_id"]) , d["body"] , spammezua , context.blogurl() , str(d["parent_id"]))
mTo=to_addr
mFrom=from_addr
mSubj="Erantzuna gehitu da zure blogean!"
mailhost.send(mMsg, mTo, mFrom, mSubj)

Ondoren, berriz ere "methods" karpetan "addTrackbackHook" izeneko Script (Python) bat sortuko dugu (hau trackback bat publikatzen den bakoitzean automatikoki exekutatuko da), "d" parametroa jasoko duena, eta hau idatziko dugu bertan:

spam_strings=context.spamstrings()
found=0
if d["title"]=="":
    found=1
words=d["title"].split()
for word in words:
    if word.lower() in spam_strings:
        found=1
if found==1:
    context.get_entry(int(d["parent_id"])).deleteTrackback(int(d["id"]))
    spammezua="Spam-tzat hartu eta ezabatu egin da\n"
else:
    spammezua=""
try:
    mailhost=getattr(context, context.superValues("Mail Host")[0].id)
except:
    raise AttributeError, "Mail Host object cant be found."
to_addr="gureposta@guredomeinua.com"
from_addr="gurebloga@guredomeinua.com"
mMsg="""To: %s
From: %s
Mime-Version: 1.0
Content-Type: text/plain;
Egilea %s
URLa %s
Izenburua %s
IDa %s
Mamia
%s
%s
Kudeatzeko %s/%s/manage_trackbacks
""" % (to_addr , from_addr , d["blog_name"] , d["url"] , d["title"] , str(d["parent_id"]) , d["excerpt"] , spammezua , context.blogurl() , str(d["parent_id"]))
mTo=to_addr
mFrom=from_addr
mSubj="Trackback-a gehitu da zure blogean!"
mailhost.send(mMsg, mTo, mFrom, mSubj)

Eta kitto! Honekin nahikoa da. Aurrerantzean, norbaitek erantzun edo trackback bat bidaltzean, spam-a bada automatikoki ezabatuko da, inoiz publikatuta agertu gabe, eta spam-a izan nahiz ez, e-postaz abisatuko zaigu; horrela, positibo faltsua bada, berriz publikatuko ahal izango dugu; eta negatibo faltsua bada, mezuan bertan doan estekan klik eginda ezabatu ahal izango dugu eta hurrengorako spam kateen zerrenda eguneratu ahal izango dugu.

Aurreko artikuluak:

etiketak: informatika, e-gorblog
eneko
eneko dio:
2005/08/26 07:06

eibar.org, goiena.net edo mutriku aldeko blog berrietan... ikusi Atxukale atariko tolon bloga .

Baina arrazoia duzu, ea Arrateko amak entzuten dituen spamaren aurkako plegariak ;-)

Iruzkina gehitu

Erantzuna formulario hau betez utzi dezakezu. Formatua testu arruntarena da. Web eta e-posta helbideak automatikoki klikagarri agertuko dira.

Galdera: Idatzi zortzi zenbakiak erabiliz
Erantzuna:
e-gorblog

e-gorblog

Egunez, Igor Leturia Azkarate pertsona arrunta da. Errenterian bizi den arrasatearra, 8etatik 17etara Elhuyarren lan egiten du eta arratsaldeak neskalagunarekin eta bere bi umeekin pasatzen ditu.

Baina gaua iritsi eta umeak lotara joaten direnean, e-gor bihurtzen da, interneteko bere alter-egoa, ziberespazioko informatikaririk komikizaleena eta komikizalerik informatikariena! Bere superbotereekin (interneteko kable-konexioa, bloglines, informatika aldizkariak, gadget-ak, komiki-bilduma, Errenteriko liburutegiko komikien atala eta batez ere bere jakinmin aseezina) eta bere superlaguntzaileak ondoan dituela (Patxi Lurra, DabilenHarria...), euskaldunon teknofobiaren eta komikiei buruzko aurreiritzien aurka burrukatzen du etengabe! Hemen duzu bere bloga: e-gorblog!

Bai, hor goiko aurkezpena superheroi batena da (ezin aproposagoa honelako blog batentzat, ezta?). Superheroia banintz zein izango nintzatekeen jakiteko the Superhero Personality Test egin nuen eta hona emaitzak:

You are Spider-Man
You are intelligent, witty, a bit geeky and have great power and responsibility.

Spider-Man
80%
Superman
70%
Green Lantern
65%
Robin
65%
The Flash
60%
Supergirl
55%
Hulk
55%
Iron Man
45%
Wonder Woman
35%
Catwoman
25%
Batman
0%
Lizentzia

Creative Commons-en baimena
Blog honetako edukia, Igor Leturiak eta beste kolaboratzaile batzuek egiten dutena, Creative Commons Aitortu-PartekatuBerdin 3.0 Unported baimen baten mende dago (irudiak salbu).

Harpidetza
Erantzunen harpidetza
Artxiboa
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024
Artikulu aipagarriak

MythTV sorta
2004/11

"Pololoak" sorta
2004/11-12 - 2006/10-12 - 2007/02-03

Monoblogoa
2005/01/11

"Persepolis", xalotasunaren sakontasuna
2005/01/25

Elgetako Blogs&Beers 2005: nire inpresioa eta moblogging kontuak
2005/04/18

Firefox eta bere plugin zoragarriak
2005/05/11

"El País"-en komiki bilduma
2005/05/15

Euskarazko bi blog berri (bai, beste bi, baina hauek bereziak dira!)
2005/05/25

"Watchmen" sorta
2005/09-11 - 2006/10 - 2007/10 - 2008/07

"La cárcel de papel"-eko "Mis tebeos favoritos" saila I: 1etik 20ra
2005/11/08

"Goienkaria"-n agertu naiz
2005/12/08

Komikiak eta euskal rock-a
2005/12/14

Ruben Arozena "Ruben" komikigilea hil da
2006/01/02

Zope-rako DTML Calendar Tag produktua, euskaraz
2006/02/01

"Joyas Literarias Juveniles" bilduma, osorik eMule-n
2006/08/05

Argazkigintza eta DRM-a
2006/10/09

Paul Auster eta Euskararen Herria
2006/10/29

Angoulême sorta
2007/01-02

Gaur duela 25 urte nire bizitza aldatu zen
2007/04/23

Hergé-ren defentsan
2007/05/22

Ubuntu-ren bertsio berria, hobekuntza askorekin
2007/07/02

OLPC sorta
2007/12 - 2008/01

Guillermo Zubiaga, Marvel-eko komikilari euskalduna
2008/02/05

Asus EEE PC, ordenagailu txiki eta merkeen hurrengo sorta
2008/03/11

Agur, Ipurbeltz, agur... :-(
2008/08/04

"Café Budapest", gizatasuna eta bizikidetzaren aldeko aldarria
2008/08/25

"Arturo Erregea" serie mitikoa, Euskal Encodings-en! (beste askorekin batera)
2008/09/17

"Gazteak", beste serie mitiko bat euskaraz eskuragai!
2008/10/14

Pottokiek 50 urte!
2008/10/22

Europan ere OLPC-ren XO ordenagailuak erosteko aukera!
2008/11/12

Microsoft-en web zerbitzuetako gehienak, euskaraz!
2008/12/04

"Heroes"-en 2. denboraldia: ETB kirtenkeria errepikatzera, eta Euskal Encodings konpontzera
2009/01/23

I. Euskal OLPC Party-a, apirilaren 23an Donostiako Doka kafe antzokian
2009/04/16

Elkarrizketa egin didate 7K-n
2009/06/03

Azpiriren Spectrum-entzako jokoen azalak liburu batean
2009/10/06

Asterix, heroi garaitua
2009/10/29

"Ihes ederra", euskarazko komikigintzaren heldutasunaren konfirmazioa
2009/11/13

Pololoak 3: The making of
2009/11/22

5 urte 5!
2009/12/15

Nobela grafikoa, komikien prestigiorako ala mespretxurako?
2009/12/20

"Pololoak 3 - Atxeritoko balada", trilogiaren amaiera borobila
2010/01/13

Sinclair ZX Spectrum bat oparitu didate!
2010/01/19

Zergatik ez dudan liburu elektronikorik erosiko (gauzak aldatzen ez diren artean)
2010/01/27

Errealitate areagotua: munduaren pertzepzioa aberasten
2010/02/09

e-gorblog, "Nick dut nik" telebista saioan
2010/05/20

Sarearen neutraltasunari erasoak: Interneten izaera arriskuan
2010/06/02

"Avatar, azken aire maisua" osoa eta "Heroiak"-en lehen bi denboraldiak, Euskal Encodings-en
2010/07/22

Sistema eragileen guda berria
2010/12/14

Anubis 3.0 albumarentzat 3D animazio ederra
2010/12/27

Telebistaren benetako iraultza hemen da, eta ez da LTDa
2011/01/10

"Asterix galiarra" eta "Urrezko igitaia" berrargitaratu ditu Salvatek
2011/01/13

Euskarazko komikigintza digitalizazioaren aurrean
2011/01/27

"Ihes ederra"ren gaztelaniazko eta katalanezko bertsioak eta "Alokairuan", kalean
2011/02/20

Star Wars jatorrizko trilogia, euskaraz
2011/03/21

Sare sozialetan preso
2011/04/06

Zer dudan Steve Jobsen, edo Appleren, aurka
2011/10/14

Gaur 100 urte Adèle Blanc-Sec-en abenturak hasi zirela
2011/11/04

Euskarazko 8 komiki berri
2011/12/02

Social networks killed the RSS star?
2012/06/10