Hiztegi Batua - Jardunaldia eta tresna berriak
Joan zen martitzenean, martxoak 23, 70 lagun inguru elkartu ginen Euskaltzaindiaren egoitzan, Bilbon, tartean Ahotsak.com egitasmoko zenbait kide. Egun guztiko jardunaldia izan zen. Andoni Sagarna antolatzaileak aipatu zuen moduan, Hiztegi Batuaren "stripteasea" egin zuten: euren lan egiteko modua azaldu, irizpideak, datu-basea, tresnak eta baliabideak aurkeztu... Interesgarria, oso; gustura egon ginen.
Jardunaldiak 3 atal nagusi izan zituen:
- Hiztegi Batuaren (HB) aurkezpena: izaera, irizpideak, xedeak...
- Jendaurreko aurkezpena: aurrerantzean Euskaltzaindiaren webgunean
kontsultagai egongo diren bi tresna lexikal berriak, hain zuzen ere,
Hiztegi Batu Oinarriduna (HBO) eta Lexikoaren Behatokia. - Hiztegi Batua osatzeko bidean erabiltzen diren hainbat corpus eta
tresna gainbegiratu ziren: Orotariko Euskal Hiztegia (OEH), XX. mendeko corpus estatistikoa, eta
abar.
Andoni Sagarna izan zen gidari nagusia, HB taldeko kidea eta Euskaltzaindiaren Iker sailburua. Bere alboan, baina, beste bi kide ere izan ziren: Jose Antonio Aduriz Hiztegi Batuko lantaldearen arduraduna eta Miriam Urkia, lantaldeko kide eta UZEIko arduradunetako bat. Aurkezpenak sareratu egin dituzte, euren webgunean (PDF, 360 Kb).
Hiztegi Batua
Goizeko lehenengo jardunean Hiztegi Batuaren inguruko gogoeta egin zen. Andoni Sagarnak Hiztegi Batuaren izaera eta xedea azaldu zituen:
- Euskaltzaindiaren egitasmo nagusienetakoa da.
- Helburu nagusia bat: Euskal hitzen forma estandarra zehaztea.
- Ondo finkatutako hitzak, literatura tradizioan erabilitakoak, azken hamarkadetako erabilerak finkatzen joan direnak.
- Ez ditu batzen idatzirik ez dagoena, desagertutako hitzak eta teknizismoak.
- Ez dira nahastu behar HB eta Euskararen Hiztegia. Hiztegi Batua ez da euskararen hiztegia.
Eta Jose Antonio Adurizek Erabakiak hartzeko irizpideei eman zien gainbegiratua, luze eta sakon. Lantaldearen irizpideak zeintzuk diren, informazio osagarria nola bideratzen den, eta abar (esandakoak bere aurkezpenean dituzue, PDF formatuan).
Orain arte hilean behin elkartzen zen Euskaltzaindia eta hortxe hartzen ziren behin-betiko erabakiak. Duela gutxi, baina, Batzorde ahaldun bat osatu da eta erabakiak bertan hartuko dira, azkarrago eta arinago.
Hiztegi Batu Oinarriduna (HBO)
Hiztegi Batua (HB) osatzeko lana orain dela 18 urte hasi zen eta bide horretan txosten eta material ugari sortu eta landu da. HBan erabaki bat hartzeko erabilitako ezkutuko informazio guzti hori sarean jarri du Euskaltzaindiak HBO aplikazioan. 18 urtean zehar Word dokumentuetan batutako lana datu-base batera erauzi da eta sarean ipini da. Bertan ikusi ahal izango dugu hitz bat edo aldaera bat onartzeko/baztertzeko bidean zer urrats eman diren (edo zati bat, behinipehin).
Lexikoaren Behatokia (LB)
Euskaraz erabiltzen dugun hiztegia finkatzeko orduan ezinbestekoak dira tradizioa eta orain arteko corpusetan bildutako hitzak, baina hizkuntzak bizirik daude eta derrigorrezkoa da gaur egungo hiztunek darabilten hizkera eta hiztegia ere jasotzea. Horretarako sortu da Lexikoaren Behatokia. Hori ere sarean eta kontsultagai aste honetatik aurrera.
Zer hitz berri ari dira azaltzen? Euskaltzaindiaren erabakiak errespetatzen dira? Zeintzuk bai? Zeintzuk ez? Zergatik?
Horretarako hedabideetako materiala jaso behar da eta horixe da LBaren helburua. Euskaltzaindiak bideratutako egitasmoa da, baina auzolanean egindakoa:
- UZEIk egiten du hasierako lana: materiala jaso, fitxak bete, katalogatu eta abar.
- Ondoren Elhuyarrek lantzen du corpus hori eta sareratzeko lana ere berea da.
- Eta IXA taldeak bideratzen du lan informatikoa, corpusaren tratamendu automatikoa.
Urtebetean 4 miloi hitz jaso dituzte (Berriatik); aurten 10 milioi hitz gehituko dira (Berria, Argia eta EITB); hurrengo 3 urteetan beste 40 milioi hitz (iturriak ere ugarituz).
Hala ere, Corpus oportunista bat da eta ez-orekatua (iturri gutxi batzuk, denak hedabideak, erregistro antzekoa, euskalkirik ez,...). Izan ere, oraindik erreferentziazko corpusa falta zaio euskarari: Euskararen Corpus Erreferentziala (euskararen corpus orokorra, erregistro, iturri, gai eta euskalki guztiak bilduko dituena). Lexikoaren Behatokia lehenengo urratsa izan daiteke bide horretan.
Orotariko Euskal Hiztegia (OEH)
Eguerdiko atsedenaldiaren ostean, arratsaldeko saioan, batez ere, Hiztegi Batua osatzeko orduan gainbegiratzen diren corpus eta baliabideak aztertu ziren. Miriam Urkiak Orotariko Euskal Hiztegia (OEH) eta XX. mendeko corpus estatistikoa aurkeztu zituen. Ezagunak nituen, baina hor ere gustura egon nintzen.
Lehenengoa, Orotariko Euskal Hiztegia (OEH), Euskaltzaindiak burutu duen egitasmo handienetakoa da, handiena ez bada. Corpus diakroniko itxia dela esan dezakegu. 1970. hamarkada arte iristen baita. 310 obra oso "aukeratu" biltzen ditu, 5.800.000 hitzek osatua; kodetu eta lematizatu gabea. Hala ere, euskararen historiaren altxor ezinbestekoa da. Sailkapen orokorra du: epea, euskalkia, eta testu mota zabala.
EEBS edo Corpus estatistikoa
Corpus Estatistikoa, aldiz, XX. mendeko euskara jasotzen duen corpus estatistikoa da, 4.658.036 testu-hitzez osatua. Erabili izan den eta erabiltzen den euskararen lekuko eta erakusgarri izatea du egiteko nagusi eta ez ereduzko hizkuntza proposatzea. Corpus estatistikoaren oinarria, XX. mendeko euskal argitalpenen inbentario osoa da, irizpide batzuen arabera sailkatua gainera (gaika, euskalkika eta kronologikoki). Argitalpenek osatzen duten unibertsotik abiatuta, osotasun hori proportzionalki adieraziko duen lagina eskuratu da zozketa bidez, orotara jasotako 6.351 obra-zatik osatzen dutena.
Flickerren argazki gutxi batzuk gehiago
Premina-preminazkoa ireki den bidea; poz ematen du.