Testuen Trataera Automatikoaren Aplikazioak eta estandarrak
Aplikazioak
Testuen Trataera Automatikoaren teknologiari sarreratxoa eskaintzen dio Le traitement automatique des langues dans les industries de l'information Liburu Zuriak eta, adibide moduan, Testuen Trataera Automatikoaren zenbait aplikazio zehatzak aipatzen ditu.
Besteak beste, honako hauek:
- Zelata estrategikoa
- Zelata adimen ekonomikoan
- Web Atariak
- Sailkapen Automatikoa
- Patente kudeaketa
- E-merkataritza
- Enpresa Terminologia
- Lan eskaintzen kudeaketa
- Bilaketa motoreak
Testuen trataera automatikoaren aplikazioak aurrerakuntza eta errentagarritasun handia eskein diezaizkiete, beste beste, arlo hauei.
Estandarrak
Datuen trataeran estandarrak erabiltzean dago gakoetariko bat. Hau da, behar beharrezkoa da trukaketa eta interoperabilitatea arlo ezberdinetan:
- datu testualetan
- hizkuntz errekurtsoetan eta terminologietan
- meta data delakoetan
Ikerketaren arabera, de facto-ko estandarrak lortu ez direnez, soluzioa de jure-ko estandarrak definitzean dago.
ISO-k Hizkuntzaren Trataera Automarikoari zuzendutako arau familia definitu du, ISO-TC37-ren barnean. Bi mailatan:
- Maila bajuko arau edo norma batzuk: hizkuntz kodeak (ISO-639), script kodeak (ISO-15924), lurralde kodeak (ISO-3166), Unicode karaketeren kodeaketarako, etabar
- Maila altuko arau edo normak, askoz ere egiturauak: TMF (Terminological Markup Framework ISO-16642), enpresas terminologiei buruz elebakarrak edo eleanitzak; LMF (Lexical Markup Framework ISO-24613), hiztegiak hartzen ditu neurria handian; eta MAF (Morpho-syntactic Annotation Framework ISO-24611) Korpusen anotazioei buruz.
Hirurak XML lengoaian definituak daude, beraz interoperatibitate handia eskeintzen dute.