Forum Barcelona 2004 | Español | English | herramientas Inici Mapa de continguts Buscador Mida textMida text text petita 11px text mitjana 14px text gran 17px
Continguts > 42a Reunió Anual de l'Associació de Lingüística Computacional. Comunicació i llenguatge en l´era digital > La semàntica lèxica (Lexical Semantics)
Documents Envia a un amicEnvia a un amic ImprimeixImprimeix
Resum sessió Resum sessió
La semàntica lèxica (Lexical Semantics)
Diàleg de referencia: 42a Reunió Anual de l'Associació de Lingüística Computacional. Comunicació i llenguatge en l´era digital

Algunes de les tasques dels ordinadors en el terreny de la lingüística computacional es poden complicar si en l’anàlisi hi ha elements relacionants (preposicions, conjuncions, etc.) que dificulten el valor temàtic d’algunes categories gramaticals. Per alliberar el text d’aquest llast es proposen models d’aïllament lèxic, en els quals es caracteritza la categoria i se li assigna un paper temàtic, tant si aquesta depèn del nucli verbal o només de les relacions entre constituents.

L’establiment dels complements del verb a través de sistemes informàtics és una qüestió complexa perquè no es tenen en compte gaires anomalies pròpies del llenguatge natural. WordNet, en concret, pren com a referència dues qüestions bàsiques (en el cas de l’anglès): una ontologia general dels substantius i una classificació dels verbs.

L’establiment de predicats genèrics estarà influït per la dependència semàntica dels verbs amb els seus complements (que també es marca mitjançant construccions de règim preposicional) que es van catalogant fins arribar a una base de dades de diferents funcions gramaticals. Un exemple significatiu és el verb anglès «gain», que pot funcionar amb els rols semàntics de pes (weight), possessió (possession) o un valor locatiu (reach-a-location). Dintre de la base de dades de WordNet, aquests rols semàntics es van classificant amb números per poder-los aplicar a l’hora de fer l’anàlisi sintàctica, amb la qual cosa aquest arxiu està adquirint un gran valor dins dels estudis de semàntica lèxica.

La identificació de lexemes dintre d’un text (i el paper que juguen) no s’ha de fer a través d’un criteri purament sintàctic o purament semàntic, sinó combinant les virtuts d’alguns algoritmes d’anàlisis que pertanyen a cadascuna d’aquestes disciplines. Per provar això es va dur a terme un experiment en el qual es prenia part del funcionament del parser Penn-II Treebank (que té per objectiu l’anàlisi en forma d’arbre), i en concret la part que s’encarrega de la categorització de les paraules sense arribar a la descomposició de la clàusula en un esquema arbori (simplement es queda en la f-structure, que defineix les categories gramaticals de cada una de les paraules del text estudiat). El que es pretén amb això és que, juntament amb la divisió temàtica, se sàpiga quin lloc ocupen els lexemes en la seqüència sintàctica sense haver de dependre de marcadors preposicionals que determinin un tipus de complement o un altre. L’ordre en què estan col·locats els elements, les relacions semàntiques entre ells i les categories a les quals pertanyen, són els únics criteris vàlids en aquesta experiència. Tot això amb l’objectiu de poder identificar relacions entre elements allunyats entre ells (qüestions de referència anafòrica) i saber si una clàusula està en veu activa o passiva (d’aquí la importància dels actants).

Basat en les ponències: - «Building Verb Predicates: A Computational View»,de Fernando Gómez - «Large-Scale Induction and Evaluation of Lexical Resources from the Penn-II Treebank», de Ruth O'Donovan et al.

Pujar
Per paraula clau
Doc. més relacionats
RS L’anàlisi sintàctica i semàntica (Synthax/Semantic Parsing)
 
RS Tallers, seminaris i una conferència associada (Workshops)
 
RS Preguntes i respostes
 
RS La coreferència i l’anàfora
 
RS El processament de la parla conversacional (Conversational Spoken Language Processing)
 

Els més de 800 Resums de Sessió que s’han generat durant els 141 dies de diàlegs al Fòrum BCN 2004 han estat realitzats gràcies a la participació de més de 70 estudiants i llicenciats universitaris, als quals agraïm el seu esforç desinteressat.