Project information
Abstract: 

Coreference resolution is a key ingredient for the automatic interpretation of text. It has been studied mainly from a linguistic perspective, with an emphasis on establishing potential antecedents for pronouns. Practical applications, such as Information Extraction (IE), summarization and Question Answering (QA), require accurate identification of coreference relations between noun phrases in general. Computational systems for assigning such relations automatically, require the availability of a sufficient amount of annotated data for training and testing. For Dutch, annotated data is scarce and coreference resolution systems are lacking. In COREA, a robust system for assigning such relations automatically will be developed, and we will investigate the effect of making coreference relations explicit on the accuracy of systems for IE and QA.

Abstract Dutch: 

Coreferentieresolutie vervult een sleutelfunctie bij het automatisch interpreteren van tekst. Het is een probleem dat tot op heden vooral vanuit een linguïstisch standpunt werd bestudeerd. De nadruk lag daarbij dan vooral op pronominale coreferentieresolutie, nl. het zoeken van een antecedent voor een gegeven anaforisch voornaamwoord. Prakische toepassingen zoals informatie-extractie (IE), automatisch samenvatten en automatische vraag-beantwoord-systemen (QA) vereisen echter een correcte herkenning van de coreferentiële relaties tussen verschillende types nominale constituenten. Corpusgebaseerde computationele systemen die dergelijke relaties automatisch detecteren, moeten getraind en getest worden op voldoende geannoteerde data. Voor het Nederlands echter zijn er nauwelijks geannoteerde corpora beschikbaar en bovendien bestaan er geen automatische systemen voor de resolutie van coreferentiële relaties tussen nominale constituenten. In COREA zal er een robuust systeem ontwikkeld worden voor de resolutie van dergelijke coreferentiële relaties en zal het effect van coreferentieresolutie onderzocht worden op praktische toepassingen zoals IE en QA.

Project Leader(s): 
Walter Daelemans
External Collaborator(s): 

University of Groningen

Period: 
01/05/2005 - 31/10/2007
Sponsor(s): 

Nederlandse TaalUnie (STEVIN)

Syndicate content