LANGAGES Nº 224 (4/2021)
Pour acheter ce numéro, contactez-nous
Recevez les numéros de l'année en cours et accédez à l'intégralité des articles en ligne.
Les expressions référentielles qui désignent exactement le même référent constituent les maillons d’une chaîne de coréférence. Il arrive que le référent d’une expression soit difficile à identifier précisément et soit impliqué dans une relation de coréférence floue. Ce phénomène ne pose pas de problème lors de la lecture d’un texte mais peut générer des difficultés lors de l’annotation de corpus en coréférence. Nous proposons une analyse de l’annotation de certains marqueurs vecteurs de flou référentiel dans le corpus DEMOCRAT, annoté en coréférence stricte. Ces marqueurs ont généré des conduites d’annotation différentes. Pour homogénéiser ces conduites, nous proposons des précisions à ajouter au manuel d’annotation ainsi que la prise en compte de la coréférence floue dans le schéma d’annotation.
A coreference chain designates the set of referential expressions that refer to the same exact referent. The referent of an expression is sometimes difficult to identify with precision and involved in a fuzzy coreference relationship. For a reader, this lack of precision does not necessarily create difficulties, but it may generate complications during the coreference annotation. We provide an analysis of the annotation of some markers that generate referential fuzziness in the DEMOCRAT corpus, annotated in strict coreference. These markers have generated different annotation behaviors. In order to homogenize these behaviors, we propose precisions to be added to the annotation manual and the consideration of fuzzy coreference in the annotation scheme.