Langue française n° 195 (3/2017)
Pour acheter ce numéro, contactez-nous
Recevez les numéros de l'année en cours et accédez à l'intégralité des articles en ligne.
Nous étudions les indicateurs de la cohésion (chaînes de référence et anaphoriques) par rapport à la complexité des textes au sein de deux corpus français qui s’adressent à plusieurs types de public (enfants/adultes pour le premier, apprenants de FLE pour le second). Cette étude a comme objectif la modélisation des aspects de cohésion textuelle des textes en vue de faciliter leur accessibilité pour les lecteurs. Pour ce faire, nous avons annoté les chaînes de référence dans les deux corpus. Nous comparons les propriétés de ces chaînes (longueur, nature des maillons, fonctions syntaxiques), en relation avec le niveau de difficulté, dans des textes informatifs et narratifs.
A coreference chain groups a set of referring expressions (or mentions) that all refer to the same extra-linguistic entity. Each mention may be annotated with linguistic interpretations, as well as links between mentions. As a consequence, one can find difficult to apprehend and quickly analyse a coreference chain. We present methodological prerequisites, so that the resulting annotated corpus can be exploited as well for machine learning purpose than for linguistic deep analyses. We therefore give precisions on the links that put together theoretical linguistics, computer-aided corpus linguistics, and natural language processing.