Le traitement automatique des langues pour les sciences sociales

Dossier  : Méthodes digitales. Approches quali/quanti des données numériques
Quelques éléments de réflexion à partir d'expériences récentes
Par Thierry Poibeau
Français

La masse de données textuelles aujourd’hui disponible permet d’envisager les sciences sociales sous un jour nouveau, dans la mesure où les textes regorgent d’éléments d’informations jamais exploités jusqu’ici. La difficulté consiste alors à accéder à la bonne information, à la « normaliser » puis à la mettre en contexte, dans la mesure où cette information doit être formatée pour être exploitable par d’autres outils automatiques. Cet article présente un panorama des techniques de traitement automatique des langues utilisées de nos jours et examine surtout une série de réalisations concrètes, permettant de mettre en avant ce qui fonctionne, mais aussi les limites des systèmes actuels.

Voir l'article sur Cairn.info