« Mais l’algo, là, il va mimer nos erreurs ! »

Dossier
Contraintes et effets de l’annotation des données d’entraînement d’une IA
Par Camille Girard-Chanudet
Français

Les techniques d’apprentissage automatique traitent algorithmiquement des données fournies en entrée. Celles-ci font, au préalable, l’objet d’un travail d’annotation manuelle visant à en identifier les éléments saillants à des fins d’entraînement des modèles. Fastidieux et souvent déconsidéré, ce travail du clic façonne pourtant une « vérité » de référence pour l’IA, qui conditionne en grande partie les résultats produits. Cet article étudie les modalités d’exécution de ce travail et ses effets à partir de l’étude du cas de la conception d’un outil d’anonymisation automatique des décisions de justice au sein de la Cour de cassation. Enquête ethnographique et par entretiens permettent de mettre en évidence la pluralité des compétences mobilisées par les acteurs chargés de l’annotation des données. L’article montre l’importance des systèmes représentationnels et moraux dans la mise en œuvre de cette activité, et donc, pour le fonctionnement de l’IA.

Mots clés

  • IA
  • annotation
  • classification
  • algorithme
  • données
  • travail
Voir l'article sur Cairn.info