Face aux discriminations systémiques de l'intelligence artificielle dans le recrutement, le crédit et la justice, un protocole en quatre actions permet de construire des algorithmes plus équitables. Découvrez comment diversifier les équipes, auditer les systèmes, équilibrer les données et appliquer des normes éthiques pour lutter contre les biais de l'IA.
Dans « L'IA expliquée à ma grand-mère », Arthur Gressier expose comment les algorithmes reproduisent et amplifient les discriminations historiques. Le chapitre 11.3 présente un protocole en quatre leviers pour construire une IA plus juste. Aucune solution n'est suffisante isolément, mais leur combinaison offre une approche robuste contre les biais algorithmiques.
1. Diversifier les équipes de conception
La diversité des équipes constitue la première ligne de défense contre les discriminations algorithmiques. Chaque personne porte ses angles morts cognitifs : un ingénieur blanc de 30 ans ne détectera pas spontanément les problèmes qu'une femme noire de 50 ans identifiera immédiatement.
« Plus l'équipe est diverse en termes de genre, d'origine ethnique, d'âge et de parcours, plus elle a de chances de détecter les déséquilibres potentiels avant qu'ils ne contaminent le système. »
L'initiative européenne BLOOM illustre parfaitement cette approche interdisciplinaire. Elle développe un modèle équivalent à ChatGPT en associant philosophes, sociologues et historiens aux programmateurs. Cette diversité d'expertises permet un filtrage important des textes utilisés pour l'entraînement.
Concrètement, la diversification passe par :
- L'orientation de davantage de femmes et personnes issues de groupes minoritaires vers les disciplines STIM (science, technologie, ingénierie et mathématiques)
- L'adoption de politiques de recrutement plus diversifiées dans les professions du développement IA
- La sensibilisation des équipes existantes aux questions d'équité et de biais cognitifs
2. Auditer régulièrement les systèmes
La vigilance continue est indispensable pour maintenir l'équité des systèmes IA. Les audits réguliers permettent de détecter les discriminations avant qu'elles n'affectent des milliers de personnes.
« Afin de protéger les individus et de ne pas perdre la confiance du public, les entreprises doivent assurer l'équité, la précision et la transparence des systèmes d'IA. »
Les audits efficaces reposent sur des tests systématiques évaluant la performance des algorithmes sur différents groupes démographiques. Ces tests vérifient qu'aucun groupe ne subit de désavantage en raison d'un manque de diversité dans les données d'entraînement.
Les méthodes d'audit incluent :
- L'examen attentif des données d'entrée pour les rendre plus proches de la réalité
- Le rééquilibrage des données en ajoutant ou supprimant des observations
- La correction du contenu de certaines variables discriminantes
- L'ajustement de la façon dont le système évalue les informations
Un exemple de succès : après avoir constaté que leur programme DALLE-2 présentait des défauts de représentation des minorités, les développeurs d'OpenAI ont mis en œuvre une technique augmentant la diversité des groupes représentés dans les images produites.
3. Créer des jeux de données équilibrés
La qualité et la représentativité des données d'entraînement constituent le socle de tout système équitable. Sans données diversifiées, même les meilleures intentions échouent.
« Pour réduire les déséquilibres liés au genre dans l'IA, il est crucial que les données utilisées pour entraîner les systèmes d'IA soient diversifiées et représentent tous les genres, races et communautés. »
Trois techniques principales permettent de rééquilibrer des jeux de données biaisés :
- Sur-échantillonnage : Ajouter davantage d'exemples issus de catégories sous-représentées. Si votre jeu contient 1000 photos d'hommes mais seulement 100 photos de femmes, ajoutez des photos de femmes jusqu'à atteindre un équilibre.
- Sous-échantillonnage : Réduire la présence excessive de certaines catégories sur-représentées. Dans l'exemple précédent, réduire le nombre de photos d'hommes à 100 pour équilibrer.
- Création de données synthétiques : Générer des données artificielles représentatives des groupes minoritaires pour compenser leur absence dans les bases d'apprentissage.
L'utilisation de données alternatives joue également un rôle clé. Dans le domaine du crédit, intégrer des informations comme les paiements de loyer ou de factures aide à évaluer la solvabilité de personnes sans historique bancaire traditionnel, réduisant ainsi les discriminations.
4. Établir des régulations et normes éthiques
Au-delà des bonnes pratiques techniques, le cadre juridique joue un rôle déterminant pour garantir l'équité algorithmique à grande échelle.
« Selon Ashwini K.P., Rapporteuse spéciale des Nations Unies, la réglementation de l'IA est nécessaire pour garantir son équilibre. Elle recommande aux États de s'attaquer de toute urgence à la question de la réglementation de l'IA en gardant à l'esprit la façon dont elle perpétue la discrimination. »
L'Union européenne a mis en place un cadre réglementaire strict avec sa proposition de règlement sur l'intelligence artificielle, imposant des obligations de diligence, de transparence et de mesures contre les risques liés aux déséquilibres. Cette approche repose sur le concept d'éthique dès la conception, intégrant les préoccupations d'équité à chaque étape du cycle de vie d'un algorithme.
Aux États-Unis, le gouvernement a publié des directives pour les employeurs sur les risques discriminatoires des logiciels d'embauche automatisés. Depuis avril 2023, les employeurs de New York doivent informer les candidats de l'utilisation de ces technologies et mieux les examiner pour y débusquer les préjugés.
La transparence algorithmique devient un enjeu majeur. L'idée est de rendre publics ou de mettre sous séquestre des algorithmes pour les auditer et étudier les difficultés potentielles. Cette transparence se heurte cependant à la résistance de certaines entreprises invoquant le secret commercial.
Mise en œuvre concrète du protocole
L'application simultanée de ces quatre actions crée un cercle vertueux. Les équipes diverses détectent mieux les biais potentiels, les audits réguliers révèlent les discriminations émergentes, les données équilibrées réduisent les préjugés à la source, et les régulations garantissent l'application généralisée de ces bonnes pratiques.
Selon les recherches sur les biais algorithmiques, cette approche multidimensionnelle est essentielle car aucune solution unique ne peut résoudre un problème aussi complexe que les discriminations systémiques de l'IA.
Les entreprises doivent intégrer ces actions dans leur processus de développement dès le début, plutôt que de tenter de corriger les biais après coup. Cette approche préventive s'avère plus efficace et moins coûteuse que les corrections tardives.
Points clés à retenir
- La diversité des équipes de conception permet de détecter les angles morts et préjugés inconscients avant qu'ils contaminent les systèmes.
- Les audits réguliers avec des tests sur différents groupes démographiques révèlent les discriminations émergentes.
- L'équilibrage des données par sur-échantillonnage, sous-échantillonnage ou création synthétique corrige les biais à la source.
- Les cadres réglementaires stricts avec obligations de transparence garantissent l'application généralisée des bonnes pratiques.
- L'application simultanée de ces quatre actions crée un cercle vertueux pour une IA plus équitable.
Pour approfondir cette méthode et découvrir des exemples concrets de discriminations algorithmiques dans le recrutement, le crédit et la justice, consultez « L'IA expliquée à ma grand-mère » d'Arthur Gressier. Le chapitre 11 offre une analyse complète des biais de l'intelligence artificielle et des solutions pour les combattre.
Les informations de cet article s'appuient sur l'ouvrage de référence cité. Elles ne remplacent pas un accompagnement par un professionnel spécialisé en éthique de l'IA ou en conformité algorithmique. Pour la mise en œuvre de systèmes d'IA dans votre organisation, consultez des experts qualifiés.