Siri, Alexa, Cortana, Google Voice ChatGPT 4o, ce n’est pas une coïncidence s’ils ont tous des voix (et parfois même des noms) féminines. En fait, Spike Jonze a même littéralement nommé son film dystopique basé sur l’IA “Her” ; d’après l’assistante IA du film, Samantha. Avec Scarlett Johansson, le film partait d’un postulat qui semblait absurde il y a 11 ans, mais qui semble aujourd’hui tout à fait réaliste après l’annonce par OpenAI de son modèle d’IA GPT 4o (omni) basé sur la voix. L’annonce a été suivie d’une levée de boucliers de la part de Johansson, qui a affirmé que l’IA lui ressemblait beaucoup, bien qu’elle n’ait pas donné à OpenAI l’autorisation d’utiliser sa voix. Mme Johansson a indiqué que Sam Altman, PDG d’OpenAI, lui avait proposé d’être la voix de GPT 4o, mais qu’elle avait décliné l’offre. Quelques jours avant l’annonce de GPT 4o, M. Altman lui a de nouveau demandé de reconsidérer sa proposition, mais elle a toujours refusé. GPT 4o a été annoncé il y a exactement 10 jours, le 13 mai, et Johansson a clairement reconnu que la voix ressemblait beaucoup à la sienne. Si beaucoup affirment que les voix ne se ressemblent pas, il est indéniable qu’OpenAI cherchait une voix qui ressemble à celle de Samantha dans Her plutôt que d’opter pour une voix plus féminine mais mécanique comme celle de Siri ou de Google Voice. Tout cela soulève quelques questions : pourquoi la plupart des assistants vocaux d’IA ont-ils des voix féminines, comment les humains perçoivent-ils ces voix, pourquoi ne voit-on pas autant d’assistants vocaux masculins (et le « mansplaining » joue-t-il un rôle à cet égard) ? Enfin, les assistants vocaux féminins aident-ils ou nuisent-ils aux femmes et à l’égalité des sexes à long terme (indice : un peu des deux, mais la seconde hypothèse semble la plus probable) ?
Assistants vocaux : Histoire
L’histoire des assistants vocaux remonte bien avant 2011, date à laquelle Siri a été présenté pour la première fois au monde… ; cependant, beaucoup de ces cas relevaient de la fiction et de la culture pop. Siri a été le premier assistant vocal basé sur l’IA, mais l’histoire remonte à plusieurs décennies. On ne peut pas vraiment attribuer à Siri le mérite d’avoir été la première voix féminine automatisée, car pendant des années, les SVI ont dominé les conversations téléphoniques – vous vous souvenez des voix automatisées lorsque vous appeliez le centre de services d’une entreprise, comme votre banque, votre câblo-opérateur ou votre fournisseur d’accès à internet ? Historiquement, les voix étaient souvent féminines, ce qui a ouvert la voie à Siri en 2011. En fait, l’histoire remonte à 1878, lorsque Emma Nutt a été la première femme téléphoniste, inaugurant ainsi une profession entièrement dominée par les femmes. Contrairement aux précédentes voix de SVI, Siri ne débite pas de phrases préenregistrées. Elle a été formée à la voix d’une vraie femme et a conversé avec vous (du moins à ce moment-là) comme un véritable être humain. Le choix d’une voix féminine pour Siri a été influencé par des études d’utilisateurs et des facteurs culturels, dans le but de rendre l’IA sympathique et accessible. Cette décision n’était pas un cas isolé, mais a marqué le début d’une tendance plus large dans l’industrie technologique. Dans la culture pop, cependant, c’est le contraire qui s’est produit. Bien avant Siri en 2011, JARVIS est entré en scène dans le film Iron Man de 2008 en tant qu’assistant vocal masculin. Bien que quelque peu robotisé, JARVIS pouvait faire à peu près n’importe quoi, comme contrôler les moindres détails de la maison, du costume et de la vie de Tony Stark… ; et même, potentiellement, devenir un voyou. Mais au-delà de cela, les études montrent quelque chose de très intéressant sur la façon dont les humains perçoivent les voix féminines.
Historiquement, les robots sont masculins et les assistants vocaux féminins.
La prédominance des voix féminines dans les systèmes d’IA n’est pas accidentelle. Plusieurs facteurs contribuent à cette tendance :
- Les préférences des utilisateurs : Des études indiquent que de nombreux utilisateurs trouvent les voix féminines plus apaisantes et plus agréables. Cette préférence guide souvent les décisions de conception des développeurs d’IA, qui cherchent à créer une expérience utilisateur confortable.
- Connexion émotionnelle : Les voix féminines sont traditionnellement associées à des fonctions d’aide et de soins. Cela correspond bien à l’objectif de nombreux systèmes d’IA, qui sont conçus pour aider et soutenir les utilisateurs dans diverses tâches.
- Étude de marché : Les entreprises ont souvent recours à des études de marché pour déterminer les moyens les plus efficaces de susciter l’intérêt des utilisateurs. Les voix féminines ont toujours obtenu de bons résultats dans ces études, ce qui a conduit à leur adoption généralisée.
- Influences culturelles : Les influences culturelles et sociales déterminent la manière dont les voix sont perçues. Par exemple, dans de nombreuses cultures, les voix féminines sont associées de manière stéréotypée à des rôles de service (par exemple, réceptionnistes, service à la clientèle), ce qui peut influencer les décisions de conception.
Il ne s’agit là que de théories et d’études, et le revers de la médaille est tout aussi intéressant. Les robots physiques sont souvent construits avec des physiques et des proportions masculins, car leur fonction principale, qui consiste à soulever des objets et à déplacer des charges, est aussi traditionnellement exercée par des hommes. Là encore, la culture populaire joue un rôle clé : les Transformers sont essentiellement masculins, tout comme Terminator, T-1000, Ultron, C3PO, Robocop… et la liste est encore longue. la liste est sans fin.
Que disent les études sur les voix masculines et féminines dans l’IA ?
De nombreuses études ont analysé l’impact du genre sur les voix de l’IA, révélant une série de données qui nous aident à comprendre les préférences et les perceptions des utilisateurs. Voici ce que ces études révèlent :
- La sympathie : Des études indiquent que les utilisateurs ont tendance à apprécier davantage les voix féminines. Cela peut améliorer l’efficacité de l’IA dans les fonctions de service à la clientèle et d’assistance, où le confort et la confiance de l’utilisateur sont primordiaux.
- Confort et engagement : Les voix féminines sont souvent perçues comme plus réconfortantes et plus engageantes, ce qui peut améliorer la satisfaction des utilisateurs et la qualité de l’interaction. Cet aspect est particulièrement important dans des applications telles que l’aide à la santé mentale, où un ton apaisant peut faire toute la différence.
- Autorité perçue : Les voix masculines sont parfois perçues comme plus autoritaires, ce qui peut être avantageux dans des contextes où une présence forte et dominante est nécessaire, comme les systèmes de navigation ou les alertes d’urgence. Toutefois, cette perception peut varier considérablement en fonction des différences individuelles et culturelles.
- Pertinence de la tâche : La pertinence d’une voix peut dépendre de la tâche ou du contexte spécifique. Par exemple, les utilisateurs peuvent préférer les voix féminines pour les assistants personnels qui gèrent les tâches quotidiennes, tandis que les voix masculines peuvent être préférées pour les conseils financiers ou juridiques en raison de l’autorité perçue.
- Charge cognitive : Certaines recherches suggèrent que la facilité de compréhension et la clarté perçues des voix féminines peuvent réduire la charge cognitive, rendant les interactions avec l’IA moins exigeantes sur le plan mental et plus intuitives pour les utilisateurs.
- Le mansplaining, un problème : Le concept de « mansplaining » (lorsqu’un homme explique quelque chose à quelqu’un, généralement une femme, de manière condescendante ou paternaliste) peut indirectement influencer la préférence pour les voix féminines dans l’IA. Les voix masculines peuvent être perçues comme plus autoritaires, ce qui peut parfois passer pour de la condescendance. Une voix d’IA masculine qui n’est pas d’accord avec vous ou qui vous dit quelque chose que vous savez déjà peut être beaucoup plus rebutante qu’une voix féminine qui fait la même chose.
Les voix féminines de l’IA aideront-elles les femmes à être prises plus au sérieux à l’avenir ?
Il y a vingt ans, il était pratiquement impossible de déterminer à quel point les médias sociaux allaient créer une dépendance et nuire à notre santé. Nous sommes aujourd’hui à un stade où nous devrions réfléchir aux implications de l’IA. Bien sûr, la discussion la plus évidente porte sur la façon dont l’IA pourrait nous remplacer, inonder les ondes de fausses informations potentielles et rendre les humains stupides et inefficaces… ; mais avant cela, concentrons-nous sur l’impact social de ces voix, et sur ce qu’elles font pour nous et pour les générations à venir. Cette tendance a des répercussions positives :
- Normalisation de l’autorité féminine : L’exposition régulière à des voix féminines dans des rôles d’autorité et de connaissance peut contribuer à normaliser l’idée de femmes occupant des postes de direction. Cela peut contribuer à une plus grande acceptation des femmes dans ces rôles dans divers secteurs.
- Changer les perceptions : Écouter les voix féminines associées à l’expérience et au soutien peut subtilement changer les perceptions sociales, remettre en question les stéréotypes et réduire les préjugés sexistes.
- Les modèles : Les systèmes d’IA dotés de voix féminines confiantes et compétentes peuvent servir de modèles virtuels, démontrant que ces caractéristiques ne sont pas l’apanage des hommes et qu’elles peuvent également être incarnées par des femmes.
Toutefois, l’impact de cette tendance dépend de la qualité et de la neutralité des réponses de l’IA, ce qui est pour le moins douteux. Si les systèmes d’IA à voix féminine fournissent systématiquement des informations précises et utiles, ils peuvent accroître la crédibilité des femmes dans la technologie et dans les postes d’autorité… ; mais qu’en est-il de l’inverse ?
Des voix féminines dans des bases de données masculines
Le problème évident, cependant, est que ces assistants d’IA sont encore, le plus souvent, programmés par des hommes qui peuvent apporter leurs propres préjugés subtils (ou évidents) au fonctionnement de ces robots d’IA. De plus, un vaste corpus de bases de données qui alimente ces LLM (Large Language Models) d’IA est créé par des hommes. Historiquement, la culture, la littérature, la politique et la science ont été dominées par les hommes pendant des siècles, et les femmes n’ont joué un rôle plus important et plus visible dans ces domaines que récemment. Tout cela a un effet clair et perceptible sur la manière dont la société civile pense et agit. Le fait d’avoir une voix féminine n’y change rien – cela a même un effet négatif plus involontaire.
En fait, il n’y a pas de problème lorsque l’IA travaille avec des faits concrets … ; mais cela devient un problème lorsque l’IA doit partager des opinions. Les préjugés peuvent miner la crédibilité d’une IA, causer des problèmes en ne représentant pas fidèlement les femmes qu’elle est censée représenter, promouvoir des stéréotypes erronés et même renforcer les préjugés. Nous remarquons déjà l’augmentation massive de l’utilisation de mots tels que ‘deepen’ ; et ‘will’ ; en raison de la fréquence à laquelle les LLM en IA les utilisent – ; pensez à tout ce que nous NE POUVONS PAS voir, et à la manière dont cela pourrait affecter la vie et la société dans une dizaine d’années.
L’avenir des assistants vocaux artificiellement intelligents
Je ne suis ni programmeur ni ingénieur, mais voici la direction que devraient prendre les assistants vocaux artificiels et les mesures à prendre :
- Données d’entraînement diversesVeiller à ce que les données de formation soient diversifiées et inclusives peut contribuer à atténuer les préjugés. Cela implique de tirer des données d’un large éventail de contextes et d’assurer une représentation équilibrée des différents sexes et perspectives.
- Détecter et atténuer les préjugésIl est essentiel de mettre en œuvre des mécanismes robustes pour détecter et atténuer les biais dans les systèmes d’IA. Cela inclut l’utilisation d’algorithmes conçus pour identifier et corriger les biais dans les données d’apprentissage et les résultats.
- Conception inclusiveL’implication d’équipes diverses dans la conception et le développement de systèmes d’IA peut contribuer à garantir la prise en compte de différents points de vue, ce qui permet d’obtenir des systèmes d’IA plus équilibrés et plus justes.
- Contrôle continuLes systèmes d’IA doivent être contrôlés et mis à jour en permanence afin de remédier à tout biais émergent. Cela nécessite une évaluation et un perfectionnement continus des données d’apprentissage et des algorithmes d’IA.
- Commentaires des utilisateursL’intégration des commentaires des utilisateurs peut aider à identifier les préjugés et les domaines à améliorer. Les utilisateurs peuvent fournir des informations précieuses sur la manière dont l’IA est perçue et sur les points faibles en termes d’équité et d’inclusion.
Les assistants d’IA ne vont nulle part. Il fut un temps, pas si lointain, où l’on pensait que les assistants d’IA étaient morts. Fin 2022, Amazon a annoncé qu’Alexa avait accumulé 10 milliards de dollars de dettes et semblait être un échec– ; le même mois, ChatGPT a fait ses débuts. Aujourd’hui, les assistants d’intelligence artificielle sont soudainement redevenus courants. À tel point que presque toutes les entreprises et startups cherchent à intégrer l’IA dans leurs produits et services. Siri et GPT 4o ne sont que le début de cette nouvelle frontière de la voix féminine… ; il est important que nous comprenions les pièges et que nous les évitions avant qu’il ne soit trop tard. Après tout, si vous vous souvenez du film Terminator Salvation, Skynet était aussi une femme… ;
The post Pourquoi la plupart des voix d’IA sont-elles féminines ? Exploring the Reasons Behind Female AI Voice Dominance appeared first on Plare.