La parité analysée par un logiciel

Mar 15, 2019 | Assises, Outils | 0 commentaires

Un tiers. C’est le temps de parole des femmes à la télévision et à la radio. Cette donnée est issue d’une vaste étude mondiale menée par l’institut national de l’audiovisuel (INA). Grâce à un logiciel entraîné à reconnaître les voix masculines et féminines, 700 000 heures ont pu être analysées sur la période 2008-2018.

Mélanie Hennebique

Il aurait fallu 91 ans, sans manger et sans dormir, pour écouter et visionner les 700 000 heures issues de chaînes et émissions radios utilisées pour cette étude. Au lieu de cela, avec le logiciel inaSpeechSegmenter, la démarche a pris six mois. Cet outil développé par l’INA a appris à reconnaître les voix féminines et masculines à partir d’un dictionnaire. Le résultat ? 30% du temps de parole est alloué aux femmes à la télévision et à la radio françaises. Pour David Doukhan, chercheur en informatique à l’INA, le temps de parole est un très bon indicateur des inégalités. « Nous avons publié cette étude pour rationaliser le débat. C’est nécessaire car il y a un risque de généraliser des choses très globales. » précise-t-il.

Un outil fiable et sans précédent

Mais comment reconnaître la voix des femmes ? « Il ne s’agit pas seulement d’une distinction entre le grave et l’aigu » , explique David Doukhan. L’intelligence artificielle de ce logiciel apprend à reconnaître les voix grâce au dictionnaire du locuteur de l’INA. Il contient environ 3000 voix différentes, chacune ayant trois enregistrements différents. C’est, à priori, la plus grande banque de données audiovisuelle au monde. Les concepteurs du logiciel peuvent se targuer d’une très bonne fiabilité de leur outil, dont le taux d’erreur avoisine les 2%. Seule limite : les voix chantées ne sont pas analysées, mais l’INA planche sur le sujet pour développer un peu plus le logiciel.

Des résultats contrastés

22 chaînes de télévision ont été analysées par tranche d’une heure. Tout est passé au crible de manière indifférente : la publicité, les documentaires mais aussi la fiction. Certains résultats ont étonné David Doukhan, notamment la relative variabilité de la présence féminine en fonction des chaînes et des types de contenus. « Pour les programmes culturels et éducatifs, on entend beaucoup moins les femmes. Elles parlent moins sur Arte que sur M6. » En revanche, les femmes semblent parler davantage aux heures de forte audience. Autre cas étonnant et significatif : France 24 est la seconde chaîne où il y a le plus de parole de femmes. « Intriguant » pour l’expert car la chaîne est une vitrine de la France à l’étranger. Un tel résultat donne une image de la France qui est, ici, faussée. D’après lui, la chaîne est assez jeune et a peu de budget, ce qui expliquerait la présence des femmes, qui coûtent moins cher. D’autres résultats mettent en avant des stéréotypes déjà forts dans le métier. Les stéréotypes genrés sont bien ancrés. Par exemple, plus il y a de sport à la télévision et moins on entend les femmes. La chaîne Canal +, très orientée sport, a le taux de parole le plus faible. Du côté de la radio, la sous-représentativité est plus marquée du côté des stations privées que publiques. Ces analyses mettent en avant un problème de fond au sein des rédactions. Selon Béatrice Damian- Gaillard, Professeure en sciences de l’information et de la communication, « il n’y a rien d’étonnant. Dans les rédactions, les stéréotypes jouent, y compris sur la manière dont on va distribuer les sujets ou s’adresser aux femmes ».