À la radio et à la télé, les femmes parlent deux fois moins que les hommes

Article  par  David DOUKHAN  •  Publié le 04.03.2019  •  Mis à jour le 07.03.2019
Pour la première fois, une intelligence artificielle a mesuré le temps de parole des femmes et des hommes dans les médias français. Réalisée sur 700 000 heures de programmes, soit le plus gros volume de données jamais analysé au monde, cette étude dresse un état des lieux, chaîne par chaîne, depuis 2001.

Sommaire

Récemment déclarée « grande cause du quinquennat », la question de l’égalité entre les femmes et les hommes est un sujet qui suscite de nombreux débats et passions. La description objective des différences de représentation existant entre les hommes et les femmes dans les médias est un enjeu sociétal majeur, nécessaire pour rationaliser les débats citoyens et orienter les décisions politiques.
 
Lorsque j’ai été amené à présenter mes travaux dans des congrès scientifiques, j’ai à de nombreuses reprises rencontré des hommes qui m’ont déclaré « Les femmes parlent trop » lorsque je leur ai décrit ma thématique de recherche. Ces mêmes hommes ont été les premiers surpris lorsqu’ils ont découvert les conclusions des analyses présentées dans cette étude.
 
 
Plusieurs études fondées sur l’analyse quantitative du contenu des médias ont été menées ces dernières années pour décrire ces différences de représentation. On pourra citer le Global Media Monitoring Project (GMMP), ou encore les analyses menées par le Conseil supérieur de l’audiovisuel (CSA), qui sont fondées entre autres sur la description du taux de présence, défini comme le pourcentage d’hommes et de femmes présents à l’antenne. Ce taux peut être présenté par catégories correspondant au statut des intervenants (reporter, expert, journaliste, témoin, invité politique...), ou encore aux sujets traités (économie, santé, éducation…).
 
Les études fondées sur l’analyse du taux d’expression, défini comme le pourcentage de temps de parole attribué à des femmes ou à des hommes, sont rares. On pourra néanmoins citer le rapport public coordonné par Michèle Reiser et Brigitte Grésy, L'image des femmes dans les médias (commandé par le secrétariat d’État à la Solidarité), fondé sur l’analyse d'émissions diffusées le 15 mai 2008 (temps d’analyse compris entre 6 minutes et 3 heures par chaîne), ainsi qu’une étude menée à titre expérimental par le CSA de la Communauté française de Belgique, Les représentations femmes-hommes sont-elles influencées par les générations ?, fondée sur l’analyse de 36 heures de programmes collectées pendant une semaine.
 
La mesure manuelle du temps de parole est coûteuse, ce qui explique que les analyses produites à ce jour ont été réalisées sur des échantillons de taille limitée. Ces limitations peuvent se traduire par des biais d’analyse, tendant à généraliser des situations observées sur des échantillons non représentatifs, et ne permettant pas d’apprécier l’évolution de ces phénomènes observés dans le temps.
 
Cette étude, conduite à l’INA (Institut national de l’audiovisuel), propose d’utiliser une intelligence artificielle pour estimer le temps de parole des femmes et des hommes automatiquement (la méthodologie complète est à retrouver en bas de l’article) Ce type d’approche vise à traiter une masse de documents beaucoup plus importante et réduire les effets de biais liés à la taille de l’échantillon d’analyse. Les phénomènes observés sont également susceptibles d'orienter des analyses qualitatives, et de contribuer ainsi à créer de nouvelles connaissances en sciences humaines.

Un déséquilibre à géométrie variable

L’analyse massive des fonds collectés de 2010 à 2018 dresse un état des lieux caractérisé par un fort déséquilibre entre le temps de parole utilisé par les hommes et les femmes. Les prises de parole des femmes à la télévision représentent moins d’un tiers du temps de parole alloué (32,7 %). Ce constat est encore plus frappant à la radio où il n’est que de 31,2 %, comme le montre la figure ci-dessous. 

 
 
 
 
Le taux de parole (axe horizontal) correspond au pourcentage de parole observé sur les chaînes proportionnellement aux autres phénomènes (musique, bruits d’environnement, applaudissements...). Il est indépendant du sexe du locuteur. Un taux de parole égal à 0 signifie que la chaîne ne diffuse que de la musique, et un taux égal à 100 correspond à une chaîne ne diffusant que de la parole. Le taux de parole varie entre 62,5 et 93,8 %. Il est minimal sur W9 (chaîne musicale) et maximal pour l'ensemble des chaînes d'information ainsi que pour les chaînes de sport.
 
Le taux d’expression des femmes (axe vertical) correspond au pourcentage de temps de parole attribué à des femmes. Un taux égal à 0 signifie que les femmes ne parlent pas à la télévision, un taux égal à 50 signifie que le temps de parole des femmes et des hommes est égal, un taux égal à 100 signifie que seules des femmes parlent à l’antenne.
 
Quelle que soit la chaîne considérée, le taux d'expression des femmes est inférieur à 50 %, ce qui signifie que sur l’ensemble des chaînes TV, les hommes parlent davantage que les femmes. Les chaînes où les femmes ont un temps de parole maximal sont les chaînes visant un public féminin (Téva, Chérie 25). Les chaînes diffusant du contenu sportif, sont quant à elles associées aux plus faibles taux d’expression des femmes : 7,4 % pour Eurosport et 16,5 % pour La chaîne L’Équipe. Le taux d’expression des femmes est plus faible pour les chaînes à programmation culturelle ou éducative (Histoire, Arte, France 5) que pour les chaînes à contenu généraliste. Au sein des chaînes généralistes, les plus forts taux d’expression des femmes sont observés sur M6 (40,9 %) et sur TF1 (36,1 %), tandis que le plus faible taux est observé sur Canal+, chaîne qui se démarque par une plus grande programmation de contenu sportif. Ces observations renforcent les analyses réalisées à plus petite échelle en 2008 dans le rapport d’État coordonné par Michèle Reiser et Brigitte Grésy, qui observent que « le sérieux d’Arte se fait donc avec les hommes ; l’émotion de M6 se fait avec les femmes »...
 
Le cas de la chaîne France 24 est particulièrement intéressant. Cette chaîne d'information internationale présente, après Téva, le deuxième plus haut taux d’expression des femmes (44,8 %). Cette singularité est assez paradoxale, sachant que cette chaîne est une vitrine du paysage audiovisuel français à l'étranger. Les disproportions de temps de parole entre les sexes observées sur l’ensemble des chaînes nationales y étant beaucoup plus faibles, France 24 contribue ainsi à véhiculer l’image faussée d’un pays où la répartition du temps de parole entre hommes et femmes est relativement équitable...
 
En résumé, on observe donc que sur l’ensemble des chaînes de télévision, les femmes parlent assez nettement moins longtemps que les hommes. Leur parole est davantage présente dans les chaînes s'adressant à un public féminin, et elle est extrêmement faible dans les chaînes diffusant du contenu sportif. Le temps de parole des femmes est comparable sur les chaînes d'information en continu et les chaînes généralistes, et légèrement inférieur sur les chaînes diffusant des programmes culturels ou éducatifs.
 
Chérie FM, seule station de radio où les femmes parlent davantage que les hommes
 
 
À la radio, on constate beaucoup plus de disparité dans le pourcentage de parole (par opposition au pourcentage de musique), avec d’une part, les stations à programmation majoritairement musicale (RFM, RTL2, Chérie FM...) qui diffusent plus de deux tiers de contenu musical, et d’autre part, des stations contenant principalement de la parole (France Inter, France Info, RMC). Pour les stations dont le contenu est principalement de la parole, le taux d’expression des femmes maximal est de 33,2 % sur Radio France International, et minimal sur RMC (16,9 %), une station diffusant beaucoup de contenu sportif.
La seule station contenant plus de parole de femmes que d’hommes est Chérie FM, ce qui reste marginal sachant que cette station diffuse plus de 80 % de musique. Skyrock quant à elle, est de loin la station musicale où les femmes ont le moins la parole, avec un taux d’expression de seulement 16,2 %.

Revenir au sommaire

Sur les chaînes privées, les femmes parlent moins aux heures de forte audience

Quand parlent les femmes ? Cette partie décrit les différences de taux d’expression des femmes observées en fonction des heures de la journée, observées sur la période 2010-2018. Pour plus de cohérence, nous avons exclus de ces mesures les programmes diffusés lors des week-ends, jours fériés et vacances scolaires. Nous nous sommes inspirés de la méthodologie du CSA, définissant les heures de forte audience comme le créneau 6 h – 9 h à la radio et 19 h – 22 h à la télévision.
 
Sur les chaînes de télévision privées, les femmes parlent moins aux heures de forte audience
 
 
Aux heures de forte audience, le taux d’expression des femmes baisse en moyenne de 3,2 %[+] Noteles valeurs sont exprimées en pourcentage absolu ou point de pourcentageX [1] sur les chaînes de télévision privées, ainsi que sur les chaînes publiques (-1,1 %). Les plus fortes augmentations du temps de parole des femmes aux heures de forte audience sont observées pour les chaînes France 3 (+8,7 %) et Arte (+6,2 %). Les plus fortes baisses pour France 2 (-10 %), NRJ 12 (-8,1 %), et Chérie 25 (-7 %). Sur le créneau prime time (19 h -20 h), le taux d’expression des femmes est de 37,7 % sur les chaînes publiques contre 24,6 % sur les chaînes privées.
 
Sur les stations de radio privées, les femmes ont un plus faible taux de parole aux heures de forte audience
 
 
Aux heures de forte audience, le taux d’expression des femmes baisse de 2,7 % sur les chaînes privées, et augmente de 0,3 % sur les chaînes publiques.
Les plus grosses disparités sont observées pour Radio Classique (-14,6 %), Virgin Radio (-14,2 %), NRJ (-12,9 %), France Musique (+12,1 %)

Revenir au sommaire

Des évolutions positives, en particulier sur les chaînes publiques

Dans les parties précédentes, nous avons mis en évidence de fortes disparités existant dans la répartition du temps de parole entre les femmes et les hommes, plus particulièrement aux heures de forte écoute. Ces inégalités de représentation tendent à se réduire au fil des années.
 
Le temps de parole des femmes à la radio a augmenté de 9,3 % de 2001 à 2018
 
 
Le taux médian d’expression des femmes est passé de 25,1 % en 2001 à 34,4 % en 2018, soit une augmentation d’environ 0,5 % par an pendant 18 ans. Les femmes parlent davantage sur les stations publiques : l’écart maximal ayant été observé en 2015 (+ 4,7 %). Les évolutions les plus importantes (statistiquement significatives) sont observées pour France Musique (+17,1 %), Europe 1 (+17 %), RTL2 (+13,1 %), Sud Radio (+10,9 %), Fun Radio (+10,7 %), Nostalgie (+10 %), France Culture (+9,6 %), France Inter (+8,8 %). Cette tendance à la hausse du temps de parole des femmes n’est pas observée sur l’ensemble des chaînes, notamment RMC (-7,7 %), Radio Classique (-5,8 %) ou encore Skyrock (-2,1 %).
 
Le temps de parole des femmes à la télévision a augmenté 4,7 % de 2010 à 2018.
 
Le taux d’expression des femmes, toutes chaînes confondues, a évolué de 30,4 % en 2010 à 35,1 % en 2018. Cette évolution est particulièrement visible sur les chaînes publiques (+7 %). Jusqu’en 2016, c’est sur les chaînes privées que les femmes avaient le plus de temps de parole, mais cette tendance n’est plus vraie depuis 2017.
 
Les évolutions les plus importantes concernent France 5 (+9,3 %) et France 2 (+8,8 %). On observe également une forte baisse de la présence des femmes sur la chaîne sportive L’Équipe (-10,1 %) et sur CNews (-8 %).

Revenir au sommaire

Quelques disparités régionales : le 19/20 de France 3

L’exploration de l’intégralité des éditions régionales du 19/20 de France 3 — émissions d'informations diffusées en prime time de 19 h à 19 h 30 — sur l’année 2016, permet d’établir des disparités régionales du taux d'expression par sexe. Cette analyse a nécessité de mettre au point une intelligence artificielle fondée sur l’analyse d’images, permettant de détecter le début et la fin des éditions du 19/20, en se basant sur la reconnaissance des bandeaux caractéristiques de ces JT. En raison des évolutions de l’aspect de ces bandeaux et de la complexité de cette recherche, celle-ci n’a pu porter que sur une seule année. Elle offre toutefois une intéressante topographie de la situation sur une année pleine.

Le pourcentage de parole attribué aux femmes dans les 24 éditions régionales varie entre 25.89 % et 52.9 %. L'Alsace et le Nord-Pas-de Calais sont les seules éditions pour lesquelles le temps de parole des femmes est supérieur à celui des hommes. Sept éditions sur 24 sont associées à un temps de parole par sexe à peu près égal (compris entre 45 et 55 %) : Alsace, Nord-Pas-de-Calais, Île-de-France, Picardie, Bretagne, Provence-Alpes, Languedoc-Roussillon. Quatre éditions régionales sont associées à un temps de parole des femmes inférieur à un tiers : Lorraine, Midi-Pyrénées, Auvergne, Aquitaine.

Revenir au sommaire

S’emparer des vastes possibilités d’exploitation de ces données : un enjeu sociétal

L’étude présentée dans cet article a permis de décrire une partie des différences de représentation existant entre les hommes et les femmes dans les médias, en se focalisant sur la répartition du temps de parole.
 
Les analyses présentées pourraient être approfondies en croisant les temps de parole avec d’autres sources de données : budget de fonctionnement des chaînes, données d’audience détaillée, grilles de programmation, événements sociaux et politiques… L’étendue des possibilités d’exploitation de ce matériau est vaste, et dépasse très largement les limites de cette étude. Dans le cadre de la politique d’ouverture des données entreprise par l’INA, l’ensemble des indicateurs générés lors de cette étude a été mis à disposition sur data.gouv.fr, la plateforme ouverte des données publiques françaises. Elles pourront ainsi être utilisées par l’ensemble des acteurs de l’audiovisuel, les chercheurs en sciences humaines et sociales (SHS), journalistes, instances politiques, ainsi que l’ensemble des citoyens.
 
La description des différences de représentation est complexe et on ne peut, bien évidemment, pas se contenter de ne l’aborder qu'à travers le prisme du taux d’expression. Des efforts de recherche supplémentaires sont nécessaires pour mettre au point des systèmes fiables d’analyse automatique permettant de détecter les thèmes évoqués par les différents intervenants, les personnalités dont il est question, ou encore le rôle des locuteurs.
 
C’est à cette fin que le projet de recherche Gender Equality Monitor a récemment été soumis à l’Agence nationale de la recherche (ANR). Ce projet est porté par un consortium pluridisciplinaire composé de deux professionnels de l’audiovisuel (INA, Deezer), deux laboratoires STIC (Limsi / CNRS, Lium) et trois laboratoires SHS spécialisés dans l’étude du genre et des médias (Carism, Lerass, ENS Lyon-CMW). Les retombées de ce projet devraient contribuer à une meilleure compréhension du fonctionnement des médias et à alimenter les débats citoyens sur la place des hommes et des femmes dans la société.

Revenir au sommaire

Méthodologie

Comment l’IA a permis de distinguer les voix d’hommes et de femmes
 
L’analyse des fonds télévision et radio a été réalisée à l’aide d’InaSpeechSegmenter, un logiciel libre issu d’une collaboration entre le service de recherche de l’INA et le laboratoire d’informatique de l’université du Mans. Il s’agit d’un logiciel d’analyse acoustique, permettant de localiser les zones de parole au sein de documents multimédias, et de déterminer le sexe des locuteurs (personnes qui parlent). La voix chantée n’est pas à proprement parler de la parole : elle est catégorisée comme musique et exclue des analyses.
 
 la figure du haut représente le signal audio brut. La figure du milieu correspond à la représentation « temps-fréquence » du signal sonore, qui sert de base à son analyse automatique. La figure du bas représente les portions de signal qui ont été attribué à des hommes (H) et à des femmes (F)
 
Exemple d’analyse automatique : la figure du haut représente le signal audio brut. La figure du milieu correspond à la représentation « temps-fréquence » du signal sonore, qui sert de base à son analyse automatique. La figure du bas représente les portions de signal qui ont été attribué à des hommes (H) et à des femmes (F).
 
La distinction entre les voix d’hommes et de femmes est modélisée à l’aide de réseaux de neurones profonds (deep learning) : une famille de méthodes issues de l’intelligence artificielle. Les réseaux de neurones nécessitent d’être entraînés à partir d'exemples pour pouvoir reconnaître des concepts : plus les exemples sont variés et plus le système résultant est performant. Les exemples d’entraînement utilisés sont issus du dictionnaire de locuteurs de l’INA, qui est à notre connaissance la plus grande base de locuteurs annotée manuellement à partir de données audiovisuelles (télévision et radio). Ce dictionnaire est composé de 32 000 extraits sonores diffusés de 1957 à 2012, correspondant à 1 780 locuteurs et 494 locutrices distincts, s’exprimant en français.
 
Le système résultant permet d’estimer le taux d’expression des hommes et des femmes avec une erreur inférieure à 0,6 %. Plus la durée analysée est importante, et plus l’estimation du taux d’expression est robuste.

Revenir au sommaire

700 000 heures de programmes TV et radio analysées

Depuis 2001, l’INA collecte l’intégralité des flux diffusés sur une sélection de stations TV et radio. La sauvegarde de flux captés 24 h/24 est le résultat de choix politiques spécifiques à la France, qui n’ont, à notre connaissance, pas d’équivalent dans le monde. Les politiques de sauvegarde du patrimoine audiovisuel national mises en place dans les autres pays sont limitées à une sélection restreinte de programmes. Cette spécificité française permet la mise en place d’approches exhaustives, fondées sur l’analyse systématique de l’ensemble des programmes diffusés.
 
L’échantillon d’analyse sélectionné pour cette étude est composé de 22 chaînes de télévision et 21 stations de radio. La sélection des stations a été réalisée de manière à faire apparaître les chaînes associées aux plus fortes audiences, ainsi que certaines chaînes thématiques ciblées (informations, sport, histoire, musique, contenu visant un public féminin). Les créneaux horaires sélectionnés correspondent aux heures de plus forte audience : ils ont été fixés entre cinq heures et minuit pour la radio, et dix heures et minuit pour la télévision.
 
L’échantillon radio est composé de 7 stations publiques (France Bleu, France Culture, France Info, France Inter, France Musique, Le Mouv’ (désormais Mouv’), Radio France internationale/RFI) et 14 stations privées (Chérie FM, Europe 1, Fun Radio, Nostalgie, NRJ, Radio Classique, RFM, Rire et Chansons, RMC, RTL, RTL 2, Skyrock, Sud Radio, Virgin Radio). Pour réduire le temps de calcul, les flux ont été découpés en tranches d’une heure et 486 000 heures ont sélectionnées aléatoirement pour être analysés, soit environ 18 % de la totalité des programmes diffusés sur ces créneaux.
 
L’échantillon TV est composé de 7 chaînes publiques (Arte, France 24, France 2, France 3, France 5, France Ô, LCP/Public Sénat) et 14 chaînes privées : BFM TV, Canal+, Chérie 25, La chaîne L'Équipe, Eurosport, Histoire, CNews (anciennement I-Télé), C8 (anciennement D8), LCI, M6, NRJ 12, Téva, TF1, TMC et W9. À l’époque où a eu lieu cette analyse, achevée en janvier 2019, les flux TV antérieurs à 2010 étaient conservés sur DVD et n’étaient pas encore accessibles via des serveurs. Pour cette raison, les analyses réalisées sur les flux TV n’ont porté que sur la période 2010-2018. Un total de 270 000 heures de contenu TV a été analysé, soit environ 27 % de la totalité des programmes diffusés sur ces créneaux.

 
Crédit :
INA. Illustration : Martin Vidberg.


Ce projet a reçu des financements du programme Horizon 2020 de l’Union européenne pour la recherche et l'innovation sous le Grant Agreement N°780069 (projet MeMAD, http://memad.eu).
Revenir au sommaire
  • 1. les valeurs sont exprimées en pourcentage absolu ou point de pourcentage
Vous souhaitez nous apporter un complément, rectifier une information ? Contactez la rédaction