Après l’interconnexion des données, leur exploitation

Retour sur le hackathon DSN : deux jours pour interroger l’une des grandes bases de données de l’Etat et imaginer comment l’utiliser au-delà des utilisations actuelles.

Hubert Guillaud

Vous ne connaissez peut-être pas la DSN, la base des Déclarations sociales nominatives, qui est l’une des grandes bases de données de l’Etat. La DSN a été créée en 2012 pour simplifier le partage d’information entre employeurs et l’Etat. Cette base de données est le produit des déclarations réalisées par les logiciels de paie qu’utilisent les entreprises et les acteurs publics. Elle sert à payer les cotisations sociales et à transmettre les données sur les salariés aux impôts et aux organismes sociaux (France Travail, CPAM, Urssaf…). La DSN concerne donc toutes les entreprises et l’essentiel des employés (certains relèvent néanmoins d’autres obligations déclaratives, comme les travailleurs indépendants, les artistes ou les salariés employés par des particuliers…). 

Parmi les informations disponible dans cette base essentielle au fonctionnement de l’Etat, on trouve bien sûr le Siret des entreprises qui permet d’identifier chacune, les numéros de sécurité sociale des salariés qui y sont rattachés, la nature du contrat, sa durée, les embauches, les arrêts de travail et leur durée, les motifs de rupture du contrat, la durée du temps de travail, la rémunération… Des données particulièrement sensibles et précieuses donc. Jusqu’à présent, le cœur du travail de l’Etat autour de cette base a été d’organiser leur collecte et leur interconnexion. Mais un rapport de l’Inspection générale interministérielle du secteur social de 2022 recommandait d’améliorer son exploitation.

Le premier Hackathon consacré au DNS

L’organisation d’un premier Hackathon consacré au DSN les 14 et 15 mai 2024 par Etalab, la Dinum et le GIP-MDS semble ouvrir cependant de nouvelles perspectives. 

Pendant deux jours, une centaine d’agents, de data-scientists, d’entreprises et de chercheurs étaient invités à exploiter un extrait de la base anonymisée pour imaginer des modes d’exploitations des données. L’idée n’est plus d’interconnecter les données, mais de regarder comment les faire parler, quels services et usages imaginer depuis elles. C’est déjà le cas d’ailleurs, la base alimente quelques services tiers, comme Mes Droits Sociaux, notamment pour permettre aux employés de vérifier les données transmises par leurs employeurs, ou encore La bonne alternance, qui l’utilise pour produire un algorithme d’entreprises à fort potentiel d’embauche en alternance en observant leur historique d’embauche. Pour Stéphanie Schaer, directrice interministérielle du numérique, ce hackathon est la marque d’une maturité nouvelle qui vise à imaginer comment utiliser la richesse des données disponibles dans la DSN, par exemple pour évaluer des politiques publiques ou pour produire des statistiques depuis les actions concrètes des entreprises plutôt que depuis des enquêtes. 

Pendant deux jours, les participants ont imaginé de nombreux cas d’usages, comme le montrent les projets documentés. Certains par exemple ont tenté de sonder les données pour savoir s’il était possible de mieux évaluer l’impact de l’apprentissage sur l’emploi, en observant par secteurs et entreprises, les ruptures et les embauches. Depuis ces données, on pourrait imaginer produire de meilleurs indicateurs sur l’employabilité des jeunes, qui ne reposeraient pas sur les déclarations des anciens élèves et les déclarations des écoles qui collectent ces sondages (et qui permet à bien des écoles d’afficher des chiffres d’employabilité post-formation fantaisistes, comme l’expliquait très clairement l’émission Complément d’enquête consacrée à la question), mais qui regarderaient à 6, 12 et 24 mois le taux effectif des alternants en emploi. Les données pourraient aussi permettre de prédire la probabilité des entreprises à rompre les contrats d’alternance depuis leurs comportements passés ou les secteurs auxquels elles appartiennent…. D’autres participants imaginent même mesurer l’insertion professionnelle voire décerner un label aux entreprises les plus exemplaires. Certains ont travaillé pour regarder si la DSN pouvait permettre de calculer automatiquement l’index d’égalité professionnelle plutôt qu’il ne repose, comme aujourd’hui, sur du déclaratif, permettant là encore de compiler plus facilement des statistiques par région ou secteurs. 

Un autre projet a proposé de contrôler l’évolution de la main d’œuvre dans les établissements de santé où les tensions sont fortes, par exemple les Ehpad, en permettant aux autorités de vérifier que les taux d’encadrements en professionnels sont suffisants par rapport à la taille des structures (là encore en remplaçant par les données du DSN les obligations déclaratives qui mobilisent du temps de personnels pour les réaliser). Un moyen concret de mettre en place un quota minimal de soignants par structure, comme le défend une proposition de loi

Un autre projet – le bon salaire –  propose aux employés d’accéder à un tableau de bord pour comparer son salaire aux pratiques des autres entreprises et du secteur… et aux entreprises un outil de comparaison de leur main d’oeuvre par rapport à d’autres entreprises du secteur afin d’améliorer leur politique RH. 

Le but de ces explorations n’était pas que les projets deviennent effectifs. Les acteurs publics semblaient surtout motivés à se donner des idées. De là à ce qu’elles deviennent effectives, il sera nécessaire de les organiser, de voir ce qui est possible, qui peut les porter et ouvrir ou non des accès. Pour Stéphanie Schaer, le bilan du Hackathon montre que l’Etat doit être plus fort sur la circulation et l’utilisation de ses données. 

Jusqu’à présent, la mise en œuvre du DSN s’est surtout appliquée à interconnecter les administrations aux données. L’enjeu nouveau qu’ouvrait le hackathon est celui d’un élargissement possible de leur exploitation. Plusieurs projets montraient que l’outil pourrait devenir un outil de contrôle des politiques publiques et un outil de production de statistiques et d’indicateurs plutôt intéressant. Mais le DSN peut aussi devenir un outil pour renforcer le contrôle des salariés, des entreprises et des administrations. Quant à la question du pilotage des orientations de l’évolution de la DSN et de ses usages, de la gouvernance ou de la représentation des partenaires sociaux dans les décisions qui vont décider de ces orientations, le moment a apporté plus de questions que de réponses. Les administrations présentes ont seulement confié qu’elles souhaitaient améliorer leur coordination. C’est un premier pas.