Aperçu
Les pénuries de dotation, les interférences politiques et une fermeture du gouvernement fédéral perturbent tous les opérations routinières des agences statistiques fédérales non partisanes qui recueillent de manière fiable des faits et publient des données sur l'état de l'économie américaine et du marché du travail américain. Beaucoup dans l'industrie privée, les gouvernements des États et locaux, les groupes de réflexion, les associations et les universitaires intensifient pour soutenir et défendre l'intégrité et l'importance des données fédérales. Simultanément, de nombreuses personnes et organisations peuvent et devraient s'engager dans la création de collaborations de données et de jeux de données qui, au fil du temps, pourraient conduire à des données économiques encore meilleures.
Bien sûr, il ne peut y avoir de remplacement pour la valeur créée lorsque les agences statistiques fédérales, telles que le Bureau of Labor Statistics, suivent les procédures opérationnelles standard accessibles au public qui protègent les informations confidentielles et produisent des données objectives, opportunes et précises pour le public, comme l'exige une loi bipartite de 2018 et la création de 2019. Depuis 1992, la National Academy of Sciences recommande régulièrement les meilleures pratiques aux agences de statistiques fédérales. Et, jusqu'à ce qu'il soit récemment dissous, des experts techniques indépendants d'un comité consultatif des utilisateurs de données ont systématiquement rencontré et conseillé le personnel de BLS. Tous les autres produits de données, y compris les privés, sont réalisés contre les données fédérales.
Dans le même temps, le budget anémique du BLS a chuté de 22% depuis 2010 en dollars réels, malgré la nécessité de maintenir le financement et d'améliorer les opérations. Alors que les associations professionnelles des économistes et des statisticiens recommandent une augmentation de 10% du budget fédéral de 2026 pour soutenir les opérations actuelles du BLS, le budget du président Donald Trump recommande plutôt une réduction de 8% et une réduction supplémentaire du personnel. (Les estimations suggèrent que 20% des membres du personnel de BLS ont déjà quitté leurs postes depuis janvier 2025, et un tiers des rôles de leadership de l'agence sont vacants.)
Rendre des données fiables accessibles en temps opportun pour éclairer la prise de décision est fondamentale pour la croissance économique et les capitaux propres aux États-Unis. En tant que Jonathan Cohen à l'American Academy of Arts and Sciences et politologue Katherine Cramer à l'Université du Wisconsin – Madison a souligné plus tôt cette année, les bonnes données sont essentielles pour une démocratie qui dépend d'une citoyenneté éclairée.
La défense de la tradition BLS de «la publication intrépide des faits sans égard à l'influence que ces faits peuvent avoir sur la position de toute partie ou les points de vue de tout partisan» est essentiel pour les données fédérales fiables. Mais un autre chemin à terme peut être poursuivi simultanément. Les utilisateurs de données peuvent travailler sur des projets qui contribuent à démocratiser nos données.
Si les utilisateurs de données n'agissent pas, les données publiques peuvent disparaître. Cette chronique met en évidence les travaux passés et présents de nombreuses organisations et chercheurs pour protéger et préserver les données du marché du travail et introduire un nouveau document de travail qui illustre une voie vers la création de données, de connaissances et de valeur que le statu quo.
Ce qui peut être fait maintenant pour améliorer les données du marché du travail américain
En 2020, le professeur émérite de l'école de service public de l'Université de New York, Julia Lane, est l'auteur d'un manifeste, Démocratiser nos donnéesexposant une vision de la transformation des données publiques en engageant les consommateurs de données dans la collecte de données et la construction de statistiques qui peuvent être mises à la disposition du public. Sa vision des données publiques engagées par la communauté a le potentiel de réduire les coûts, d'augmenter la rapidité, de créer plus de valeur, de permettre une plus grande adaptabilité à différentes utilisations et de susciter une plus grande innovation grâce à une participation plus large, tout en continuant à protéger la confidentialité essentielle des données.
La vision de Lane est basée sur son expérience pionnière de la conception d'abord, puis de la création de l'ensemble de données du US Census Bureau qui relie les données des ménages et des employeurs, qui impliquaient la construction de partenariats d'État par état pour lier les sources de données étatiques et fédérales. Elle a ensuite continué à construire l'initiative Coleridge, une plate-forme sécurisée pour le partage des données d'État et fédéral. Les deux projets sont mentionnés dans sa citation de prix pour le seul prix de 2025 pour les contributions aux données et à la mesure de la Société des économistes du travail.
Des milliers de praticiens et de chercheurs comptent sur les données qu'elle a aidé à assembler et à construire. Le travail impliqué dans la construction de ces ensembles de données l'a obligé à convaincre de nombreuses personnes dans de nombreuses organisations avec peu d'incitations à travailler à améliorer la collecte et la construction de données publiques, pour se rendre compte qu'ils bénéficieraient tous de son existence. Ses efforts ont jeté des bases essentielles et ont ouvert la voie à des collaborations de données, comme un nouveau projet d'agrégation de données d'emploi en ligne avec le National Labor Exchange dans lequel moi et mes co-collaborateurs sommes engagés.
Dans un nouveau Washington Center for Equitable Growth Working Paper, «Extraire O * Net Fonctionnalités du NLX Corpus pour construire des données générales sur le marché du travail des agrégats», mes co-auteurs Stephen Meisenbacher à l'Université technique de Munich, Svetlozar Nestorov à l'Université Loyola de l'Université Chicago, et je décrivais la construction d'un ensemble de données d'agrégation pour les fonctionnalités Extract Universit Juin 2025. Notre projet s'appuie sur la recommandation unanime de 2024 par le Conseil consultatif de l'information du Department of Labour du Department of Labour que le Secrétaire américain au Travail investit dans des données en temps opportun, localisées et exploitables. Leur recommandation supérieure était de renforcer l'échange national du travail, ou NLX.
NLX est le fiduciaire de données des données d'emploi en ligne de notre pays et est parrainé et maintenu par la National Association of State Workforce Agencies et la Direct Employers Association, qui comprend les plus grands employeurs du secteur privé du pays. Nous avons construit notre ensemble de données à partir de plus de 155 millions de postes d'emploi collectés par le NLX Research Hub, un partenariat à but non lucratif dont la mission est de «fournir la collection la plus précise et la plus complète d'ouverture d'emplois réels en ligne sans frais supplémentaires pour les agences de travail et les employeurs d'État».
Notre ensemble de données suit la taxonomie O * nette pour comprendre le travail utilisé par de nombreux chercheurs et praticiens. Dans notre ensemble de données, il y a beaucoup plus de données alignées sur les classifications standard pour comprendre le marché du travail américain que tout autre ensemble de données actuellement disponible.
Surtout, les accords et les dispositions d'utilisation des données NLX protègent les informations sensibles et désagrégées. Les outils de traitement du langage naturel que nous avons développés pour extraire les fonctionnalités standard O * NET des publicités professionnelles sont hébergés publiquement sur la plate-forme de partage de code GitHub et la plate-forme de la communauté AI étreignant le visage, qui permettent à d'autres de tester et d'adopter ce logiciel, que nous mettons à disposition librement pour des utilisations non commerciales. Les données agrégées à l'occupation, à l'industrie et aux niveaux géographiques peuvent et seront publiées publiquement après l'examen par les pairs et la publication.
Les propres produits de données de NLX incluent Joe, un estimateur d'ouverture d'emploi à la disposition du public qui sera bientôt lancé, où les utilisateurs peuvent trouver une prédiction des ouvertures mensuelles du BLS et un enquête sur le chiffre d'affaires du travail un mois plus tôt que la version officielle, en fonction de la corrélation historiquement étroite entre les données de benchmark-jolts et les données NLX. Ensuite, il y a la plate-forme NLX On Demand, qui permet aux utilisateurs d'accéder aux données globales des travaux en ligne. Une équipe utilisant les données NLX a également développé un outil d'extraction de compétences dans le tirage de l'IA pour l'extraction et la recherche de compétences, ou LAISER, Project à l'Institut de politique publique de l'Université George Washington et travaille avec des partenaires à travers le pays pour analyser la demande des employeurs. Ce ne sont que quelques-uns des nombreux projets de cet écosystème national dynamique de professionnels du développement de la main-d'œuvre au niveau de l'État et du niveau local et du secteur privé et des collaborateurs académiques.
De petites équipes agiles dédiées à la collecte de données et à la production de statistiques agrégées peuvent avoir un impact. Le NLX Research Hub et le successeur travaillaient avec elle, ont émergé du travail d'une petite équipe de la National Association of State Workforce Organismes, ou NASWA. Étudiant au doctorat à l'Université George Washington, Emma Northcott, a d'abord suggéré de postuler pour la National Science Foundation et les investissements de la Gates Foundation qui permettent désormais aux chercheurs d'accéder aux données NLX de haute qualité via le centre de recherche.
Depuis 2007, les dirigeants de la NASWA ont géré continuellement et progressivement le travail d'archiver les annonces d'emploi en ligne du pipeline de distribution national des maisons de compensation des informations sur le marché du travail envisagées pour la première fois dans la loi de Wagner-Peyser de 1933 afin de faciliter un match efficace sur le marché du travail. Le modèle NLX est encore au début et a démontré le succès en peu de temps – et il peut perdurer avec le soutien des praticiens et des chercheurs universitaires.
En effet, le partenariat NLX avec la Direct Employers Association vient de renouveler jusqu'en 2037. NLX a des suggestions pour les employeurs privés, les agences gouvernementales et les organismes locaux, les analystes et les chercheurs, et d'autres à s'impliquer dans le soutien de la collecte précise de données et des utilisations supplémentaires de ces données.
Des modifications sont nécessaires pour protéger et améliorer la collecte des données fédérales
Tous ceux qui aspirent à produire des données publiques utiles sont sur les épaules des géants et devraient avoir de la gratitude pour les nombreuses contributions qui créent aujourd'hui les produits de données publiques de classe mondiale aux États-Unis. Des investissements soutenus dans les agences statistiques fédérales sont nécessaires, mais les changements sont également des changements pour réduire le coût, augmenter la vitesse du changement et s'adapter aux besoins en évolution des utilisateurs grâce à une manière de travailler différente.
Les agences statistiques fédérales reconnaissent également un besoin de changement. Un défi à la collecte des données fédéraux est que les réponses à l'enquête ont diminué, en particulier à la suite de la pandémie Covid-19. Les articles récents du directeur par intérim du Bureau du recensement américain Ron Jarmin décrivent les efforts majeurs pour intégrer des flux de données en temps réel des fournisseurs extérieurs et améliorer la collecte de données sur l'écosystème des affaires. Malgré cela, en tant que scientifiques de l'information Christine L. Borgman à l'Université de Californie, Los Angeles et Philip E. Bourne à l'Université de Virginie ont écrit, «il faut un village pour gérer et partager des données» dans le travail qui décrit comment les approches des communs sont nécessaires pour construire des systèmes durables.
Les bailleurs de fonds, y compris le gouvernement fédéral, pourraient soutenir la coproduction de données publiques engagées par la communauté. Des investissements en semences dans des projets, tels que le NLX, sont nécessaires pour collecter des données et établir des infrastructures qui protègent la confidentialité et permet à un écosystème d'utilisateurs intéressés d'accéder aux données et de créer des statistiques agrégées qui informent le public et créent plus de valeur pour les utilisateurs.
Les établissements universitaires et les revues pourraient publier et récompenser les efforts de prise de risques pour développer les projets de logiciels et de démonstration de données publiques qui engagent une communauté pertinente. Les établissements d'enseignement devraient reconnaître où la demande est: dans son manifeste, la voie de NYU décrit également la nécessité d'une main-d'œuvre formée capable de construire et de travailler dans des collaborations de données qui seront nécessaires à ce travail. Les professeurs peuvent impliquer les étudiants dans le travail.
Rien ne peut remplacer la valeur des statistiques fédérales. Un Bureau indépendant des statistiques et du recensement du Bureau indépendant des statistiques et du recensement indépendants entièrement financés est essentiel. Dans le même temps, les données publiques prises pour acquises peuvent disparaître. Un exemple majeur: toute l'histoire des publicités en ligne du début de l'Internet à 2007 a été détruite lorsque le financement fédéral pour soutenir la banque d'emploi américaine a pris fin.
Prendre les pièces après une démolition est difficile. Les données publicitaires en ligne avant 2015 restent inégales. Les efforts à près et à moyen terme d'une communauté d'utilisateurs engagés peuvent en partie combler les lacunes et progresser. À long terme, ces efforts pourraient être combinés, élargir et compléter les capacités uniques des agences statistiques fédérales vitales de notre pays.
Avez-vous trouvé ce contenu informatif et engageant?
Obtenez des mises à jour et restez en phase avec les inégalités et la croissance économiques américaines!

Restez au courant de nos dernières recherches