L'apprentissage automatique trop cher pour les archives d'État
J'ai regardé_Mis/Getty Images
Inscrivez-vous à notre newsletter
Rester connecté
ParChris Teale
Ayant initialement prévu d'utiliser l'apprentissage automatique pour aider les archivistes à trier des tonnes de données, les archives de l'État de l'Oregon déploieront à la place des analyses de données avancées au milieu des préoccupations concernant le coût et la maturité de la technologie ML.
À la fin de l'année dernière, les responsables des archives ont publié une demande de propositions appelant à la technologie ML pour aider à traiter les données en supprimant les doublons et tout élément non pertinent, tout en les indexant pour faciliter l'accès futur. La demande de propositions a été motivée par le départ de l'ancienne gouverneure Kate Brown et la transmission prévue aux archives de l'État de jusqu'à 10 téraoctets de données de ses huit années en tant que gouverneur.
Mais les réponses à l'appel d'offres ont forcé les responsables à repenser, a déclaré Kristofer Stenson, responsable des archives d'État aux archives de l'État de l'Oregon, lors du sommet Nextgov et GCN sur les technologies émergentes et la modernisation. Au moins une offre pour le contrat ML a été évaluée à trois fois plus que le budget biennal total des archives, ce que Stenson a décrit comme "une révélation".
"Je n'appellerais pas cela un échec d'approvisionnement, dans la mesure où nous en avons beaucoup appris", a déclaré Stenson. Compte tenu de la nécessité pour la technologie de mûrir davantage et de baisser les prix, les chefs d'État ont décidé de "s'éloigner" du ML.
Au lieu de cela, Stenson a déclaré que l'Oregon utilisera des analyses de données avancées pour traiter les enregistrements des archives du gouverneur de Brown. Cette technologie aidera à identifier et à supprimer les doublons ainsi que les informations sensibles telles que les numéros de sécurité sociale et les numéros de téléphone. Il propose également une recherche avancée pour parcourir les archives.
Cet effort, a déclaré Stenson, est "beaucoup plus faisable à court terme" et dans les limites du budget actuel. D'autres agences de l'Oregon utilisent des outils d'analyse similaires, il existe donc un précédent pour les archives qui l'utilisent pour l'instant comme un "tremplin" vers le ML complet à l'avenir.
Articles Liés
L'apprentissage automatique fouille dans les archives des États
Un comté rural met les registres fonciers sur la blockchain
La pandémie teste la gestion des dossiers électroniques
"Cela représente toujours un grand pas en avant pour nous et, espérons-le, nous permettra également de fournir bientôt un accès plus direct à ces collections", a déclaré Stenson.
Les archives sont également au milieu d'une conversation sur la façon de stocker les téraoctets de documents, de communications et d'autres données du mandat de Brown, qui comprenait la direction de la réponse du gouvernement de l'État à la pandémie de COVID-19. Stenson a déclaré que la solution sera probablement une approche hybride avec à la fois un stockage dans le cloud et sur site pour assurer la redondance.
Faire face à l'énorme quantité de données électroniques générées par les élus est un problème auquel toutes les archives d'État doivent faire face. Stenson a déclaré que ML sera bientôt un "outil essentiel" pour gérer ces informations.
"C'est réel, ce n'est plus un rêve irréel", a déclaré Stenson. "C'est le monde dans lequel nous allons vivre. Bien que nous n'en soyons peut-être pas encore tout à fait là, nous y arrivons assez rapidement."
Pour les responsables des achats, l'épisode a montré l'état de maturité de la technologie ML et le coût pour les gouvernements de son utilisation. Stenson a déclaré que si l'Oregon "a peut-être juste légèrement sauté le pas" en demandant des solutions ML maintenant, il vaut mieux être avant-gardiste sur les technologies émergentes plutôt que derrière la courbe. "Je préfère regarder vers l'avenir plutôt que d'être cinq ans trop tard", a-t-il déclaré.
PROCHAINE HISTOIRE :L'innovation prospère lorsque les gouvernements adoptent des partenariats public-privé de nouvelle génération
PROCHAINE HISTOIRE :