Développeurs

IBM annonce Data Asset Exchange (DAX) pour aider les développeurs avec des jeux de données libres et open source pour l’IA

Share this post:

Comme de plus en plus d’entreprises adoptent l’intelligence artificielle (IA), il est impératif de mettre des modèles de machine learning (ML) entre les mains des développeurs. À cette fin, le Center for Open-Source Data & AI Technologies (CODAIT) a lancé IBM Model Asset eXchange (MAX) en 2018 pour aider les data scientists et les développeurs à découvrir facilement des modèles prêts à l’emploi et open source de machine learning et de deep learning.

À l’OSCON 2019 cet été, nous avons annoncé le lancement d’IBM Data Asset eXchange (DAX), une plate-forme en ligne permettant aux développeurs et aux data scientists de trouver des jeux de données libres et ouverts soigneusement conservés sous licences open sources. Les développeurs qui adoptent des modèles de ML ont besoin de données ouvertes qu’ils peuvent utiliser en toute confiance sous des licences clairement définies.

Dans la mesure du possible, les jeux de données disponibles sur DAX utiliseront le cadre de licences de données open source de la Community Data License Agreement (CDLA) de la Linux Foundation afin de permettre le partage des données et la collaboration. De plus, DAX fournit un accès unique à divers jeux de données d’IBM et IBM Research et IBM prévoit de les enrichir régulièrement. Les données sur DAX s’intégreront de manière appropriée aux services IBM Cloud et d’IA.

 

Une source fiable de jeux de données libres

Pour les développeurs, DAX fournit une source fiable pour des jeux de données ouvertes soigneusement conservés pour l’IA. Ces jeux sont prêts à être utilisés dans les applications d’IA d’entreprise, avec du contenu connexe tel que des tutoriels pour faciliter le démarrage.

Pour le personnel responsable de l’utilisation et de la vérification des jeux de données, DAX fournit la conservation ainsi que des formats de jeux de données et des métadonnées normalisés, contrairement à la plupart des autres ressources de données ouvertes qui ont tendance à intégrer moins de vérifications de la qualité et des conditions de licence. Ainsi, les ensembles de données DAX sont globalement plus faciles à adopter au sein des entreprises.

Exemple d’utilisation des jeux de données

Un exemple des types d’ensembles de données que nous publions est celui de la Finance Proposition Bank et de la Contracts Proposition Bank. Ces jeux de données font partie d’un programme de recherche actif d’IBM Research. Ce projet de recherche vise à améliorer les technologies de compréhension du langage naturel que sous-tendent les multiples offres de produits IBM, notamment Watson Natural Language Understanding et Watson Compare & Comply.

Nos chercheurs ont créé ces fichiers de données avec l’aide des développeurs de Watson, en faisant correspondre les caractéristiques du texte cible à celles des documents du monde réel que le système analyse en production. Les chercheurs ont utilisé ces jeux de données pour former des versions spécifiques à un domaine des analyseurs qui extraient la signification sémantique des documents commerciaux régissant l’entreprise tels que les accords juridiques et les rapports financiers.

IBM Research détient une expérience importante dans ce type de travail, et l’équipe CODAIT est fière de contribuer à la mission d’ouverture d’IBM Research en publiant ces données de recherche de pointe sur le Data Asset eXchange.

 

Pourquoi le DAX ?

Bien qu’il y ait beaucoup de ressources en ligne pour trouver des jeux de données open source – des collections de liens sur GitHub aux sites tels que Kaggle Datasets – DAX est unique dans par son haut niveau de qualité et de conservation. DAX aide à créer des workflows de deep learning de bout en bout (de l’utilisation des données pour former des modèles au déploiement de modèles de manière standard), ce qui permet aux développeurs de consommer des données ouvertes en toute confiance sous des licences de données ouvertes clairement définies.

 

Les données dont vous avez besoin pour développer des solutions d’IA

IBM a conçu le référentiel Data Asset eXchange pour compléter le Model Asset eXchange. L’interface utilisateur pour organiser les ressources est cohérente sur les deux plates-formes et les utilisateurs peuvent facilement former les modèles sur MAX en utilisant les données de Data Asset eXchange.

L’objectif de l’équipe CODAIT est de simplifier l’utilisation des ressources DAX et MAX en conjonction avec les produits IBM IA ainsi qu’avec d’autres outils d’IA hybrides et multicloud, propriétaires et open source. Nous voulons donner aux datascientists et aux développeurs une point de départ bien cadré, afin qu’il leur soit plus facile de commencer à développer leurs solutions d’IA.

En savoir plus du DAX

 

Écrit par Vijay Bommireddipalli, Frederick Reiss, Gabriela de Queiroz, Nick Pentreath, le 16 juillet 2019

Traduit par Isabelle Ulrich

Version originale : https://developer.ibm.com/blogs/ibm-data-asset-exchange-dax-free-open-data-ai/

 

 

Developer Relations Marketing Leader IBM France

More Développeurs stories
3 juillet 2024

Intégration par design : la clé de la réussite de la transformation cloud

La transformation cloud est un processus complexe qui nécessite une planification méticuleuse et une exécution soignée pour réussir. Alors que les organisations se lancent dans la transformation du cloud, elles se concentrent souvent sur la migration des applications et des données vers le cloud, négligeant un aspect critique : l’intégration. L’un des défis majeurs que […]

Continue reading

14 juin 2024

Gestion de l’obsolescence logicielle : véritable enjeu pour la DSI et le business

Dans le paysage numérique actuel, les applications logicielles sont le pilier des entreprises modernes. Cependant, avec l’évolution rapide de la technologie, l’obsolescence logicielle est devenue un défi majeur pour les organisations. Les logiciels obsolètes peuvent entraîner des vulnérabilités de sécurité, des crashes système et une productivité réduite, affectant ainsi la performance commerciale et la compétitivité. […]

Continue reading

12 juin 2024

Simplifier les déclarations liées à la CSRD grâce aux nouvelles fonctionnalités d’IBM®Envizi™

IBM a le plaisir d’annoncer la prise en compte de la directive européenne (CSRD) dans le module « sustainability reporting manager » d’IBM® Envizi™. Cette considération aidera les entreprises à répondre aux exigences de reporting de la directive européenne (CSRD). La CSRD impose aux entreprises de fournir des informations et des indicateurs définis via les […]

Continue reading