Accueil
Case Studies
Digital Office Company
Digital Office Company (DOC), un fournisseur de solutions et de services de gestion des informations basé en Finlande, aide les entreprises à trouver et à gérer de grandes quantités de documents rapidement et à grande échelle en leur permettant d’identifier, de classer et d’extraire des informations de leurs documents.
Le plus souvent, les systèmes automatisés de classification des documents ne fournissent qu’un aperçu superficiel de la nature des documents par le biais de balises génériques ou d’enrichissements des métadonnées. Cette classification superficielle ne tient pas entièrement compte du contenu du document lui-même, ce qui signifie que la véritable valeur des données ne peut être exploitée que si chaque document est évalué manuellement.
En définitive, un tel processus d’évaluation manuelle des documents pour identifier les types de documents, détecter les documents égarés et extraire des détails cruciaux serait très laborieux et chronophage. En outre, le manque de gestion des métadonnées pose un problème potentiel de conformité avec le RGPD et a un impact négatif sur la qualité des données pour les tâches en aval. Si ces défis ne sont pas résolus, ils peuvent menacer l’avantage concurrentiel et l’efficacité des clients de DOC en raison de ces problèmes de qualité des données et de conformité aux réglementations.
Pour surmonter ces obstacles, DOC a collaboré avec IBM Ecosystem Engineering Build Lab, IBM Client Engineering et IBM Technology Expert Labs pour développer un projet pilote qui tire à la fois parti du machine learning traditionnel et de l’IA générative (les grands modèles de langage (LLM)) avec IBM watsonx .ai et IBM Watson Discovery.
Dans le cadre d’un projet pilote de co-création de 6 semaines, DOC a développé une solution de pipeline de données alimentée par la plateforme IBM Watson Discovery qui utilise des modèles de machine learning personnalisés avec le LLM Mixtral-8x7B de Mistral AI pour classer les documents avec des étiquettes personnalisées et des balises de métadonnées. Le projet pilote a été axé sur le secteur de l’immobilier en raison de la variété des types de données et des exigences réglementaires auxquels sont confrontés les clients de DOC dans ce domaine. Cette orientation sectorielle a conduit à la création d’une fonctionnalité supplémentaire qui a élargi la portée de la solution : l’utilisation de LLM pour extraire des informations riches telles que les décisions du conseil d’administration à partir des procès-verbaux des réunions.
Le projet pilote s’est avéré très fructueux en termes d’augmentation de la vitesse et de la qualité de la classification des documents et d’informations sur de grands volumes de documents. En outre, les résultats du projet pilote fournissent une indication claire des avantages d’une approche combinée du machine learning traditionnel et de l’IA générative, dans laquelle les lacunes de chaque approche sont couvertes par les forces de l’autre. Ce qui prenait auparavant quelques minutes à un individu pour parcourir manuellement un document et le classer prend désormais 2 secondes par document grâce à un processus automatisé qui ne nécessite une évaluation humaine que pour les documents classés par le système en tant que donnée aberrante.
À l’avenir, DOC a l’intention d’étendre ce projet pilote en développant davantage sa solution afin de l’étendre à d’autres secteurs et segments de clientèle.
Digital Office Company (DOC) (lien externe à ibm.com) est une société finlandaise fondée en 1996 qui propose des solutions modernes de gestion de l’information à des organisations de différentes tailles. Ses bureaux sont situés à Espoo, Hämeenlinna, Lahti et Lappeenranta, en Finlande.
© Copyright IBM Corporation 2024. IBM, le logo IBM, IBM Watson et IBM watsonx.ai sont des marques d’IBM Corp. enregistrées aux États-Unis et/ou dans d’autres pays. Les autres noms de produits et de services sont des marques d’IBM ou d’autres sociétés. Une liste actualisée des marques IBM est disponible sur la page www.ibm.com/fr-fr/legal/copytrade. Les informations contenues dans le présent document étaient à jour à la date de sa publication initiale. Elles peuvent être modifiées sans préavis par IBM. Les exemples présentés ne sont qu’illustratifs. Les résultats réels varient en fonction des configurations et des conditions du client et, par conséquent, les résultats généralement attendus ne peuvent pas être fournis. Certaines offres mentionnées dans le présent document ne sont pas disponibles dans tous les pays où la société IBM est présente. Il incombe au client de respecter l’ensemble des lois et réglementations applicables. IBM ne fournit pas de conseils juridiques et ne déclare ni ne garantit que ses services ou ses produits mettront le client en conformité avec la législation ou la réglementation en vigueur. |