Box lance Box Extract pour automatiser l’extraction des données des documents

Box annonce la disponibilité de Box Extract, une solution pour extraire automatiquement les données des documents non structurés. L’outil s’appuie sur les modèles d’IA générative de Google, Anthropic et OpenAI pour convertir le contenu en métadonnées exploitables.

Box Extract permet d’extraire des informations issues de documents non structurés (contrats, formulaires, rapports, spécifications produits, documents réglementaires…) afin de les convertir en métadonnées exploitables directement dans l’environnement Box.

Les métadonnées générées peuvent être utilisées pour alimenter des tableaux de bord, faciliter la recherche de contenus ou déclencher des workflows automatisés au sein de la plateforme de Box. Elles peuvent également être exportées ou synchronisées vers avec des plateformes analytiques externes comme Databricks ou Snowflake. Box a prévu la possibilité pour les entreprises de créer et de déployer des agents Extract personnalisés.

L’outil vise à réduire les traitements manuels liés à l’exploitation de documents non structurés, souvent coûteux et difficiles à industrialiser. Selon Box, contrairement aux outils traditionnels d’extraction de données, son approche agentique permet de comprendre la structure et la signification des documents, de les décomposer en éléments tels que des paragraphes, des tableaux ou des graphiques, puis d’en extraire les informations les plus importantes.

L’éditeur propose deux niveaux d’agents d’extraction : un agent standard pour les cas d’usage simples et un agent avancé capable de traiter des documents volumineux et complexes grâce à une analyse multimodale de la structure documentaire.

Retour en haut