Text Mining, solution d'analyse de documents non structurés.
Basée sur son moteur d'analyse sémantique, Onyme a créé une application de Text Mining. Cette solution logicielle de découverte d'informations non structurées permet l'analyse et l'extraction de données à partir de supports non formatés.
Analyse de documents et extraction de données clefs.
La solution de Text Mining d'Onyme vous permet d'extraire de documents non structurés les informations que vous cherchez. La solution s'appuie sur :
Une analyse sémantique et lexicométrique.
L'écriture de régles spécifiques liées aux données à extraire.
Principe de fonctionnement
1ère étape : récupération des documents
Lecture des supports sources (.doc, .html...)
Déformatage
2ème étape : analyse du texte et identification des données
Lemmatisation
Segmentation
Application des régles spécifiques
contrôle
3ème étape : Production de données structurées utilisables directement.
création d'un fichier XML comprenant les données classées.
Spécifications techniques
La solution de Text Mining d'Onyme permet de lire les formats de fichiers suivants
.html, .doc, .pdf, .rtf, .txt
Les données résultantes de l'analyse des documents sont livrées au format XML. La structure du fichier varie en fonction des données extraites.