Text Mining, analyse de documents non structurés et extraction de données. 

Text Mining, solution d'analyse de documents non structurés.

Basée sur son moteur d'analyse sémantique, Onyme a créé une application de Text Mining. Cette solution logicielle de découverte d'informations non structurées permet l'analyse et l'extraction de données à partir de supports non formatés.

Analyse de documents et extraction de données clefs.

La solution de Text Mining d'Onyme vous permet d'extraire de documents non structurés les informations que vous cherchez. La solution s'appuie sur :

Une analyse sémantique et lexicométrique.

L'écriture de régles spécifiques liées aux données à extraire.

Principe de fonctionnement

1ère étape : récupération des documents

Lecture des supports sources (.doc, .html...)
Déformatage

2ème étape : analyse du texte et identification des données

Lemmatisation
Segmentation
Application des régles spécifiques
contrôle

3ème étape : Production de données structurées utilisables directement.

création d'un fichier XML comprenant les données classées.

Spécifications techniques

La solution de Text Mining d'Onyme permet de lire les formats de fichiers suivants

.html, .doc, .pdf, .rtf, .txt

Les données résultantes de l'analyse des documents sont livrées au format XML. La structure du fichier varie en fonction des données extraites.