Projet de Master informatique dans le domaine du traitement automatique du langage naturel. L'objectif de ce programme est de rechercher les relations sémantiques présentes dans un texte.
Le programme utilise les données du système JeuxDeMots.org.
java -jar extracteur.jar
-regles fichier/de/regles
-cible document/à/analyser
-comp fichier/mots/composes [optionnel]
-output dossier/de/sortie
-verbose(2) [optionnel] : verbose pour afficher dans le terminal le déroulement de l'exécution,
verbose2 pour plus de détails
-export_stats [optionnel] : Exporter les statistiques de l'exécution
*** Le document cible peut être écrit de n'importe quelle manière, cependant, les mots étant analysés via une base de données linguistique, il est nécessaire d'éviter le plus possible les fautes.
*** Le fichier de mots composés n'est pas obligatoire, si vous le donnez en argument, le programme le gérera automatiquement. Dans le fichier, un seul mot composé doit être écrit par ligne.
*** Concernant les règles, elles doivent respecter le format suivant :
contrainte sur ce qui précède ; relation sémantique ; ensemble de mots déclencheur ; contrainte sur ce qui suit
Les contraintes sont optionnelles et portent sur les éléments qui entourent une relation. Elles peuvent imposer le genre, le nombre et la classe grammaticale.
Les contraintes sur le nombre sont : Sing ou Plu.
Les contraintes sur le genre sont : Masc ou Fem.
Toutes les contraintes doivent être séparées par un point, par exemple : Masc.Plu.Adj signifie que l'on recherche un adjectif masculin au pluriel.
Exemples de règles :
Sing ; r_carac-1 ; caractérise la ; Sing.Fem ;
Sing ; r_carac-1 ; caractérise le ; Sing.Masc ;
Sing ; r_against ; agit contre la ; Fem.Sing ;
Sing ; r_against ; agit contre le ; Masc.Sing ;
Sing ; r_telic_role ; a pour role d' ; ;
Sing.Fem ; r_telic_role ; est faite pour ; ;
Plu.Masc ; r_carac ; sont-ils ; Adj.Plu.Masc ;
Actuellement, pour les contraintes, le code ne peut gérer que les adjectifs (Adj) et les verbes (Ver) pour les classes grammaticales, pour les autres cas, un nom sera recherché.