diff --git a/data/xml/2006.tal.xml b/data/xml/2006.tal.xml
new file mode 100644
index 0000000000..3a47869c2e
--- /dev/null
+++ b/data/xml/2006.tal.xml
@@ -0,0 +1,265 @@
+
+
+
+
+ Traitement Automatique des Langues, Volume 47, Numéro 1 : Varia [Varia]
+ SylvainKahane
+ ChristianRetoré
+ PierreZweigenbaum
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2006
+ tal
+
+
+ Variabilité des performances des outils de TAL et genre textuel [Textual genre and variability of NLP tools’ performance]
+ Marie-PauleJacques
+ NathalieAussenac-Gilles
+ 11–32
+ 2006.tal-1.1
+ fra
+ jacques-aussenac-gilles-2006-variabilite
+
+
+ Du quatrième de proportion comme principe inductif : une proposition et son application à l’apprentissage de la morphologie [Inference with formal analogical proportions: application to the automatic learning of morphology]
+ NicolasStroppa
+ FrançoisYvon
+ 33–59
+ 2006.tal-1.2
+ fra
+ stroppa-yvon-2006-du
+
+
+ Traiter les documents XML avec les « contextes de lecture » [Processing XML documents with “reading contexts”]
+ XavierTannier
+ 61–85
+ 2006.tal-1.3
+ fra
+ tannier-2006-traiter
+
+
+ Une exploration de la structure sémantique du lexique adjectival français [Exploring the semantic structure of the French adjectival lexicon]
+ FabienneVenant
+ 87–111
+ 2006.tal-1.4
+ fra
+ venant-2006-une
+
+
+ Comparabilité de corpus et fouille terminologique multilingue [Corpus comparability and multilingual terminology Mining]
+ EmmanuelMorin
+ BéatriceDaille
+ 113–136
+ 2006.tal-1.5
+ fra
+ morin-daille-2006-comparabilite
+
+
+ Un cas de “polysémie logique” : modélisation de noms d’action en français ambigus entre processus et artefact [A case of “logical polysemy”: modeling process versus artifact ambiguous French action nouns]
+ EvelyneJacquey
+ 137–166
+ 2006.tal-1.6
+ fra
+ jacquey-2006-un
+
+
+ Inférence de règles de propagation syntaxique pour l’alignement de mots [Inference of Syntactic Propagation Rules for Word Alignment]
+ SylwiaOzdowska
+ VincentClaveau
+ 167–186
+ 2006.tal-1.7
+ fra
+ ozdowska-claveau-2006-inference
+
+
+
+
+ Traitement Automatique des Langues, Volume 47, Numéro 2 : Discours et document : traitements automatiques [Computational Approaches to Discourse and Document Processing]
+ Marie-PaulePéry-Woodley
+ DoniaScott
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2006
+ tal
+
+
+ Computational Approaches to Discourse and Document Processing
+ Marie-PaulePéry-Woodley
+ DoniaScott
+ 7–19
+ 2006.tal-2.1
+ pery-woodley-scott-2006-computational
+
+
+ Discourse-based answering of why-questions
+ SuzanVerberne
+ LouBoves
+ Peter-ArnoCoppen
+ NellekeOostdijk
+ 21–41
+ 2006.tal-2.2
+ verberne-etal-2006-discourse
+
+
+ Attribution and its annotation in the Penn Discourse TreeBank
+ RashmiPrasad
+ NikhilDinesh
+ AlanLee
+ AravindJoshi
+ BonnieWebber
+ 43–64
+ 2006.tal-2.3
+ prasad-etal-2006-attribution
+
+
+ Relations intersubjectives dans les discours rapportés [Intersubjective relations in reported speech]
+ AgataJackiewicz
+ 65–87
+ 2006.tal-2.4
+ fra
+ jackiewicz-2006-relations
+
+
+ Validation d’une méthodologie pour l’étude des marqueurs de la segmentation dans un grand corpus de textes [Validation of a methodology for the study of segmentation markers in large corpora]
+ PiérardSophie
+ BestgenYves
+ 89–110
+ 2006.tal-2.5
+ fra
+ sophie-yves-2006-validation
+
+
+ Approches endogène et exogène pour améliorer la segmentation thématique de documents [Endogenous and Exogenous Approaches for Improving Thematic Document Segmentation]
+ OlivierFerret
+ 111–135
+ 2006.tal-2.6
+ fra
+ ferret-2006-approches
+
+
+ Visualising discourse coherence in nonlinear documents
+ ClaraMancini
+ DoniaScott
+ Simon BuckinghamShum
+ 137–168
+ 2006.tal-2.7
+ mancini-etal-2006-visualising
+
+
+ Capacité générative forte de RST, SDRT et des DAG de dépendances pour le discours [Strong generative capacity of RST, SDRT and dependency DAGs for discourse]
+ LaurenceDanlos
+ 169–198
+ 2006.tal-2.8
+ fra
+ danlos-2006-capacite
+
+
+ Contraindre le fond et la forme en domaine contraint: la normalisation de documents [Constraining form and content in a constrained domain: document normalization]
+ AurélienMax
+ 199–224
+ 2006.tal-2.9
+ fra
+ max-2006-contraindre
+
+
+ Navigation textuelle : représentation des textes et des connaissances [Text navigation: text and knowledge representation]
+ JavierCouto
+ Jean-LucMinel
+ 225–254
+ 2006.tal-2.10
+ fra
+ couto-minel-2006-navigation
+
+
+
+
+ Traitement Automatique des Langues, Volume 47, Numéro 3 : Varia [Varia]
+ SylvainKahane
+ ChristianRetoré
+ PierreZweigenbaum
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2006
+ tal
+
+
+ Représentation des expressions calendaires dans les textes : vers une application à la lecture assistée de biographies [Representation of calendar expressions in texts: towards an application to assisted reading of biographies]
+ DelphineBattistelli
+ Jean-LucMinel
+ Sylviane R.Schwer
+ 11–37
+ 2006.tal-3.1
+ fra
+ battistelli-etal-2006-representation
+
+
+ Une architecture de services pour mieux spécialiser les processus d’acquisition terminologique [A service architecture for better specialization of terminology acquisition processes]
+ FaridCerbah
+ BéatriceDaille
+ 39–61
+ 2006.tal-3.2
+ fra
+ cerbah-daille-2006-une
+
+
+ Vers une double annotation des entités nommées [Towards a double annotation of named entities]
+ MaudEhrmann
+ GuillaumeJacquet
+ 63–88
+ 2006.tal-3.3
+ fra
+ ehrmann-jacquet-2006-vers
+
+
+ Modélisation de la coordination dans les grammaires d’interaction [Modeling coordination in interaction grammars]
+ JosephLe Roux
+ GuyPerrier
+ 89–113
+ 2006.tal-3.4
+ fra
+ le-roux-perrier-2006-modelisation
+
+
+ Prolexbase. Un dictionnaire relationnel multilingue de noms propres [Prolexbase: a multilingual relational dictionary of Proper Names]
+ MickaëlTran
+ DenisMaurel
+ 115–139
+ 2006.tal-3.5
+ fra
+ tran-maurel-2006-prolexbase
+
+
+ Acquisition et évaluation sur corpus de propriétés de sous-catégorisation syntaxique [Acquisition and corpus-based evaluation of syntactic subcategorization properties]
+ DidierBourigault
+ CécileFrérot
+ 141–154
+ 2006.tal-3.6
+ fra
+ bourigault-frerot-2006-acquisition
+
+
+ Une grammaire partagée multitâche pour le traitement de la parole : application aux langues romanes [A multitask shared grammar for speech processing: application to romance languages]
+ PierretteBouillon
+ MannyRayner
+ BrunaNovellas
+ MarianneStarlander
+ MarianneSantaholma
+ YukieNakao
+ NikosChatzichrisafis
+ 155–173
+ 2006.tal-3.7
+ fra
+ bouillon-etal-2006-une-grammaire
+
+
+ Traduction automatisée fondée sur le dialogue et documents auto-explicatifs : bilan du projet LIDIA [Machine translation based on dialogues and self-explanatory documents: an assessment of the LIDIA project]
+ HervéBlanchon
+ ChristianBoitet
+ AliChoumane
+ 175–204
+ 2006.tal-3.8
+ fra
+ blanchon-etal-2006-traduction
+
+
+
diff --git a/data/xml/2007.tal.xml b/data/xml/2007.tal.xml
new file mode 100644
index 0000000000..0b2169572c
--- /dev/null
+++ b/data/xml/2007.tal.xml
@@ -0,0 +1,240 @@
+
+
+
+
+ Traitement Automatique des Langues, Volume 48, Numéro 1 : Principes de l'évaluation en Traitement Automatique des Langues [Principles of Evaluation in Natural Language Processing]
+ PatrickParoubek
+ StéphaneChaudiron
+ LynetteHirschman
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2007
+ tal
+
+
+ Principles of Evaluation in Natural Language Processing
+ PatrickParoubek
+ StéphaneChaudiron
+ LynetteHirschman
+ 7–31
+ 2007.tal-1.1
+ paroubek-etal-2007-principles
+
+
+ Pour l’évaluation externe des systèmes de TA par des méthodes fondées sur la tâche [For an external evaluation of MT systems by task-based methods]
+ HervéBlanchon
+ ChristianBoitet
+ 33–65
+ 2007.tal-1.2
+ fra
+ blanchon-boitet-2007-pour
+
+
+ Le rôle des métriques d’évaluation dans le processus de recherche en TAL [The role of evaluation metrics in the NLP research process]
+ AndreiPopescu-Belis
+ 67–91
+ 2007.tal-1.3
+ fra
+ popescu-belis-2007-le
+
+
+ Trois expériences d’évaluation dans le cadre du développement d’un système d’alignement sous-phrastique [Three evaluation experiments in the context of the development of a sub-sentential alignment system]
+ SylwiaOzdowska
+ 93–114
+ 2007.tal-1.4
+ fra
+ ozdowska-2007-trois
+
+
+ SIMDIAL - Un paradigme pour évaluer automatiquement des systèmes de dialogue homme-machine en simulant un utilisateur de façon déterministe [SIMDIAL - A paradigm for the automatic evaluation of human-machine dialogue systems by deterministic simulation of a user]
+ JosephAllemandou
+ LaurentCharnay
+ LaurenceDevillers
+ MurielLauvergne
+ JosephMariani
+ 115–139
+ 2007.tal-1.5
+ fra
+ allemandou-etal-2007-simdial
+
+
+ Evaluation in Natural Language Generation: Lessons from Referring Expression Generation
+ JetteViethen
+ RobertDale
+ 141–160
+ 2007.tal-1.6
+ viethen-dale-2007-evaluation
+
+
+ Terminologie et paramètres expérimentaux pour l’évaluation des résumés automatiques [Terminology and experimental parameters for the evaluation of automatic summaries]
+ Marie-JoséeGoulet
+ 161–185
+ 2007.tal-1.7
+ fra
+ goulet-2007-terminologie
+
+
+ Prosodic Phrase Break Prediction: Problems in the Evaluation of Models against a Gold Standard
+ ClaireBrierley
+ EricAtwell
+ 187–206
+ 2007.tal-1.8
+ brierley-atwell-2007-prediction
+
+
+
+
+ Traitement Automatique des Langues, Volume 48, Numéro 2 : Communication Assistée [Assisted communication]
+ DenisMaurel
+ Jean-YvesAntoine
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2007
+ tal
+
+
+ Introduction [Introduction]
+ DenisMaurel
+ Jean-YvesAntoine
+ 1–2
+ 2007.tal-2.1
+ fra
+ maurel-antoine-2007-introduction
+
+
+ Aide à la communication pour personnes handicapées et prédiction de texte [Communication support for people with disabilities and text prediction]
+ DenisMaurel
+ Jean-YvesAntoine
+ 9–46
+ 2007.tal-2.2
+ fra
+ maurel-antoine-2007-aide
+
+
+ Le moteur de prédiction de mots de la Plateforme de Communication Alternative [The word prediction engine of the Alternative Communication Platform]
+ PhilippeBlache
+ StéphaneRauzy
+ 47–70
+ 2007.tal-2.3
+ fra
+ blache-rauzy-2007-le
+
+
+ Modèle adaptatif pour la prédiction de mots. Adaptation à l’utilisateur et au contexte dans le cadre de la communication assistée pour personnes handicapées [Adaptive model for word prediction. Adaptation to user and context in assistive communication for people with disabilities]
+ TonioWandmacher
+ Jean-YvesAntoine
+ 71–95
+ 2007.tal-2.4
+ fra
+ wandmacher-antoine-2007-modele
+
+
+ Le système KEYGLASS: Système d’ajout dynamique de touches sur clavier logiciel [The KEYGLASS system: a dynamic keystroke addition system on a software keyboard]
+ MathieuRaynal
+ 97–121
+ 2007.tal-2.5
+ fra
+ raynal-2007-le
+
+
+ Éléments pour adapter les systèmes de recherche d’information aux dyslexiques [Towards adapting information retrieval systems to dyslexic people]
+ LaurianeSitbon
+ PatriceBellot
+ PhilippeBlache
+ 123–147
+ 2007.tal-2.6
+ fra
+ sitbon-etal-2007-elements
+
+
+
+
+ Traitement Automatique des Langues, Volume 48, Numéro 3 : Modélisation et traitement des langues des signes [Sign Language Modelling and Processing]
+ ChristianCuxac
+ PatriceDalle
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2007
+ tal
+
+
+ Préface [Foreword]
+ ChristianCuxac
+ PatriceDalle
+ 7–10
+ 2007.tal-3.1
+ fra
+ cuxac-dalle-2007-preface
+
+
+ Research Directions in Sign Language Processing
+ ChristianCuxac
+ PatriceDalle
+ 15–30
+ 2007.tal-3.2
+ cuxac-dalle-2007-research
+
+
+ Vers un système de traduction automatique : français/langue des signes française (TLF) [Towards a French/French Sign Language Machine-Translation System (TLF)]
+ LoïcKervajan
+ ÉmilieGuimier De Neef
+ GaspardBreton
+ 31–54
+ 2007.tal-3.3
+ fra
+ kervajan-etal-2007-vers
+
+
+ Comparative Correlatives in Italian Sign Language
+ CarloGeraci
+ 55–92
+ 2007.tal-3.4
+ geraci-2007-comparative
+
+
+ Compositionnalité morphophonétique de la langue des signes française (LSF) et exploration des relations structurales entre paramètres [Morphophonetic Compositionality of French Sign Language (LSF) and Exploration of Structural Relationships Between Parameters]
+ DominiqueBoutet
+ BrigitteGarcia
+ 93–114
+ 2007.tal-3.5
+ fra
+ boutet-garcia-2007-compositionnalite
+
+
+ Formalisme de description des gestes de la langue des signes française pour la génération du mouvement de signeurs virtuels [French Sign Language Gesture Description Formalism for the Generation of Virtual Signer Motion]
+ SylvieGibet
+ AlexisHéloir
+ 115–149
+ 2007.tal-3.6
+ fra
+ gibet-heloir-2007-formalisme
+
+
+ Description lexicale des signes — Intérêts linguistiques d’un modèle géométrique à dépendances [Lexical Description of Signs — Linguistic Benefits of a Geometric Dependency Model]
+ MichaelFilhol
+ AnneliesBraffort
+ 151–177
+ 2007.tal-3.7
+ fra
+ filhol-braffort-2007-description
+
+
+ Modèles et méthodes de traitement d’images pour l’analyse de la langue des signes [Image processing models and methods for sign language analysis]
+ FrédérickGianni
+ ChristopheCollet
+ FrançoisLefebvre
+ 175–200
+ 2007.tal-3.8
+ fra
+ gianni-etal-2007-modeles
+
+
+ Langue des signes et schémas [Sign language and diagrams]
+ PierreGuitteny
+ 205–229
+ 2007.tal-3.9
+ fra
+ guitteny-2007-langue
+
+
+
diff --git a/data/xml/2008.tal.xml b/data/xml/2008.tal.xml
new file mode 100644
index 0000000000..8735eee7d7
--- /dev/null
+++ b/data/xml/2008.tal.xml
@@ -0,0 +1,298 @@
+
+
+
+
+ Traitement Automatique des Langues, Volume 49, Numéro 1 : Varia [Varia]
+ ChristianRetoré
+ YvonFrançois
+ PierreZweigenbaum
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2008
+ tal
+
+
+ Enrichissement d’un lexique bilingue par apprentissage analogique [Enrichment of a Bilingual Lexicon by Analogical Learning]
+ PhilippeLanglais
+ AlexandrePatry
+ 13–40
+ 2008.tal-1.1
+ fra
+ langlais-patry-2008-enrichissement
+
+
+ Fouille d’erreurs sur des sorties d’analyseurs syntaxiques [Error Mining on Syntactic Parser Output]
+ BenoîtSagot
+ ÉricVillemonte de la Clergerie
+ 41–60
+ 2008.tal-1.2
+ fra
+ sagot-villemonte-de-la-clergerie-2008-fouille
+
+
+ Prolexbase et LMF : vers un standard pour les ressources lexicales sur les noms propres [Prolexbase and LMF: towards a standard for Proper Name lexical resources]
+ BéatriceBouchou
+ DenisMaurel
+ 61–88
+ 2008.tal-1.3
+ fra
+ bouchou-maurel-2008-prolexbase
+
+
+ “Penser global, agir local” : Les coordinations antithétiques dans une grammaire de construction multi-dimensionnelle [“Thinking global, acting local”: Antonym coordinations in a multidimensional construction grammar]
+ Marie-LaureGuénot
+ 89–113
+ 2008.tal-1.4
+ fra
+ guenot-2008-penser
+
+
+ Contrôle rhétorique de l’ellipse sémantique en génération du langage pour le dialogue homme-machine à plusieurs locuteurs [Rhetorical Control of Semantic Ellipsis in Language Generation for Multi-Party Human-Computer Dialogue]
+ VladimirPopescu
+ JeanCaelen
+ CorneliuBurileanu
+ 115–139
+ 2008.tal-1.5
+ fra
+ popescu-etal-2008-controle
+
+
+ Compréhension automatique de la parole arabe spontanée — Une modélisation numérique [Automatic Understanding of Spontaneous Arabic Speech — A Numerical Model]
+ AnisZouaghi
+ MounirZrigui
+ GeorgesAntoniadis
+ 141–166
+ 2008.tal-1.6
+ fra
+ zouaghi-etal-2008-comprehension
+
+
+ RELAX — Extraction de relations sémantiques dans les contextes biographiques [RELAX — Extractino of Semantic Relations in Biographical Contexts]
+ MichaelaGeierhos
+ OlivierBlanc
+ SandraBsiri
+ 167–190
+ 2008.tal-1.7
+ fra
+ geierhos-etal-2008-relax
+
+
+
+
+ Traitement Automatique des Langues, Volume 49, Numéro 2 : Plate-formes pour le traitement automatique des langues [Platforms for Natural Language Processing]
+ PatriceEnjalbert
+ KalinaBontcheva
+ BenoitHabert
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2008
+ tal
+
+
+ Préface [Preface]
+ PatriceEnjalbert
+ 7–10
+ 2008.tal-2.1
+ fra
+ enjalbert-2008-preface
+
+
+ TiLT : plate-forme pour le traitement automatique des langues naturelles [TiLT : a natural language processing platform]
+ JohannesHeinecke
+ GrégorySmits
+ ChristineChardenon
+ ÉmilieGuimier De Neef
+ EstelleMaillebuau
+ MalekBoualem
+ 17–41
+ 2008.tal-2.2
+ fra
+ heinecke-etal-2008-tilt
+
+
+ Antelope : une plate-forme industrielle de traitement linguistique [Antelop : an industrial platform for linguistic processing]
+ François-RégisChaumartin
+ 43–71
+ 2008.tal-2.3
+ fra
+ chaumartin-2008-antelope
+
+
+ Articulation des traitements en TAL. Principes méthodologiques et mise en œuvre dans la plate-forme LinguaStream [Scheduling natural language processing steps : Methodological principles and implemantation in the LinguaStream platform]
+ AntoineWidlöcher
+ FrédérikBilhaut
+ 73–101
+ 2008.tal-2.4
+ fra
+ widlocher-bilhaut-2008-articulation
+
+
+ SUMMA. A Robust and Adaptable Summarization Tool
+ HoracioSaggion
+ 103–125
+ 2008.tal-2.5
+ saggion-2008-summa
+
+
+ Le développement d’une plate-forme pour l’annotation spécialisée de documents Web : retour d’expérience [Developping a platform dedicated to the annotation of web documents: a case study]
+ ThierryHamon
+ AdelineNazarenko
+ 127–154
+ 2008.tal-2.6
+ fra
+ hamon-nazarenko-2008-le
+
+
+ SxPipe 2 : architecture pour le traitement présyntaxique de corpus bruts [SxPipe 2 : an architecture for surface preprocessing of raw corpora]
+ BenoîtSagot
+ PierreBoullier
+ 155–188
+ 2008.tal-2.7
+ fra
+ sagot-boullier-2008-sxpipe
+
+
+ CorpusReader : construction et interrogation de corpus multiannotés [CorpusReader : designing and querying multi-layer corpora]
+ SylvainLoiseau
+ 189–215
+ 2008.tal-2.8
+ fra
+ loiseau-2008-corpusreader
+
+
+ A Flexible Framework for Integrating Annotations from Different Tools and Tag Sets
+ ChristianChiarcos
+ StefanieDipper
+ MichaelGötze
+ UlfLeser
+ AnkeLüdeling
+ JuliaRitz
+ ManfredStede
+ 217–246
+ 2008.tal-2.9
+ chiarcos-etal-2008-flexible
+
+
+ SEWS : un serveur d’évaluation orienté Web pour la syntaxe [SEWS : an web-based server for evaluating syntactic annotation tools]
+ OlivierHamon
+ PatrickParoubek
+ DjamelMostef
+ 247–270
+ 2008.tal-2.10
+ fra
+ hamon-etal-2008-sews
+
+
+ Cocytus: parallel NLP over disparate data
+ NoahEvans
+ MasayukiAsahar
+ YujiMatsumoto
+ 271–293
+ 2008.tal-2.11
+ evans-etal-2008-cocytus
+
+
+
+
+ Traitement Automatique des Langues, Volume 49, Numéro 3 : Recherches actuelles en phonologie et en phonétique : interfaces avec le traitement automatique des langues [Current Research in Phonology and Phonetics: Interfaces with Natural-Language Processing]
+ BernardLaks
+ NoëlNguyen
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2008
+ tal
+
+
+ Préface [Editorial]
+ BernardLaks
+ NoëlNguyen
+ 7–11
+ 2008.tal-3.1
+ fra
+ laks-nguyen-2008-preface
+
+
+ Contributions du traitement automatique de la parole à l’étude des voyelles orales du français [Using automatic speech processing to study French oral vowels]
+ MartineAdda-Decker
+ CédricGendrot
+ NoëlNguyen
+ 13–46
+ 2008.tal-3.2
+ fra
+ adda-decker-etal-2008-contributions
+
+
+ La parole spontanée : transcription et traitement [Processing and transcribing spontaneous speech]
+ ThierryBazillon
+ VincentJousse
+ FrédéricBéchet
+ YannickEstève
+ GeorgesLinarès
+ DanielLuzzati
+ 47–76
+ 2008.tal-3.3
+ fra
+ bazillon-etal-2008-la
+
+
+ IrcamCorpusTools : plate-forme pour les corpus de parole [IRCAM Corpus Tools: Managing speech corpora]
+ GrégoryBeller
+ ChristopheVeaux
+ GillesDegottex
+ NicolasObin
+ PierreLanchantin
+ XavierRodet
+ 77–103
+ 2008.tal-3.4
+ fra
+ beller-etal-2008-ircamcorpustools
+
+
+ Le CID - Corpus of Interactional Data. Annotation et exploitation multimodale de parole conversationnelle [The “Corpus of Interactional Data” (CID) - Multimodal annotation of conversational speech”]
+ RoxaneBertrand
+ PhilippeBlache
+ RobertEspesser
+ GaëlleFerré
+ ChristineMeunier
+ BéatricePriego-Valverde
+ StéphaneRauzy
+ 105–134
+ 2008.tal-3.5
+ fra
+ bertrand-etal-2008-le
+
+
+ Accents étrangers et régionaux en français. Caractérisation et identification [Foreign and regional accents in French. Characterisation and identification]
+ PhilippeBoula de Mareüil
+ BiancaVieru-Dimulescu
+ CécileWoehrling
+ MartineAdda-Decker
+ 135–163
+ 2008.tal-3.6
+ fra
+ boula-de-mareuil-etal-2008-accents
+
+
+ Alignement automatique et analyse phonétique : comparaison de différents systèmes pour l’analyse du schwa [Automatic alignment and phonetic studies: Comparing alignment systems for the analysis of the schwa]
+ AudreyBürki
+ CédricGendrot
+ GuillaumeGravier
+ GeorgeLinarès
+ CécileFougeron
+ 165–197
+ 2008.tal-3.7
+ fra
+ burki-etal-2008-alignement
+
+
+ Caractéristiques acoustiques et prosodiques des hésitations vocaliques dans trois langues [Acoustic and prosodic characteristics of vocalic hesitations in three languages]
+ IoanaVasilescu
+ MartineAdda-Decker
+ RenaNemoto
+ 199–228
+ 2008.tal-3.8
+ fra
+ vasilescu-etal-2008-caracteristiques
+
+
+
diff --git a/data/xml/2009.tal.xml b/data/xml/2009.tal.xml
new file mode 100644
index 0000000000..7ed9f85637
--- /dev/null
+++ b/data/xml/2009.tal.xml
@@ -0,0 +1,302 @@
+
+
+
+
+ Traitement Automatique des Langues, Volume 50, Numéro 1 : Varia [Varia]
+ BéatriceDaille
+ ÉricVillemonte de la Clergerie
+ FrançoisYvon
+ YvesLepage
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2009
+ tal
+
+
+ Un modèle formel de descriptions lexicales: Formalisme BDéf et structures de traits typées [A formal model for lexical descriptions: Typed feature-structure in the formalism BDéf]
+ LucieBarque
+ AlexisNasr
+ 11–34
+ 2009.tal-1.1
+ fra
+ barque-nasr-2009-un
+
+
+ Une approche textuelle pour l’analyse de textes de recommandations médicales [A textual approach for the analysis of health practice guidelines]
+ AmandaBouffier
+ 35–59
+ 2009.tal-1.2
+ fra
+ bouffier-2009-une
+
+
+ Alignement monolingue avec recherche de déplacements pour la critique génétique [Monolingual alignment with moves for genetic criticism]
+ JulienBourdaillet
+ 61–85
+ 2009.tal-1.3
+ fra
+ bourdaillet-2009-alignement
+
+
+ Résolution de métonymie des entités nommées : proposition d’une méthode hybride [Metonymy resolution for named entities: an hybrid approach]
+ CarolineBrun
+ MaudEhrmann
+ GuillaumeJacquet
+ 87–110
+ 2009.tal-1.4
+ fra
+ brun-etal-2009-resolution
+
+
+ D-STAG : un formalisme d’analyse automatique de discours fondé sur les TAG synchrones [D-STAG : a discourse analysis formalism based on synchronous TAGs]
+ LaurenceDanlos
+ 111–143
+ 2009.tal-1.5
+ fra
+ danlos-2009-stag
+
+
+ SLAM. Solutions lexicales automatiques pour métaphores [SLAM. Automatic lexical solutions for metaphors]
+ YannDesalle
+ BrunoGaume
+ KarineDuvignau
+ 145–175
+ 2009.tal-1.6
+ fra
+ desalle-etal-2009-slam
+
+
+ Similitude entre les sens d’usage d’un terme dans un réseau lexical [Similarity between term senses in a lexical network]
+ MathieuLafourcade
+ AlainJoubert
+ 177–200
+ 2009.tal-1.7
+ fra
+ lafourcade-joubert-2009-similitude
+
+
+ Analyse conjointe du signal sonore et de sa transcription pour l’identification nommée de locuteurs [Joint signal and transcription analysis for named speaker identification]
+ VincentJousse
+ SylvainMeignier
+ ChristineJacquin
+ SimonPetitrenaud
+ YannickEstève
+ BéatriceDaille
+ 201–225
+ 2009.tal-1.8
+ fra
+ jousse-etal-2009-analyse
+
+
+ Convertir des grammaires d’arbres adjoints à composantes multiples avec tuples d’arbres (TT-MCTAG) en grammaires à concaténation d’intervalles (RCG) [Converting tree tuple multicomponent tree adjoining grammars (TT-MCTAGs) into range concatenation grammars (RCGs)]
+ LauraKallmeyer
+ YannickParmentier
+ 227–255
+ 2009.tal-1.9
+ fra
+ kallmeyer-parmentier-2009-convertir
+
+
+ Évaluation des outils terminologiques : enjeux, difficultés et propositions [Evaluation of terminological tools : challenges, problems and propositions]
+ AdelineNazarenko
+ HaïfaZargayouna
+ OlivierHamon
+ Jonathanvan Puymbrouck
+ 257–281
+ 2009.tal-1.10
+ fra
+ nazarenko-etal-2009-evaluation
+
+
+ Points d’ancrage pour l’extraction lexicale bilingue à partir de petits corpus comparables spécialisés. Éléments de confiance pour la caractérisation des termes [Anchor points for bilingual extraction from small specialized comparable corpora]
+ EmmanuelProchasson
+ EmmanuelMorin
+ 283–304
+ 2009.tal-1.11
+ fra
+ prochasson-morin-2009-points
+
+
+ Extraction de collocations et leurs équivalents de traduction à partir de corpus parallèles [Extracting collocations and their translations from parallel corpora]
+ VioletaSeretan
+ 305–332
+ 2009.tal-1.12
+ fra
+ seretan-2009-extraction
+
+
+
+
+ Traitement Automatique des Langues, Volume 50, Numéro 2 : Langues anciennes [Ancient Languages]
+ JosephDenooz
+ SergeRosmorduc
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2009
+ tal
+
+
+ Préface [Editorial]
+ JosephDenooz
+ SergeRosmorduc
+ 7–11
+ 2009.tal-2.1
+ fra
+ denooz-rosmorduc-2009-preface
+
+
+ Computational and Linguistic Issues in Designing a Syntactically Annotated Parallel Corpus of Indo-European Languages
+ Dag T.Haug
+ Marius L.Jøhndal
+ Hanne M.Eckhoff
+ EirikWelo
+ Mari J. B.Hertzenberg
+ AngelikaMüth
+ 17–45
+ 2009.tal-2.2
+ haug-etal-2009-computational
+
+
+ Building and Using a Richly Annotated Interlinear Diachronic Corpus: The Case of Old High German Tatian
+ SvetlanaPetrova
+ MichaelSolf
+ JuliaRitz
+ ChristianChiarcos
+ AmirZeldes
+ 47–71
+ 2009.tal-2.3
+ petrova-etal-2009-building
+
+
+ Building a Corpus-based Historical Portuguese Dictionary : Challenges and Opportunities
+ Arnaldo JuniorCandido
+ Sandra MariaAluísio
+ 73–102
+ 2009.tal-2.4
+ candido-aluisio-2009-building
+
+
+ The Index Thomisticus Treebank Project: Annotation, Parsing and Valency Lexicon
+ BarbaraMcGillivray
+ MarcoPassarotti
+ PaoloRuffolo
+ 103–127
+ 2009.tal-2.5
+ mcgillivray-etal-2009-index
+
+
+ Variations langagières et annotation morphosyntaxique du latin classique [Linguistic variations and morphosyntactic annotation of Latin classical texts]
+ CélinePoudat
+ DominiqueLongrée
+ 129–148
+ 2009.tal-2.6
+ fra
+ poudat-longree-2009-variations
+
+
+ LGeRM: Lemmatisation des mots en moyen français [LGeRM: lemmatization of Middle French words]
+ GillesSouvay
+ Jean-MariePierrel
+ 149–172
+ 2009.tal-2.7
+ fra
+ souvay-pierrel-2009-lgerm
+
+
+ Une description morphologique structurée en arbre du verbe akkadien qui utilise des structures de traits et des transducteurs multirubans [A Tree-Structured morphological description of the Akkadian verb which uses Feature Structures and Multi-tape Transducers]
+ FrançoisBarthélémy
+ 173–199
+ 2009.tal-2.8
+ fra
+ barthelemy-2009-une
+
+
+ Identification of Cognates and Recurrent Sound Correspondences in Word Lists
+ GrzegorzKondrak
+ 201–235
+ 2009.tal-2.9
+ kondrak-2009-identification
+
+
+ Automatic Creation of Interlinear Text for Philological Purposes
+ Mark-JanNederhof
+ 237–255
+ 2009.tal-2.10
+ nederhof-2009-automatic
+
+
+
+
+ Traitement Automatique des Langues, Volume 50, Numéro 3 : Apprentissage automatique pour le TAL [Machine Learning for NLP]
+ IsabelleTellier
+ MarkSteedman
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2009
+ tal
+
+
+ Introduction [Préface]
+ IsabelleTellier
+ 7–21
+ 2009.tal-3.1
+ fra
+ tellier-2009-introduction
+
+
+ Une nouvelle représentation vectorielle pour la classification sémantique [New Word Vector Representation for Semantic Clustering]
+ SalmaJamoussi
+ 23–57
+ 2009.tal-3.2
+ fra
+ jamoussi-2009-une
+
+
+ Fouille de données séquentielles pour l’extraction d’information dans les textes [Sequential Data Mining for Information Extraction from Texts]
+ ThierryCharnois
+ MarcPlantevit
+ ChristopheRigotti
+ BrunoCrémilleux
+ 59–87
+ 2009.tal-3.3
+ fra
+ charnois-etal-2009-fouille
+
+
+ A SVM Cascade for Agreement/Disagreement Classification
+ PierreAndrews
+ SureshManandhar
+ 89–107
+ 2009.tal-3.4
+ andrews-manandhar-2009-svm
+
+
+ Cross-framework parser stacking for data-driven dependency parsing
+ LiljaØvrelid
+ JonasKuhn
+ KathrinSpreyer
+ 109–138
+ 2009.tal-3.5
+ ovrelid-etal-2009-cross
+
+
+ Sélection de caractéristiques pour les champs aléatoires conditionnels par pénalisation L1 [Selecting features with L1 regularization in Conditional Random Fields]
+ NataliyaSokolovska
+ OlivierCappé
+ FrançoisYvon
+ 139–171
+ 2009.tal-3.6
+ fra
+ sokolovska-etal-2009-selection
+
+
+ Modèles discriminants pour l’alignement mot à mot [Discriminant Models for Word Alignment]
+ AlexandreAllauzen
+ GuillaumeWisniewski
+ 173–203
+ 2009.tal-3.7
+ fra
+ allauzen-wisniewski-2009-modeles
+
+
+
diff --git a/data/xml/2010.tal.xml b/data/xml/2010.tal.xml
new file mode 100644
index 0000000000..4eff151f36
--- /dev/null
+++ b/data/xml/2010.tal.xml
@@ -0,0 +1,188 @@
+
+
+
+
+ Traitement Automatique des Langues, Volume 51, Numéro 1 : Varia [Varia]
+ BéatriceDaille
+ ÉricVillemonte de la Clergerie
+ YvesLepage
+ FrançoisYvon
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2010
+ tal
+
+
+ Composition filtrée et marqueurs de règles de réécriture pour une distance d’édition flexible. Application à la correction des mots hors vocabulaire [Filtered Composition and Markers for a Flexible Edit-Distance. Application to the Correction of Out-Of-Vocabulary Words.]
+ RichardBeaufort
+ 11–40
+ 2010.tal-1.1
+ fra
+ beaufort-2010-composition
+
+
+ Repérer automatiquement les segments obsolescents à l’aide d’indices sémantiques et discursifs [Automatic Tracking of Obsolescent Segments with Linguistic Cues]
+ MarionLaignelet
+ FrançoisRioult
+ 41–63
+ 2010.tal-1.2
+ fra
+ laignelet-rioult-2010-reperer
+
+
+ Acquisition de connaissances lexicales à partir de corpus : la sous-catégorisation verbale en français [Lexical acquisition from corpora: the case of subcategorization frames in French]
+ CédricMessiant
+ KataGábor
+ ThierryPoibeau
+ 65–96
+ 2010.tal-1.3
+ fra
+ messiant-etal-2010-acquisition
+
+
+ Personalized Question Answering
+ SilviaQuarteroni
+ 97–123
+ 2010.tal-1.4
+ quarteroni-2010-personalized
+
+
+ Enrichissement d’un lexique de termes subjectifs à partir de tests sémantiques [Enhancement of a subjective word lexicon by semantic tests]
+ MatthieuVernier
+ LauraMonceaux
+ 125–149
+ 2010.tal-1.5
+ fra
+ vernier-monceaux-2010-enrichissement
+
+
+
+
+ Traitement Automatique des Langues, Volume 51, Numéro 2 : Multilinguisme et traitement automatique des langues [Multilingualism and Natural Language Processing]
+ EmmanuelMorin
+ HolgerSchwenk
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2010
+ tal
+
+
+ Multilinguisme et traitement automatique des langues [Multilinguism and natural language processing]
+ HolgerSchwenk
+ EmmanuelMorin
+ 7–10
+ 2010.tal-2.1
+ fra
+ schwenk-morin-2010-multilinguisme
+
+
+ Apprentissage non supervisé de familles morphologiques : comparaison de méthodes et aspects multilingues [Unsupervised learning of morphological families: comparison of methods and multilingual aspects]
+ DelphineBernhard
+ 11–39
+ 2010.tal-2.2
+ fra
+ bernhard-2010-apprentissage
+
+
+ PARADOCS : l’entremetteur de documents parallèles indépendant de la langue [PARADOCS: A Language Independant Go-Between for Mating Parallel Documents]
+ AlexandrePatry
+ PhilippeLanglais
+ 41–63
+ 2010.tal-2.3
+ fra
+ patry-langlais-2010-paradocs
+
+
+ Micro-adaptation lexicale en traduction automatique statistique [Lexical Micro-adaptation in Statistical Machine Translation]
+ Josep MariaCrego
+ GregorLeusch
+ AurélienMax
+ HermannNey
+ FrançoisYvon
+ 65–93
+ 2010.tal-2.4
+ fra
+ crego-etal-2010-micro
+
+
+ Transliteration as Alignment vs. Transliteration as Generation for Crosslingual Information Retrieval
+ Anil KumarSingh
+ SethuramalingamSubramaniam
+ TarakaRama
+ 95–117
+ 2010.tal-2.5
+ fra
+ singh-etal-2010-translitteration
+
+
+
+
+ Traitement Automatique des Langues, Volume 51, Numéro 3 : Opinions, sentiments et jugements d’évaluation [Opinions, sentiment and evaluative language]
+ MarcEl-Bèze
+ AgataJackiewicz
+ SusanHunston
+ ATALA (Association pour le Traitement Automatique des Langues)
+ France
+ 2010
+ tal
+
+
+ Préface [Introduction]
+ AgataJackiewicz
+ SusanHunston
+ MarcEl-Bèze
+ 7–17
+ 2010.tal-3.1
+ fra
+ jackiewicz-etal-2010-preface
+
+
+ De la classification d’opinion à la recommandation : l’apport des textes communautaires [From opinion classification to recommendations: How texts from a social network can help]
+ DamienPoirier
+ FrançoiseFessant
+ IsabelleTellier
+ 19–46
+ 2010.tal-3.2
+ fra
+ poirier-etal-2010-de
+
+
+ Résumé automatique de textes d’opinion [Automatic Summarization of Opinionated Texts]
+ AurélienBossard
+ MichelGenereux
+ ThierryPoibeau
+ 47–73
+ 2010.tal-3.3
+ fra
+ bossard-etal-2010-resume
+
+
+ Le microblogging pour la micro analyse des sentiments et des opinons [Microblogging for Micro Sentiment Analysis and Opinion Mining]
+ AlexanderPak
+ PatrickParoubek
+ 75–100
+ 2010.tal-3.4
+ fra
+ pak-paroubek-2010-le
+
+
+ Extraction probabiliste de chaînes de mots relatives à une opinion [A probabilistic approach for extracting opinion-related word chains from texts]
+ RemiLavalley
+ ChloeClavel
+ PatriceBellot
+ 101–130
+ 2010.tal-3.5
+ fra
+ lavalley-etal-2010-extraction
+
+
+ Analyse des sentiments et transcription automatique: modélisation du déroulement de conversations téléphoniques [Shaping the Course of a Conversation through Sentiment Analysis on Speech Transcripts]
+ FrédérikCailliau
+ ArianeCavet
+ 131–154
+ 2010.tal-3.6
+ fra
+ cailliau-cavet-2010-analyse
+
+
+