2024
- Noé Cecillon, Vincent Labatut, Richard Dufour, Nejat Arınık.
2024.
Whole-Graph Representation Learning For the Classification of Signed Networks.
IEEE Access.
- Denis Béchet, Annie Foret.
2024.
Categorial Dependency Grammars extended with barriers (CDGb) yield an Abstract Family of Languages (AFL).
5th International Conference on Natural Language Processing and Computational Linguistics (NLPCL 2024).
- Yanis Labrak, Adel Moumen, Richard Dufour, Mickaël Rouvier.
2024.
Zero-Shot End-To-End Spoken Question Answering In Medical Domain.
Interspeech 2024.
- Yanis Labrak, Adrien Bazoge, Emmanuel Morin, Pierre‐antoine Gourraud, Mickaël Rouvier, Richard Dufour.
2024.
BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains.
62th Annual Meeting of the Association for Computational Linguistics (ACL'24).
- Théo Charlot, Elisabeth Sisarith, Nicolas Stucky, Rémi Ilango, Nicolas Gouget, Hreshvik Sewraj, Xavier Pillet.
2024.
DÉfi Fouille de Texte 2024.
35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024).
- Adrien Bazoge, Labrak Yanis, Richard Dufour, Benoît Favre, Mickaël Rouvier.
2024.
Tâches et systèmes de sélection automatique de réponses à des QCM dans le domaine médical : Présentation de la campagne DEFT 2024.
35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024).
- Thibault Bañeras-Roux, Mickaël Rouvier, Jane Wottawa, Richard Dufour.
2024.
Un paradigme pour l'interprétation des métriques et pour mesurer la gravité des erreurs de reconnaissance automatique de la parole.
35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024).
- Anas Belfathi, Ygor Gallina, Nicolas Hernandez, Laura Monceaux, Richard Dufour.
2024.
Adaptation des modèles de langue à des domaines de spécialité par un masquage sélectif fondé sur le genre et les caractéristiques thématiques.
35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024).
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2024.
Renard: A Modular Pipeline for Extracting Character Networks from Narrative Texts.
Journal of Open Source Software.
- Antoine Jamelot, Solen Quiniou, Sophie Hamon.
2024.
Improving Text Readability through Segmentation into Rheses.
LREC-COLING 2024.
- Léane Jourdan, Florian Boudin, Nicolas Hernandez, Richard Dufour.
2024.
CASIMIR: A Corpus of Scientific Articles enhanced with Multiple Author-Integrated Revisions,CASIMIR: Un corpus d'Articles Scientifiques Incluant les MultIples Revisions des auteurs.
LREC-Coling 2024.
- Yanis Labrak, Adrien Bazoge, Béatrice Daille, Mickaël Rouvier, Richard Dufour.
2024.
How Important Is Tokenization in French Medical Masked Language Models?.
Fourteenth Language Resources and Evaluation Conference (LREC-COLING 2024).
- Yanis Labrak, Adrien Bazoge, Oumaima El Khettari, Mickaël Rouvier, Pacôme Constant Dit Beaufils, Natalia Grabar, Béatrice Daille, Solen Quiniou, Emmanuel Morin, Pierre‐antoine Gourraud, Richard Dufour.
2024.
DrBenchmark: A Large Language Understanding Evaluation Benchmark for French Biomedical Domain.
Fourteenth Language Resources and Evaluation Conference (LREC-COLING 2024).
- Yanis Labrak, Mickaël Rouvier, Richard Dufour.
2024.
A Zero-shot and Few-shot Study of Instruction-Finetuned Large Language Models Applied to Clinical and Biomedical Tasks.
Fourteenth Language Resources and Evaluation Conference (LREC-COLING 2024).
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2024.
Apprendre à classer le contexte pour la reconnaissance d'entités nommées en utilisant un jeu de données synthétique.
COnférence en Recherche d’Information et Applications.
- Xavier Pillet, Anastasia Volkova, Nicolas Greffard, Richard Dufour.
2024.
Entre performance et frugalité en TAL : Approches pour la réduction de la taille des (L)LMs,Between performance and frugality in NLP : approaches to reduce de size of (L)LMs.
.
- Richard Dufour, Benoît Favre, Mickaël Rouvier, Adrien Bazoge, Yanis Labrak.
2024.
Actes du Défi Fouille de Textes@TALN 2024.
35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024).
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2024.
Renard: Relationships Extraction from NARrative Documents.
.
- Thibault Bañeras-Roux, Mickael Rouvier, Jane Wottawa, Richard Dufour.
2024.
A Paradigm for Interpreting Metrics and Measuring Error Severity in Automatic Speech Recognition.
Text, Speech and Dialogue.
- Thibault Bañeras-Roux, Mickael Rouvier, Jane Wottawa, Richard Dufour.
2024.
A Comprehensive Analysis of Tokenization and Self-Supervised Learning in End-to-End Automatic Speech Recognition applied on French Language.
32th European Signal Processing Conference (EUSIPCO).
2023
- Anas Belfathi, Nicolas Hernandez, Laura Monceaux.
2023.
Harnessing GPT-3.5-turbo for Rhetorical Role Prediction in Legal Cases.
JURIX 2023 - The 36th International Conference on Legal Knowledge and Information Systems.
- Adrien Bazoge, Emmanuel Morin, Béatrice Daille, Pierre-Antoine Gourraud.
2023.
Applying Natural Language Processing to Textual Data From Clinical Data Warehouses: Systematic Review.
JMIR Medical Informatics.
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2023.
Learning to Rank Context for Named Entity Recognition Using a Synthetic Dataset.
Conference on Empirical Methods in Natural Language Processing (EMNLP).
- Thibault Bañeras-Roux, Jane Wottawa, Mickael Rouvier, Teva Merlin, Richard Dufour.
2023.
HATS: An Open data set Integrating Human Perception Applied to the Evaluation of Automatic Speech Recognition Metrics,HATS : Un jeu de données intégrant la perception humaine appliquée à l'évaluation des métriques de transcription de la parole.
Text, Speech and Dialogue 2023 - Interspeech Satellite.
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2023.
The Role of Global and Local Context in Named Entity Recognition.
61st Annual Meeting of the Association for Computational Linguistics (ACL).
- Yanis Labrak, Adrien Bazoge, Richard Dufour, Mickael Rouvier, Emmanuel Morin, Béatrice Daille, Pierre-Antoine Gourraud.
2023.
DrBERT: A Robust Pre-trained Model in French for Biomedical and Clinical domains.
61th Annual Meeting of the Association for Computational Linguistics (ACL'23).
- Oumaima El Khettari, Solen Quiniou, Samuel Chaffron.
2023.
Building a Corpus for Biomedical Relation Extraction of Species Mentions.
The 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks.
- Anas Belfathi, Nicolas Hernandez, Laura Monceaux.
2023.
Enhancing Pre-Trained Language Models with Sentence Position Embeddings for Rhetorical Roles Recognition in Legal Opinions.
6th Workshop on Automated Semantic Analysis of Information in Legal Text (ASAIL) held online in conjunction with 19th International Conference on Artificial Intelligence and Law (ICAIL).
- Florian Boudin.
2023.
Analyse et indexation de textes scientifiques,Analysing and indexing scientific texts.
.
- Emmanuel Desmontils, Laura Monceaux.
2023.
Enseigner SQL en NSI,Teaching SQL.
11éme Conférence Environnements Informatiques pour l’Apprentissage Humain (EIAH 2023 ) -Atelier "Apprentissage de la pensée informatique de la maternelle à l'Université : mise à l'épreuve des dispositifs et outils".
- Emmanuel Desmontils, Laura Monceaux.
2023.
Enseigner SQL en NSI.
Atelier « Apprendre la Pensée Informatique de la Maternelle à l'Université », dans le cadre de la conférence Environnements Informatiques pour l'Apprentissage Humain (EIAH).
- Virgile Barthet, Marie José Aroulanda, Laura Monceaux-Cachard, Christine Jacquin, Cyril Grouin, Johann Gutton, Guillaume Hocquet, Pascal de Groote, Michel Komajda, Emmanuel Morin, Pierre Zweigenbaum.
2023.
La pré-annotation automatique de textes cliniques comme support au dialogue avec les experts du domaine lors de la mise au point d'un schéma d'annotation,Automatic pre-annotation of clinical texts to support the dialogue with domain experts during the design of an annotation schema.
Atelier ARTS, 18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues.
- Yanis Labrak, Mickaël Rouvier, Richard Dufour.
2023.
MORFITT : A multi-label corpus of French scientific articles in the biomedical domain,MORFITT : Un corpus multi-labels d'articles scientifiques français dans le domaine biomédical.
30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) Atelier sur l'Analyse et la Recherche de Textes Scientifiques.
- Léane Jourdan, Richard Dufour, Nicolas Hernandez, Florian Boudin.
2023.
CASIMIR : un Corpus d’Articles Scientifiques Intégrant les ModIfications et Révisions des auteurs.
Atelier sur l'Analyse et la Recherche de Textes Scientifiques, CORIA-TALN 2023.
- Léane Jourdan, Florian Boudin, Nicolas Hernandez, Richard Dufour.
2023.
CASIMIR : un Corpus d'Articles Scientifiques Intégrant les ModIfications et Révisions des auteurs.
Atelier sur l'Analyse et la Recherche de Textes Scientifiques, CORIA-TALN 2023.
- Yizhe Wang, Béatrice Daille, Nabil Hathout.
2023.
Exploring synonymy relation between multi-word terms in distributional semantic models.
10th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguisitics (LTC'23).
- Léane Jourdan, Florian Boudin, Richard Dufour, Nicolas Hernandez.
2023.
Text revision in Scientific Writing Assistance: An Overview,La révision de texte dans l'assistance à l'écriture scientifique : Un résumé.
13th International Workshop on Bibliometric-enhanced Information Retrieval (BIR 2023).
- Denis Béchet, Annie Foret.
2023.
Categorial Dependency Grammars: Analysis and Learning.
.
- Martin Laville.
2023.
Évaluation en extraction de lexiques bilingues à partir de corpus comparables,Evaluating bilingual lexicon induction using comparable corpora.
.
- Victor Connes.
2023.
Recommandation de Ressources Éducatives Libres dans le projet X5GON,Recommendation of Open Educational Resources in the X5GON project.
.
- Noé Cecillon, Vincent Labatut, Richard Dufour, Nejat Arınık.
2023.
SWGE: Signed Whole-Graph Embedding methods.
.
- Oumaima El Khettari, Solen Quiniou, Samuel Chaffron.
2023.
Annotation d'interactions hôte-microbiote dans des articles scientifiques par similarité sémantique avec une ontologie,Annotating host-microbiota interactions in scientific articles using semantic similarity to an ontology.
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues.
- Yizhe Wang, Béatrice Daille, Nabil Hathout.
2023.
Exploring terminological relations between multi-word terms in distributional semantic models.
Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication.
- Maël Houbre, Florian Boudin, Béatrice Daille.
2023.
Classification de relation pour la génération de mots-clés absents,Relation classification for absent keyphrase generation.
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues.
- Yanis Labrak, Mickael Rouvier, Richard Dufour.
2023.
MORFITT : Un corpus multi-labels d'articles scientifiques français dans le domaine biomédical.
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues.
- Florian Boudin, Richard Dufour, Béatrice Daille.
2023.
Projet NaviTerm : navigation terminologique pour une montée en compétence rapide et personnalisée sur un domaine de recherche.
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues.
- Yanis Labrak, Adrien Bazoge, Béatrice Daille, Richard Dufour, Emmanuel Morin, Mickael Rouvier.
2023.
Tâches et systèmes de détection automatique des réponses correctes dans des QCMs liés au domaine médical : Présentation de la campagne DEFT 2023.
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues.
- Thibault Bañeras-Roux, Jane Wottawa, Mickael Rouvier, Teva Merlin, Richard Dufour.
2023.
HATS : Un jeu de données intégrant la perception humaine appliquée à l'évaluation des métriques de transcription de la parole.
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues.
- Yanis Labrak, Adrien Bazoge, Richard Dufour, Mickael Rouvier, Emmanuel Morin, Béatrice Daille, Pierre-Antoine Gourraud.
2023.
DrBERT: Un modèle robuste pré-entraîné en français pour les domaines biomédical et clinique.
18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues.
2022
- Mael Houbre, Florian Boudin, Beatrice Daille.
2022.
A Large-Scale Dataset for Biomedical Keyphrase Generation.
13th International Workshop on Health Text Mining and Information Analysis (LOUHI 2022).
- Yanis Labrak, Adrien Bazoge, Richard Dufour, Béatrice Daille, Pierre‐antoine Gourraud, Emmanuel Morin, Mickaël Rouvier.
2022.
FrenchMedMCQA: A French Multiple-Choice Question Answering Dataset for Medical domain,FrenchMedMCQA : Un jeu de données de questions à choix multiple en français pour le domaine médical.
Empirical Methods in Natural Language Processing 2022.
- Yanis Labrak, Adrien Bazoge, Richard Dufour, Béatrice Daille, Pierre-Antoine Gourraud, Emmanuel Morin, Mickael Rouvier.
2022.
FrenchMedMCQA: A French Multiple-Choice Question Answering Dataset for Medical domain.
LOUHI 2022 @ Empirical Methods in Natural Language Processing (EMNLP) 2022.
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2022.
Traitement du langage et modélisation de relations pour la représentation unifiée de documents narratifs.
Meetup LIAvignon.
- Noé Cecillon, Vincent Labatut, Richard Dufour.
2022.
Abusive Language Detection in Online Conversations by Combining Content- and Graph-based Features.
Meetup LIAvignon.
- Vianney Guardiolle, Adrien Bazoge, Emmanuel Morin, Béatrice Daille, Delphine Toublant, Guillaume Bouzillé, Youenn Merel, Morgane Pierre-Jean, Alexandre Filiot, Marc Cuggia, Matthieu Wargny, Antoine Lamer, Pierre‐antoine Gourraud.
2022.
Linking Biomedical Data Warehouse Records With the National Mortality Database in France: Large-scale Matching Algorithm.
JMIR Medical Informatics.
- Thibault Bañeras Roux, Mickael Rouvier, Jane Wottawa, Richard Dufour.
2022.
Qualitative Evaluation of Language Model Rescoring in Automatic Speech Recognition.
Interspeech.
- Yanis Labrak, Richard Dufour.
2022.
ANTILLES: An Open French Linguistically Enriched Part-of-Speech Corpus.
25th International Conference on Text, Speech and Dialogue (TSD).
- Yanis Labrak, Philippe Turcotte, Richard Dufour, Mickael Rouvier.
2022.
Correction automatique d'examens écrits par approche neuronale profonde et attention croisée bidirectionnelle,Deep Neural Networks and Bidirectional Cross-Attention for Automatic Answer Grading.
Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier DÉfi Fouille de Textes (DEFT).
- Merieme Bouhandi, Emmanuel Morin, Thierry Hamon.
2022.
Adaptation au domaine de modèles de langue à l'aide de réseaux à base de graphes.
Traitement Automatique des Langues Naturelles (TALN 2022).
- Yanis Labrak, Philippe Turcotte, Richard Dufour, Mickael Rouvier.
2022.
Correction automatique d'examens écrits par approche neuronale profonde et attention croisée bidirectionnelle.
DEFT - Traitement Automatique des Langues Naturelles.
- Thibault Bañeras Roux, Mickael Rouvier, Jane Wottawa, Richard Dufour.
2022.
Mesures linguistiques automatiques pour l'évaluation des systèmes de Reconnaissance Automatique de la Parole.
29ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Aymeric Beauchamp, Thi-Bich-Hanh Dao, Samir Loudni, Christel Vrain.
2022.
Intégration incrémentale de contraintes pour le clustering avec la programmation par contraintes,Incremental constraint integration for clustering using constraint programming.
Journées Francophones de Programmation par Contraintes (Evènement affilié à PFIA 2022).
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2022.
Remplacement de mentions pour l'adaptation d'un corpus de reconnaissance d'entités nommées à un domaine cible.
29ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Omar Adjali, Emmanuel Morin, Serge Sharoff, Reinhard Rapp, Pierre Zweigenbaum.
2022.
Overview of the 2022 BUCC Shared Task: Bilingual Term Alignment in Comparable Specialized Corpora.
BUCC, 15th Workshop on Building and Using Comparable Corpora.
- Nicolas Hernandez, Tristan Faine, Nabil Oulbaz.
2022.
Open corpora and toolkit for assessing text readability in French.
LREC Workshop 2nd Workshop on Tools and Resources for People with REAding DIfficulties (READI).
- Amir Hazem, Mériem Bouhandi, Florian Boudin, Béatrice Daille.
2022.
Cross-lingual and Cross-domain Transfer Learning for Automatic Term Extraction from Low Resource Data.
Language Resources and Evaluation Conference.
- Omar Adjali, Emmanuel Morin, Pierre Zweigenbaum.
2022.
Building Comparable Corpora for Assessing Multi-Word Term Alignment.
LREC 2022 - Language Resources and Evaluation Conference.
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2022.
Data Augmentation for Robust Character Detection in Fantasy Novels.
Workshop on Computational Methods in the Humanities 2022.
- Arthur Amalvy, Vincent Labatut, Richard Dufour.
2022.
BERT meets d'Artagnan: Data Augmentation for Robust Character Detection in Novels.
Workshop on Computational Methods in the Humanities (COMHUM).
- Annie Foret, Denis Béchet, Valérie Bellynck.
2022.
Iterated Dependencies in a Breton treebank and implications for a Categorial Dependency Grammar.
Proceedings of the 4th Celtic Language Technology Workshop within LREC2022.
- Esther Félix, Nicolas Hernandez, Issam Rebaï.
2022.
Exploring the Limits of Lexicon-based Natural Language Processing Techniques for Measuring Engagement and Predicting MOOC’s Certification.
CSEDU 2022: 14th International Conference on Computer Supported Education.
- Rui Meng, Debanjan Mahata, Florian Boudin.
2022.
From Fundamentals to Recent Advances: A Tutorial on Keyphrasification.
44th European Conference on Information Retrieval.
- Benjamin Piwowarski, Florian Boudin, Gaël Dias, Jean-Pierre Chevallet, Jose G. Moreno, Mathieu Roche, Thierry Charnois.
2022.
Actes de la 3ème journée : Technologies du langage humain et accès interactif à l'information (avril 2022).
3ème journée : Technologies du langage humain et accès interactif à l'information (2022).
- Ygor Gallina.
2022.
Indexation de bout-en-bout dans les bibliothèques numériques scientifiques,End-to-end indexation in digital scientific libraries.
.
- Qingyu Chen, Alexis Allot, Robert Leaman, Rezarta Islamaj, Jingcheng Du, Li Fang, Kai Wang, Shuo Xu, Yuefu Zhang, Parsa Bagherzadeh, Sabine Bergler, Aakash Bhatnagar, Nidhir Bhavsar, Yung-Chun Chang, Sheng-Jie Lin, Wentai Tang, Hongtong Zhang, Ilija Tavchioski, Senja Pollak, Shubo Tian, Jinfeng Zhang, Yulia Otmakhova, Antonio Jimeno Yepes, Hang Dong, Honghan Wu, Richard Dufour, Yanis Labrak, Niladri Chatterjee, Kushagri Tandon, Fréjus Laleye, Loïc Rakotoson, Emmanuele Chersoni, Jinghang Gu, Annemarie Friedrich, Subhash Chandra Pujari, Mariia Chizhikova, Naveen Sivadasan, Saipradeep Vg, Zhiyong Lu.
2022.
Multi-label classification for biomedical literature: an overview of the BioCreative VII LitCovid Track for COVID-19 literature topic annotations.
Database - The journal of Biological Databases and Curation.
- Kenichi Iwatsuki, Florian Boudin, Akiko Aizawa.
2022.
Extraction and evaluation of formulaic expressions used in scholarly papers.
Expert Systems with Applications.
2021
- Denis Béchet, Annie Foret.
2021.
Categorial Dependency Grammars: Analysis and Learning (Invited Talk).
Logic and Algorithms in Computational Linguistics 2021 (LACompLing2021).
- Yanis Labrak, Richard Dufour.
2021.
Team LIA/LS2N at BioCreative VII LitCovid Track: Multi-label Document Classification for COVID-19 Literature using Keyword Based Enhancement and Few-Shot Learning.
BioCreative VII Challenge Evaluation Workshop.
- Béatrice Daille.
2021.
TAL et linguistique outillée.
ONELA.
- Florian Boudin.
2021.
ACM-CR: A Manually Annotated Test Collection for Citation Recommendation.
ACM/IEEE Joint Conference on Digital Libraries (JCDL).
- Mathias Quillot, Jarod Duret, Richard Dufour, Mickael Rouvier, Jean-François Bonastre.
2021.
Influence of speaker pre-training on character voice representation,L'influence du pré-entrainement locuteur sur la représentation de voix de personnages.
23rd International Conference on Speech and Computer (SPECOM).
- Mathias Quillot, Richard Dufour, Jean-François Bonastre.
2021.
Assessing speaker-independent character information for acted voices,Évaluation de l'information personnage indépendante du locuteur pour les voix actées.
23rd International Conference on Speech and Computer (SPECOM).
- Victor Connes, Colin de La Higuera, Hoel Le Capitaine.
2021.
Using Grammatical Inference to Build Privacy Preserving Data-sets of User Logs.
International Conference on Grammatical Inference.
- Victor Connes, Colin de La Higuera, Hoel Le Capitaine.
2021.
What should I learn next? Ranking Educational Resources.
2021 IEEE 45th Annual Computers, Software, and Applications Conference (COMPSAC).
- Yizhe Wang, Béatrice Daille, Nabil Hathout.
2021.
Caractérisation des relations sémantiques entre termes multi-mots fondée sur l'analogie.
28e conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN-2021).
- Florian Boudin, Ygor Gallina.
2021.
Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness.
Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies.
- Thibault Prouteau, Victor Connes, Nicolas Dugué, Anthony Perez, Jean-Charles Lamirel, Nathalie Camelin, Sylvain Meignier.
2021.
SINr: Fast Computing of Sparse Interpretable Node Representations is not a Sin!.
Advances in Intelligent Data Analysis XIX, 19th International Symposium on Intelligent Data Analysis, IDA 2021.
- Denis Béchet, Annie Foret.
2021.
Incremental learning of iterated dependencies.
Machine Learning.
- Noé Cecillon, Richard Dufour, Vincent Labatut.
2021.
Approche multimodale par plongements de texte et de graphes pour la détection de messages abusifs.
Revue TAL : traitement automatique des langues.
- Timothée Poulain, Victor Connes.
2021.
DEFT 2021: Évaluation automatique de réponses courtes\, une approche basée sur la sélection de traits lexicaux et augmentation de données.
Traitement Automatique des Langues Naturelles.
- Adrien Bazoge.
2021.
Revue de la littérature : entrepôts de données biomédicales et traitement automatique de la langue.
Traitement Automatique des Langues Naturelles.
2020
- Amir Hazem, Béatrice Daille, Louis Chevalier, Dominique Stutzmann, Christopher Kermorvant.
2020.
Hierarchical Text Segmentation for Medieval Manuscripts.
COLING'2020 The 28th International Conference on Computational Linguistics.
- Antoine Caubrière, Yannick Estève, Antoine Laurent, Emmanuel Morin.
2020.
Confidence measure for speech-to-concept end-to-end spoken language understanding.
Interspeech 2020.
- Chantal Enguehard, Camille Noûs.
2020.
Some Things you may Want to Know about Electronic Voting in France,Quelques choses que vous pourriez avoir envie de savoir au sujet du vote électronique en France.
E-Vote-ID 2020.
- Ygor Gallina, Florian Boudin, Béatrice Daille.
2020.
Large-Scale Evaluation of Keyphrase Extraction Models.
ACM/IEEE Joint Conference on Digital Libraries (JCDL).
- Florian Boudin, Béatrice Daille, Evelyne Jacquey, Jian-Yun Nie.
2020.
The DELICES project: Indexing scientific literature through semantic expansion.
Joint Conference of the Information Retrieval Communities in Europe (CIRCLE).
- Florian Boudin, Ygor Gallina, Akiko Aa Aizawa.
2020.
Keyphrase Generation for Scientific Document Retrieval.
The 58th Annual Meeting of the Association for Computational Linguistics (ACL).
- Sofiane Elguendouze.
2020.
Simplification de textes : un état de l’art.
6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL.
- Jingshu Liu, Emmanuel Morin, Sebastián Peña Saldarriaga, Joseph Lark.
2020.
A unified and unsupervised framework for bilingual phrase alignment on specialized comparable corpora.
24th European Conference on Artificial Intelligence (ECAI).
- Kenichi Iwatsuki, Florian Boudin, Akiko Aizawa.
2020.
An Evaluation Dataset for Identifying Communicative Functions of Sentences in English Scholarly Papers.
12th Conference on Language Resources and Evaluation (LREC 2020).
- Amir Hazem, Mérième Bouhandi, Florian Boudin, Béatrice Daille.
2020.
TermEval 2020: TALN-LS2N System for Automatic Term Extraction.
6th International Workshop on Computational Terminology (COMPUTERM 2020).
- Amir Hazem, Béatrice Daille, Marie-Laurence Bonhomme, Martin Maarand, Mélodie Boillet, Christopher Kermorvant, Dominique Stutzmann.
2020.
Books of Hours: the First Liturgical Corpus for Text Segmentation.
12th Language Resources and Evaluation Conference.
- Salima Mdhaffar, Yannick Estève, Antoine Laurent, Nicolas Hernandez, Richard Dufour, Delphine Charlet, Géraldine Damnati, Solen Quiniou, Nathalie Camelin.
2020.
A Multimodal Educational Corpus of Oral Courses: Annotation\, Analysis and Case Study.
LREC.
- Antoine Caubrière, Sophie Rosset, Yannick Estève, Antoine Laurent, Emmanuel Morin.
2020.
Where are we in Named Entity Recognition from Speech?.
12th International Conference on Language Resources and Evaluation (LREC).
- Antoine Caubrière, Sahar Ghannay, Natalia Tomashenko, Renato de Mori, Antoine Laurent, Emmanuel Morin, Yannick Estève.
2020.
Error analysis applied to end-to end spoken language understanding.
45th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2020).
- Claudia Lanza, Amir Hazem, Béatrice Daille.
2020.
Towards Automatic Thesaurus Construction and Enrichment..
6th International Workshop on Computational Terminology (COMPUTERM 2020).
- Yizhe Wang, Béatrice Daille, Nabil Hathout.
2020.
A study of semantic projection from single word terms to multi-word terms in the environment domain.
6th International Workshop on Computational Terminology (COMPUTERM 2020).
- Béatrice Daille, Kyo Kageura, Rigouts Ayla.
2020.
Workshop 6e International Workshop on Computational Terminology (COMPUTERM 2020).
.
- Jingshu Liu.
2020.
Unsupervised cross-lingual representation modeling for variable length phrases,Apprentissage de représentations cross-lingue d’expressions de longueur variable.
.
- Cécile Fabre, Emmanuel Morin, Sophie Rosset, Pascale Sébillot.
2020.
Varia - Préface - 60-1.
Revue TAL : traitement automatique des langues.
- Thomas Cerqueus, Jonathan Bonnaud, Oleksandr Dashkov, Emmanuel Morin.
2020.
Thesaurus Matching in Electronic Commerce.
Electronic Commerce Research.
- Antoine Caubrière, Sophie Rosset, Yannick Estève, Antoine Laurent, Emmanuel Morin.
2020.
Où en sommes-nous dans la reconnaissance des entités nommées structurées à partir de la parole ?.
6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole.
- Basma El Amel Boussaha, Nicolas Hernandez, Christine Jacquin, Emmanuel Morin.
2020.
End-to-End Response Selection Based on Multi-LevelContext Response Matching.
Computer Speech and Language.
2019
- Issouf Modi, Chantal Enguehard.
2019.
Contributions à la modélisation des ressources du tamajaq à partir de l'analyse des verbo-nominaux de deux parlers nigériens.
Journées de Linguistique Berbère.
- Chantal Enguehard, Anaïs Danet.
2019.
Les Systèmes Inéquitables Numériques (SIN).
Journées Réseaux de l'Enseignement et de la Recherche JRES2019.
- Nazanin Firoozeh, Adeline Nazarenko, Fabrice Alizon, Béatrice Daille.
2019.
Keyword extraction: Issues and methods.
Natural Language Engineering.
- Ygor Gallina, Florian Boudin, Béatrice Daille.
2019.
KPTimes: A Large-Scale Dataset for Keyphrase Generation on News Documents.
12th International Conference on Natural Language Generation (INLG).
- Basma El Amel Boussaha.
2019.
Response Selection for End-to-End Retrieval-Based Dialogue Systems,Sélection de Réponses pour les Systèmes de Dialogue Basés sur la Recherche de Réponse de Bout en Bout.
.
- Natalia Tomashenko, Antoine Caubrière, Yannick Estève, Antoine Laurent, Emmanuel Morin.
2019.
Recent Advances in End-to-End Spoken Language Understanding.
7th International Conference on Statistical Language and Speech Processing (SLSP).
- Denis Béchet, Annie Foret.
2019.
On Categorial Grammatical Inference and Logical Information Systems.
.
- Salima Mdhaffar, Yannick Estève, Nicolas Hernandez, Antoine Laurent, Richard Dufour, Solen Quiniou.
2019.
Qualitative Evaluation of ASR Adaptation in a Lecture Context: Application to the PASTEL Corpus.
Interspeech 2019.
- Antoine Caubrière, Natalia Tomashenko, Antoine Laurent, Emmanuel Morin, Nathalie Camelin, Yannick Estève.
2019.
Curriculum-based transfer learning for an effective end-to-end spoken language understanding and domain portability.
20th Annual Conference of the International Speech Communication Association (InterSpeech).
- Amir Hazem, Nicolas Hernandez.
2019.
Tweaks and Tricks for Word Embedding Disruptions.
Recent Advances In Natural Language Processing (RANLP).
- Amir Hazem, Nicolas Hernandez.
2019.
Meta-Embedding Sentence Representation for Textual Similarity.
Recent Advances In Natural Language Processing (RANLP).
- Jean-Claude Houbart, Solen Quiniou, Marion Berthaut, Béatrice Daille, Claire Salomé.
2019.
Automatic segmentation of texts into units of meaning for reading assistance.
IJCAI workshop on AI and the United Nations SDGs.
- Amir Hazem, Béatrice Daille, Dominique Stutzmann, Jacob Currie, Christine Jacquin.
2019.
Towards Automatic Variant Analysis of Ancient Devotional Texts.
1st International Workshop on Computational Approaches to Historical Language Change.
- Chantal Enguehard.
2019.
Blockchain et vote électronique.
Terminal. Technologie de l’information, culture & société.
- Dominique Stutzmann, Jacob Currie, Béatrice Daille, Amir Hazem, Christopher Kermorvant.
2019.
Integrated DH. Rationale of the HORAE Research Project..
Digital Humanities Conference.
- Victor Connes, Nicolas Dugué.
2019.
Apprentissage de plongements lexicaux par une approche réseaux complexes,Complex networks based word embeddings.
TALN 2019.
- Mérième Bouhandi.
2019.
Apport des termes complexes pour enrichir l'analyse distributionnelle en domaine spécialisé.
21e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL).
- Mérième Bouhandi, Florian Boudin, Ygor Gallina.
2019.
DeFT 2019 : Auto-encodeurs\, Gradient Boosting et combinaisons de modèles pour l’identification automatique de mots-clés. Participation de l’équipe TALN du LS2N.
Défi Fouille de Textes (DEFT).
- Claudia Lanza, Béatrice Daille.
2019.
Terminology systematization for Cybersecurity domain in Italian language.
TIA 2019 Terminologie et Intelligence Artificielle - Atelier TALN-RECITAL et IC (PFIA 2019).
- Amir Hazem, Béatrice Daille, Dominique Stutzmann, Jacob Currie, Christine Jacquin.
2019.
Réutilisation de textes dans les manuscrits anciens.
26e conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Ygor Gallina.
2019.
État de l'art des méthodes d'apprentissage profond pour l'extraction automatique de termes-clés,State of the art of deep learning methods for automatic keyphrase extraction.
21e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL).
- Antoine Caubrière, Natalia Tomashenko, Yannick Estève, Antoine Laurent, Emmanuel Morin.
2019.
Curriculum d'apprentissage : reconnaissance d'entités nommées pour l'extraction de concepts sémantiques.
26e conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Emmanuel Morin, Sophie Rosset, Pierre Zweigenbaum.
2019.
Actes de la 26e conférence sur le Traitement Automatique des Langues Naturelles.
Plate-Forme Intelligence Artificielle.
- Sabrina Mraouahi, Franck Petit, Chantal Enguehard, Jean-Didier Graton.
2019.
La démocratie sociale à l’ère numérique.
Lexbase Social.
- Emmanuel Morin, Sophie Rosset, Pascale Sébillot.
2019.
Varia - Préface - 59-1.
.
- Basma El Amel Boussaha, Nicolas Hernandez, Christine Jacquin, Emmanuel Morin.
2019.
Towards Simple but Efficient Next Utterance Ranking.
20th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing).
- Alexis Linard, Colin de La Higuera, Frits Vaandrager.
2019.
Learning Unions of k-Testable Languages.
LATA: Language and Automata Theory and Applications.
- Basma El Amel Boussaha, Nicolas Hernandez, Christine Jacquin, Emmanuel Morin.
2019.
Multi-level Context Response Matching in Retrieval-Based Dialog Systems.
Dialog System Technology Challenges Workshop at AAAI.
- Béatrice Daille, Amir Hazem, Christopher Kermorvant, Martin Maarand, Marie-Laurence Bonhomme, Dominique Stutzmann, Jacob Currie, Christine Jacquin.
2019.
Transcription automatique et segmentation thématique de livres d’heures manuscrits,Handwritten text recognition and text segmentation adapted to manuscript books of hours.
Revue TAL : traitement automatique des langues.
- Achilles Beros, Colin de La Higuera.
2019.
Teachers\, Learners\, and Oracles.
Notre Dame Journal of Formal Logic.
2018
- Sahar Ghannay, Antoine Caubrière, Yannick Estève, Nathalie Camelin, Edwin Simonnet, Antoine Laurent, Emmanuel Morin.
2018.
End-to-end named entity and semantic concept extraction from speech.
IEEE Spoken Language Technology Workshop.
- Adeline Granet.
2018.
Extraction d’information dans des documents manuscrits anciens,Extracting information in old handwritten documents.
.
- Valentin Lesfauries, Chantal Enguehard.
2018.
L'introduction de machines à voter en République Démocratique du Congo.
Les Convergences du droit et du numérique.
- Emmanuel Morin, Amir Hazem.
2018.
Leveraging Meta-Embeddings for Bilingual Lexicon Extraction from Specialized Comparable Corpora.
27th International Conference on Computational Linguistics (COLING).
- Jingshu Liu, Emmanuel Morin, Sebastián Peña Saldarriaga.
2018.
Towards a unified framework for bilingual terminology extraction of single-word and multi-word terms.
27th International Conference on Computational Linguistics (COLING).
- Adeline Granet, Emmanuel Morin, Harold Mouchère, Solen Quiniou, Christian Viard-Gaudin.
2018.
Transfer Learning for a Letter-Ngrams to Word Decoder in the Context of Historical Handwriting Recognition with Scarce Resources.
27th International Conference on Computational Linguistics (COLING).
- Adeline Granet, Emmanuel Morin, Solen Quiniou, Christian Viard-Gaudin, Harold Mouchère.
2018.
Separating Optical and Language Models through Encoder-Decoder Strategy for Transferable Handwriting Recognition.
16th International Conference on Frontiers in Handwriting Recognition (ICFHR).
- Mathieu Mangeot, Chantal Enguehard.
2018.
Dictionaries for Under-Resourced Languages: from Published Files to Standardized Resources Available on the Web.
.
- Florian Boudin.
2018.
Unsupervised Keyphrase Extraction with Multipartite Graphs.
16th Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL HLT).
- Adeline Granet, Emmanuel Morin, Harold Mouchère, Solen Quiniou, Christian Viard-Gaudin.
2018.
Décodeur neuronal pour la transcription de documents manuscrits anciens.
25e conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Patrick Paroubek, Cyril Grouin, Patrice Bellot, Vincent Claveau, Iris Eshkol-Taravella, Amel Fraisse, Agata Jackiewicz, Jihen Karoui, Laura Monceaux, Juan-Manuel Torres-Moreno.
2018.
DEFT2018 : Recherche d'information et analyse de sentiments dans des tweets concernant les transports en Île de France,DEFT2018 : Recherche d’information et analyse de sentiments dans des tweets concernant les transports en Île de France..
DEFT 2018 - 14ème atelier Défi Fouille de Texte.
- Basma El Amel Boussaha, Nicolas Hernandez, Christine Jacquin, Emmanuel Morin.
2018.
Ordonnancement de réponses dans les systèmes de dialogue basé sur une similarité contexte/réponse.
25e conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Adeline Granet, Benjamin Hervy, Geoffrey Roman Jimenez, Marouane Hachicha, Emmanuel Morin, Harold Mouchère, Solen Quiniou, Guillaume Raschia, Françoise Rubellin, Christian Viard-Gaudin.
2018.
Crowdsourcing-based Annotation of the Accounting Registers of the Italian Comedy.
11th International Conference on Language Resources and Evaluation (LREC).
- Solen Quiniou, Béatrice Daille.
2018.
Towards a Diagnosis of Textual Difficulties for Children with Dyslexia.
11th International Conference on Language Resources and Evaluation (LREC).
- Nicolas Hernandez, Amir Hazem.
2018.
PyRATA\, PYthon Rule-based feAture sTructure Analysis.
11th International Conference on Language Resources and Evaluation (LREC).
- Amir Hazem, Basma El Amel Boussaha, Nicolas Hernandez.
2018.
A Multi-Domain Framework for Textual Similarity. A Case Study on Question-to-Question and Question-Answering Similarity Tasks.
11th International Conference on Language Resources and Evaluation (LREC).
- Jean-Luc Minel, Emmanuel Morin, Pascale Sébillot, Isabelle Tellier.
2018.
Varia - Préface - 58-1.
Revue TAL : traitement automatique des langues.
- Jingshu Liu, Emmanuel Morin, Sebastián Peña Saldarriaga.
2018.
Alignement de termes de longueurs variables en corpus comparables spécialisés,Alignment of variable length terms in specialized comparable corpora.
25e conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Béatrice Daille, Amir Hazem.
2018.
Word Embedding Approach for Synonym Extraction of Multi-Word Terms.
11th International Conference on Language Resources and Evaluation (LREC).
- Basma El Amel Boussaha, Nicolas Hernandez, Christine Jacquin, Emmanuel Morin.
2018.
Next utterance ranking based on context response similarity.
5th Machine Learning and Data Analytics Symposium (MLDAS).
- Marine Roche, Colin de La Higuera, Christophe Michaut.
2018.
Enseigner la programmation informatique : comment réagissent les professeurs des écoles ?.
Notes du CREN.
- Adeline Granet, Emmanuel Morin, Harold Mouchère, Solen Quiniou, Christian Viard-Gaudin.
2018.
Transfer Learning for Handwriting Recognition on Historical Documents.
7th International Conference on Pattern Recognition Applications and Methods (ICPRAM).
- Geoffrey Roman-Jimenez, Christian Viard-Gaudin, Adeline Granet, Harold Mouchère.
2018.
Transfer Learning for Structures Spotting in Unlabeled Handwritten Documents using Randomly Generated Documents.
International Conference on Pattern Recognition Applications and Methods.
- Colin de La Higuera, Tatsuya Akutsu, Takayuki Tamura.
2018.
A Simple Linear-Time Algorithm for Computing the Centroid and Canonical Form of a Plane Graph and Its Applications.
Annual Symposium on Combinatorial Pattern Matching (CPM 2018).
- Adrien Bougouin, Florian Boudin, Béatrice Daille.
2018.
Modélisation à base de graphe pour l’indexation en domaines de spécialité..
Recherche d’Information, Document et Web Sémantique.
- Béatrice Daille, Sabine Barreaux, Adrien Bougouin, Florian Boudin, Damien Cram, Amir Hazem.
2018.
Indexation d’articles scientifiques. Présentation et résultats du défi fouille de textes DEFT 2016.
Recherche d’Information, Document et Web Sémantique.
- Michael Carl, Emmanuel Planas.
2018.
Advances in interactive translation technology.
.
2017
- Colin de La Higuera, Jorge Calvo-Zaragoza, Jose Oncina.
2017.
Computing the Expected Edit Distance from a String to a Probabilistic Finite-State Automaton.
International Journal of Foundations of Computer Science.
- Aurélie Picton, Emmanuel Planas, Amélie Josselin-Leray.
2017.
Monitoring the Use of newly Integrated Resources into cat Tools: A Prototype.
.
- Denis Béchet, Michael Dekhtyar.
2017.
Biography of Alexandre Dikovsky.
Journal of Logic, Language and Information.
- Amir Hazem, Emmanuel Morin.
2017.
Bilingual Word Embeddings for Bilingual Terminology Extraction from Specialized Comparable Corpora.
8th International Joint Conference on Natural Language Processing (IJCNLP).
- Soufian Antoine Salim.
2017.
Analyse discursive et multi-modale des conversations écrites en ligne portées sur la résolution de problèmes,Multi-modal discursive analysis of problem-solving written online conversations.
.
- Joseph Lark.
2017.
Construction semi-automatique de ressources pour la fouille d'opinion,Semi-automatic acquisition of opinion mining resources.
.
- Chantal Enguehard, Tatiana Shulga-Morskaya.
2017.
De l'annulation d'élections par Internet par le moyen des insuffisances du système de vote.
Les convergences du droit et du numérique.
- Anaïs Danet, Chantal Enguehard.
2017.
De la preuve et de l'utilisation des Systèmes Inéquitables Numériques (SIN).
Les convergences du droit et du numérique.
- Amir Hazem, Basma El Amel Boussaha, Nicolas Hernandez.
2017.
MappSent: a Textual Mapping Approach for Question-to-Question Similarity.
Recent Advances in Natural Language Processing (RANLP).
- Dat Tien Nguyen, Shafiq Joty, Basma El Amel Boussaha, Maarten de Rijke.
2017.
Thread Reconstruction in Conversational Data using Neural Coherence.
Neu-IR: Workshop on Neural Information Retrieval.
- Béatrice Daille.
2017.
Term variation in specialised corpora: characterisation\, automatic discovery and applications..
.
- Aurélie Picton, Amélie Josselin-Leray, Emmanuel Planas.
2017.
Defining Knowledge-Rich Contexts for Specialized Translation: Uses and Limitations of a Mixed-Methods Approach.
21st Conference on Language for Specific Purposes 2017.
- Davide Buscaldi, Aude Grezka, Gaël Lejeune.
2017.
Tweetaneuse : Fouille de motifs en caractères et plongement lexical à l’assaut du deft 2017.
24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) : Analyse d'opinion et langage figuratif dans des tweets.
- Rémi Bois, Guillaume Gravier, Eric Jamet, Emmanuel Morin, Maxime Robert, Pascale Sébillot.
2017.
Linking multimedia content for efficient news browsing.
2017 ACM International Conference on Multimedia Retrieval (ICMR).
- Soufian Salim, Nicolas Hernandez, Emmanuel Morin.
2017.
Dialogue Act Taxonomy Interoperability Using a Meta-Model.
18th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing).
- Joseph Lark, Emmanuel Morin, Sebastián Peña Saldarriaga.
2017.
A comparative study of target-based and entity-based opinion extraction.
18th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing).
- Firas Hmida, Emmanuel Morin, Béatrice Daille, Emmanuel Planas.
2017.
KRCTool : un concordancier bilingue pour l'aide à la révision,KRCTool: A Bilingual KRC Concordancer for Assisted Revision.
1er Congrès Mondial de Traductologie (CMT).
- Chantal Enguehard.
2017.
Le vote électronique est-il transparent\, sûr\, fiable ?.
Science ... et pseudo-sciences.
- Chantal Enguehard.
2017.
Le vote électronique\, 10 ans après....
Interstices.
- Adeline Granet, Emmanuel Morin, Harold Mouchère, Solen Quiniou, Christian Viard-Gaudin.
2017.
Étude préliminaire de reconnaissance d'écriture sur des documents historiques.
Rencontre des Jeunes Chercheurs en Recherche d'Information (RJCRI).
- Adeline Granet, Geoffrey Roman-Jimenez, Françoise Rubellin, Solen Quiniou, Emmanuel Morin, Harold Mouchère, Christian Viard-Gaudin.
2017.
Analyse des registres manuscrits de la comédie-Italienne au XVIIIe siècle : de l'image au langage.
Folle Journée de l'Imagerie Nantaise (FJIN).
- Firas Hmida.
2017.
Identification et exploitation de contextes riches en connaissances pour l’aide à la traduction terminologique,Identification and exploitation of knowledge-rich contexts for terminological assisted translation.
.
- Béatrice Daille, Evelyne Jacquey, Sabine Barreaux.
2017.
Indexation automatique en SHS : bilan d’une expérimentation.
I2D – Information, données & documents.
- Béatrice Daille, Adeline Nazarenko.
2017.
Le tournant des données en traitement automatique des langues..
.
- Rémi Bois, Guillaume Gravier, Eric Jamet, Maxime Robert, Emmanuel Morin, Pascale Sébillot.
2017.
Language-based Construction of Explorable News Graphs for Journalists.
Empirical Methods in Natural Language Processing - Workshop on Natural Language Processing meets Journalism.
2016
- Florian Boudin, Hugo Mougard, Damien Cram.
2016.
How Document Pre-processing affects Keyphrase Extraction Performance.
COLING 2016 Workshop on Noisy User-generated Text (WNUT).
- Florian Boudin.
2016.
pke: an open source python-based keyphrase extraction toolkit.
COLING.
- Adrien Bougouin, Florian Boudin, Béatrice Daille.
2016.
Keyphrase Annotation with Graph Co-Ranking.
COLING.
- Colin de La Higuera, Achilles Beros.
2016.
A Canonical Semi-Deterministic Transducer.
Fundamenta Informaticae.
- James Scicluna, Colin de La Higuera.
2016.
Grammatical Inference of PCFGs Applied to Language Modelling and Unsupervised Parsing.
Fundamenta Informaticae.
- Rémi Eyraud, Colin de La Higuera, Makoto Kanazawa, Ryo Yoshinaka.
2016.
Preface.
Fundamenta Informaticae.
- Adrien Bougouin, Florian Boudin, Béatrice Daille.
2016.
Modélisation unifiée du document et de son domaine pour une indexation par termes-clés libre et contrôlée.
23e conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Béatrice Daille, Sabine Barreaux, Florian Boudin, Adrien Bougouin, Damien Cram, Amir Hazem.
2016.
Indexation d'articles scientifiques. Présentation et résultats du défi fouille de textes DEFT 2016,Automatic indexing of scientific papers. Presentation and results of DEFT 2016 text mining challenge.
Atelier DEFT 2016.
- Adrien Bougouin, Florian Boudin, Béatrice Daille.
2016.
TopicRank en domaines de spécialité : participation du LINA à DEFT 2016,TopicRank for specialized domains : LINA team at DEFT 2016.
Atelier DEFT 2016.
- Alexis Linard, Emmanuel Morin, Beatrice Daille.
2016.
Extraction de lexiques bilingues à partir de corpus comparables spécialisés à travers une langue pivot.
23e conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Nicolas Hernandez, Soufian Salim, Elizaveta Loginova Clouet.
2016.
Ubuntu-fr: a Large and Open Corpus for Supporting Multi-Modality and Online Written Conversation Studies.
The Tenth International Conference on Language Resources and Evaluation (LREC 2016).
- Béatrice Daille, Evelyne Jacquey, Gaël Lejeune, Luis Felipe Melo, Yannick Toussaint.
2016.
Ambiguity Diagnosis for Terms in Digital Humanities.
Language Resources and Evaluation Conference.
- Emmanuel Morin, Amir Hazem.
2016.
Improving Bilingual Terminology Extraction from Comparable Corpora via Multiple Word-Space Models.
10th International Conference on Language Resources and Evaluation (LREC).
- Firas Hmida, Emmanuel Morin, Béatrice Daille.
2016.
Aligned Knowledge-Rich Contexts from Specialized Comparable Corpora.
7th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing).
- Yves Lepage, Jean-Luc Minel, Emmanuel Morin, Pascale Sébillot, Isabelle Tellier.
2016.
Varia - Préface - 57-1.
Revue TAL : traitement automatique des langues.
- Emmanuel Morin, Amir Hazem.
2016.
Exploiting Unbalanced Specialized Comparable Corpora for Bilingual Lexicon Extraction.
Natural Language Engineering.
2015
- Adrien Bougouin.
2015.
Automatic Domain-Specific Keyphrase Annotation,Indexation automatique par termes-clés en domaines de spécialité.
.
- Florian Boudin, Hugo Mougard, Benoit Favre.
2015.
Concept-based Summarization using Integer Linear Programming: From Concept Pruning to Multiple Optimal Solutions.
Conference on Empirical Methods in Natural Language Processing (EMNLP) 2015.
- Alexis Linard, Béatrice Daille, Emmanuel Morin.
2015.
Attempting to Bypass Alignment from Comparable Corpora via Pivot Language.
8th Workshop on Building and Using Comparable Corpora (BUCC).
- Emmanuel Morin, Amir Hazem, Florian Boudin, Elizaveta Loginova Clouet.
2015.
LINA: Identifying Comparable Documents from Wikipedia.
8th Workshop on Building and Using Comparable Corpora (BUCC).
- Florian Boudin.
2015.
Reducing Over-generation Errors for Automatic Keyphrase Extraction using Integer Linear Programming.
ACL 2015 Workshop on Novel Computational Approaches to Keyphrase Extraction.
- Denis Béchet, Ophélie Lacroix.
2015.
CDGFr\, un corpus en dépendances non-projectives pour le français..
Conférence sur le Traitement Automatique des Langues Naturelles (TALN).
- Gaël Lejeune, Romain Brixtel, Charlotte Lecluze.
2015.
Évaluation intrinsèque et extrinsèque du nettoyage de pages Web,Intrinsic and extrinsic evaluation of boilerplate removal tool.
Traitement Automatique des Langues Naturelles 2015.
- Gaël Lejeune, Frédéric Dumonceaux.
2015.
A stylometric approach for opinion mining,Une approche stylométrique pour la fouille d'opinion.
Traitement Automatique des Langues Naturelles 2015, DEFT.
- Gaël Lejeune, Béatrice Daille.
2015.
Towards diagnosing ambiguity of candidate terms,Vers un diagnostic d'ambiguïté des termes candidats d'un texte.
Traitement Automatique des Langues Naturelles 2015.
- Hugo Mougard, Matthieu Riou, Colin de La Higuera, Solen Quiniou, Olivier Aubert.
2015.
The Paper or the Video: Why Choose ?.
2nd Semantics, Analytics, Visualisation: Enhancing Scholarly Data Workshop (SAVE-SD) co-located with the 24th International World Wide Web Conference.
- Anca-Roxana Simon, Rémi Bois, Guillaume Gravier, Pascale Sébillot, Emmanuel Morin, Sien Moens.
2015.
Hierarchical Topic Models for Language-based Video Hyperlinking.
Workshop on Speech, Language and Audio in Multimedia.
- Elizaveta Loginova Clouet, Rima Harastani, Béatrice Daille, Emmanuel Morin.
2015.
Compositional Translation of Single-Word Complex Terms Using Multilingual Splitting.
Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication.
2014
- Ophélie Lacroix.
2014.
De l’étiquetage syntaxique pour les grammaires catégorielles de dépendances à l’analyse par transition dans le domaine de l’analyse en dépendances non-projective,From syntactic tagging for categorial dependency grammars to transition-based parsing in the domain of non-projective dependency parsing.
.
- Joseph Lark, Sebastián Peña Saldarriaga, Emmanuel Morin, Fabien Poulard, Sylvain Ornetti.
2014.
Consumer Concern Extraction in Social Web Reviews,Origine des inquiétudes des consommateurs dans les critiques sur les sites sociaux.
International Conference on Digital Intelligence 2014.
- Elizaveta Loginova Clouet, Béatrice Daille.
2014.
Splitting of Compound Terms in non-Prototypical Compounding Languages.
Workshop on Computational Approaches to Compound Analysis, COLING 2014.
- Ophélie Lacroix, Denis Béchet.
2014.
A Three-Step Transition-Based System for Non-Projective Dependency Parsing.
The 25th International Conference on Computational Linguistics (COLING 2014).
- Solen Quiniou, Peggy Cellier, Thierry Charnois.
2014.
Fouille de données pour associer des noms de sessions aux articles scientifiques.
DEFT 2014.
- Adrien Bougouin, Florian Boudin, Béatrice Daille.
2014.
Influence des domaines de spécialité dans l'extraction de termes-clés.
Traitement Automatique des Langues Naturelles (TALN).
- Emmanuel Morin, Amir Hazem.
2014.
Looking at Unbalanced Specialized Comparable Corpora for Bilingual Lexicon Extraction.
Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL).
- Amir Hazem, Béatrice Daille.
2014.
Semi-compositional Method for Synonym Extraction of Multi-Word Terms.
9th edition of the Language Resources and Evaluation Conference (LREC 2014).
- Ophélie Lacroix, Denis Béchet.
2014.
Validation Issues induced by an Automatic Pre-Annotation Mechanism in the Building of Non-projective Dependency Treebanks.
Ninth International Conference on Language Ressources and Evaluation (LREC 2014).
- Ophélie Lacroix, Denis Béchet, Florian Boudin.
2014.
Label Pre-annotation for Building Non-projective Dependency Treebanks for French.
15th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing 2014).
- Elizaveta Loginova Clouet, Béatrice Daille.
2014.
Compound Terms and Their Multi-word Variants: Case of German and Russian Languages.
CICLing 2014.
- Denis Béchet, Alexander Dikovsky, Ophélie Lacroix.
2014.
CDG Lab'': an Integrated Environment for Categorial Dependency Grammar and Dependency Treebank Development.
.
- Romain Deveaud, Florian Boudin.
2014.
De quoi parle ce Tweet? Résumer Wikipédia pour contextualiser des microblogs.
Revue I3 - Information Interaction Intelligence.
- Adrien Bougouin, Florian Boudin.
2014.
TopicRank : ordonnancement de sujets pour l'extraction automatique de termes-clés.
Revue TAL : traitement automatique des langues.
2013
- Mohamed Hatmi, Christine Jacquin, Sylvain Meigner, Emmanuel Morin, Solen Quiniou.
2013.
Intégration de la reconnaissance des entités nommées au processus de reconnaissance de la parole.
Revue TAL : traitement automatique des langues.
- Romain Deveaud, Florian Boudin.
2013.
Effective Tweet Contextualization with Hashtags Performance Prediction and Multi-Document Summarization.
INitiative for the Evaluation of XML Retrieval (INEX).
- Amir Hazem, Emmanuel Morin.
2013.
Word Co-occurrence Counts Prediction for Bilingual Terminology Extraction from Comparable Corpora..
6th International Joint Conference on Natural Language Processing. IJCNLP 2013..
- Adrien Bougouin, Florian Boudin, Béatrice Daille.
2013.
TopicRank: Graph-Based Topic Ranking for Keyphrase Extraction.
International Joint Conference on Natural Language Processing (IJCNLP).
- Florian Boudin.
2013.
A Comparison of Centrality Measures for Graph-Based Keyphrase Extraction.
International Joint Conference on Natural Language Processing (IJCNLP).
- Amir Hazem.
2013.
Extraction de lexiques bilingues à partir de corpus comparables,Bilingual lexicon extraction from comparable corpora.
.
- Nicolas Hernandez.
2013.
Aid to spatial navigation within a UIMA annotation index.
UIMA@GSCL, 3rd Workshop on Unstructured Information Management Architecture.
- Estelle Delpech.
2013.
Traduction assistée par ordinateur et corpus comparables : contributions à la traduction compositionnelle,COMPUTER-AIDED TRANSLATION AND COMPARABLE CORPORA: CONTRIBUTIONS TO COMPOSITIONAL TRANSLATION.
.
- Adrien Bougouin.
2013.
État de l'art des méthodes d'extraction automatique de termes-clés.
Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL).
- Florian Boudin.
2013.
TALN Archives : une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.
Traitement Automatique des Langues Naturelles (TALN).
- Nicolas Hernandez, Florian Boudin.
2013.
Construction automatique d'un large corpus libre annoté morpho-syntaxiquement en français.
Traitement Automatique des Langues Naturelles (TALN).
- Florian Boudin, Emmanuel Morin.
2013.
Keyphrase Extraction for N-best Reranking in Multi-Sentence Compression.
North American Chapter of the Association for Computational Linguistics (NAACL).
- Elizaveta Loginova Clouet, Béatrice Daille.
2013.
Multilingual compound splitting combining language dependent and independent features.
Dialogue.
- Romain Deveaud, Florian Boudin.
2013.
Contextualisation automatique de Tweets à partir de Wikipédia.
Conférence en Recherche d'Information et Applications (CORIA).
- Béatrice Daille, Helena Blancafort.
2013.
Knowledge-poor and knowledge-rich approaches for multilingual terminology extraction.
13th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 2013).
- Nicolas Béchet, Peggy Cellier, Thierry Charnois, Bruno Crémilleux, Solen Quiniou.
2013.
SDMC : un outil en ligne d'extraction de motifs séquentiels pour la fouille de textes.
Conférence Francophone sur l'Extraction et la Gestion des Connaissances (EGC'13).
- Helena Blancafort, Francis Bouvier, Béatrice Daille, Ulrich Heid, Anita Ramm.
2013.
TTC Web Platform: from Corpus Compilation to Bilingual Terminologies for MT and CAT Tools.
Tralogy II. Trouver le sens : où sont nos manques et nos besoins respectifs ?.
- Béatrice Daille, Emmanuel Morin, Emmanuel Ep Prochasson.
2013.
Bilingual Terminology Mining from Comparable Corpora.
.
2012
- Tatiana Gornostay, Anita Ramm, Ulrich Heid, Emmanuel Morin, Rima Harastani, Emmanuel Planas.
2012.
Terminology Extraction from Comparable Corpora for Latvian.
HLT 2012: 5th International Conference Human Language Technologies.
- Romain Deveaud, Florian Boudin.
2012.
LIA/LINA at the INEX 2012 Tweet Contextualization track.
INitiative for the Evaluation of XML Retrieval (INEX).
- Elizaveta Loginova Clouet, Anita Gojun, Helena Blancafort, Marie Guegan, Tatiana Gornostay, Ulrich Heid.
2012.
Reference Lists for the Evaluation of Term Extraction Tools.
Proceedings of the 10th Terminology and Knowledge Engineering Conference (TKE'12)Terminology and Knowledge Engineering Conference (TKE).
- Florian Boudin, Amir Hazem, Nicolas Hernandez, Prajol Shrestha.
2012.
Participation du LINA à DEFT 2012.
Atelier Défi Fouille de Textes (DEFT).
- Mohamed Hatmi.
2012.
Adaptation d'un système de reconnaissance d'entités nommées pour le français à l'anglais à moindre coût.
RECITAL.
- Boris Karlov, Ophélie Lacroix.
2012.
Prémices d'une analyse syntaxique par transition pour des structures de dépendances non-projectives.
RECITAL 2012.
- Béatrice Daille.
2012.
Building Bilingual Terminologies from Comparable Corpora: The TTC TermSuite.
5th Workshop on Building and Using Comparable Corpora with special topic "Language Resources for Machine Translation in Less-Resourced Languages and Domains", co-located with LREC 2012.
- Amir Hazem, Emmanuel Morin.
2012.
Adaptive Dictionary for Bilingual Lexicon Extraction from Comparable Corpora.
12th International Conference on Language Resources and Evaluation. LREC 2012 (Short paper).
- Florian Boudin, Jian-Yun Nie, Martin Dawes.
2012.
Using a Medical Thesaurus to Predict Query Difficulty.
34th European Conference on Information Retrieval (ECIR).
- Amir Hazem, Emmanuel Morin.
2012.
QAlign: A New Method for Bilingual Lexicon Extraction from Comparable Corpora..
the 13th Conference on Intelligent Text Processing and Computational Linguistics. CICLing 2012..
- M. Weller, Anita Gojun, Ulrich Heid, Béatrice Daille, Emmanuel Morin.
2012.
Compiling terminological data using comparable corpora: from term extraction to dictionaries.
34th Annual Conference of the German Linguistic Society (DGfS).
- Solen Quiniou, Peggy Cellier, Thierry Charnois, Dominique Legallois.
2012.
What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics ?.
.
2011
- Jérôme Rocheteau, Béatrice Daille.
2011.
TTC TermSuite: A UIMA Application for Multilingual Terminology Extraction from Comparable Corpora.
5th International Joint Conference on Natural Language Processing (IJCNLP).
- Béatrice Daille.
2011.
Term variation in texts.
9th International Conference on Terminology and Artificial Intelligence (TIA 2011).
- M. Weller, Anita Gojun, Ulrich Heid, Béatrice Daille, Rima Harastani.
2011.
Simple methods for dealing with term variation and term alignment.
9th International Conference on Terminology and Artificial Intelligence (TIA 2011).
- Béatrice Daille, Christine Jacquin, Laura Monceaux, Emmanuel Morin, Jérôme Rocheteau.
2011.
TTC TermSuite : une chaîne de traitement pour la fouille terminologique multilingue..
18ème Conférence francophone sur le Traitement Automatique des Langues Naturelles Conference (TALN 2011)..
- Fabien Poulard, Béatrice Daille, Christine Jacquin, Laura Monceaux, Emmanuel Morin, Helena Blancafort.
2011.
Comparability Measurement for Terminology Extraction.
Workshop on Creation, Harmonization and Application of Terminology resources (CHAT 2011) in conjunction with the 18th Nordic Conference on Computational Linguistics (NODALIDA 2011)..
- Helena Blancafort, Ulrich Heid, Tatiana Gornostay, Claude Méchoulam, Béatrice Daille, Serge Sharoff.
2011.
User-centred Views on Terminology Extraction Tools: Usage Scenarios and Integration into MT and CAT Tools..
Tralogy I. Métiers et technologies de la traduction : quelles convergences pour l'avenir ?.
- M. Weller, Anita Gojun, Ulrich Heid, Helena Blancafort, Béatrice Daille.
2011.
Identifying and Grouping Variants of Technical Terms on the Basis of Text Corpora.
33rd Annual Conference of the German Linguistic Society (DGfS).
2010
- Helena Blancafort, Béatrice Daille, Tatiana Gornostay, Ulrich Heid, Claude Méchoulam, Serge Sharoff.
2010.
TTC: Terminology Extraction\, Translation Tools and Comparable Corpora.
14th EURALEX International Congress.
- Nuria Bel, Béatrice Daille, Andrejs Vasiljevs.
2010.
Worshop\, Methods for the automatic acquisition of Language Resources and their evaluation methods.
Seventh International Language Resources and Evaluation Conference (LREC 2010).
- Fabien Poulard, Nicolas Hernandez, Béatrice Daille.
2010.
Detecting Derivatives using Specific and Invariant Descriptors.
Twelveth International Conference on Computational Linguistics and Intelligent Text Processing (CICLING 2010).
- Emmanuel Morin, Béatrice Daille, Kyo Kageura, Koichi Takeuchi.
2010.
Brains\, not Brawn: The Use of ‘’Smart’’ Comparable Corpora in Bilingual Terminology Mining.
ACM - Transactions on Speech and Language Processing.
2008
- Béatrice Daille, Emmanuel Morin.
2008.
Effective Compositional Model for Lexical Alignment.
IJCNLP 2008: Third International Joint Conference on Natural Language Processing.
2006
- Farid Cerbah, Béatrice Daille.
2006.
Une architecture de services pour mieux spécialiser les processus d'acquisition terminologique.
Revue TAL : traitement automatique des langues.
2005
- Béatrice Daille.
2005.
Variations and application-oriented terminology engineering.
Terminology. International Journal of Theoretical and Applied Issues in Specialized Communication.
2004
- Emmanuel Morin, Béatrice Daille.
2004.
Extraction de terminologies bilingues á partir de corpus comparables d'un domaine spécialisé.
Revue TAL : traitement automatique des langues.
2003
- Béatrice Daille.
2003.
Terminology Mining.
.
2002
- Chantal Enguehard, Béatrice Daille, Emmanuel Morin.
2002.
Tools for Terminology Processing.
The Indo-European Conference on Multilingual Communications Technologies (IEMCT).
- Christian Jacquemin, Béatrice Daille, Jean Royauté, Xavier Polanco.
2002.
In vitro evaluation for a program to machine-aided indexing.
Information Processing \& Management (IPM).
2001
- Emmanuel Desmontils, Christine Jacquin.
2001.
Indexing a Web Site with a Terminology Oriented Ontology.
The first Semantic Web Working Symposium (SWWS'01).
- Béatrice Daille.
2001.
Qualitative terminology extraction: Identifying relational adjectives.
.
- Béatrice Daille.
2001.
L'identification en corpus d'adjectifs relationnels : une piste linguistique pour l'extraction automatique de terminologie.
Revue TAL : traitement automatique des langues.