You are here : Home News and Events News and Events TTC @ IEEE/WIC/ACM - August 22-27, 2011, Lyon, France  

TTC @ IEEE/WIC/ACM - August 22-27, 2011, Lyon, France

Clément de Groc (SYLLABS) presented  Babouk: Focused web crawling for corpus compilation and automatic terminology extraction (paper) at the 2011 IEEE/WIC/ACM International Conference on Web Intelligence held on August 22-27, 2011 at Campus Scientifique de la Doua in Lyon, France.

WI-IAT

Abstract (in French):

L’exploitation du Web en tant que source de données linguistiques à la fois immense et gratuite est une idée maintenant bien établie. Dans cet article, nous présentons une plate-forme industrielle de parcours orienté du web pour la constitution automatique de corpus et de lexiques spécialisés. Cette application, réalisée dans le cadre du projet européen TTC1, est utilisée quotidiennement par plusieurs linguistes pour créer rapidement de larges lexiques et corpus. Ces derniers sont ensuite utilisés pour générer automatiquement des terminologies bilingues.