Le cours est la continuité du cours L5SOPRG intitulé "Programmation de modèles linguistiques 1 (phonétique et morpho-syntaxe)". On part du constat des insuffisances de la représentation morpho-syntaxique des documents textuels et de la nécessité d'y incorporer de la sémantique. On abordera 2 types de représentation sémantique à savoir la sémantique endogène/implicite et la sémantique exogène/explicite.

Notion de probabilité et variable aléatoire. Lois binomiale, de Poisson, uniforme, normale, du chi2.

Test du chi2, estimation et intervalle de confiance, tests de conformité, d'homogénéité d'échantillons, tableau de contingence.

Les séances de travaux dirigés sont réalisés avec le logiciel R.

Ce cours propose une introduction à la sociologie, et en particulier à la sociologie des controverses et à la sociologie des problèmes publics.

Lundi 8h30-10h30, Maison de la Recherche salle D040.

-Représentation des connaissances avec des réseaux sémantiques

-Logiques de description

-Développement des ontologies

-Langage SPARQL


Présentation et analyse de données avec R.

Alternance de cours et TD.

Lorsque l'on s'intéresse au traitement automatique des données en langue naturelle (écrites ou orales), une des problématiques principales consiste à transposer des modèles linguistiques en code informatique. Nous verrons dans ce cours comment l'on peut implanter des modèles phonétiques et syntaxiques en langage Python. Ce cours fera appel aux notions de Logique et de Codage des données textuelles enseignées en Epistémologie de l'informatique. Nous étudierons les modèles phonétiques et syntaxiques sous-jacents aux aux principales applications de Traitement des Langues. Parmi les applications traités figurera l'Extraction d'Information qui vise à partir d'énoncés en langue naturelle à extraire une représentation structurée sous forme de base de connaissances.

Nous aborderons par ce biais l'interface syntaxe/sémantique afin de préparer les étudiants au semestre suivant de programmation.

Bibliographie :

Mohamed Zakaria KURDI, Traitement automatique des langues et linguistique informatique 1, ISTE 2017


Les bases de données permettent à des utilisateurs de tirer efficacement partie des données existantes dans différents formats et exploitées pour différents besoins. Ce cours est destiné à présenter:

- les principes des bases de données

- la terminologie du domaine

- les méthodes de conceptions des bases de données

- les langages d'interrogation. 

Nous présenterons les problèmes récurrents liés à l'utilisation des bases de données et les stratégies usuelles pour les traiter avec succès. 

Bibliographie : 

Pour une introduction aux bases de données vous pouvez allez consulter le cours de Laurent Audibert (disponible en ligne). Un panorama plus complet est offert par le livre du même auteur "Bases de données – de la modélisation au SQL" (Ellipses).

Cet atelier propose aux étudiants de découvrir le métier du Traitement Automatique du Langage. Les étudiants se visualise dans un dans un avenir professionnel afin de žcomprendre les enjeux de leur projet et žconfirmer leur choix d’études. L'évaluation du cours : žprésentation orale des principaux résultats de recherches personnelles. žLa présentation permet d’explorer d’autres pistes professionnelles.