Propositions de TER sur la fouille de données (relationnelles) pour 2009-2010

N'hésitez pas à nous contacter pour plus d'informations sur un sujet, ou pour candidater.

Fouille de données relationnelles : cardinalisation

Il s'agit de poursuivre les travaux sur une technique développée l'an dernier dans l'équipe FDBT. Cette technique, baptisée cardinalisation, cherche à gérer des données relationnelles contenant des attributs continus. Il faudra poursuivre les tests, en particulier comparer avec les techniques concurrentes, sur des jeux de données divers. Une application intéressante est celle des bases de données géographiques étudiées dans le projet GeOpenSim sur lequel travaille l'équipe FDBT.

Un intérêt, voire des connaissances, sur la fouille de données, ainsi que des compétences en développement sont requis.

Co-encadré par Agnès Braud

Fouille de données relationnelles : applications à la chimie

L'équipe FDBT collabore depuis plusieurs années avec le laboratoire de chemo-informatique, en particulier sur la prédiction de réactions chimiques. Ce projet consiste à tester des approches existantes de la fouille de données relationnelles sur les données de réaction étudiées jusqu'à présent et comparer les résultats obtenus.

Un intérêt, voire des connaissances, sur la fouille de données, ainsi que des compétences en développement sont requis. Un intérêt pour la chimie et les collaborations est le bienvenu.

Fouille de données relationnelles : données clients de grande taille

Dans le cadre d'un contrat, nous disposons de deux extraits (un "petit" et un "moyen") d'une base de données de grande taille (en nombre de lignes et en nombre de colonnes). Le projet consiste à appliquer des approches existantes de la fouille de données relationnelles à ces données pour tester leur applicabilité.

Un intérêt, voire des connaissances, sur la fouille de données, ainsi que des compétences en développement sont requis. Le projet s'appuiera sur des bases de données, voire des entrepôts.

Co-encadré par Agnès Braud

Fouille de données médicales : Houston

Dans le cadre d'une collaboration avec l'université de Houston et un hôpital de Houston, aux USA, nous proposons de travailler sur des données médicales relatives à des maladies cardiaques. Il pourrait y avoir un séjour à Houston. Il s'agit d'un problème de fouille de données complet : formalisation du problème, préparation des données, construction de modèles, évaluation, et on affine !

Des compétences en fouille de données sont requises. La connaissance de l'anglais est souhaitable.

Co-encadré par Agnès Braud


Nicolas Lachiche