Seminaires

Année 2019-2020

Les séminaires ont lieu les mardis à 14h dans l'amphithéâtre du CGFB (sauf si c'est précisé autrement)

Octobre 2019

8/10 Laurent Brehelin (LIRMM, Montpellier)

Probing transcriptional regulation with statistical models

L'expression des gènes chez les eucaryotes est orchestrée par des mécanismes de régulation distincts afin d'assurer une grande variété de types et de fonctions de cellules. Bien que ces réglementations incluent des acteurs aussi différents que les facteurs de transcription (TF), les marques d'histone ou la structure de la chromatine, la séquence d'ADN elle-même est invariablement impliquée dans les différents processus. Par conséquent, un défi clé en génomique réglementaire consiste à déchiffrer les liens entre la régulation des gènes et la séquence de l'ADN. Dans cet exposé, je présenterai deux tentatives pour problème basé sur des méthodes d’apprentissage statistique et de sélection de caractéristiques.

Dans le premier travail [1], nous sondons les instructions au niveau de la séquence pour l'expression des gènes et développons une méthode pour expliquer les niveaux d'ARNm basée uniquement sur les caractéristiques des nucléotides. Notre méthode positionne la composition nucléotidique en tant que composante essentielle de l'expression des gènes. Dans le second [2], nous étudions les combinaisons de TF impliquées dans la liaison d'un TF cible dans un type de cellule particulier. Nous montrons que les combinaisons de TF sont différentes entre les promoteurs et les amplificateurs, mais similaires pour les promoteurs d'ARNm, d'ARNlnc et de pri-miARN.

[1] https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1005921
[2] https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-018-5408-0

 

22/10 Guillaume Bernard (Sorbonne university, MNHN, Paris)

Next-generation phylogenomics: alignment-free approaches, sequence similarity networks and more.

Depuis les années 2000, avec le développement du séquençage de nouvelle génération (NGS), les biologistes ont pu séquencer les microbes directement à partir de l’environnement. La «matière noire microbienne» représentée dans les métagénomes pourrait contenir une quantité considérable de nouvelles informations sur la diversité microbienne de la Terre et les origines de la vie, ainsi que sur des solutions aux problèmes médicaux ou à l’adaptation aux changements climatiques. La technologie NGS a apporté un déluge de données de séquences collectées dans lesquelles nous avons trouvé une énorme diversité et des organismes non caractérisés qui n’étaient pas cultivés en laboratoire. Des approches alternatives aux méthodes phylogénétiques classiques basées sur l'alignement multiple de séquences (MSA), telles que les réseaux de similarité de séquences (SSN) et les méthodes sans alignement (AF), sont de plus en plus utilisées dans les analyses évolutives pour faire face à la quantité de plus en plus grande de données. Ces dernières approches sont plus rapides et plus évolutives que leurs homologues basées sur MSA et peuvent être appliquées à une gamme plus large de données (lectures de séquençage, génomes entiers, etc.). Je commencerai par une brève introduction aux approches AF suivie d'un aperçu des différentes méthodes disponibles. Ensuite, je montrerai les méthodes basées sur le réseau et leurs applications. Enfin, je présenterai une nouvelle approche combinant les méthodes SSN et AF pour identifier rapidement les gènes / protéines d’intérêt dans les données métagénomiques et déduire des approximations de phylogénie, attractives pour les longues branches, lorsque les données sont trop volumineuses ou divergentes pour effectuer une analyse MSA.

 

10/12 Laura Cantini (IBENS, ENS, Paris)

 


 

Année 2018-2019

 

Novembre

20/11 Clovis Galliez (Université de Grenoble) "Making sense of the metagenomics mixture: identifying bacterial hosts from phage sequences and binning billions of contigs"

29/11 Antonio Marco (University of Essex, UK), TBA, "On sex, mothers and microRNA"

Janvier

8/01 Warren Francis (University of Southern Denmark) "Comparative genomics and the nature of placozoan species"

Février

19/02 Magali Champion (Université Paris Descartes), "AMARETTO: Multi-omics data fusion for cancer data "

Mars

26/03 Julien Chiquet (AgroParisTech), "A collection of Poisson lognormal models for multivariate analysis of count data"

Mai

7/05 Florian Thibord (UPMC Université Paris 6), "Alignement des données miRseq"

21/05 Eduardo Rocha (Institut Pasteur), "Horizontal gene transfer: from acquisition to functional innovation"