Nous utilisons des méthodes avancées de traitement et d’analyse de l’expression génique avec tous les types de données générées. Notre équipe prend en charge les analyses spécialisées et personnalisées, adaptées aux besoins spécifiques de votre projet.
Nos analyses avancées comprennent l’analyse de l’expression différentielle des gènes (gènes codant pour des protéines, miARN, ARNlnc) ainsi que l’analyse de séries chronologiques pour le suivi des patients et la réponse au traitement.
Le traitement des données de séquençage de l’ARN (RNA-Seq) est effectué par Cobra, notre plateforme infonuagique de gestion et d’analyse des données de RNA-Seq mise au point à l’interne. Cobra traite les données de séquençage des petits ARN, des ARN messagers (ARNm) et des longs ARN non codants (ARNlnc) selon une approche axée sur la qualité. Notre processus de traitement automatisé des données comprend 3 grandes étapes : la préparation des données, la cartographie des séquences et la quantification de l’ARN.
Vous pouvez compter sur un service offrant :
Le traitement des petits ARN et des miARN repose sur un outil exclusif de quantification des petits ARN procurant une visualisation graphique du contrôle de la qualité adaptée aux miARN. Pour la quantification des longs ARN non codants, nous avons recours à un transcriptome de référence enrichi de plus de 20 000 modèles de gènes d’ARNlnc répertoriés dans la base de données LNCipedia. Les annotations de ce transcriptome de référence enrichi en ARNlnc permettent une détection nettement améliorée des ARNlnc et une meilleure quantification.
Les données de séquençage de l’ARN constituent un excellent point de départ pour aller au-delà de l’analyse classique de l’abondance des ARN et exploiter simultanément l’information structurale encodée dans le transcriptome, telles que les mutations et les gènes de fusion présents dans les cellules cancéreuses.
Notre plateforme d’analyse des séquences d’ARN permet la détection de variants mononucléotidiques, de petites insertions et délétions, et de gènes de fusion. Les variants sont ensuite recherchés dans des ressources externes fournissant une annotation fonctionnelle du génome.
Nos plateformes d’analyse de données comprennent l’accès à des bases de données d’annotations fonctionnelles des ARNlnc et des petits ARN.
Notre base de données sur les fonctions prédites des ARNlnc, établie par l’analyse de perturbations à haut débit causées par des composés chimiques et par l’inhibition de l’expression de facteurs de transcription, permet de positionner les ARNlnc sur des voies de régulation moléculaires, de les associer à un contexte fonctionnel et d’identifier leurs régulateurs en amont.
Une autre de nos bases de données exclusives associe un contexte fonctionnel aux ARNlnc et aux miARN humains sur la base du principe de « culpabilité par association ». Ce dernier stipule que les gènes qui partagent un profil d’expression similaire sont plus susceptibles d’agir dans la même voie moléculaire ou de répondre aux mêmes régulateurs en amont. Sur la base de ce principe, nous utilisons les données dérivées de la partie annotée du transcriptome (constituée des ARNm codant pour les protéines) pour déduire les voies moléculaires associées à la partie non annotée du transcriptome (constituée des ARN non codants). Il est donc possible d’appliquer le principe de « culpabilité par association » pour déduire les fonctions associées aux miARN et aux longs ARN non codants. Nous pouvons également appliquer ce même principe pour prédire les fonctions associées à vos données d’expression génique sans avoir recours aux bases de données publiques, en utilisant des méthodes d’enrichissement de groupes de gènes.
Pour l’analyse des données de PCR quantitative, notre équipe s’appuie sur des modèles de quantification validés par les pairs pour corriger les résultats en fonction de l’efficacité de la PCR, estimer la propagation des incertitudes, effectuer la calibration entre les différentes séries d’échantillons et réaliser les analyses statistiques. Des méthodes de normalisation avancées ainsi qu’une version améliorée de l’algorithme geNorm permettant la sélection de gènes de référence exprimés de manière stable sont également utilisées pour une analyse optimale des données.
Pour l’analyse des données de PCR numérique, nous allons au-delà de la méthode de validation classique lorsque nous testons la linéarité et la précision. Nous utilisons des modèles linéaires mixtes généralisés et une propagation des incertitudes fiable, entre autres lorsque nous analysons un grand nombre d’échantillons parallèles et de gènes de référence. Pour en savoir plus.