Enrichissement des parcours d'apprentissage du biocrédit 1 (analyse GO)

Enrichissement du parcours 1 de l'apprentissage du biocrédit (analyse GO) :

Connaissance théorique de l'analyse d'enrichissement

L'analyse d'enrichissement est une méthode statistique largement utilisée dans la recherche bioinformatique, principalement utilisée pour tester le degré d'enrichissement de certaines fonctions ou caractéristiques d'un ensemble de gènes. L’objectif principal de l’analyse d’enrichissement est de trouver des modèles et des fonctions biologiquement significatifs à partir de grandes quantités de données génétiques. Selon les objectifs et les méthodes d'analyse, l'analyse d'enrichissement peut être divisée en les types suivants :

Analyse d'enrichissement d'ontologie génétique : il s'agit du type d'analyse d'enrichissement le plus couramment utilisé pour examiner l'enrichissement des entrées d'ontologie génétique (GO) dans un ensemble de gènes. Cela peut aider les chercheurs à comprendre les caractéristiques communes des gènes de la collection de gènes en termes de processus biologiques, de fonctions moléculaires et de composition cellulaire.

Analyse d'enrichissement des voies : Ce type d'analyse d'enrichissement se concentre sur le rôle des gènes dans les voies métaboliques et de signalisation. En détectant l’enrichissement des voies dans les ensembles de gènes, les chercheurs peuvent comprendre les fonctions et les mécanismes de régulation de ces gènes dans les organismes. Les bases de données de voies telles que KEGG (Kyoto Encyclopedia of Genes and Genomes) et Reactome sont des ressources courantes pour l'analyse de l'enrichissement des voies.

Analyse d'enrichissement d'ensemble de gènes (GSEA) : GSEA est une méthode conçue pour détecter un ensemble de gènes (tels que des gènes exprimés différentiellement) et certaines caractéristiques biologiques (telles que l'ontologie des gènes, la voie, la maladie, le phénotype, etc.) par méthode d'association. La GSEA peut aider les chercheurs à comprendre l’association entre les ensembles de gènes et les fonctions et processus biologiques, révélant ainsi une signification biologique potentielle.

Analyse d'enrichissement des interactions protéine-protéine : ce type d'analyse d'enrichissement se concentre sur les interactions entre les protéines et aide les chercheurs à comprendre la fonction des protéines dans les collections de gènes dans la signalisation cellulaire et le métabolisme.

Analyse d'enrichissement de la régulation de l'expression génique : Ce type d'analyse d'enrichissement se concentre sur les effets régulateurs des facteurs de transcription, des miARN et d'autres facteurs régulateurs sur l'expression des gènes. Grâce à cette analyse d'enrichissement, les chercheurs peuvent comprendre les mécanismes de régulation et les interrelations de l'expression des gènes.

Connaissance théorique de l'analyse GO

Gene Ontology (GO) est un système terminologique standard utilisé pour décrire les attributs des gènes et des produits géniques. Il fournit une manière organisée de représenter les différents rôles des gènes dans un organisme. L'ontologie génétique décrit généralement les gènes à trois niveaux : les composants cellulaires (Cellular Component, CC), les processus biologiques (Biological Process, BP) et les fonctions moléculaires (Molecular Function, MF).

Composant cellulaire (CC) : Ce niveau décrit l'emplacement des produits génétiques (tels que les protéines) dans la cellule. Par exemple, ils peuvent être situés dans le noyau, le cytoplasme, la membrane mitochondriale ou d'autres organites. Cela aide à comprendre le rôle et la fonction des produits génétiques dans les cellules.

Processus biologique (BP) : Ce niveau décrit les processus biologiques auxquels les gènes participent. Ces processus peuvent inclure la croissance cellulaire, la transduction du signal, la régulation de l’expression génique, les voies métaboliques, etc. En comprenant les processus biologiques dans lesquels les gènes sont impliqués, nous pouvons mieux comprendre les fonctions physiologiques des organismes et les mécanismes des maladies.

Fonction moléculaire (MF) : Ce niveau décrit la fonction du produit génique au niveau moléculaire, impliquant généralement des interactions avec d'autres molécules ou catalysant des réactions biochimiques. Par exemple, un produit génique peut être une enzyme qui catalyse une réaction biochimique spécifique ; ou il peut s'agir d'une protéine structurelle impliquée dans l'assemblage et le maintien du cytosquelette.

Gene Ontology offre aux chercheurs un moyen systématique de représenter et de partager des connaissances sur les fonctions et les processus des gènes et des produits génétiques dans les organismes vivants. Cela contribuera à promouvoir le développement de la recherche sur la fonction des gènes, à améliorer l'efficacité de la recherche et à fournir des informations importantes pour le traitement des maladies et le développement de médicaments.

montrer quelques photos liées

Insérer la description de l'image ici
Insérer la description de l'image ici

Principes de base de l'analyse GO :

Préparez la liste de gènes : Tout d’abord, vous avez besoin d’analyser une liste de gènes, qui est généralement une collection de gènes exprimés différentiellement ou associés à une condition spécifique obtenue à partir de données expérimentales.

Mappage des gènes aux entrées GO : Ensuite, chaque gène de la liste de gènes doit être mappé à l'entrée GO correspondante. Ceci peut être réalisé en utilisant des outils et des bases de données bioinformatiques (telles que DAVID, Ensembl, AmiGO, etc.).

Enrichissement statistique : Ensuite, vous devez calculer l'enrichissement de chaque entrée GO dans la liste des gènes. Cela se fait généralement en comparant le rapport entre le nombre réel de gènes observés et le nombre de gènes attendus sur la base de la distribution aléatoire du génome de fond. Les méthodes statistiques couramment utilisées comprennent le test hypergéométrique, le test exact de Fisher et le test du chi carré.

Correction de comparaisons multiples : étant donné que l'analyse d'enrichissement GO implique un grand nombre de tests d'hypothèse, une correction de comparaisons multiples est nécessaire pour réduire les résultats faussement positifs. Les méthodes courantes de correction par comparaison multiple incluent la correction de Bonferroni, la correction de Benjamini-Hochberg (FDR), etc.

Interpréter et visualiser les résultats : Enfin, la liste de gènes peut être interprétée sur la base des résultats de l'analyse d'enrichissement pour identifier des fonctions, des processus et des fonctions moléculaires biologiquement significatifs. De plus, les résultats d'enrichissement peuvent également être affichés sous forme graphique via divers outils de visualisation (tels que Cytoscape, REVIGO, etc.) pour faciliter la compréhension et la communication.

L'analyse de l'ontologie génétique aide les chercheurs à extraire la signification biologique des données d'expression génique en évaluant l'enrichissement de fonctions biologiques, de processus ou de fonctions moléculaires spécifiques dans des ensembles de gènes. Cela aide à révéler les liens entre les gènes dans les processus et fonctions biologiques, favorisant ainsi la compréhension de la régulation génétique et des mécanismes d’action dans les organismes.

GO分析代码

// An highlighted block
degdf <- FindMarkers(scRNA1,ident.1 = "DapiNeg1",ident.2 = "DapiNeg2", 
                     logfc.threshold = 0.5,group.by = "orig.ident",ident=1)
degdf <- FindAllMarkers(scRNA1)

saveRDS(degdf,"markers.rds")
# degdf<-readRDS("markers.rds")
# BiocManager::install("org.Hs.eg.db")
# BiocManager::install("rlang")
# BiocManager::install("vctrs",force = TRUE)
# 
# 
# 
# install.packages("clusterProfiler")
# install.packages("GOSemSim")
# 
# 
# 
# options(connectionObserver = NULL)
library(org.Hs.eg.db)
library(GOSemSim)

library(clusterProfiler)
degs.list=rownames(degdf)
erich.go.BP = enrichGO(gene =degs.list,
                       OrgDb = org.Hs.eg.db,
                       keyType = "SYMBOL",
                       ont = "BP",
                       pvalueCutoff = 0.05,
                       qvalueCutoff = 0.05)

Insérer la description de l'image ici
Insérer la description de l'image ici

La création du projet GO remonte à 1998, et ses résultats et méthodes ont été largement adoptés et publiés dans de nombreux articles de recherche. Voici quelques publications importantes sur le projet GO :

  1. Ashburner, M., Ball, CA, Blake, JA, Botstein, D., Butler, H., Cherry, JM, Davis, AP, Dolinski, K., Dwight, SS, Eppig, JT, Harris, MA, Hill, DP, L. Issel-Tarver, A. Kasarskis, S. Lewis, JC Matese, JE Richardson, M. Ringwald, GM Rubin et G. Sherlock. Gene Ontology : outil pour l'unification de la biologie. Génétique de la nature, 25(1), 25-29. https://doi.org/10.1038/75556

Cet article est un document important sur la fondation et la réalisation initiale du projet Gene Ontology. Les auteurs présentent le contexte du projet, les objectifs, ainsi que le concept et la réalisation des trois composants principaux (composants cellulaires, processus biologiques et fonctions moléculaires).

  1. Le Consortium d'ontologie génétique. (2017). Expansion de la base de connaissances et des ressources Gene Ontology. Recherche sur les acides nucléiques, 45(D1), D331–D338. https://doi.org/10.1093/nar/gkw1108

Cet article décrit l'expansion de la base de connaissances et des ressources de Gene Ontology, y compris le développement de la terminologie, des annotations et des outils. L'article présente également les dernières avancées du projet GO en matière de soutien à la recherche sur la fonction des gènes.
D'autres connaissances en bioinformatique sont les bienvenues pour échanger v : coffeeiix (peut également recevoir une formation sur l'analyse du transcriptome unicellulaire)

Je suppose que tu aimes

Origine blog.csdn.net/coffeeii/article/details/130355514
conseillé
Classement