[Notas de estudio] Bioinformática de la Universidad de Shandong-03 Evolución molecular y filogenética

Dirección del curso : Bioinformática, Universidad de Shandong


3. Evolución molecular y filogenia

3.1 Conceptos básicos

evolución molecular

  • Evolución molecular : utilice software para construir árboles filogenéticos entre varios organismos desde el nivel molecular (ADN\, ARN, secuencia de proteínas). La precisión depende de la calidad del software y de la configuración de los parámetros.
  • El estadounidense Linus Dauling propuso la teoría de la evolución molecular en 1964. Estudie los procesos evolutivos a nivel molecular (secuencias de ADN, ARN o proteínas) en lugar de basarse en las características extrínsecas de una especie.
  • Un árbol filogenético se construye con base en las diferencias de secuencia de una molécula en particular en diferentes especies .
  • Supuestos básicos :
    (1) las secuencias de ADN, ARN o proteínas contienen toda la información de la historia evolutiva de las especies ;
    (2) Teoría del reloj molecular : la velocidad de variación evolutiva de una proteína específica es básicamente constante en diferentes especies . Es decir, cuanto más similares sean las secuencias de dos proteínas, más cerca estarán de su ancestro común.

Homólogo

  • Homólogo Homologs : las secuencias similares derivadas de un ancestro común son homólogas.
  • Secuencias similares no son necesariamente secuencias homólogas
  1. OrtólogosOrthologs : Genes de diferentes especies que han evolucionado a través de familias verticales (especiación). Y normalmente conserva la misma función que el gen original .
  2. Parálogo : un gen derivado de Paralogsla duplicación de genes en la misma especie puede desarrollar una nueva función relacionada con el original .
  3. Similitud y homologíaXenologs : mediante transferencia horizontal de genes , derivados de genes similares producidos por simbiosis o infección viral .
    inserte la descripción de la imagen aquí
  • Similitud y homología
    ◆ Similitud → cuantificable
    La similitud entre la secuencia A y la secuencia B es del 80% ✔
    La secuencia A y la secuencia B son similares ✔
    HomologíaNo cuantificable
    La homología entre la secuencia A y la secuencia B es del 80%
    ✖La secuencia A y la secuencia B son homólogas secuencias✔

3.2 Árbol filogenético

árbol filogenético

  • Importancia de construir un árbol filogenético
    1. Para un gen o secuencia de proteína desconocidos, determine sus parientes más cercanos.
    2. Predecir la función de un gen o una proteína recién descubierta .
    3. Ayuda a predecir la tendencia de una función molecular.
    4. Rastreando el origen de un gen .
  • La estructura del árbol filogenético :
    inserte la descripción de la imagen aquí
  • Árboles filogenéticos de varias formas.
    inserte la descripción de la imagen aquí
  • El árbol filogenético se puede girar a voluntad : las ramas de cualquier punto giran alrededor de este punto sin cambiar el significado biológico del árbol.
    inserte la descripción de la imagen aquí

Árboles enraizados y sin enraizar

  • Árboles enraizados y no enraizados : los dos son intercambiables, y la ubicación de la raíz la determina el grupo externo .
  • El árbol sin raíces solo refleja la distancia entre los taxones y no involucra la ascendencia de quién es de quién.
  • Un árbol enraizado refleja el orden cronológico de la evolución de genes o proteínas en el árbol.Al analizar la longitud de las ramas del árbol enraizado , es posible comprender cómo y a qué velocidad evolucionan los diferentes genes o proteínas. Para hacer un árbol enraizado, debe especificar grupos externos.
  • Outgroupoutgroup : Un grupo fuera de lo que estás estudiando. Asegúrese de que esté fuera de lo que está investigando, pero no demasiado lejos . Puede ser no solo una especie, sino varias (2-3 están bien).
  • Por ejemplo, si desea analizar la relación evolutiva de un gen entre diferentes razas , puede elegir chimpancés para unirse como un grupo externo para participar en la construcción del árbol. Asegúrese de que el grupo externo seleccionado esté fuera de su rango de estudio, pero no demasiado lejos.
  • El nodo en la rama del grupo externo es la raíz.
    inserte la descripción de la imagen aquí

árbol de especies y árbol molecular

  • El árbol de especies se construye en base a la relación evolutiva general (basada en el genoma completo ) de cada especie .
  • Los árboles moleculares se construyen en base a la relación entre un gen o secuencia de proteína en diferentes especies .
    inserte la descripción de la imagen aquí

3.3 Construcción del árbol filogenético

  • método de construcción

    1. Método basado en la distancia Unión de vecinos UPGMA (NJ) (cálculo más rápido, resultado más aproximado)
    2. El método de máxima parsimonia máxima parsimonia (MP) (alta o baja, poca gente lo usa)
    3. Método de máxima verosimilitud máxima verosimilitud (ML) (recomendado, la velocidad de cálculo y la precisión son moderadas)
    4. Método de inferencia bayesiana Inferencia bayesiana (resultados más lentos y precisos)
      inserte la descripción de la imagen aquí
  • Software de construcción de árboles actualmente popular :

    software ilustrar DIRECCIÓN
    FELIPE Herramienta de análisis evolutivo gratuita e integrada http://evolution.genetics.washington.edu/phylip.html
    MEGA Herramienta gráfica de análisis evolutivo integrada http://www.megasoftware.net/
    PAUP Software comercial, herramientas integradas de análisis evolutivo. PEAJE http://paup.csit.fsu.edu/
    CINCO La herramienta de creación de árboles ML más rápida http://www.atgc-montpellier.fr/phyml/
    señorbayes Herramientas de construcción de árboles basadas en métodos bayesianos http://mrbayes.csit.fsu.edu/

Método UPGMA basado en la distancia

  • Ejemplo de construcción del método de promedio de grupo no ponderado (UPGMA)
  • Método de grupo de pares no ponderado con media aritmética
  • Vea el video para más detalles : Construcción del árbol filogenético P67
  • El método UPGMA consiste en calcular la distancia entre todas las secuencias y luego construir un árbol filogenético de acuerdo con la distancia .
  • La distancia entre dos secuencias se puede representar por el grado de identidad/similitud obtenido de la alineación por pares , o se puede reemplazar por otros valores simplificados.
  • El número de bases diferentes entre secuencias se utiliza como medida de la distancia genética entre secuencias.
    inserte la descripción de la imagen aquí
  1. registrar la distancia en una tabla;
  2. El AB con la distancia mínima (1) se fusiona y agrega (el punto de bifurcación es d(AB)/2=0,5) como un todo, y se calcula la distancia entre AB y C y D;
    inserte la descripción de la imagen aquí
  3. Encuentre la nueva distancia mínima CD (2) y luego combine y reúna los CD (el punto de bifurcación es d (CD) / 2 = 1)
  4. Considerando CD como un todo, calcule la distancia entre CD y AB (3).
  5. Combine AB y CD en una categoría, y el punto de bifurcación es d(CDAB)/2=1.5.
    inserte la descripción de la imagen aquí
  • La longitud de las ramas de un árbol refleja su distancia de un ancestro común.

  • ¿Qué secuencia se usa para construir árboles? ¿ADN o proteína?
    ◆ Sila identidad entre dos secuencias de ADN es superior al 70% , seleccione la secuencia de ADN .
    ◆ Si la identidad entre dos secuencias de ADN es inferior al 70 % , se pueden utilizar tanto secuencias de ADN como secuencias de proteínas (experiencia:la secuencia de proteínas es mejor)。

3.4 Construcción del árbol NJ por MEGA7

  • MEGA7 : gratuito, fácil de operar (buen efecto automático), generalmente reconocido en la industria (puede usarse para la publicación de artículos) y admite múltiples sistemas operativos.
  • Vea el video para más detalles : MEGA7 construye el árbol NJ P68

Supongo que te gusta

Origin blog.csdn.net/zea408497299/article/details/125176458
Recomendado
Clasificación