Download Interfaz de R a DMU package para el uso de los Modelos Mixtos

Document related concepts
no text concepts found
Transcript
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Interfaz de R a DMU package para el uso de los
Modelos Mixtos aplicado al Modelo (Animal)
Genético Cuantitativo
Mila Sánchez Mayor
Dr. Juan José Arranz Santos1
Dra. Beatriz Gutiérrez Gil1
1 Departamento of Producción Animal
Universidad of León
León, España
[email protected]
23 de Octubre del 2014
ULE
Mila Sánchez Mayor
1/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Contenido
1
2
3
4
5
ULE
Introducción
Introducción
Modelo Mixto General
Formulación del Modelo Mixto General
Estimando los Efectos Fijos y Prediciendo los Efectos Aleatorios
Ecuaciones del Modelo Mixto (MME)
Modelos para la Estimación de los Breeding Values.
Modelos para la Estimación de los Breeding Values
Interfaz de R a DMU package para el uso de los Modelos Mixtos
Software's para la estimación del Modelo Animal Genético Cuantitativo
DMU package
Módulos de DMU
Interfaz de R a DMU
Ejemplos de Animal Breeding
Ejemplos usando Rdmuai
Mila Sánchez Mayor
2/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Introducción
Existen diferentes enfoques estadísticos que permiten la eciente estimación de parámetros genéticos-cuantitativos bajo arbitrarios marcos, incluyendo aquellos involucrados en extensos pedigrís, desigual tamaños de familias, apareamiento selectivo, etc.
Nosotros mostraremos el Modelo Mixto Lineal Generalizado, el cual abarca
la mayoría de los problemas de estimación en diferentes situaciones de
Animal Breeding; usualmente llamado Modelo Animal en el escenario de
Animal Breeding.
Explicaremos el método general BLUP (Best Linear Unbiased Prediction)
para la predicción de los efectos aleatorios, donde esta metodología asume
que las componentes de varianza apropiadas son conocidas. BLUP es ahora
la técnica dominante para la estimación de los Breeding values.
ULE
Mila Sánchez Mayor
3/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Formulación del Modelo Mixto General
Sea el modelo mixto:
y = X β + Zu + e
√
y vector fenotípico con n observaciones.
√
β vector con f efectos jos.
√
u ∼ (0, G ) vector con q efectos aleatorios y Gqxq = Cov (ui , uj ) como la matriz de covarianzas de los
efectos genéticos aleatorios.
e ∼ (0, R) vector con los errores residuales y Rnxn = Cov (ei , ej ) como la matriz de covarianzas de los
errores residuales (generalmente nosotros asumimos que los errores residuales tienen varianza constante y
están incorrelacionados R = σE2 I ).
√
X matriz de incidencia indicando para cada observación los efectos jos por el cual esta es inuenciada.
√
Z matriz de incidencia indicando para cada observación los efectos aleatorios por el cual esta es
inuenciada.
√
∴
implicando y ∼ (X β, V ) = (X β, ZGZ 0 + R)
Podemos observar y , X and Z , pero β , u , R y G son generalmente desconocidos.
∴
Este modelo involucra 2 cuestiones de estimación complementarias:
√
Estimación de los vectores de los efectos jos y aleatorios, β y u .
√
Estimación de las matrices de covarianzas G y R . Donde estas matrices son
generalmente asumidas a ser funciones de algunas componentes de varianzas
desconocidas.
,: Si hay una simple observación por cada individuo, entonces Z = I y la matriz de covarianzas para el vector de
observaciones (y ) es: V = σA2 A + σE2 I
ULE
Mila Sánchez Mayor
4/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Estimando los Efectos Fijos y Prediciendo los Efectos Aleatorios
El objetivo principal del análisis cuantitativo-genético es a menudo solamente estimar
las componentes de varianza, pero también hay numerosas situaciones en las que las
inferencias acerca de efectos jos y/o efectos aleatorios son la motivación central.
Inferencia sobre los efectos jos son conocidos como estimaciones y las que se reeren
a efectos aleatorios se conoce como predicciones.
Hay muchos tipos de procedimientos para obtener estos estimadores y predictores, pero
los procedimientos más utilizados son BLUE (mejor estimador lineal insesgado) y BLUP
(mejor predictor lineal insesgado).
Describiendo los términos de cada expresión:
√
mejor: en el sentido que ellos minimizan la varianza muestral.
lineal: porque ellos son funciones lineales de los fenotipos observados y .
√
insesgados: E [BLUE (β)] = β and E [BLUP(u)] = u
√
β̂ = (X 0 V −1 X )−1 X 0 V −1 y
ULE
and û = GZ 0 V −1 (y − X β̂)
Mila Sánchez Mayor
5/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Problemas con estos estimadores y predictores. Solución
Nótece que las soluciones de las previas ecuaciones, requieren la inversa de la matriz de covarianzas V , pero cuando y contiene muchos
miles de observaciones, este cálculo se puede dicultar.
Henderson fue un estadístico americano y pionero en
animal breeding. Él ofreció un método más compacto
para conjuntamente obtener β̂ y û en la forma de estas
Ecuaciones del Modelo Mixto (MME).
X 0 R −1 X
Z 0 R −1 X
X 0 R −1 Z
+ G −1
Z 0 R −1 Z
β̂
û
=
X 0 R −1 y
Z 0 R −1 y
Importancia del BLUP: es primariamente usado para la identicación de
individuos con máximos méritos genéticos en programas de selección y
para monitorar la respuesta de selección actual. En general, BLUP se ha
convertido en el método de elección para la estimación de los valores
genéticos de los individuos a partir largos y complejos pedigrís.
Note: Para que BLUP sea el mejor estimador insesgado, las varianzas
genéticas apropiados deben ser conocidos sin error.
ULE
Mila Sánchez Mayor
6/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Introducción a los Modelos para la Estimación de los Breeding Values
Hay numerosas maneras de formular el Modelo Mixto General para
aplicar el análisis BLUP.
Tres variantes especícas del modelo proporcionan la base para la
mayoría de los métodos de estimación de los breeding values:
√
Modelo Animal: estima los breeding values de cada individuo medido.
Modelo Gamético: Estima los breeding values de los individuos medidos en términos de contribuciones de los padres, es decir, este modelo se utiliza a menudo
cuando los valores genéticos de los padres son más preocupantes que los valores
de sus descendencias.
√
Modelo Animal Reducido: Combina aspectos de ambos modelos, Animal y Gamético en aplicaciones especícas en el cual los breeding values de los padres son
los únicos de interés. El pedigrí contiene sólo los padres y sus hijos, ignorando las
terceras generaciones y más allá.
√
ULE
Mila Sánchez Mayor
7/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Software's para la estimación del Modelo Animal Genético Cuantitativo
Existen diferentes programas que pueden ajustar el Modelo Animal
de alguna manera, como son:
√
√
√
√
√
√
√
√
ASReml
BGF90
DFREML
DMU
MATVEC
PEST/VCE
WOMBAT
entre otros...
En nuestro centro utilizamos una interfaz de R para DMU con el
propósito de facilitar la especicación del Modelo y los datos.
ULE
Mila Sánchez Mayor
8/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
DMU package
El programa DMU fue desarrollado en el centro de Genómica y Genética Cuantitativa, del Departamento de Genética y Biología Molecular en la Universidad de Aarhus, Dinamarca. Dicho software fue
publicado en el World Congress on Genetics Applied to Livestock
Production 2006.
DMU incluye diferentes módulos:
√
DMU1
DMU4
√
DMU5
√
DMUAI
√
entre otros...
√
ULE
Mila Sánchez Mayor
9/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Módulos de DMU
DMU1 : El análisis en DMU siempre comienza ejecutando el módulo de
inicialización de DMU1 seguido por uno de los otros módulos en el paquete.
Las tareas principales aquí son: leer el modelo y la descripción de los datos;
chequear el modelo y los datos; escribir una recodicación de los datos y
la información del modelo para el uso de los módulos siguientes.
DMU4 : Este módulo puede ser usado para predecir futuras respuestas de
efectos aleatorios, ejemplos, los breeding values; y para estimar los efectos
jos tanto simples como múltiples a través de las ecuaciones del modelo
mixto. DMU4 puede manejar el mismo tipo de modelos como DMUAI.
DMU5 : Este puede ser utilizado para resolver múltiples características de
las ecuaciones del modelo mixto basado en la iteración de datos.
ULE
Mila Sánchez Mayor
10/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Módulos de DMU
DMUAI : Este módulo utiliza el método de estimación REML para la estimación de
las componentes de (co)varianzas usando los algoritmos de Average Information (AI) o
Expectation Maximization (EM).
DMUAI puede manejar modelos de regresión aleatorios, modelos con efectos maternos
y los modelos con efectos de dominancia. También se puede utilizar para el análisis de
QTL multivariante.
La componente de varianza para cada QTL es estimable basada en las matrices de las
IBD (Idénticos por Descendencias) facilitada por el usuario. Es posible ajustar diferentes
tipos de modelos de IBD (gaméticos, genotípicos y cluster), métodos IBD (Linkage,
Linkage Desequilibrium y combinados Linkage y Linkage Desequilibrium) y modelos
genéticos (pleiotropic, close linkage, epistatic).
Los efectos aleatorios con una estructura de correlación especíca puede ser manejado a
través de una matriz de correlación inversa suministrado por el usuario. Estos se pueden
utilizar para la predicción genómica basado en la matriz de relación genómica.
ULE
Mila Sánchez Mayor
11/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Interfaz de R a DMU
DMU está escrito en Fortran 90/95 y se ha desarrollado bajo Linux en estaciones de
trabajo basadas en 32 y 64 bits. Ha sido adaptada a una variedad de sistemas UNIX y
Windows (32 y 64 bits).
Interfaz R:
Una interfaz de R para DMU fue desarrollada con el propósito de facilitar la
especicación de los modelos y los datos. Usando la interface, el modelo se especica a
través de una fórmula del lenguaje de R, DMU se ejecuta y los resultados se devuelven
a R.
Funciones para resumir los resultados y extraer varias componentes del análisis son también proporcionados. De esta manera la interfaz de R para DMU hace posible combinar
la potencia de cálculo de DMU con las diversas herramientas disponibles y exibles
dentro de R.
A modo de ejemplo, los scripts de secuencias de comandos de R hace que sea fácil usar
DMU para ajustar modelos mixtos dentro de un bucle (por ejemplo para detectar QTL)
y las facilidades grácas de R hace que sea fácil de visualizar los resultados.
ULE
Mila Sánchez Mayor
12/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Describiendo la función DMUAI
Description:
The function uses the model formula language in R to describe the model and
from this generates the les needed to do an analysis using dmuai. Afterwards
dmuai is executed and results are returned to R.
Usage:
Rdmuai(formula,
data, corlist = NULL, NOCOV = NULL, VARREST = NULL,
family = NULL, rescale = !is.null(start), control = list(), start = NULL, weights,
oset, data.le = "data.txt", dir.le = "test.DIR", generate.data.le=TRUE,
execute=TRUE)
execute.dmuai(object)
read.dmuai(object)
check.dmuai(object)
summary.dmuai(object)
convergence.dmuai(object)
coef.dmuai(object)
ULE
Mila Sánchez Mayor
13/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Ejemplos usando Rdmuai
library(Rdmu)
setwd("...")
Pedigree
]]] Read pedigree le. Get the external pedigree le
]]]]]]]]]
ped.obj <- PED(anim.ID,le="pedigree.txt")
]]]]]]]]]
Run the null model
MM0 <- Rdmuai(Tvalue ∼ (1|anim.ID), corlist=list(ped.obj), control=list(SOL=TRUE),
execute=TRUE, data=myphe) ]]] Simple case.
Run the mixed model for one SNP. Slightly more complicated by including a
xed factor
]]]]]]]]]
MM1 <- Rdmuai(Tvalue ∼ mySNP + (1|anim.ID), corlist=list(ped.obj), control=list(SOL=TRUE),
execute=TRUE, data=myphe)
ULE
Mila Sánchez Mayor
14/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Ejemplos usando Rdmuai
Fuction PED:
Creates a pedigree le with four columns 'id', 'sire', 'dam'/'maternal grandsire' and a
'sort' variable. The pedigree le is used by dmuai to construct a correlation matrix for
the random eect. In most cases is that the random eect have correlated levels due to
shared ancestors given in the pedigree structure.
If considering more than one correlated additive eect (for example direct and maternal
eect) then the variables should be seperated by 0 +0 .
Fuction COR:
Describes the correlation of the levels of given random factor(s). However, 'COR' has
later shown to also been useful in genomic prediction, where the matrix is an extended
genomic relationship matrix.
ULE
Mila Sánchez Mayor
15/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
Ejemplos usando Rdmuai
Caso Multivariado:
La manera de especicar los modelos multivariados son como un vector de fórmulas o
usando una matrix de respuesta.
MM2 <- Rdmuai(c(Tvalue1 ∼ mySNP + (1|anim.ID), Tvalue2 ∼ mySNP + (1|anim.ID)),
data=myphe)
MM3
ULE
<- Rdmuai(cbind(Tvalue1, Tvalue2) ∼ mySNP + (1|anim.ID)), data=myphe)
Mila Sánchez Mayor
16/17
Introducción Modelo Mixto General Modelos para la Estimación de los Breeding Values. Interfaz de R
GRACIAS
GRACIAS
ULE
Mila Sánchez Mayor
17/17