macierz krowa

Transkrypt

macierz krowa
METODY HODOWLANE
METODY HODOWLANE - zagadnienia
1. Matematyczne podstawy metod hodowlanych
2. Wartość cechy ilościowej i definicje parametrów genetycznych
3. Metody szacowania parametrów genetycznych
4. Wartość hodowlana cechy ilościowej (ocena wartości hodowlanej na
podstawie różnych źródeł informacji, porównanie ich dokładności)
5. Indeks selekcyjny (łączenie źródeł informacji o wartości hodowlanej)
6. Eliminacja wpływów środowiska w ocenie wartości hodowlanej (metody
równoczesnego porównania, metoda BLUP)
BLUP
7. Selekcja i postęp hodowlany
Eliminacja wpływów środowiska w ocenie wartości hodowlanej
Ocena buhaja na podstawie wydajności córek z różnych stad
Model:
Ocena:
yijk    hi  s j  eijk
W każdym modelu  jest zawsze
efektem stałym, e – zawsze
Gˆ  bY  P
b
efektem losowym. Pozostałe (h, s)
możemy uznać za stałe lub
losowe; mówimy wtedy o całym
modelu, że jest stały lub losowy.
efekt stały – jaki jest wpływ konkretnych stad
efekt losowy – jaki jest ogólnie wpływ ojcowski
a
2n
na
4  h2
h2
EFEKTY MODELU
Przykład: jak zrobić drinki z kroplą tabasco?
Sposób 1: Rozlewamy
butelkę 0,5l do 5 szklanek i
do każdej dodajemy 1 kroplę
tabasco
Sposób 2: Do butelki 0,5l
wpuszczamy 5 kropli tabasco,
mieszamy i rozlewamy do 5
szklanek.
Jaki jest „efekt” tabasco
w naszych drinkach?
STAŁY
LOSOWY
MODEL MIESZANY W OCENIE WARTOśCI HODOWLANEJ
W modelach związanych z oceną wartości hodowlanej, np.:
yijk    hi  s j  eijk
efekty stad czy
grup w modelu
to efekty stałe
Jest to tzw. model mieszany
oceniane wartości
hodowlane to
efekty losowe
Skutek wieloletniego stosowania metod CC
Trafny
wybór na
ojców
Dokładna
ocena
buhajów
Potomstwo
lepsze
genetycznie
Populacja dzieli się na stada
yijk    hi  s j  eijk
Z roku na na rok
rośnie średnia
wartość hodowlana
populacji – pojawia
się trend genetyczny
Trzeba dopasować
model
Populacja dzieli się na stada i
istnieje trend genetyczny
yijkl    hi  a j  s jk  eijkl
aj – efekt roku urodzenia buhaja
Dodatkowy efekt genetyczny w modelu
W modelu
yijkl    hi  a j  s jk  eijkl
efekt aj oznacza średnią wartość hodowlaną buhajów
urodzonych w roku j.
Jest to dodatkowy (oprócz efektu sjk) efekt genetyczny w
modelu.
Rozwiązanie problemu dodatkowych efektów genetycznych w
modelu umożliwia
METODA BLUP
METODA BLUP
Nazwa BLUP – skrót od Best Linear Unbiased Prediction, po
polsku: najlepsza liniowa nieobciążona predykcja, dająca:
najlepszy (o
minimalnym
błędzie
standardowym)
przy
założeniu
liniowej
zależności
nieobciążony
(o wartości
oczekiwanej
równej jego
prawdziwej
wartości w
populacji)
predyktor
efektu
losowego
modelu (ocenę
wartości
hodowlanej)
Predykcja – przewidywanie wartości zmiennej losowej na podstawie
wartości przyjmowanych przez inne zmienne.
Szacowanie efektów losowych modelu to
predykcja, w jej wyniku otrzymujemy
predyktory; analogicznie: szacowanie
efektów stałych to estymacja; otrzymujemy
estymatory.
METODA BLUP
Metoda BLUP:
 opracowana w roku 1949 (C.R.Henderson)
 wprowadzona do szerokiej praktyki od lat
80-tych XXw
 od strony technicznej – oparta na
rachunku macierzowym
 umożliwia jednoczesną ocenę dużych
grup zwierząt
 dopuszcza i wykorzystuje zależności
efektów modelu mieszanego
Wymaga
MOCY
oblicze
niowej
MODELE MIESZANE W METODZIE BLUP
 Model ojcowski (Sire Model, SM)
yijk    hi  s j  eijk
yijkl    hi  a j  s jk  eijkl
 Model osobniczy (Animal Model, AM)
yij    hi  g j  eij
(zapis uproszczony)
gdzie gj – efekt genetyczny ocenianego osobnika
yij – jego wydajność (obserwacja),
eij – efekt specyficzny dla tej obserwacji,hi – efekt stada.
Są to modele mieszane: przyjmuje się, że hi i aj są efektami stałymi,
natomiast sj, sjk, gj – efektami losowymi.
Metoda BLUP nie wymaga się założeń o niezależności efektów. Zależności
wynikające np. ze spokrewnienia umożliwiają wykorzystanie dodatkowych
źródeł informacji.
METODA BLUP
Metoda BLUP
oparta na
rachunku
macierzowym
wykorzystuje
zależności
efektów, np.
spokrewnienie
W obliczeniach wykorzystuje się
MACIERZ SPOKREWNIEŃ
METODA BLUP – MACIERZ SPOKREWNIEŃ
Nr Nr
os oj
ob ca
ni
ka
Przykład macierzy spokrewnień
Nr
m
at
ki
rodzice 
2
1
3
1,2
4
3,4
5
1,4
6
5,6
7
3
1
-
Nr i
j
1
1
1
0
0,5
0,5
0,5
0,75
0,625
4
1
2
2
0
1
0
0,5
0,25
0,25
0,25
5
3
4
6
1
4
3
0,5
0
1
0,25
0,625
0,375
0,5
7
5
6
4
0,5
0,5
0,25
1
0,625
0,75
0,6875
5
0,5
0,25
0,625
0,625
1,125
0,5625
0,84375
6
0,75
0,25
0,375
0,75
0,5625
1,25
0,90625
7
0,625
0,25
0,5
0,6875
0,84375 0,90625 1,28125
METODA BLUP – MACIERZ SPOKREWNIEŃ
Macierz spokrewnień A:
 macierz symetryczna
 jej elementy aij to współczynniki pokrewieństwa
 jej elementy diagonalne ajj są równe 1 + wsp. inbredu
 jeśli rodzice osobnika j nie są spokrewnieni to ajj = 1
Przykłady prostych macierzy spokrewnień dla trzech osobników:
 1 0,5 0,5
A1  0,5 1 0,5
0,5 0,5 1 
0,25 0,25
 1
A 2  0,25
1
0,25
0,25 0,25
1 
A1 – pełne rodzeństwo
A2 – półrodzeństwo
1 0 0
A 3  0 1 0  I
0 0 1
Te macierze tak wyglądają
jeśli rodzice nie uczestniczą
w ocenie!
A3 – zwierzęta niespokrewnione (macierz identyczności)
METODA BLUP – MACIERZ SPOKREWNIEŃ
Elementy macierzy spokrewnień to współczynniki pokrewieństwa
aij 
Współczynnik pokrewieństwa z definicji:
a przy założeniu
 g2   g2   g2
i
j
aij 
cov( g i g j )
 gi  g j
cov( g i g j )
 g2
Zatem: elementy macierzy spokrewnień to ilorazy kowariancji i
wariancji genetycznych, np.

 1

 cov g12
A
2
 g
 cov g13

2

g

cov g 21
 g2
1
cov g 23
 g2
cov g 31 

 g2 
cov g 32 

 g2 

1 

METODA BLUP – MACIERZ KOWARIANCJI
Jeśli pomnożymy macierz spokrewnień przez wariancję genetyczną
otrzymamy macierz kowariancji ocenianych wartości hodowlanych G

 1

 cov g12
2
A  g  
2

 g
 cov g13

2

g

cov g 21
 g2
1
cov g 23
 g2
cov g 31 

 g2 
  g2
cov g 32  2 
   g  cov g12
 g2 
cov g13


1 

G  A   g2
Przy braku spokrewnień
G  I   g2
cov g 21
 g2
cov g 23
cov g 31 

cov g 32   G
 g2 
MODELE MIESZANE W METODZIE BLUP
 Model ojcowski
yijk    hi  s j  eijk
yijkl    hi  a j  s jk  eijkl
 Model osobniczy
yij    hi  g j  eij
Ogólna postać modelu mieszanego
yijk    ai  g j  eijk
gdzie a – efekty stałe (stada, grupy itp.), g – efekty losowe (genetyczne)
METODA BLUP
Weźmy podstawowy model ojcowski
yijk    hi  s j  eijk
Taki model to ogólny zapis układu wielu równań. Jeśli mamy np.
wydajności pięciu krów z dwóch stad, które są córkami trzech
buhajów, to ten układ wygląda tak:
y111    h1  s1  e111
y121    h1  s2  e121
y131    h1  s3  e131
y211    h2  s1  e211
y231    h2  s3  e231
METODA BLUP
Równania…
można przedstawić tak…
y111    h1  s1  e111
y121    h1  s2  e121
y131    h1  s3  e131
y211    h2  s1  e211
y231    h2  s3  e231
y111  1  1h1  1s1  e111
y121  1  1h1  1s2  e121
=
y131  1  1h1  1s3  e131
y211  1  1h2  1s1  e211
y231  1  1h2  1s3  e231
METODA BLUP
y111    h1  s1  e111
y121    h1  s2  e121
y131    h1  s3  e131
y211    h2  s1  e211
y231    h2  s3  e231
=
y111  1  1h1  1s1  e111
y121  1  1h1  1s2  e121
y131  1  1h1  1s3  e131
y211  1  1h2  1s1  e211
y231  1  1h2  1s3  e231
a jeśli w każdym równaniu uwzględnimy wszystkie informacje o tej
stawce zwierząt, przedstawiamy je tak:
y111  1  1h1  0h2  1s1  0s2  0s3  e111
y121  1  1h1  0h2  0s1  1s2  0s3  e121
=
y131  1  1h1  0h2  0s1  0s2  1s3  e131
y211  1  0h1  1h2  1s1  0s2  0s3  e211
y231  1  0h1  1h2  0s1  0s2  1s3  e231
=
METODA BLUP
Zapis klasyczny układu równań
y1  1  1h1  0h2  1s1  0 s2  0 s3  e1
y2  1  1h1  0h2  0 s1  1s2  0 s3  e2
y3  1  1h1  0h2  0 s1  0 s2  1s3  e3
y4  1  0h1  1h2  1s1  0 s2  0 s3  e4
y5  1  0h1  1h2  0 s1  0 s2  1s3  e5
Zapis macierzowy układu równań
 y1  1
 y  1
 2 
 y3   1
 y  1
 4 
 y5  1
1 0
1
1 0    0
1 0  h1   0


0 1 h2  1
0
0 1
0 0
 e1 
1 0  s1  e2 
0 1  s2   e3 
 

0 0  s3  e4 
e5 
0 1
METODA BLUP
Zapis macierzowy układu równań
 y1  1
 y  1
 2 
 y3   1
 y  1
 4 
 y5  1
1 0
1
1 0    0
1 0  h1   0


0 1 h2  1
0
0 1
wektor
obserwacji
wektor
efektów
stałych
macierz
wystąpień
efektów
stałych
0 0
 e1 
1 0  s1  e2 
0 1  s2   e3 
 

0 0  s3  e4 
e5 
0 1
wektor
efektów
losowych
macierz
wystąpień
efektów
losowych
wektor
efektów
specyficznych
METODA BLUP
Zapis macierzowy układu równań
 y1  1
 y  1
 2 
 y3   1
 y  1
 4 
 y5  1
y
wektor
obserwacji
1 0
1
1 0    0
1 0  h1   0


0 1 h2  1
0
0 1
X
macierz
wystąpień
efektów
stałych
a
wektor
efektów
stałych
0 0
 e1 
1 0  s1  e2 
0 1  s2   e3 
 

0 0  s3  e4 
e5 
0 1
Z
macierz
wystąpień
efektów
losowych
g
wektor
efektów
losowych
e
wektor
efektów
specyficznych
METODA BLUP
Zapis macierzowy układu równań
 y1  1
 y  1
 2 
 y3   1
 y  1
 4 
 y5  1
y
=
1 0
1
1 0    0
1 0  h1   0


0 1 h2  1
0
0 1
X
a
+
0 0
 e1 
1 0  s1  e2 
0 1  s2   e3 
 

0 0  s3  e4 
e5 
0 1
Z
y = Xa + Zg + e
g
+
e
MODELE MIESZANE W METODZIE BLUP
Ogólna postać modelu mieszanego
zapis klasyczny
zapis macierzowy
yijk    ai  g j  eijk
y = Xa + Zg + e
gdzie a – efekty stałe (stada, grupy, roku itp.), g – efekty losowe (genetyczne;
oceniane wartości hodowlane), X, Z – macierze wystąpień.
Co z wektorem e?
Zakłada sie, że efekty e mają rozkład
normalny o tej samej wariancji i są
parami nieskorelowane. Do obliczeń
bierze się tylko  2
e
METODA BLUP
Model:
y = Xa + Zg + e
Założenie: efekty e mają rozkład normalny o wariancji
 e2
i są parami nieskorelowane.
Rozwiązanie: estymatory efektów a oraz predyktory wartości
hodowlanych g uzyskuje się w wyniku rozwiązania
następującego układu równań modelu mieszanego, Mixed
Model Eguations, MME):
X' Z
 X' X
 aˆ   X' y 
 Z' X Z' Z  σ 2G 1  gˆ   Z' y 
e


  
gdzie macierz G to macierz kowariancji dla elementów wektora g.
MACIERZ KOWARIANCJI
Przypomnijmy sobie:

 1

 cov g12
A   g2  
2

g

 cov g13

2

 g
cov g 21
 g2
1
cov g 23
 g2
cov g 31 

 g2 
  g2
cov g 32  2 
   g  cov g12
2
g 
cov g13


1 

G  A   g2
Przy braku spokrewnień
G  I   g2
cov g 21
 g2
cov g 23
cov g 31 

cov g 32   G
 g2 
METODA BLUP
Układ równań ogólnie
X' Z
 X' X
 aˆ   X' y 
 Z' X Z' Z  σ 2G 1  gˆ   Z' y 
e


  
Jeśli oceniane zwierzęta są niespokrewnione:
G  I   g2 , wtedy G 1  I
1
σ g2
X' Z  ˆ
 X' X
X'
y
2 a 



σe 




Z'
X
Z'
Z

I

ˆ
2  g
Z'
y
 

σ
g


METODA BLUP
Układ równań ogólnie
X' Z
 X' X
 aˆ   X' y 
 Z' X Z' Z  σ 2G 1  gˆ   Z' y 
e


  
Jeśli oceniane zwierzęta są spokrewnione:
G  A   g2 , wtedy G 1  A 1
1
σ g2
X' Z
 X' X
 aˆ
2  
 X' y 


σ
_1 e




Z'
X
Z'
Z

A

ˆ
2  g
Z'
y
 

σ
g


METODA BLUP
Zwierzęta są spokrewnione:
Zwierzęta nie są spokrewnione:
X' Z
 X' X
 ˆ
2 a
  X' y 

1 σ e 




Z'
X
Z'
Z

A

ˆ
2  g
Z'
y

σg   

Wyrażenie
 e2
 g2
X' Z  ˆ
 X' X

σ e2  a    X' y 
 Z' X Z' Z  I σ 2  gˆ  Z' y 
g 

oznaczamy jako k.
Oceny BLUP oparte na modelu osobniczym:
Oceny BLUP oparte na modelu ojcowskim:
k 
k
1 h2
h2
4  h2
h2
Skąd my to znamy?
METODA BLUP
Układ równań MME ogólnie
X' Z
 X' X
 aˆ   X' y 
 Z' X Z' Z  σ 2G 1  gˆ   Z' y 
e


  
L
b
L•b=r
r
A jak rozwiązać taki układ
równań???
No, jeśli L • b = r to b = L-1 • r
1
X' Z
 X' X
  X' y  aˆ 
 Z' X Z' Z  σ 2G 1  Z' y   gˆ 
e
  

 
b = L-1 • r
METODA BLUP
Układ równań
Rozwiązanie
1
X' Z
 X' X
 aˆ   X' y 
 Z' X Z' Z  σ 2G 1  gˆ   Z' y 
e


  
X' Z
 X' X
  X' y  aˆ 
 Z' X Z' Z  σ 2G 1  Z' y   gˆ 
e
  

 
L•b=r
b = L-1 • r
Tak po prostu?!
Niestety, uzyskanie odwrotności macierzy
L to sporo pracy; nie dość, że bywa wielka,
to jest w dodatku osobliwa… Chętnie to
wyjaśnię…
Spadaj! Sam jesteś osobliwy!!!
PODSUMOWANIE
METODA BLUP
 oparta jest na rachunku macierzowym
 wymaga dużej mocy obliczeniowej (ocena wielu zwierzat
naraz, odwracanie dużych macierzy)
 pozwala na dobre dopasowanie modelu: można
uzwględnić wiele efektów, w tym dodatkowe efekty
genetyczne
 umożliwia jednoczesną ocenę efektów stałych i losowych,
przez co są one na siebie nawzajem „poprawione”
 dopuszcza i wykorzystuje zależności efektów; poprzez
włączenie do obliczeń macierzy kowariancji genetycznych
wykorzystuje dodatkowe źródła informacji
 daje oceny o wysokiej dokładności