„Badania kryminalistyczne z wykorzystaniem dziesięciu

Transkrypt

„Badania kryminalistyczne z wykorzystaniem dziesięciu
Skrót sprawozdania z pracy badawczo-rozwojowej wykonanej w Wydziale Biologii
Centralnego laboratorium Kryminalistycznego Komendy Głównej Policji w Warszawie,
w ramach projektu celowego KBN „Locus”, pod kierunkiem prof. dr. hab. Andrzeja
Płucienniczaka1, na temat:
„Badania kryminalistyczne z wykorzystaniem dziesięciu niekodujących
układów STR, obejmujących reprezentatywną część populacji polskiej.
Stworzenie możliwości identyfikacji genetycznej sprawców przestępstw.”
Warszawa 2002 r.
1
Instytut Biotechnologii i Antybiotyków w Warszawie, Warszawa, ul. Starościńska 5.
BADANIA POPULACYJNE
Kryminalistyczna
analiza
DNA
jest
analizą
porównawczą.
W
przypadku
porównywania śladu biologicznego z materiałem porównawczym, tj. pobranym od konkretnej
osoby, brak zgodności profili DNA w którymkolwiek z badanych loci wyklucza pochodzenie
DNA wyizolowanego ze śladu od tej osoby. W przypadku zgodności profili DNA w każdym
z badanych loci, ekspert musi ocenić, jakie jest prawdopodobieństwo wystąpienia zaistniałej
zgodności
w
określonej
populacji
ludzkiej.
Przedstawiana
w
opiniach
wartość
prawdopodobieństwa poddawana jest ocenie sądu i stanowi o sile zebranego w sprawie
materiału dowodowego. Wartość ta jest zależna od liczby zdefiniowanych loci i częstości
występowania w danej populacji oznaczonych alleli. W standardowych wyliczeniach
statystycznych wykorzystuje się dane populacyjne, opracowane dla poszczególnych grup
rasowych lub etnicznych danego kraju, którego sprawa karna dotyczy.
Celem pracy było zbadanie i ustalenie częstości alleli dziesięciu loci STR (SGM plus)
w populacji polskiej oraz wykazanie, że dane te, wyliczone na podstawie przebadanej próby
populacyjnej, mogą stanowić bazę służącą do statystycznej oceny profili DNA osób
identyfikowanych w sprawach karnych.
Pobieranie materiału
Materiał do badań populacyjnych stanowiły komórki nabłonkowe jamy ustnej,
pobrane sterylnymi wymazówkami (HAGMED- Zakład Tworzyw Sztucznych i Wyrobów
dla Medycyny w Rawie Mazowieckiej), od dobrowolnych dawców.
W celu uzyskania próby reprezentatywnej dla polskiej populacji, uwzględniając
homogenność rasową populacji polskiej, kompletowanie wymazów odbywało się według
wstępnie określonych założeń, a mianowicie:
•
z wyłączeniem osób blisko spokrewnionych i osób o innej niż rasa biała kaukaska
przynależności rasowej,
•
z uwzględnieniem całego obszaru Polski, przyjmując miejsce urodzenia za kryterium
przynależności terytorialnej.
Przygotowanie próbek do badań
Zebrane do badań wymazy grupowano w partie po 30 sztuk. Każdy z wymazów
dzielono na dwie części, z których jedną przeznaczano do badań populacyjnych a drugą do
ewentualnego powtórzenia.
Izolowanie DNA
Przeznaczone do badań populacyjnych wymazy poddawano ekstrakcji DNA metodą
absorpcji-elucji, przy użyciu gotowego zestawu QIAamp DNA Mini Kit firmy QIAGEN
(nr katalogowy 51306), według protokołu podanego przez producenta zestawu.
Ekstrakcję przeprowadzano w partiach, po 30 próbek w każdej. Dla sprawdzenia
prawidłowości procesu ekstrakcji, do każdej partii dołączano dwie próby kontrolne- kontrolę
dodatnią, którą stanowił wymaz o znanym profilu DNA, pochodzący od personelu
laboratoryjnego i kontrolę negatywną jako kontrolę sterylności procesu.
Amplifikacja DNA
Proces amplifikacji, czyli powielania fragmentów DNA wykonywano metodą
multipleksowej reakcji PCR, przy użyciu gotowego zestawu odczynników- AmpFlSTR SGM
Plus firmy Applied Biosystems (nr katalogowy 4307133). Reakcję przeprowadzano
w partiach, po 30 próbek w każdej, w aparatach GeneAmp PCR System 9700 tej samej firmy,
zaprogramowanych zgodnie z zaleceniami producenta (PE Biosystems, 1999). Dla
sprawdzenia prawidłowości procesu PCR, do każdej partii próbek, oprócz dwóch
2
ekstrakcyjnych prób kontrolnych, dołączano dwie kontrole PCR- kontrolę dodatnią o znanym
profilu DNA, pochodzącą z zestawu AmpFlSTR SGM Plus i kontrolę negatywną jako
kontrolę sterylności procesu.
W celu bardziej ekonomicznego wykorzystania odczynników wchodzących w skład
zestawu SGM Plus, dziesięć początkowych partii próbek amplifikowano w dwóch wersjach
objętościowych. W pierwszej wersji reakcję PCR przygotowywano ściśle według procedury
podanej przez producenta zestawu (PE Biosystems, 1999), tj. w zalecanej przez producenta
objętości reakcyjnej wynoszącej 50 µl i przy zachowaniu określonych w procedurze proporcji
poszczególnych składników reakcji. W drugiej wersji, utrzymując proporcje składników,
zredukowano objętość reakcyjną do 25 µl. Po przeprowadzeniu dalszych etapów badawczych
powyższego eksperymentu i stwierdzeniu pełnej powtarzalności wyników, kolejne partie
próbek amplifikowano w zmodyfikowanej objętości reakcyjnej, tj. wynoszącej 25 µl.
Elektroforeza
Powielone
metodą
PCR
fragmenty
DNA
rozdzielano
elektroforetycznie
w denaturujących, 5% żelach poliakryloamidowych, w aparatach ABI Prism 377 firmy
Applied Biosystems. Żele sporządzano z gotowych zestawów odczynników- Long Ranger
Singel Packs firmy BMA (nr katalogowy 50691), zgodnie z procedurą dołączoną do zestawu.
Próbki do elektroforezy przygotowywano poprzez zmieszanie produktów PCR w stosunku
1:1 z roztworem formamidu zawierającym standard wielkości- GS 500 Rox Size Standard
firmy Applied Biosystems (nr katalogowy 401734), a następnie denaturowano w 95oC przez
2 minuty, w aparacie GeneAmp PCR System 9700 firmy Applied Biosystems. Elektroforezę
prowadzono na 36 ścieżkach żelu (30 ścieżek zajmowały próbki badane, 4 – próby kontrolne,
2 – drabiny alleli, pochodzące z zestawu SGM Plus), w środowisku buforowym 1xTBE
(89 mM Tris, 89 mM H3BO3, 2 mM EDTA) przez 2,5 godziny, zachowując wskazane przez
producenta parametry prądowe i temperaturowe (PE Biosystems, 1999). Do sterowania
procesem elektroforezy i zbierania danych użyto oprogramowania ABI Prism 377 Collection.
Analiza danych
Analizę danych zebranych w trakcie elektroforez wykonywano przy użyciu programu
komputerowego Genescan 3.1.2. Analiza obejmowała:
•
ocenę prawidłowości przebiegu elektroforezy,
•
przygotowanie obrazu elektroforetycznego do pobierania danych,
3
•
pobieranie danych z poszczególnych ścieżek żelu i zebranie ich w zbiorach próbek,
•
definiowanie standardu,
•
zainstalowanie
matrycy
matematycznej
korygującej
występowanie
artefaktów
wynikających z wzajemnego przenikania barw światła emitowanego przez barwniki
fluorescencyjne, użyte do wyznakowania standardu, próbek i drabin,
•
wprowadzenie określonych proceduralnie parametrów analizy, w tym progowych
wartości detekcji pików (75 rfu dla pików próbek, 50 rfu dla standardu i drabin, rfu –
relative fluorescence unit),
•
komputerową analizę danych - program automatycznie obliczał i zapisywał czas
zarejestowania fragmentów DNA, ich wielkość wyrażoną w ilości par zasad, wysokość
i pole pików oraz numer skanu rejestrującego dany fragment. Dane te były przedstawiane
w postaci graficznej i tabelarycznej.
•
sprawdzanie wyników przez operatora.
Podstawą do zakwalifikowania próbek do następnego etapu analizy wyników była
poprawność drabin alleli, prób kontrolnych i standardu wielkości.
Definiowanie alleli i ocena profili SGM plus
Zarejestrowane przez program Genescan allele dziesięciu loci STR i locus
Amelogeniny definiowano zgodnie z obowiązującą nomenklaturą, przy użyciu programu
Genotyper 2.5 i matrycowego pliku AmpFlSTR SGM Plus (PE Biosystems, 1999),
zawierającego gotowe zbiory poleceń (makra).
Wygenerowane graficznie wyniki poddawane były szczegółowej weryfikacji przez
operatora. W pierwszej kolejności sprawdzane były oznaczenia pików standardu, a następnie
oznaczenia pików w ścieżkach drabin alleli i w ścieżkach próbek kontrolnych.
Po zatwierdzeniu poprawności tych oznaczeń, analizowano i weryfikowano oznaczenia
dla pozostałych ścieżek elektroforetycznych, zawierających profile DNA badanych próbek.
Warunkiem zatwierdzenia i wprowadzenia do populacyjnej bazy danych profilu DNA danej
próbki było uzyskanie profilu pełnego, tj. we wszystkich loci SGM Plus oraz stwierdzenie
poprawności oznaczenia alleli w każdym z tych locus. Próbki, dla których profilu pełnego nie
uzyskano z powodu zbyt małej ilości DNA, lub profil otrzymano, ale stwierdzono,
że wymaga on potwierdzenia, kierowano do przeprowadzenia ponownego procesu
badawczego.
4
W przebadanej próbie populacyjnej, zdecydowaną większość stanowiły próbki DNA
o allelach typowych, tzn. mających odpowiedniki w drabinie alleli SGM Plus. Stwierdzono
także allele nie występujące w drabinie alleli, ale odnotowane już wcześniej, w populacji
białej kaukaskiej. Były to allele:
•
w locus D3S1358: 11 (PE Biosystems. 1999, Turowska B. 1999, Czarny J. 2002),
20 (Pawłowski R. 2000, Czarny J. 2002),
•
w locus D19S433: 12.1 (Binda S. 2000), 18 (Pepiński W. 2001, Czarny J. 2002), 18.2 (PE
Biosystems. 1999, Foreman L. 2001, Steinlechner M. 2001, Czarny J. 2002),
19.2 (Foreman L. 2001),
•
w locus D18S51: 17.2 (Gill P., 1996),
•
w locus TH01: 8.3 (Evett I.W. 1997, Steinlechner M. 2001),
•
w locus FGA: 16 (Pawłowski R., 2000) oraz allele zaliczane do częściej obserwowanych
wariantów: 20.2, 21.2, 22.2, 23.2, 24.2, 25.2.
Zaobserwowano ponadto allele, których nie odnaleziono jako występujących, w dostępnych
danych źródłowych. Należą do nich allele:
•
w locus D3S1358: 21,
•
w locus D16S539: 7,
•
w locus D19S433: 11.1, 11.2.
Niektóre wymienione allele nie zostały zdefiniowane automatycznie przez program.
Były to allele znajdujące się poza obszarem odczytu dla danego locus, takie jak allel 21 locus
D3S1358 i allel 19.2 locus D19S433 oraz allele występujące w obszarze odczytu locus,
będące wariantami zawierającymi niepełne powtórzenia typu X.1 i X.3, takie jak allel 8.3
locus TH01 i allele 11.1 oraz 12.1 locus D19S433. Allele te oznaczono manualnie, po
wykazaniu „korelacji przesunięcia prążków” (Gill P., 1996). Takie same oznaczenia
otrzymano po ponownym przeprowadzeniu analizy próbek.
Analizę wyników poszczególnych partii próbek DNA kończono zestawieniem
poprawnie oznaczonych profili SGM plus w tabelach Genotyper’a.
Utworzenie populacyjnego zbioru danych
Oznaczone i zestawione w tabelach Genotyper’a profile SGM Plus przekopiowano
do arkusza excel’a, a następnie za pomocą programu Microsoft Acces, utworzono zbiór
danych o liczebności i częstości alleli tych loci.
5
Statystyczna analiza danych
Otrzymane dane populacyjne poddano analizie statystycznej pod kątem zastosowania
ich w rutynowych badaniach identyfikacyjnych.
Za pomocą programu GDA (Lewis P.O., Zaykin D., 2002), dla poszczególnych loci
SGM plus określono heterozygotyczność obserwowaną (Ho) i oczekiwaną (He) oraz zbadano
zgodność z prawem równowagi Hardy’ego-Weinberga (HW P), stosując testy „exact” Fishera
i χ2.
Siłę
dyskryminacji
PD
dla
poszczególnych
loci
SGM
plus,
oznaczającą
prawdopodobieństwo, że dwie osoby przypadkowo wybrane z populacji polskiej będą miały
różne genotypy w locus k (k = 1, ....,10), wyliczono stosując wzór Fishera:
n
PDk = 1 - ∑ Pi2 = 1 - Sk
i=1
gdzie n oznacza liczbę alleli w locus k, Pi - oczekiwaną częstość genotypów w locus k,
n
a Sk = ∑ Pi2
i=1
PD dla całego systemu SGM plus wyliczono za pomocą wzoru:
10
PDSGM plus = 1 - ∏ Sk
k=1
Prawdopodobieństwo przypadkowej zgodności MP dla systemu SGM plus,
oznaczającą prawdopodobieństwo, że dwie osoby przypadkowo wybrane z populacji polskiej
będą miały takie same profile SGM plus, otrzymano ze wzoru:
10
PSGM plus = ∏ Sk
k=1
6
Częstości alleli poszczególnych loci SGM plus w próbie populacyjnej 2233 osób
Allel
3
4
5
6
7
8
8,3
9
9,3
10
10,2
11
11,1
11,2
12
12,1
12,2
13
13,2
13,3
14
14,2
15
15,2
16
16,2
17
17,2
18
18,2
19
19,2
20
20,2
21
21,2
22
22,2
23
23,2
24
24,2
25
25,2
26
26,2
27
27,2
28
28,2
29
29,2
30
30,2
31
31,2
32
32,2
33
33,1
33,2
34
34,2
35
Ho
He
PD
PD SGM plus
MP SGM plus
HW P (Fisher)
HW P (Chi2)
D3S135
0,0007
vWA
0,0007
D16S539 D2S1338 D8S1179 D21S11
D18S51 D19S433
0,0002
0,0085
0,0096
0,0898
0,0114
0,0002
0,0002
0,0403
0,0616
0,0002
0,2833
0,0694
0,0067
0,0000
0,0096
0,3453
0,1751
0,0976
0,0034
0,0040
0,2022
0,3316
0,0931
0,0000
0,1352
0,1021
0,0291
0,2246
0,2515
0,1055
0,0013
0,0943
0,1536
0,0002
0,1545
0,2376
0,1845
0,0499
0,0172
0,1755
0,2136
0,2788
0,2060
0,0049
0,1458
0,2351
0,0835
0,0002
0,1335
0,0002
0,0900
0,0116
0,0775
0,1162
0,0025
0,0002
0,0002
0,0887
0,0002
0,0004
0,2094
0,0168
TH01
FGA
0,0007
0,2373
0,1288
0,0965
0,0002
0,2096
0,3166
0,0101
0,0002
0,3486
0,0242
0,1814
0,0403
0,0493
0,0226
0,0016
0,0056
0,0004
0,0065
0,0007
0,0004
0,0181
0,0408
0,0871
0,0007
0,0004
0,0103
0,1348
0,0275
0,0002
0,0016
0,0378
0,0067
0,0242
0,0065
0,0958
0,0025
0,1064
0,1534
0,0004
0,1827
0,0027
0,1923
0,0148
0,1171
0,0096
0,1182
0,0025
0,0681
0,0004
0,0271
0,0007
0,1202
0,0002
0,0002
0,0002
0,0222
0,0016
0,0002
0,0027
0,0289
0,0038
0,0002
0,1861
0,0002
0,2033
0,0004
0,2300
0,0517
0,0663
0,0858
0,0130
0,0920
0,0018
0,0002
0,0358
0,0004
0,0025
0,7902
0,7949
0,9250
0,8058
0,8060
0,9332
0,7320
0,7502
0,8985
0,8792
0,8783
0,9729
0,1603
0,2819
0,2709
0,4347
0,2700
0.2706
0,7903
0,8394
0,7942
0,8335
0,7894
0,8449
0,9279
0,9584
0,999999999999766
2,3442x10-13
0,8828
0,6934
0,6331
0.7869
0,8766
0,8745
0,9708
0,7960
0,7892
0,9280
0,7681
0,7730
0,9131
0,8689
0,8654
0,9661
0,7278
0,8703
0,6347
0,4606
0,4806
0,2734
0,3069
0,5609
7
Wnioski z analizy statystycznej
Wyniki analizy statystycznej prowadzą do wniosku, że populacja polska
w poszczególnych loci SGM plus nie wykazuje istotnych odchyleń od prawa równowagi
Hardy’ego-Weinberga (HW P<0,05) co oznacza, że opracowane na podstawie badanej próby
dane populacyjne mogą być stosowane do oceny profili SGM plus oznaczanych w sprawach
karnych, przy zastosowaniu odpowiednich wzorów rachunku prawdopodobieństwa.
Określone na podstawie tych danych wartości PD i MP świadczą o wysokim
polimorfiźmie loci STR-SGM plus w populacji polskiej, co obrazuje i potwierdza wysoki
poziom użyteczności tego systemu do identyfikacji osób.
PODSUMOWANIE
W ramach prac badawczo-rozwojowych wdrożono do badań kryminalistycznych
nowy system identyfikacji genetycznej, obejmujący dziesięć niekodujących loci STRD3S1358, VWA, D16S539, D2S1338, D8S1179, D21S11, D18S51, D19S433, TH01, FGA
i locus Amelogeniny (XY), wchodzących w skład zestawu SGM plus. Stwierdzono, że system
ten z uwagi na wysoką czułość, informatywność i dobór loci STR może służyć standardowo
do identyfikacji śladów biologicznych, a także do identyfikacji osób podejrzanych przy
użyciu krajowej bazy danych DNA. Ponadto, ze względu na kompatybilność loci STR
ze standardowym zestawem ISSOL, stworzona została możliwość międzynarodowej
współpracy w wykrywaniu sprawców przestępstw.
Na podstawie przeprowadzonych badań populacyjnych utworzono dla populacji
polskiej populacyjną bazę danych w systemie SGM plus. Analiza statystyczna wykazała, że
dla populacji polskiej system SGM plus jest wystarczająco precyzyjny do bardzo dokładnej
identyfikacji osobniczej, w procesie wykrywania sprawców przestępstw. Ponadto
stwierdzono, że utworzona baza danych populacyjnych spełnia wymagania prawa równowagi
Hardy’ego-Weinberga, jest reprezentatywna dla populacji całego obszaru Polski i przy
uwzględnieniu takich założeń może być wykorzystywana do statystycznej oceny zgodności
profili DNA, oznaczanych w sprawach karnych.
8
PIŚMIENNICTWO
Binda S., Borer U.W., Gehrig C., Hochmeister M., Budowle B.: Swiss Caucasian population
data for the STR loci D2S1338 and D19S433 using the AmpFlSTR SGM Plus PCR
amplification kit. Forensic Sci Int (2000) 108: 117-120.
Czarny J.: Population Genetics of the STRs D3S1358, FGA, D2S1338, D8S1179, D21S11,
D18S51 and D19S433 in the Pomerania-Kujawy region of Poland. Forensic Sci Int (2002)
125: 90-92.
Evett I.W., Gill P.D., Lambert J. A., Oldroyd N., Frazier R., Watson S., Panchal S., Connolly
A., Kimpton C.: Statistical analysis of data for three Brtish ethnic groups from a new STR
multiplex. Int J Legal Med (1997) 110: 5-9.
Evett I.W., Weir B.: Interpreting DNA Evidence. Copright Sinauer, Inc. (1998).
Foreman L.A., Evet I.W.: Statistical analyses to support forensic interpretation for a new tenlocus STR profiling system. Int J Legal Med (2001) 114: 147-155.
Gill P., Urquhart A., Millican E., Oldroyd N., Watson S., Sparkes R., Kimpton C.P.: A new
method of STR interpretation using inferential logic – development of criminal intelligence
database. Int Legal Med (1996) 109: 14-22.
Gill P., d’Aloja E., Andersen J., Dupuy B., Jangblad M., Johnsson V., Kloosterman A.D.,
Kratzer A., Lareu M.V., Meldegaard M., Phillips C., Pfizinger H., Rand S., Sabatier M.,
Scheithauer R., Schmitter H., Schneider P., Vide M.C.: Report of the European DNA
profiling group (EDNAP): an investigation of the complex STR loci D21S11
and HUMFIBRA (FGA). Forensic Sci Int (1997) 86: 25-33.
Nei M.: Genetic distance between populations. Amer. Nat. (1972) 106: 283-291.
Olaisen B., Bar W., Brinkmann B., Carracedo A., Gill P., Lincoln P., Mayr W.R., Rand S.
DNA recommendations 1997 of the International Society for Forensic Genetics. Vox Sang
74: 61-63.
Pawłowski R., Dettlaff-Kąkol A., Jezierski G., Maciejewska A., Paszkowska R., Reichert M.:
Genetyka populacyjna dziewięciu loci typu STR z zestawu Profiler Plus w próbce
populacyjnej z obszaru Polski. Archiwum Medycyny Sądowej i Kryminologii (2000) 3:
PE Biosystems : AmpFlSTR SGM Plus PCR Amplification Kit User’s Manual, 1999.
Pepiński W., Janica J., Skawrońska M., Niemcunowicz-Janica A., Sołtyszewski I.:
Population genetics of 15 STR loci in the population of Podlasie (NE Poland). Forensic Sci
Int (2001) 124: 226-227.
9
Steinlechner M., Berger B., Scheithauer R., Parson W.: Population genetics of ten STR loci
(AmpFlSTR SGM plus) in Austria. Int J Legal Med. (2001) 114: 288-290.
Turowska B., Sanak M., Opolska-Bogusz B.: Wstępne badanie populacji Polski Południowej
w zakresie 10 STR loci z zestawu AmpFlSTR SGM Plus. Archiwum Medycyny Sądowej
i Kryminologii (1999)
Vanek D., Hradil R., Budowle B.: Czech population data on short tandem repeat loci of SGM
system kit using in FTA™ cards. Forensic Sci Int (2001) 119: 107-108.
Wolańska-Nowak P., Branicki W., Kupiec T.: STR data for AmpFlSTR Profiler Plus loci
in south Poland. Forensic Sci Int (2001) 122: 173-174.
Weir B.S.: Genetic Data Analysis II. Copright Sinauer, Inc. (1996).
10