Scenariusz – spotkanie 1 - Katedra i Zakład Epidemiologii

Transkrypt

Scenariusz – spotkanie 1 - Katedra i Zakład Epidemiologii
Katedra i Zakład Epidemiologii
Ul. Medyków 18, 40-752 Katowice
–
Wydział Lekarski w Katowicach
Śląski Uniwersytet Medyczny
–
Tel./Fax: (32) 2523734
E-mail: [email protected]
PRAKTYCZNE METODY STATYSTYCZNE W BADANIACH NAUKOWYCH
Studium Doktoranckie – Wydział Lekarski w Katowicach, SUM (2016/2017)
SCENARIUSZ BADANIA
Uzasadnienie badania
Noworodki z małą masą urodzeniową są zagrożone większym ryzykiem zgonu. Prawdopodobieństwo zgonu
w tej grupie jest kształtowane przez obecność istotnych zaburzeń stanu zdrowia przejawiających się pod
postacią objawów chorobowych (pojedynczych lub uzasadniających rozpoznanie choroby) lub zmian
patologicznych identyfikowanych w badaniu klinicznym albo laboratoryjnym. Zależność ryzyka zgonu od
wymienionych zaburzeń może być modyfikowana przez wpływ okoliczności związanych np. z miejscem i
rodzajem porodu lub stanem noworodka ocenianym bezpośrednio po urodzeniu.
Cel badania
Podstawowym celem badania jest określenie, które z zaburzeń stanu zdrowia stwierdzane w pierwszym
miesiącu życia zwiększają ryzyko zgonu noworodka o małej masie urodzeniowej.
Komentarz
Przedstawiony cel ma charakter eksploracyjny (otwarte pytanie). Cel konfirmacyjny mógłby np. brzmieć:
„celem badania jest weryfikacja hipotezy, że obecność objawów niedotlenienia noworodka o małej masie,
we wczesnym okresie po urodzeniu, zwiększa ryzyko zgonu w pierwszym miesiącu życia”.
Sformułowanie celu w postaci eksploracyjnej pociąga za sobą wykonanie wielu analiz opisowych
(charakterystyka badanych), a następnie analizy różnic i zależności, weryfikowanych analizą wielu
zmiennych.
Materiał
Zgromadzono wyniki obserwacji klinicznej 198 noworodków. Uzyskane dane wprowadzono do bazy danych
w dwóch etapach. W pierwszym etapie (baza ‘a’) zgromadzono dane opisujące okoliczności porodu i wyniki
badań z wczesnego okresu obserwacyjnego. W drugim etapie (baza ‘b’) zgromadzono dane reprezentujące
rozpoznania kliniczne oraz stan noworodka na końcu obserwacji (żyje/zgon).
Metody
…………….
W zakresie statystycznej analizy danych sekcja ma zawierać opis procedur wykorzystanych w analizie
danych (co jest przedmiotem kursu)
Wyniki badania
……………
Sekcja powstaje w wyniku realizacji zadań wykonywanych podczas spotkań (Zadanie 1, 2 … - osobne
karty/pliki, do wypełnienia podczas zajęć).
PRAKTYCZNE METODY STATYSTYCZNE W BADANIACH NAUKOWYCH
Studium Doktoranckie – Wydział Lekarski w Katowicach, SUM (2016/2017)
Dzień 1
Minimalna niezbędna wielkość próby, baza danych, program SAS, czyszczenie bazy danych, rozkład
zmiennych ilościowych, rozkład zmiennych jakościowych, transformacja zmiennych, restrykcja bazy
danych.
Kto normalny rozkład bada
Widząc zmienne jakościowe
To takiemu pewna biada
I symptomy jelitowe
(JEZ)
 Zadania:
Baza danych – program excel
Demonstracja programu SAS
Import bazy danych excel do środowiska SAS
Zawartość bazy danych
Czyszczenie bazy danych
Drukowanie bazy danych
Kontrola wartości błędnych
Zmienne ilościowe (wartości średnie i histogramy)
Normalność rozkładu, logarytmowanie zmiennych
Zmienne jakościowe (częstości i wykresy)
Transformacja zmiennych ilościowych (w tym logarytmowanie zmiennych)
Transformacja zmiennych jakościowych
Restrykcja bazy danych
 Bazy danych: „Grupa1a” ze zmiennymi:
ID – numer noworodka
Plec – płeć (1 = m, 2 = k)
Urodz – miejsce urodzenia (1 = klinika 2 = terenowy szpital)
Wiek – wiek płodowy (hbd)
Masa – masa ciała (g)
Apgar1 – skala Apgar: wynik oceny w 1 minucie (pkt)
Apgar5 – skala Apgar: wynik oceny w 5 minucie (pkt)
Apgar10 – skala Apgar: wynik oceny w 10 minucie (pkt)
Porod – rodzaj porodu (1 = siłami natury, 2 = cesarskie cięcie)
Crib – stan kliniczny w skali Crib (clinical risk index for babies w pkt)
Wodypl – czyste wody płodowe (1 = tak 2=nie)
Cechch – cechy chorioamnitis (1 = tak 2 =nie)
Steryd – sterydoprofilaktyka pneumopatii (1 =tak 2 =nie)
HR1 – tętno 1 (1 pomiar: ud/min)
HR2 – tętno 2 (2 pomiar: ud/min)
SatO2 – saturacja O2 (%)
Usgg1 – wynik pierwszego badania usg głowy (1- IVH I. 2- IVH II, 3- IVH III, 4- IVH IV, 5- brak IVH, 6- PVL, 7brak PVL, 8 – inne, 9 –IVH i PVL)
Usgg2 – wynik drugiego badania usg głowy (1- IVH I. 2- IVH II, 3- IVH III, 4- IVH IV, 5- brak IVH, 6- PVL, 7- brak
PVL, 8 – inne, 9 –IVH i PVL)
Echo1 – wynik pierwszej echokardiografii serca (1- PDA istotny hemodynamicznie, 2 – PDA nieistotny
hemodynamicznie, 3 – inne zmiany)
Echo1 – wynik drugiej echokardiografii serca (1- PDA istotny hemodynamicznie, 2 – PDA nieistotny
hemodynamicznie, 3 – inne zmiany)
Okul1 - wynik pierwszego badania okulistycznego (1- ROPI, 2- ROPII, 3- ROPIII, 4- ROPIV, 5- ROPV, 6- brak ROP,
7- inne zmiany)
Okul2 - wynik drugiego badania okulistycznego (1- ROPI, 2- ROPII, 3- ROPIII, 4- ROPIV, 5- ROPV, 6- brak ROP, 7inne zmiany)
PH – (wartość zmierzona)
PO2 - (wartość zmierzona)
PCO2 - (wartość zmierzona)
HCO3 - (wartość zmierzona)
BE - (wartość zmierzona)
Kreat – (wartość zmierzona)
CPK– (wartość zmierzona)
LDH– (wartość zmierzona)
CRP– (wartość zmierzona)
Aspat– (wartość zmierzona)
Alat– (wartość zmierzona)
 Procedury SAS
Import
Proc contents
Proc print
Sort by
Proc freq
Proc means
Proc univariate
If … then…
Where …
 Pierwsze kroki (import zewnętrznej bazy i dostęp do zaimportowanej bazy)
Import zewnętrznej bazy danych przygotowanej w programie excel.
Po uruchomieniu programu SAS na tle paneli pojawia się propozycja „Getting started with SAS”, z której rezygnujemy
klikając „Close”. Klikając następnie „File” (lewy górny róg) otwieramy zakładkę i wybieramy „Import data”.
Akceptujemy ujawnioną opcję – format pliku („Microsoft Excel Workbook”) klikając „Next”. Pojawia się prośba o
wskazanie pliku do importu, który najlepiej znaleźć klikając „Browse”. Z tej funkcji klikamy opcję pulpit (tu jest plik
źródłowy) i na ekranie pojawia się żądany plik („Grupa1a”). Po kliknięciu tego pliku akceptujemy decyzję poprzez
kliknięcie „Otwórz”. Mamy namierzony plik, co widać w oknie „Connect to MS Excel” – klikamy „OK”. Z kolei pada
pytanie o arkusz – importujemy pierwszy, bo tak jest zbudowany plik excel. A zatem klikamy „Next”. Otwiera się okno
„Import Wizzard – Select library and member”. Wybrany plik musimy umieścić w bibliotece. Chwilowo w okienku
„Library” widać bibliotekę „Work” –jest to doraźna biblioteka, z której zniknie baza po zakończeniu sesji SAS. Nam
zależy na permanentnej lokalizacji bazy danych, do użytku w przyszłości. Wybieramy zatem (klik na „v”) bibliotekę
„Sasuser” i przechodzimy do okienka „Member” (nazwa permanentnej bazy danych – nadana przez nas). Dobrze
podtrzymać znaną nam nazwę, a zatem wpisujemy tu „Grupa1a” i klikamy „Next”. Kolejne okno pyta czy zapisać
procedurę – nie korzystamy z tego i klikamy „Finish”. Rezultat importu jest oznajmiany w panelu SASa „Log”.
Oczekujemy informacji: „NOTE: SASUSER.GRUPA1A data set was successfully created”. Stworzyliśmy zatem
permanentną bazę danych pod nazwą „grupa2a” w bibliotece „sasuser” i zapis „sasuser.grupa1a” to kompletna tablica
rejestracyjna naszej bazy (uwaga: kropka pomiędzy nazwą biblioteki i bazy jest zawsze konieczna).
Dostęp do bazy danych
W panelu SASa „Explorer” widoczny jest zbiór bibliotek „Libraries”. Po kliknięciu tej ikony pojawiają się aktywne
biblioteki, w tym „Sasuser”. Po kliknięciu tej ikony pojawiają się permanentne bazy danych zgromadzone w „Sasuser”.
Kliknięcie bazy „grupa1a” pozwala na jej ogląd – i nic więcej.
W celu wszelkich działań należy wykorzystać panel SASa „Editor”. Tu wpisujemy wszystkie polecenia, ale najpierw
trzeba wskazać jakiej bazy mają one dotyczyć. Baza „grupa1a” istnieje i z niej tworzymy roboczy plik (kopia do analiz)
o dowolnej nazwie. Ta procedura zapewnia trwałe bezpieczeństwo bazy danych. Stwórzmy zatem plik roboczy „a” (lub
inna nazwa) – „Data a” i niech on powstanie z bazy „sasuser.grupa1a”. Oto procedura (uwaga – średnik jest
konieczny)”
Data a;
Set sasuser.grupa1a;
Powyższe dwa zadania wpisujemy tylko raz, na początku wszelkich późniejszych działań. Uwaga: dla SAS’a nie ma
znaczenia wielkość liter, ani przestrzenny układ procedur. To, co powyżej można zapisać:
data a; set sasuser.grupa1a;
Mamy zatem nawiązany kontakt z bazą i możemy ją analizować. Na przykład możemy poprosić o informację o jej
zawartości wpisując odpowiednią procedurę („proc contents”). Tak wygląda zapis:
Data a;
Set sasuser.grupa1a;
Proc contents;
Run;
Słowo „run” oznacza wykonaj powyższe (uwaga: każde logiczne zdanie kończymy średnikiem). Po zapisaniu
procedury klikamy sylwetkę biegacza na górnej belce SASa.
Modyfikacja zapisu (dodanie „varnum”) pokazuje wykaz zmiennych w kolejności ich występowania w bazie danych, a
nie w porządku alfabetycznym. Zapis:
Data a;
Set sasuser.grupa1a;
Proc contents varnum;
Run;
Wszelkie wydruki można opisać tytułami (uwaga: SAS wymaga, aby znaki literowe były umieszczone w
półcudzysłowiu). Można użyć jednego, dwóch tytułów. Oto przykład:
Data a;
Set sasuser.grupa1a;
Proc contents;
Title1 ‘ZAWARTOŚĆ BAZY DANYCH’; Title2 ‘Grupa1a’;
Run;
Wydruk z panelu SASa „Output” można przepisać lub zapisać. Rutynowo wydruk ma czytelny format surowy („to, co
widać”), ale można uzyskać edytowany format w trybie „rts” uruchamiając „output delivery system rtf” (ods rtf). Po
zrealizowaniu zadania należy zamknąć tę edycję („close”). Oto przykład:
Data a;
Set sasuser.grupa1a;
Ods rtf;
Proc contents;
Title1 ‘ZAWARTOŚĆ BAZY DANYCH’; Title2 ‘Grupa1a’;
Run;
Ods rtf close;
Uzyskany wydruk poddaje się edycji w systemie word i można go zapisać jako plik tekstowy. Praktycznie przydatna
jest możliwość wprowadzenia notatek. SAS nie czyta tekstu zawartego w specjalnych nawiasach: /* ……*/. Tu można
wpisywać notatki, informacje …
Data a;
Set sasuser.grupa1a; /*stworzyłem dostęp do bazy danych*/
Ods rtf; /*uruchamiam edycję wydruku w rtf*/
Proc contents; /*proszę o zawartość bazy danych*/
Title1 ‘ZAWARTOŚĆ BAZY DANYCH’; Title2 ‘Grupa1a’;
Run;
Ods rtf close; /*końćzę edycję wydruku w rtf*/
Tymi nawiasami można także wyłączyć niechcianą, a zapisaną wcześniej procedurę:
Data a;
Set sasuser.grupa1a;
/*Ods rtf;*/ /*SAS nie widzi polecenia edycji ‘ods’, wykona natomiast resztę zadań*/
Proc contents; Title1 ‘ZAWARTOŚĆ BAZY DANYCH’; Title2 ‘Grupa1a’;
Run;
/*Ods rtf close;*/
……..…………………………….KONIEC TEKSTU (DZIEŃ 1)……….……………………………