Rabu, 19 Agustus 2009

TELADAN PENYAJIAN RINGKASAN DATA

Dengan penggunaan piranti lunak komputasi statistis Minitab ringkasan-ringkasan data dapat diperoleh atau disajikan melalui penggunaan menu:
• Stat
 Basic Statistics
 Descriptive Statistics
 Correlation
 Tables
 Cross Tabulation
 Tally
• Graph
 Plot
 Time Series Plot
 Histogram
 Boxplot
 Matrix Plot
 Pie Chart
 Marginal Plot
 Character Graphs
 Histogram
 Boxplot
 Dotplot
 Stem-and-Leaf
 Scatter Plot
 Time Series Plot
Peubah-peubah kategorik (atau peubah-peubah numerik yang nilai-nilainya telah dikelas-kelaskan) pembentuk rangka suatu tabel berkasta dua atau lebih disebut sebagai peubah-peubah pengklasifikasi.
Minitab memberikan dua macam fasilitas untuk statistik-statistik yang ingin dicantumkan dalam sel-sel suatu tabel:
• frekuensi-frekuensi satuan-satuan pengamatan
o mutlak (n, counts)
o nisbi (dalam %)
 persen lajur
 persen baris
 persen total
• N nonmissing, N missing, Data, Minimums, Maximums, Sums, Means, Medians, atau Standard deviations untuk satu atau lebih “associated variables”, yaitu peubah(-peubah) lain yang diasosiasikan terhadap kerangka tabel yang terbentuk oleh kategori-kategori atau kelas-kelas dari “classification variables”.
Ikhtisar disajikan di bawah ini












Pembelajaran kita awali dengan lebih dahulu memahami masalah sebaran data suatu peubah melalui beberapa teladan dengan gugus-gugus data empirik.
Kelak akan Anda ketahui bahwa peubah-peubah yang digunakan dalam teladan-teladan dapat saja diganti dengan peubah-peubah lain yang lebih akrab sesuai dengan bidang minat profesionalnya sendiri. Yaitu, disdiakan dan diolah melalui latihan-latihan kelompok atau mandiri. Kembangkan karsa ingin tahu mendalam Anda! Selamat berlatih untuk kepentingan Anda sendiri.
Asas-asas yang ditetapkan dalam sembarang pengamatan bersangkut-paut dengan masalah keabsahan objek-objek yang dimaksud dan keterandalan nilai-nilai mungkin yang dimiliki oleh suatu peubah pengamatan.
Kriteria inklusi dan eksklusi yang digunakan dalam mengidentifikasikan apakah suatu objek termasuk ataukah tidak termasuk sebagai suatu unsur sah dari suatu universum/contoh objek-objek dimaksud. Kriteria inklusi diperlukan untuk menjamin terpenuhinya asas ‘mutually exhaustive’, yaitu tercakupnya semua objek pengamatan yang sah. Sedangkan kriteria ekslusi yang memisahkan objek-objek tak-sah dari objek-objek sah diperlukan untuk menjamin terpenuhinya asas ‘mutually inhaustive’. Yaitu, ketunggalan suatu objek.
Asas ‘mutually exclusive’: khas. Untuk suatu peubah pengamatan suatu objek memiliki/ memberikan satu dan hanya satu nilai ciri, atribut atau respons saja dari sejumlah macam nilai cri, atribut atau respons yang mungkin dapat dimiliki/diberikan oleh suatu peubah dimaksud.
Asas ‘mutually inclusive’: semua tercakup. Untuk suatu peubah pengamatan, semua objek pengamatan yang sah masing-masing memiliki atau memberikan satu dan hanya satu ciri, atribut atau responsnya. Tidak ada yang tercatat ulang/jamak dan tidak ada yang tidak tercatat.

PEUBAH BERSKALA PENILAIAN NOMINAL
Untuk suatu peubah berskala penilaian nominal perintah TALLY dari Minitab dapat digunakan untuk memperoleh keterangan mengenai atribut-atribut data dan ringkasan-ringkasan data: frekuensi-frekuensi mutlak atau nisbi, kategori modus dan banyaknya data.
Teladan 2.5.1.1
Perhatikan dua kompilasi data disajikan di bawah ini.


Kedua kompilasi menyajikan informasi yang sama. Yaitu, mengenai sebaran frekuensi-frekuensi dari jenis-jenis nama lokal kekayuan rimba di suatu tegakan hutan alam produksi dari areal kerja sebuah perusahaan HPH (Hak Pengusahaan Hutan). Tetapi, kompilasi pertama menata informasi dalam urutan alfebis nama lokal jenis-jenis kekayuan rimba. Sedangkan kompilasi kedua menyajikannya berdasarkan besar nilai-nilai dari frekuensi-frekuensi ditemukannya jenis-jenis kekayuan.
Dapat kita pahami bahwa di sini pekerjaan pencacahan (enumerasi) dilakukan atas suatu rekaman data hasil pengamatan lapang yang tersedia. Coba Anda periksa sendiri bahwa banyaknya objek pengamatan adalah 33279 pohon. Cukup banyak bukan? Kenyataan tersebut tidak jarang ditemukan dalam praktik. Mengapa atau untuk apa serta bagaimana data dikumpulkan nanti secara umum akan kita bahas dalam Anak-bab tersendiri.
Tabel menyajikan sebaran frekuensi-frekuensi mutlak atau nisbi data jenis-jenis kekayuan rimba. Meranti merah (MrntMrh) adalah jenis yang terbanyak ditemukan, yaitu sebanyak 6265 pohon (atau 18.63 % dari total 33273 pohon). Dalam hal teladan ini dikatakan bahwa “kategori modus” data jenis-jenis kekayuan rimba adalah meranti merah.
Asas yang digunakan dalam pengamatan adalah:
(1) Suatu objek pengamatan (dalam hal ini pohon individual) untuk suatu peubah yang di-maksud (dalam hal ini adalah nama lokal jenis memiliki satu dan hanya satu atribut atau ciri yang mungkin saja.
(2) Semua objek pengamatan yang sah harus tercakup, masing-masing dengan atribut-atribut atau ciri-cirinya.
Berdasarkan dua asas tadi nyatakan pendapat Anda gugus data yang digunakan dalam Teladan 2.5.1.1. Khususnya yang dinyatakan ke dalam kategori “Missing”. Seluruhnya ada 129 pohon (0.39 %) yang dinyatakan sebagai ‘Missings’ karena mungkin alfa: lupa, lalai, tidak mengetahui namanya, catatan tak-jelas, dsbnya.
Nama-nama lokal jenis merupakan kategori-kategori berskala penilaian nominal dari peubah “jenis kekayuan rimba”. Peubah kategorik berskala penilaian nominal (disingkat: peubah nominal) hanya memiliki kemampuan dalam menggolongkan atribut-atribut atau ciri-ciri sembarang dua objek: berkategori sama ataukah tak-sama.
Informasi dapat juga disajikan dalam bentuk visual, misalnya berupa graf atau gambar. Perhatikan dua sajian di bawah ini. Yang pertama ialah berupa suatu bagan turus. Sedangkan yang kedua berupa suatu bagan lingkar (pie chart).



















Gambar 2.5.1.1a. Bagan turus sebaran frekuensi- frekuensi nisbi (%)
banyaknya individu jenis-jenis pepohonan































Gambar 2.5.1.1b. Bagan lingkar banyaknya pohon menurut jenis nama lokalnya

PEUBAH BERSKALA PENILAIAN ORDINAL, HEDONIK ATAU TINGKAT INTENSITAS
Konsep frekuensi-frekuensi kumulatif (mutlak atau nisbi) dapat diterapkan kepada peubah-peubah kategorik berskala penilaian ordinal, hedonik atau tingkat intensitas. Tetapi tidak sah untuk peubah berskala penilaian nominal.
Untuk suatu peubah berskala penilaian ordinal, hedonik atau tingkat intensitas perintah “TALLY” dari Minitab dapat digunakan untuk memperoleh keterangan mengenai atribut-atribut data dan ringkasan-ringkasan data: frekuensi-frekuensi mutlak atau nisbi, frekuensi-frekuensi kumulatif (mutlak atau nisbi), kategori modus dan banyaknya data.
Penggunaan perintah “MAXIMUM” untuk mengetahui kategori dari peringkat tertinggi dapat dilakukan jika data pasokan direkam dalam bentuk angka-angka yang menyatakan urutan peringkat-peringkat dari kategori-kategori.
Teladan 2.5.2.1
Berikut diberikan suatu teladan penggunaan perintah “Tally” untuk data respons 1403 responden terhadap suatu peubah pernyataan persepsi (P26).

MTB > tally c29
Summary Statistics for Discrete Variables
P26 Count Percent
SngtStju 129 9.42
Setuju 837 61.09
Netral 45 3.28
TakStuju 324 23.65
Sngt-TS 35 2.55
N= 1370
*= 33

P26 ialah suatu peubah berskala penilaian hedonik dengan kategori-kategori skala Likert: Sangat tidak setuju, Tidak setuju, Netral, Setuju dan Sangat setuju. Oleh karena itu, frekuensi-frekuensi kumulatifnya adalah:

CumCnt CumPct
Sngt-TS 35 2.55
TakStuju 359 26.20
Netral 404 29.48
Setuju 1241 90.57
SngtStju 1370 100.00
N= 1370
*= 33
Perhatikan bahwa dalam teladan di atas ada 33 responden tidak memberikan respons-responsnya.
Teladan 2.5.2.2
Berikut diberikan sebuah teladan penggunaan perintah TALLY untuk memperoleh sebaran frekuensi-frekuensi mutlak, nisbi dan kumulatif dari suatu gugus data berskala penilaian ordinal atau tepatnya tingkat intensitas, yaitu kekerapan konsumsi telur oleh 434 rumahtangga yang mempunyai anak berusia bawah enam tahun.
Tingkat kekerapan konsumsi dinilai menurut salah satu dari 8 kategori ordinal berikut: 0 = tidak pernah; 1 = sekali; 2 = sebulan sekali; 3 = rata-rata dua minggu sekali; 4 = rata-rata 1 sampai 2 kali tiap minggu; 5 = rata-rata 3 – 4 kali tiap minggu; 6 = tiap hari selalu mengkonsumsi walau kebanyakan hanya satu kali/ hari; 7 = tiap hari selalu mengkonsumsi dan dihidangkan lebih dari satu kali/hari.
MTB > Tally ‘TELUR’;
SUBC> Counts;
SUBC> CumCounts;
SUBC> Percents;
SUBC> CumPercents.
Summary Statistics for Discrete Variables
TELUR Count CumCnt Percent CumPct
0 21 21 4.84 4.84
1 8 29 1.84 6.68
2 28 57 6.45 13.13
3 75 132 17.28 30.41
4 243 375 55.99 86.41
5 54 429 12.44 98.85
6 5 434 1.15 100.00
N= 434
Sajian grafis diberikan di bawah ini diperoleh dari penggunaan perintah PLOT dari menu GRAPH terhadap keluaran komputer di atas.

Perintah RANK di bawah ini dimaksudkan untuk menggubah nilai-nilai ordinal 434 data ke-kerapan konsumsi rumahtangga terhadap telur ke dalam peubah C243 bernilai satuan-satuan peringkat. Perhatikan perintah-perintah lainnya yang dimaksudkan untuk membuat sajian grafis.
MTB > RANK ‘TELUR’ SIMPAN DI C243
MTB > Tally ‘RNKTELUR’;
SUBC> Counts;
SUBC> CumCounts;
SUBC> Percents;
SUBC> CumPercents.
Summary Statistics for Discrete Variables

RNKTELUR Count CumCnt Percent CumPct
11.0 21 21 4.84 4.84
25.5 8 29 1.84 6.68
43.5 28 57 6.45 13.13
95.0 75 132 17.28 30.41
254.0 243 375 55.99 86.41
402.5 54 429 12.44 98.85
432.0 5 434 1.15 100
N= 434
MTB > Histogram ’RNKTELUR’;
SUBC> Percent;
SUBC> MidPoint;
SUBC> Project;
SUBC> Title “Sebaran frekuensifrekuensi nisbi tingkat kekerapan rumahtangga dalam mengkonsumsi telur”;
SUBC> Minimum 2 0;
SUBC> Maximum 2 60;
SUBC> Axis 1;
SUBC> Label ”TINGKAT KEKERAPAN KONSUMSI(rankit)”;
SUBC> Axis 2;
SUBC> Label ”FREKUENSI NISBI (%)”;
SUBC> Grid 2.













Perhatikan bahwa pemeringkatan tidak mengubah banyaknya macam nilai dalam gugus data berikut frekuensi-frekuensinya. Tetapi jarak-jarak antar nilai-nilai rankit dalam hal teladan yang diberikan tidak sama lebar. Jarak-jarak tersebut ditimbang oleh frekuensi-frekuensi.
PEUBAH BERSKALA PENGUKURAN SELANG ATAU NISBAH
Peubah cacah atau peubah kontinyu disebut juga sebagai peubah numerik. Data cacah merupakan data dari peubah diskret tetapi termasuk ke dalam gugus bilangan-bilangan nyata. Oleh karena itu absisa dalam sistem salib sumbu sebaran frekuensi-frekuensinya adalah suatu garis bilangan. Jika banyaknya macam bilangan dalam suatu gugus data cacah cukup besar maka gugus data tersebut dapat diperlakukan sebagai suatu gugus data suatu peubah kontinyu.
Teladan 2.5.3.1
Di bawah ini disajikan data banyaknya individu zooplankton dalam 140 spesimen air Waduk Saguling.
MTB > PRINT C39
Data Display
JLHZOOPL
775 1226 1636 2361 99 180 236
219 262 442 315 416 103 766
172 477 250 730 193 324 144
189 242 179 208 12 115 141
190 105 300 194 202 210 210
199 176 117 271 79 908 187
2838 634 585 349 325 101 241
272 180 137 224 244 250 68
344 82 149 75 298 39 59
739 167 71 154 65 370 229
358 203 222 96 50 49 183
86 144 185 238 468 192 271
86 256 141 100 178 137 193
223 89 187 213 208 170 194
72 92 401 358 286 348 36
66 52 79 1298 1373 182 79
141 79 79 35 90 171 94
78 266 259 461 300 67 85
66 96 85 77 188 95 123
43 43 89 89 139 102 93

Data tersebut kita gunakan untuk membandingkan tampilan-tampilan plot titik dan histogram frekuensi-frekuensi.
MTB > DotPlot 'JLHZOOPL'.
Character Dotplot
Each dot represents 2 points

:
:.:
:::
::::
::::
::::.
:::::.
.:::::::: .... . . .. . . .
+---------+---------+---------+---------+---------+- JLHZOOPL
0 600 1200 1800 2400 3000
MTB > Histogram 'JLHZOOPL';
SUBC> MidPoint;
SUBC> Project;
SUBC> Title "BAGAN TURUS SEBARAN BANYAKNYA ZOOPLANKTON";
SUBC> Title "";
SUBC> Axis 1;
SUBC> Label "BANYAKNYA ZOOPLANKTON/SPESIMEN";
SUBC> Axis 2;
SUBC> Label "FREKUENSI (botol spesimen)";
SUBC> Grid 2.
MTB > Histogram 'JLHZOOPL';
SUBC> MidPoint;
SUBC> Bar;
SUBC> Project;
SUBC> Title "HISTOGRAM FREKUENSI-FREKUENSI BANYAKNYA ZOOPLANKTON";
SUBC> Title "";
SUBC> Axis 1;
SUBC> Label "BANYAKNYA ZOOPLANKTON/SPESIMEN";
SUBC> Axis 2;
SUBC> Label "FREKUENSI (botol spesimen)";
SUBC> Grid 2.





























Tetapi jika data yang digunakan tadi itu ditansformasi ke dalam logaritme alam maka didapat sebaran frekuensi-frekuensi seperti dapat diperhatikan di bawah ini.

Di bawah ini diberikan grafik aproksimasi normal terhadap kurva sebaran frekuensi-frekuensi Ln banyaknya individu zooplankton di atas, yaitu dengan menggunakan perintah:
MTB > Describe 'LnZOOPLT';
SUBC> GNHist.


















Apa yang dapat disimpulkan dari kesan terhadap penayangan ketiga grafik di atas?
Sebaran data suatu peubah kontinyu dapat dinyatakan dalam bentuk plot titik (DOTPLOT), statistik-statistik senarai (DESCRIBE), bagan kotak-garis (BOX PLOT) dan bagan dahan-daun (STEM-AND-LEAF).
Perhatikan kembali data LnZOOPLT, yaitu Ln(JLHZOOPL) telah digunakan di atas. Data LnZOOPLT adalah suatu gugus data peubah kontinyu. Di bawah ini berturut-turut disajikan plot titik, statistik-statistik senarai dan bagan kotak-garis sebaran data LnZOOPLT.
.
::
.. ::
::: :: :
. ::: : ::::: .
::::: ::::::::::: . .
. :.::..::::::::::::::::::::. ..:.. .: . . .
-----+---------+---------+---------+---------+---------+- LnZOOPLT
3.0 4.0 5.0 6.0 7.0 8.0

Variable N Mean Median Tr Mean StDev SE Mean
LnZOOPLT 40 5.1753 5.2149 5.1461 0.8654 0.0731

Variable Min Max Q1 Q3
LnZOOPLT 2.4849 7.9509 4.5245 5.5975
MTB > Boxplot 'LnZOOPLT';
SUBC> Transpose;
SUBC> Box;
SUBC> Symbol;
SUBC> Outlier;
SUBC> Title "BAGAN KOTAK-GARIS BANYAKNYA ZOOPLANKTON";
SUBC> Axis 1;
SUBC> Axis 2;
SUBC> Label "Banyaknya zooplankton/spesimen";
SUBC> Grid 2.




MTB > Stem-and-Leaf 'LnZOOPLT'.
Character Stem-and-Leaf Display
Stem-and-leaf of LnZOOPLT N = 140
Leaf Unit = 0.10





1 2 4
1 2
1 3
9 3 55677899
34 4 0111222233333333444444444
57 4 55555556666677899999999
(42) 5 001111111112222222222222233333333444444444
41 5 55555566666777778888899
18 6 0011134
11 6 56668
6 7 1124
2 7 79

Penggunaan DOTPLOT, DESCRIBE dan BOXPLOT terhadap data logaritme alam banyaknya zooplankton per spesimen tampak saling melengkapi dalam pendeskripsian suatu gugus data peubahtunggal. Plot titik memberikan tampilan penyebaran data lebih alami. Asas yang digunakan adalah penskalaan bilangan-bilangan menurut lebar bidang cetak. Jadi, mirip dengan prosedur bagan “dahan-daun” yang juga mempedulikan “kedalaman data”.
Ketiga gambar di atas menunjukkan adanya senjang dalam sebaran data, khususnya pada bagian ekor kiri sebaran yang juga teridentifikasi sebagai data pencilan. Tetapi pencilan lebih banyak ditemukan pada bagian ekor kanan. Ketak-setangkupan sebaran data terdapat baik ukur ekor-ekor sebaran maupun dalam rentang antar kuartil ke-1 dan ke-3. Plot titik menunjukkan kesan cukup kuat akan adanya dua puncak sebaran. Tetapi kesan itu tidak begitu jelas ditunjukkan oleh histogram dan bagan dahan-daun.
Prosedur bagan “dahan-daun” mengambil analog dari anatomi pepohonan. Ada satu batang, satu atau beberapa dahan, dan dari tiap dahan mungkin ada satu atau beberapa cabang atau ranting, sebelum pada akhirnya ada daun-daun. Demikian juga halnya dengan suatu gugus data. Gugus diibaratkan 'batang'. Tiap pengamatan merupakan suatu bilangan yang terdiri atas satu atau beberapa angka yang dapat diibaratkan sebagai 'dahan', 'cabang', atau 'ranting', dan 'daun', yaitu tergantung dari besarnya nilai dan tingkat kecermatan pengukuran.
Data kandungan protein total (%) biji dari 79 kultivar kedelai berikut:
37.2 40.6 39.7 37.0 40.7 43.8 41.8 37.2
38.4 42.1 38.5 39.6 41.7 41.9 40.1 42.8
39.4 38.5 43.4 37.4 40.3 34.8 40.5 38.6
37.7 41.5 44.5 41.3 39.0 40.8 40.6 40.6
38.9 41.7 41.6 38.3 36.9 39.7 32.6 38.4
41.0 39.7 43.2 39.8 40.0 37.1 40.0 41.2
40.6 38.1 41.5 40.7 39.6 40.9 37.6 37.5
41.4 35.5 40.3 36.3 41.6 38.3 37.9 36.3
40.2 38.7 38.6 38.7 37.9 39.9 37.8 33.2
36.0 38.7 38.7 39.4 35.6 39.7 36.9
akan digunakan untuk teladan menyusun bagan dahan-daun secara manual.

Langkah-langkah menyusun suatu bagan dahan-daun secara manual adalah sebagai berikut:
1. Mendaftarkan dahan-dahan berdasarkan data
Dari data di atas diketahui bahwa semua pengamatan terdiri atas tiga angka dengan ke-cermatan satu desimal, terkecil 32.6 dan terbesar 44.5. Jika daun-daun didasarkan atas dahan-dahan puluhan, maka dalam hal ini hanya ada dua dahan, yaitu tiga puluhan dan empat puluhan. Untuk kandungan protein biji kedelai, perbedaan kelas sebesar belasan persen terlalu besar.
Sebaliknya, jika daun-daun didasarkan pada dua angka maka pengkelasan data kandungan protein biji dibuat terlalu rinci, yaitu sampai 1 %. Untuk sementara kita terima dulu daftar dahan dan cabang berdasarkan dua angka ini, sehingga sampai tahap ini diperoleh dahan dan cabang untuk daun-daun.
2. Mendaftarkan daun-daun untuk dahan/cabang
Dimulai dari pengamatan yang tercatat pertama dan diakhiri hingga pengamatan yang dicantumkan terakhir. Pengamatan pertama adalah 37.2; jadi, dahan dan ranting daun 2 adalah 3-7. Pengamatan berikutnya adalah 40.6, sehingga dahan dan ranting daun 6 adalah 4-0, dan seterusnya sehingga akhirnya didapat hasil pendaftaran seperti dapat dilihat dalam Gambar 2.5.3.1 atas. Gambar 2.5.3.1 bawah menyajikan hasil penataan daun-daun menurut besar nilai.

Banyak daun
Dahan/ranting Daun (Frekuensi)
3-2 -6 1
3 -2 1
4 -8 1
5 -56 2
6 -93309 5
7 -20247165998 11
8 -45569341376777 14
9 -76407786947 11
4-0 -671358660067932 15
1 -879537602546 12
2 -18 2
3 -842 3
4 -5 1
Jumlah 79

Banyak daun
Dahan/ranting Daun Frekuensi Kumulatif
3-2 -6 1 1
3 -2 1 2
4 -8 1 3
5 -56 2 5
6 -03399 5 10
7 -01224567899 11 21
8 -13344556677779 14 35
9 -04466777789 11 46
4-0 -001233566667789 15 61
1 -023455667789 12 73
2 -18 2 75
3 -248 3 78
4 -5 1 79

Gambar 2.5.3.1. Bagan dahan-daun sebelum (atas) dan sesudah (bawah) diurutkan

3. Penyempurnaan
Dilakukan jika bagan yang dihasilkan dari langkah 2 belum memberikan gambaran yang memadai. Lebih-lebih jika gugus data adalah suatu contoh yang diharapkan dapat dianggap mewakili suatu populasi. Frekuensi-frekuensi menggambarkan penyebaran dan pemusatan nilai-nilai pengamatan. Hal-hal yang diperhatikan untuk penyempurnaan ialah ada tidaknya senjang, banyaknya pemusatan nilai-nilai, kesetangkupan sebaran dan pengetahuan tentang data yang dihadapi. Penyempurnaan mungkin dapat dilakukan me-lalui penggabungan atau pemecahan kelas-kelas data. Perhatikan Gambar 2.5.3.1 bawah! Semua kelas data (dahan/ cabang) mempunyai anggota (daun). Jadi, kebetulan tidak ada senjang yang tidak diharapkan. Sebaran data agak menjulur ke kiri yaitu ke arah nilai-nilai kadar protein yang lebih rendah. Sebagian besar data terpusat pada kelas-kelas dari kadar protein 37.0 sampai dengan 41.9 %, dengan frekuensi-frekuensi hampir seragam (yaitu 11 sampai dengan 15). Terlihat adanya perbedaan frekuensi yang cukup tajam terhadap kelas-kelas ekor kanan maupun kiri. Pengkelasan dengan perbedaan kadar protein 1 % dinilai terlalu renik dan praktis tidak bermakna. Bagan dahan-daun dalam Gambar 2.5.3.2 yang didapat dari penggabungan kelas-kelas agaknya lebih memadai daripada yang diberikan dalam dalam Gambar 2.5.3.1.


Dahan Daun Frekuensi
Mutlak Kumulatif
32 - 62 2 2
34 - 856 3 5
36 - 0339901224567899 16 21
38 - 1334455667777904466777789 25 46
40 - 001233566667789023455667789 27 73
42 - 18248 5 78
44 - 5 1 79

Gambar 2.5.3.2. Penyempurnaan bagan dahan-daun pada Gambar 2.5.3.1

Perbedaan antar dua kelas berurutan adalah dalam kadar protein sebesar 2 %. Walaupun tidak begitu jelas bagan dahan-daun yang diberikan dalam Gambar 2.5.3.1 mengesankan adanya dua puncak (dahan 3-8 dan dahan 4-0). Kurva frekuensi-frekuensi dalam Gambar 2.5.3.2 hanya mempunyai satu puncak saja.
Perhatikan kembali Gambar 2.5.3.1 bawah atau Gambar 2.5.3.2. Bagan dahan-daun mengurutkan n = 79 pengamatan berturut-turut dari yang bernilai terkecil hingga yang bernilai terbesar. Dalam teladan ini, y(1) = 32.6 dan y(79) = 44.5. Bagan juga memberikan banyaknya macam (k) nilai pengamatan. Perintah serta anak-perintah Minitab yang dapat digunakan untuk mendapatkan hasil seperti di atas ialah:
MTB > NOTE MEMASUKKAN DATA KADAR PROTEIN BIJI KEDELAI DARI PAPAN KETIK
MTB > SET C1
DATA> 37.2 40.6 39.7 37.0 40.7 43.8 41.8 37.2
DATA> 38.4 42.1 38.5 39.6 41.7 41.9 40.1 42.8
DATA> 39.4 38.5 43.4 37.4 40.3 34.8 40.5 38.6
DATA> 37.7 41.5 44.5 41.3 39.0 40.8 40.6 40.6
DATA> 38.9 41.7 41.6 38.3 36.9 39.7 32.6 38.4
DATA> 41.0 39.7 43.2 39.8 40.0 37.1 40.0 41.2
DATA> 40.6 38.1 41.5 40.7 39.6 40.9 37.6 37.5
DATA> 41.4 35.5 40.3 36.3 41.6 38.3 37.9 36.3
DATA> 40.2 38.7 38.6 38.7 37.9 39.9 37.8 33.2
DATA> 36.0 38.7 38.7 39.4 35.6 39.7 36.9
DATA> END

MTB > NAME C1'KPROTEIN'
MTB > STEM AND LEAF C1
Stem-and-leaf of KPROTEIN N = 79
Leaf Unit = 0.10
1 32 6
2 33 2
3 34 8
5 35 56
10 36 03399
21 37 01224567899
35 38 13344556677779
11 39 04466777789
33 40 001233566667789
18 41 023455667789
6 42 18
4 43 248
1 44 5
Bandingkan Gambar 2.5.3.2 dengan hasil yang diberikan dari pelaksanaan perintah Minitab berikut:
MTB > STEM AND LEAF C1;
SUBC> INCREMENT 2.
Stem-and-leaf of KPROTEIN N = 79
Leaf Unit = 1.0

2 3 23
5 3 455
21 3 6666677777777777
25 3 8888888888888899999999999
33 4 000000000000000111111111111
6 4 22333
1 4 4

Statistik-statistik Senarai
Perhatikan statistik-statistik senarai yang didapat dari penggunaan perintah DESCRIBE terhadap data “LnZOOPLT” yang disajikan di bawah ini.
2.48491 3.55535 3.58352 3.66356 3.76120 3.76120 3.89182
3.91202 3.95124 4.07754 4.17439 4.18965 4.18965 4.20469
4.21951 4.26268 4.27667 4.31749 4.34381 4.35671 4.36945
4.36945 4.36945 4.36945 4.36945 4.40672 4.44265 4.44265
4.45435 4.45435 4.48864 4.48864 4.48864 4.49981 4.52179
4.53260 4.54329 4.55388 4.56435 4.56435 4.59512 4.60517
4.61512 4.62497 4.63473 4.65396 4.74493 4.76217 4.81218
4.91998 4.91998 4.93447 4.94876 4.94876 4.94876 4.96981
4.96981 5.00395 5.03695 5.11799 5.13580 5.14166 5.14749
5.17048 5.18178 5.18739 5.19296 5.19296 5.20401 5.20949
5.22036 5.23111 5.23111 5.23644 5.24175 5.24702 5.25750
5.26269 5.26269 5.26786 5.26786 5.29330 5.30827 5.31321
5.33754 5.33754 5.34711 5.34711 5.36129 5.38907 5.40268
5.40717 5.41165 5.43372 5.46383 5.47227 5.48480 5.48894
5.49717 5.52146 5.52146 5.54518 5.55683 5.56834 5.58350
5.60212 5.60212 5.60580 5.65599 5.69709 5.70378 5.70378
5.75257 5.78074 5.78383 5.84064 5.85220 5.85507 5.88053
5.88053 5.91350 5.99396 6.03069 6.09131 6.13340 6.14847
6.16752 6.37161 6.45205 6.59304 6.60530 6.64118 6.65286
6.81124 7.11151 7.16858 7.22475 7.40001 7.76684 7.95085
Data dari n = 140 botol spesimen dengan perintah SORT telah diurutkan mulai dari nilai yang terkecil berturut-turut sampai dengan yang terbesar.
Dari tayangan di atas diketahui bahwa ymin = 2.48491 dan ymax = 7.95085. Beda antara ymax dan ymin yaitu dalam hal ini 7.95085 - 2.48491 = 5.46594 dinamakan sebagai lebar rentang data. Sedangkan rataan data ditentukan dari = = = 5.1753. Periksa bahwa nilai rataan data yang didapat kebetulan tidak dimiliki oleh objek pengamatan.
Kuartil pertama (Q1) adalah suatu nilai yang membagi n = 140 data ke dalam dua bagian, yaitu yang bernilai  Q1 adalah sebanyak data dan yang bernilai > Q1 adalah sebanyak n - data. Kita lihat bahwa = 35. Jadi, Q1 ialah data terurut yang ke-35 yaitu Q1 = y(35) = 4.52179.
Median (Me) adalah adalah kuartil kedua (Q2), yaitu nilai yang membagi n = 140 data sama banyak. Dalam hal ini ialah data terurut yang ke 70. Jadi, Me = y(70) = 5.20949. Kuartil ketiga (Q3) dalam hal teladan ini ialah y(105) = 5.58350. Dari teladan ini kita lihat bahwa < Me.
Perhatikan bahwa nilai-nilai Q1, Me , dan Q3 yang kita dapat sedikit berbeda dengan keluaran yang diberikan dari penggunaan perintah DESCRIBE seperti disajikan di bawah ini.
MTB > Describe 'LnZOOPLT'
Descriptive Statistics

Variable Min Max Q1 Q3
LnZOOPLT 2.4849 7.9509 4.5245 5.5975

Variable N Mean Median Tr Mean StDev SE Mean
LnZOOPLT 140 5.1753 5.2149 5.1461 0.8654 0.0731
Ini terjadi karena perbedaan terhadap definisi yang umum digunakan. Yaitu, untuk n genap median data ditentukan dari
Me =
Sedangkan untuk n gasal Me = . Selanjutnya Q1 ditentukan sebagai median dari gugus data ((ymin; Me)) dan Q3 ditentukan sebagai median dari gugus data ((Me; ymax)).
Kuartil artinya perempatan. Sedangkan desil, persentil dan permil masing-masing adalah persepuluhan, perseratusan dan perseribuan. Secara umum, istilah-istilah tersebut dinamakan kuantil. Suatu kurva frekuensi-frekuensi kumulatif nisbi sering digunakan dalam memperkira-kan kuantil data.
Beda antara kuartil ketiga dan kuartil pertama, IR = Q3 - Q1, dinamakan sebagai rentang antarkuartil. Lima puluh persen dari banyaknya data dalam contoh (populasi) dicakup dalam rentang IR. Rentang antar-kuartil ialah salah satu dari ukuran-ukuran keragaman data.
Bagan kotak-garis dibentuk dari lima ringkasan data, yaitu a, Q1, Me , Q3, dan b serta (jika ada) beberapa pencilan. Dalam hal ini, a adalah mana yang lebih besar antara y(1) dan Q1 - 1.5 IR, sedangkan b adalah mana yang lebih kecil antara y(n) dan Q3 + 1.5 IR. Pencilan adalah pengamatan yang bernilai lebih kecil daripada a atau lebih besar daripada b, yaitu pengamatan yang berlokasi jauh dari pola sebaran pemusatan data.
Berikut diberikan dua batasan lain yang cukup umum digunakan dalam mengenal apakah suatu pengamatan ialah suatu pencilan (outlier) , yaitu pengamatan yang memberikan:
(1) | | > c, c ialah suatu konstanta misalnya 2, 2.5, atau 3; sedangkan = , dalam hal ini dan masing-masing ialah rataan dan simpangan baku data,
(2) n < 0.1; dalam hal ini  ditentukan dari tabel fungsi kepekatan normal baku Z, yaitu dari P[Z > ] dengan adalah seperti dibatasi dalam butir (1).
Pencilan-pencilan adalah pengamatan-pengamatan ekstrim. Dalam praktik perlu diperiksa apakah suatu pencilan merupakan kejadian mustahil. Jika demikian halnya maka pencilan tadi tidak digunakan dalam analisis data. Tetapi, jika pencilan itu merupakan kejadian mungkin (walaupun jarang terjadi) peneliti harus memeriksa kembali datanya. Mungkin terjadi kekeliruan dalam pengukuran, pencatatan pengamatan atau pengutiban data. Dalam beberapa bidang ilmu-pengetahuan pencilan-pencilan dari kejadian-kejadian langka yang mungkin bahkan dicari-cari sebagai temuan yang boleh jadi berharga.
Berbeda dengan median, rataan peka terhadap adanya pencilan lebih-lebih yang sangat ekstrim. Oleh karena itu penggunaan statistik rataan sebagai suatu ringkasan data tidak dianjurkan untuk data menyebar jauh dari setangkup.
Ada beberapa teknik yang dapat digunakan untuk koreksi rataan jika gugus data mengandung pencilanpencilan yang tidak dapat diabaikan. Bagan kotak-garis dapat digunakan untuk memeriksa kesetangkupan dan secara kasar untuk kenormalan sebaran data. Ciri-ciri data menyebar normal antara lain adalah:
Nilai-nilai modus, rataan, dan median sama besarnya. Dengan perkataan lain, modus, rataan, dan median berlokasi sama.
Sebaran data setangkup: Me - Q1 = Q3 - Me dan Q1 - y(1) = y(n) - Q3. Masing-masing dari keempat rentang tersebut mencakup 25 % dari banyaknya data pengamatan.
Karena P[Q1 < Z Simpangan baku (StDev) ditentukan dari . Ini terutama benar untuk simpangan baku contoh atau simpangan baku populasi terhingga. Untuk populasi tak-terhingga pembagi yang digunakan adalah n, bukan n – 1. Galat baku atau simpangan baku rataan-rataan (SE Mean) ditentukan dari .
Rataan dipancung ditentukan dari pereduksian gugus data, yaitu setelah sejumlah yang dikehendaki dari pencilan-pencilan ditiadakan dari perhitungan rataan data. Jika nilai rataan dapat dipandang sebagai tidak banyak berbeda dengan nilai rataan dipancung maka pengaruh dari keberadaan pencilan-pencilan masih dapat ditenggang.
Teladan 2.5.3.2
Plot matriks
Sering diperlukan dalam analisis simultan dengan banyak peubah kontinyu dengan menggunakan keterangan dari suatu matriks korelasi antar peubah-peubah.
MTB > MatrixPlot 'PAPAITAN'-'JAMARAK' 'SMUTCNTG';
SUBC> Symbol;
SUBC> Lowess;
SUBC> Color 2;
SUBC> Title "Plot Matriks Populasi Semut Cantang";
SUBC> Title "dan Populasi Empat Jenis Rumput Habitat";
SUBC> Axis 1;
SUBC> Axis 2.



Perhatikan grafik garis LOWESS (LOcally WEighted Scatterplot Smoothing) yang diberikan untuk masing-masing plot hubungan antar peubah-peubah. Dalam hal teladan ini adalah antar populasi semut ‘cantang’ dan populasi-populasi dari empat jenis rerumputan.

Teladan 2.5.3.3
Graf-graf hubungan
Di bawah ini disajikan teladan grafik-grafik hubungan bobot lahir bayi pada partus ibunya untuk masing-masing dari tiga kelas tinggi badan ibu.




Data Tak-bebas pada Waktu
Perhatikan misalnya peubah-peubah yang umum direkam di suatu stasiun meteorologi dalam memantau kondisi-kondisi harian cuaca: awan, radiasi surya, suhu udara, kecepatan angin, evaporasi, kelengasan nisbi udara dan curah hujan. Beberapa dari peubah-peubah tersebut masing-masing bahkan diuraikan lagi menurut pukul-pukul tertentu pengamatan-pengamatan berulang .
Data suatu peubah kondisi-kondisi cuaca tertata dalam seri waktu. Dalam seri waktu data peubah bersifat statistis tak-bebas, yaitu biasanya dikenal sebagai ”persisten” (Wilks, 1995). Oleh karena itu, penyajian n data suatu peubah kondisi-kondisi cuaca atau ringkasan-ringkasannya adalah pada suatu satuan waktu.
Agregasi-agregasi n data curah hujan harian misalnya dalam dasahari-dasahari, bulan-bulan atau tahun-tahun almanak menghasilkan peubah bentukan yang bermakna: curah hujan dasaharian, curah hujan bulanan atau curah hujan tahunan. Peubah-peubah bentukan lainnya misalnya adalah hari hujan bulanan dan hari hujan tahunan.
Berikut diberikan sebuah teladan sajian grafis sebaran curah hujan harian tertinggi dari bulan ke bulan dalam periode Tahun 1975 s/d Tahun 1988 berdasarkan hasil pemantauan di Stasiun Agroklimat Sukamandi, Jawa Barat.


Sedangkan di bawah ini adalah sebuah teladan sajian grafis sebaran curah hujan bulanan dalam 14 tahun.


Tiap bagan kotak-garis dalam teladan pertama menggambarkan sebaran 14 data curah hujan harian tertinggi dalam suatu bulan dari Tahun 1975 s/d Tahun 1988. Sedangkan dalam teladan kedua tiap bagan kotak-garis menggambarkan sebaran curah hujan bulanan. Perhatikan kesetangkupan sebaran dalam kuartil-kuartil dalam (inner quartiles) dan kuartil-kuartil ekor. Perhatikan juga pola yang ditunjukkan oleh garis yang menghubungkan median-median data atau statistik-statistik dari bulan ke bulan.
Teladan ketiga berikut melukiskan sebaran kumulatif curah hujan dasaharian dalam masing-masing tahun pemantauan.

Tiap grafik sebaran kumulatif merupakan kurva naik-monoton. Ujung kurva menunjukkan besar curah hujan tahunan. Perhatikan tingkat-tingkat kenaikan dari dasahari ke dasahari.
Data ”replicated over time”
Pengamatan untuk suatu peubah tidak jarang dilakukan berkali-kali. Yaitu, sebagai suatu pengukuran-pengukuran diulang terhadap objek(-objek) yang itu-itu juga. Atau terhadap objek-objek berbeda (replicated over time). Plot pada waktu dimaksudkan untuk mengetahui pola atau tren dari perubahan-perubahan: pertumbuhan, perkembangan atau fluktuasi.
Di bawah ini diberikan sebuah teladan penyajian ringkasan data ‘replicated over time’ lama penggunaan antibiotik profilaksis


oleh total 1170 pasien bedah dengan luka operasi dari kategori “bersih” dalam suatu rentang waktu 85 minggu di Rumah Sakit Cipto Mangunkusumo, Jakarta. Intervensi manajemen terhadap para dokter bedah dilakukan dalam minggu ke 28, 41, 54 dan 73. Intervensi dimaksudkan sebagai usaha untuk mengubah sikap para dokter agar dalam memberikan resep antibiotik menjadi lebih proporsional. Perhatikan tren garis hubung median-median dalam periode sebelum intervensi dan ketika atau sesudah suatu kali intervensi pada gambar di bawah ini. Perhatikan juga lebar kotak-kotak yang bervariasi yang menunjukan perbedaan dalam banyaknya pasien dalam periode empat mingguan.

Teladan 2.5.3.4
Di bawah ini diberikan teladan penyajian data menurut waktu dengan menggunakan perintah TSPlot.
MTB > TSPlot 'MLANTIB0';
SUBC> Index;
SUBC> TDisplay 11;
SUBC> Start -22;
SUBC> Symbol;
SUBC> Connect;
SUBC> Lowess;
SUBC> Title "LAMA PEMBERIAN ANTIBIOTIKA
TERHADAP PASIEN OPERASI BEDAH";
SUBC> Title "Empat kali intervensi/Sugesti terhadap Dokter";
SUBC> Title "KASUS LUKA BERSIH";
SUBC> Axis 11;
SUBC> Label "Sebelum vs Sesudah Intervensi (minggu)";
SUBC> Axis 2;
SUBC> Label "Median konsumsi antibiotika (hari)";
SUBC> Grid 11;
SUBC> Grid 2.















Dalam hal data teladan yang digunakan, untuk suatu satuan waktu pengamatan data mentah sebenarnya adalah ber’replication’ dan dari waktu ke waktu objek-objek pengamatan adalah berbeda individu. Untuk menggunakan perintah-perintah dari menu utama STAT  TIME SERIES di sini lebih dipertimbangkan untuk menggunakan ringkasan data berupa median daripada rataan data.
Berikut diberikan sebuah teladan memperoleh statistik-statistik: frekuensi-frekuensi nisbi (dalam % lajur), rataan-rataan dan simpanganbaku-simpangan baku bobot lahir bayi untuk suatu tabel: 3 (kelas tinggi badan) x 4 (kelas partus) dari 1280 ibu.
MTB > Table 'KLTINGGI' 'KLPARTUS';
SUBC> ColPercents;
SUBC> Means 'BOBOTLHR';
SUBC> StDev 'BOBOTLHR'.
Tabulated Statistics

Rows: KLTINGGI Columns: KLPARTUS
1 2 3 4 All
1 47.48 48.63 50.92 41.38 48.67
273.44 292.15 298.96 288.37 290.43
32.88 38.00 34.35 31.57 36.86
2 51.68 50.91 48.16 58.62 50.70
286.15 304.08 305.81 314.03 301.62
37.03 39.64 41.59 40.25 40.35
3 0.84 0.46 0.92 -- 0.62
295.00 321.33 345.67 -- 323.87
21.21 35.85 47.61 -- 39.03
All 100.00 100.00 100.00 100.00 100.00
280.19 298.36 302.69 303.41 296.31
35.51 39.26 38.37 38.76 39.11


Cell Contents --
% of Col
BOBOTLHR:Mean
StDev

Catatan
Kelas tinggi badan:
1 = tinggi 149 cm; 2 = 149 cm < tinggi 163 cm; 3 = tinggi > 163 cm
Kelas partus (frekuensi melahirkan):
1 = partus = 1x; 2 = 2x partus 4x;
3 = 5x partus 8x; 4 = partus > 8x
Teladan 2.5.3.5
Plot tepi
Berikut diberikan suatu teladan plot dwipeubah dengan plot tepi berupa histogram data tekanan darah sistolik dan diastolik dari 1735 ibu sedang mengandung. Data diangkat dari hasil Studi Tindak-lanjut Ibu Hamil, yang merupakan suatu bagian dari suatu Survei Kesehatan Rumahtangga dan Demografi yang diselenggarakan oleh Departemen Kesehatan bekerja sama dengan Biro Pusat Statistik dalam tahun 1994.
MTB > %Margplot 'SISTOL-2' 'DIASTOL2';
SUBC> title "PLOT DWI-PEUBAH TEKANAN DARAH IBU HAMIL";
SUBC> xlabel "Tekanan Darah Diastol (mm Hg)";
SUBC> ylabel "Tekanan Darah Sistol (mm Hg)".
Executing from file: C:\MTBWIN\MACROS\Margplot.MAC
Macro is running ... please wait
Dari kedua histogram di atas tampak bahwa sebaran data tekanan darah sistol dan diastol agak menjulur ke kanan. Dengan perkataan lain, sebaran kedua jenis data tersebut lebih memusat kepada nilai-nilai yang lebih rendah.
Data tekanan darah sistol dan diastol dari ibu-ibu hamil tersebut tidak dapat dianggap menyebar normal. Dalam hal ini, karena sebaran data tidak setangkup, rataan bukan merupakan ukuran pemusatan data yang baik.
Tetapi, peringkasan dan penyajian data di atas tadi mungkin tidak banyak maknanya di mata para ahli kesehatan. Menurut kesepakatan yang berlaku umum di kalangan para ahli kesehatan internasional, untuk tekanan darah sistolik (TDS) dan diastolik (TDD) seseorang dapat digolongkan ke dalam salah satu dari pengkelasan serempak sebagai berikut:
Tek. Drh =
Perintah dan anakperintah Minitab di bawah ini dapat digunakan untuk keperluan peringkasan data berdasarkan pengkelasan telah dikemukakan di atas ke dalam bentuk suatu tabel dwikasta. Penyajian dapat disempurnakan lagi sesuai ketentuan baku yang berlaku. Di sini cara pengkelasan TDS maupun TDD dengan menggunakan perintah LET dan CODE dari Minitab tidak ditunjukkan.
MTB > TABLE C169 C170; SUBC> COUNT; SUBC> TOTPCT. Tabulated Statistics Rows: KLSISTOL Columns: KLSDIAST 1 2 3 4 All
1 51 18 1 2 72
3.71 1.31 0.07 0.15 5.23
2 125 1142 0 10 127
9.08 82.99 -- 0.73 92.81
3 0 5 0 9 14
-- 0.36 -- 0.65 1.02
4 1 4 0 8 13
0.07 0.29 -- 0.58 0.94
All 177 1169 1 29 1376
12.86 84.96 0.07 2.11 100
Cell Contents –
Count
% of Tbl

Tidak ada komentar:

Posting Komentar