Mari Belajar IPS: Reliabilitas Suatu Tes

Oleh Muhammad Abdul Aziz

Jurusan Pendidikan IPS Universitas Negeri Yogyakarta

BAB I

PENDAHULUAN

A. Latar Belakang Masalah

Hasil belajar dan proses belajar tidak hanya dinilai oleh tes, baik melalui bentuk tes uraian maupun tes objektif, tetapi juga dapat dinalia dengan alat non tes atau bukan tes. Alat –alat bukan tes yang sering digunakan antara lain ialah kuesioner dan wawancara, unjuk kerja, skala (penilaian, sikap, minat), observasi atau pengamatan, study kasus, dan sosiometri.

Di Indonesia, banyak sekali para peneliti ataupun bukan peneliti yang banyak melakukan sebuah riset guna memenuhi tugas ataupun sebagai pembuktian dari sebuah kejadian. Yang dimana setiap penelitian tersebut biasanya memerlukan sebuah pengujian agar nantinya mampu menjadi sebuah hasil ilmiah yang benar-benar valid dan bersifat riel tanpa adanya kebohongan ataupun ketidaknyataan yang mengesankan data yang diperoleh bersifat dibuat-buat. Agar kajian kita bisa bersifat riel maka kita sebagai seorang peneliti harus menguji terlebih dahulu hasil penelitian kita yang disebut dengan uji reabilitas.

Uji reliabilitas mampu menunjukkan tingkat kepercayaan terhadap sekor atau tingkat kecocokan sekor dengan sekor sesungguhnya. Rebilitas ini bisa dicapai melalui tingkat kecocokan di antara sekor pada lebih dari sekali pengukuran. Jika makin cocok dengan sekor sesungguhnya maka makin tinggi tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu merupakan kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap ada, namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak berpengaruh terhadap hasil akhir dari sebuah pengujian.

B. Rumusan Masaah

1. Bagaimana Pengertian dan Jenis Reliabilitas?

2. Bagaimana Metode metode dan pengaruh reliabilitas?

3. Bagaimana Perhitungan Reliabilitas dan Membuat Instrument tes yang relaiabel?

C. Tujuan

1. Untuk mengetahui pengertian dan jenis reliabilitas.

2. Untuk mengetahui metode dan pengaruh reliabilitas.

3. Untuk mengetahui perhitungan dan membuat tes yang reliabel.

BAB II

PEMBAHASAN

A. Pengetian dan Jenis Reliabilitas

1. Pengertian

Reliabilitas diartikan dengan keajekan (konsistensi) bila mana tes tersebut diuji berkali-kali hasilnya relatif sama, artinya setelah hasil tes yang pertama dengan tes yang berikutnya dikorelasikan terdapa hasil korelasi yang signifikan. Ada juag yang mengartikan dengan keandalan (reliability) artinya ketetapan/ketelitian suatu alat evaluasi. Suatu tes/alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif. Jadi yang dipentingakan disini adalah ketelitian sejauh mana tes/alat tersebut dapat dipercaya kebenarannya. Reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat penilain tersebut digunakan akan memberikan hasil yang relatif sama.

Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil pada saat yang berlainan waktunya terhadap siswa yang sama. Misalnya siswa kelas V pada hari ini di tes kemampuan matematikanya. Minggu berikutnya siswa tersebut di tes kembali. Hasil dari ke dua tes relatif sama. Sungguhpun demikian, masih mungkin terjadi ada perbedaan hasil untuk hal-ha tertentu akibat faktor kebetulan, selang waktu, atau terjadinya perubahan pandangan siswa terhadap soal yang sama. Jika itu terjadi, kelamahan terletak pada tes itu, yang tidak memiliki kepastian jawaban atau meragukan siswa. Dengan kata lain, derajat reliabilitasnya masih rendah.

2. Jenis Reliabilitas

a. Reliabilitas stabil (stability reliability)

Mengacu pada waktu. Untuk menentukan stabilitas, tes dilakukan ulang terhadap variabel yang sama di waktu yang berlainan. Hasil pengujian tersebut akan dibandingkaan dan berkorelasi dengan pengujian awal untuk memberikan stabilitas.

b. Reliabilitas terwakili (representative reliability)

Mengacu pada keterandalan masing-masing grup. Menguji apakah penyampaian indikator sama jawabannya saat diterapkan kekelompok yang berbeda-beda.

c. Reliabilitas seimbang (equivalence reliability)

Menerapkan banyak indikator yang dapat dioperasionalisasikan ke semua konsepsi pengukuran. Kesetaraan keandalan akan menggunakan dua instrumen untuk mengukur konsep yang sama pada tingkat kesulitan yang sama. Reliabilitas atau tidaknya pengujian akan ditentukan dari hubungan dua skor instrumen, atau lebih dikenal dengan hubungan antara variabel bebas (independen variable) dengan variabel terikat (dependen variable).

B. Metode dan Pengaruh Reliabilitas

1. Methode-Methode Yang Digunakan Untuk Mengetahui Tingakat Reliabilitas

Kehandalan suatu tes dinyatakan dengan coefisient of reliability (r), yaitu dengan jalan mencari korelasi misalnya:

a. Dengan metode dua tes

Yaitu 2 tes yang paralel dan setaraf (ekuivalue) diberikan kepada sekelompok anak. Hasil kedua tersebut kemudian dicari korelasinya.

b. Dengan metode satu tes

Yaitu sebuah tes diberikan 2 kali kepada sekelompok murid yang sama tetapi dalam waktu yang berbeda.kedua hasil tes itu kemudian dicari korelasinya.

c. Metode spit half (masih dengan 1 tes)

Yaitu suatu tes dibagi menjadi 2 bagian yang sama tingakat kesukarannya, sama isi dan bentuknya kemudian dilihat skor masing-masing bagian. Dan dicari korelasinya
Cara membagi mislnya dengan jalan semua item yang bernomor genap untuk tes A Semua yang yang bernomor ganjil untuk tes B. Setelah kita mendapat korelasi antar setengah tes yang pertama (tes A) dan setengah tes yang ke kedua (tes B) untuk menghitung keadaan seluruh tes itu digunakan rumus sebagai berikut:
Keadaan seluruh tes(r) : 2x (reliability half test)
1+ (reliabelity half test)

d. Termasuk “Split Half Method

Yaitu dengan cara yang lain yang tidak memerlukan perhitungan korelasi, yaitu sebagi berikut. Dengan menggunakan deviasi standar masing masing-masing dari ke 2 bagian tes dan deviasi standart seluruh tes, rumusnya:

R = 2 (1-SI2 + SII2)

S2t

Ket : SI : Ds dari ½ tes yang pertama

SII : Ds dari ½ tes yang ke kedua

St : Ds dari seluruh tes

e. Methode kuder-Richardo

Yaitu penerapan methode ini dengan persyaratan penggunaan skor dengan dua kemungkinan yaitu skor 1 untuk jawaban benar dan skor 0 untuk jawaban salah. Pada methode ini ada KR-20 dan KR-21:

KR-21 : r = n (s2t-npq)

n-1 s2t

KR-20 : r = n (s2t-pq)

n-1 s2t

ket : n = jumlah item dalam tes

St = Ds untuk seluruh tes

P = man dibagi jumlah item

q = 1-p

f. Methode koefisian alpha

Metode ini digunakan pada soal-soal yang tidak bisa dilakukan dengan penskoran 1 atau nol seperti dalam bentuk tes essai. Jadi tidak bisa diterapkan pada butir-butir yang tidak bisa diskor secara dikotomis, melainkan berbentuk rentangan.

g. Methode perkiraan

Dengan menggunakan dua macam tabel, satu tes yang dikatagorikn sebagai tes mudah dan satu lagi untuk tes yang sulit. Cara menghitunt ini dapoat dilakukan berdasarkan jumlah butir soal (n), rataan (r), dan simpangan baku (SB)

R= (SX: N)

X= Skor

N= Banyaknya sekor yang dihitung

SB= (Sx2 : N)

X = selisih antara suatu skor dengan R

2. Pengaruh Reliabilitas pada Suatu Tes

Tingkat reliabilitas suatu instrumen atau tes dipengaruhi oleh banyak hal antara lain:

a. Jumlah butir soal, banyaknya soal pada suatu instrumen ikut mempengaruhi derajat reliabilitasnya, dengan semakin banyaknya soal-soal maka tes yang bersangkutan cenderung untuk menjadi semakin reliabel, sebagaimana yang dinyatakan dalam rumus spearmen-brown.

Hubungan antar jumlah butir dengan rekiabilitas dapat dilihat pada keadaan berikut:

Jumlah Butir Reliabilitas

5 0,20

10 0,33

20 0,50

40 0,67

80 0,80

160 0,89

320 0,94

640 0,97

Gambaran diatas menunjukkan bahwa semakin tinggi tingakat reliabilitas instrumen, semakin sedikit peningakatan yang terjadi akibat pelipat gandaan butirnya. Gejala yang terlihat dari pemakaian rumus tersebut akan berlaku apabila dua asumsinya terpenuhi, yaitu

1) Butir-butir instrumen yang ditambahkan tersebut memiliki karakteristik yang sama dengan butir-butir yang sudah ada, misalnya tidak lebih mudah atau lebih sulit.

2) Subjek yang mengisi instrumen atau mengerjakan test tersebut tidak erpengaruh secra psikologis dengan bertambahnya jumlah butir-butir, misalnya tidak menjadi lelah dan lain sebagainya.

3) Homoginitas soal test, soal yang memiliki homoginitas yang tinggi cenderung mengarah kepada tingginya tingkat reliabilita. Dua buah test yang sama butirnya akan tetapi berbeda isinya, misalnya yang satu mengukur pengetahuan kebahasaan dan yang lainya mengukur kemampuan fisika akan menghasilkan tingkat reliabilitas berbeda. Test fisika cederung menghasilka tingkat reliabilitas yang lebih tinggi daripada test kebahasaan karena dari segi isi kemampuan menyelesaikan soal fisika lebih homogen daripada pengetahuan kebahasaan.

4) Waktu yang diperluka untuk menyelesaikan test, semakin terbatasnya waktu dalam pengejaan test maka akan mendorong test untuk cenderung memiliki reliabilitas yang tinggi, hl ini terutama apabila realiabilitas diperoleh dengan cara splithalf (belah dua).

5) Keseragaman kondisi pada saat test diberikan, kondisi pelaksanaan test yanhg semakin seragam akan memunculkan reliabilitas yang semakin tinggi.

6) Kecocokan tingkat kesukaran terhadap peserta test

7) Heteroginitas kelompok, bahwa semakin hiterogen suatu kelompok dalam pengerjaan suatu test maka test terebut semakin cenderung untuk menunjukan tingkat reliabilitas yang tinggi

8) Variabel skors instrumen yang mengahasilkan rentangan skor yang lebih luas atau lebih tinggi variabilitasnya akan memiliki tingkat reliabilitas yang lebih tinggi daripada yang menghaslkan menghsilkan rentang skor yang lebih sempit. Seperti test bentuk pilihan ganda cenderung menghasilakan tingkat reliabilitas lebih tinggi dari pada test bentuk benar salah.

Faktor-faktor yang dapat mempengaruhi keadaan suatu tes:

a. Luas tidaknya sampling yang diambil

b. Perbedaan bakat kemampuan murid yang dites.

c. Suasana atau kondisi testing

d. Kehandalan tes

e. Motivasi individu

C. Perhitungan dan Tes yang Reliabel

1. Perhitungan Reliabilitas

Reliabilitas Tes Objektif

Menentukan koefisien reliabilitas tes objektif dapat dilakukan dengan 2 cara, yaitu:

a. Teknik Belah Dua

Teknik belah dua adalah teknik analisis yang digunakan dengan cara instrumen tes objektif dibelaj menjadi dua bagian yang sama, artinya jumlah soal yang harus dianalisis memiliki jumlah soal yang genap (agar terbagi rata), berikut ini beberapa fungsi (formula) yang digunakan dalam menentukan koefisien reliabilitas dari teknik belah dua, yaitu:

1) Formula Spearman-Brown

Langkah pertama yang dilakukan adalah menghitung reliabilitas bagian (setengah) instrumen tes objektif tersebut, dengan rumus:

Jika reliabilitas bagiannya telah ditemukan maka langkah selanjutnya adalah menghitung nilai koefisien reliabilitasnya dengan rumus:

Keterangan:
n adalah banyaknya subjek

X1 adalah data belahan pertama

X2 adalah data belahan kedua

2) Formula Rulon

Konsep formula Rulon adalah perbedaan antara skor yang diperoleh subjek pada belahan pertama dengan belahan kedua, perbedaan ini dipandang sebagai galat (error) dari instrumen tes objektif. Persamaan yang digunakan adalah:

Dengan:

3) Formula Flanangan

Koefisien reliabilitas menurut Flanangan berdasarkan pada varians masing-masing belahan dan varians totalnya. Dengan formula, sebagai berikut:

b. Teknik Non Belah Dua

Uji reliabilitas dengan teknik non belah dua dikembangkan oleh Kuder dan Richardson, hasil pengembangan ini kemudian disebut dengan rumus KR-20 dan KR-21.

1) Formula KR-20

Rumus yang digunakan adalah:

Keterangan:
r11 : Reliabilitas tes secara keseluruhan

p : proporsi subjek yang menjawab benar butir soal ke-i

q : proporsi subjek yang menjawab salah butir soal ke-I (q = 1 – p)

Jum.pq : Jumlah hasil kali p dan q

n : Banyaknya item

S : Standar deviasi (akar varians)

2) Formula KR-21

Rumus yang digunakan adalah:

Keterangan:
n : Banyaknya item

Xt : Rerata skor total

2. Tes yang Reliabel

Reliabilitas dan kehandalan suatu tes memberikan informasi tentang besarnya kesalahan pengukuran. Kehandalan pengukuran dapat dikategorikan menjadi 3 kehandalan pengukuran yaitu kehandalan internal, stabilitas dan antar penilai. Besarnya indeks konsistensi diperoleh dari hasil tes, karena untk mencari indeks ini cukup dilakukan 1 kali tes. Indeks stabilitas merupakan tingkat kestabilan hasil pengukuran yang dilakukan paling tidak dua kali untuk orang yang sama. Dalam waktu yang berbeda, dengan asumsi bahwa tidak ada efek tes. Kehandalan antarpenilai diperoleh dari besarnya korelasi hasil penyekoran dari dua orang terhadap lembar jawaban tes yang sama.

Besarnya indeks reliabilitas ini adalah 0 sampai 1 dan yang dapat diterima minimum adalah 0,7. Semakin reliabel suatu tes berarti kesalahan pengukurannya semakin kecil. Besarnya indek reliabilitas digunakan untuk menghitung besarnya kesalahan pengukuran. Kesalahan pengukuran ada dua: secara acak dan secara sistematik. Secara acak berarti kesalahan karena kondisi yang diukur dan yang mengukur bervariasi dan pemilihan bahan yang diujikan tidak tepat. Sedangkan kesalahan sistematik karena alat ukur atau penyekorannya yang cenderung murah atau mahal untuk semua peserta didik.

Cara Meningkatkan Reliabilitas:

a. Mengonsep satu variabel dengan jelas.

Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat suatu level pengukuran, maka variabel yang dibuat akan semakin reliabelkarena informasi yang dimiliki semakin mendetail. Prinsip dasarnya adalah cobalah melakukan pengukuran pada level paling tepat yang mungkin diperoleh.
Gunakan lebih dari satu indikator. Dengan adanya lebih dari satu indikator yangspesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas terhadap konten definisi konseptual.
Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah pengukuran sebelum menuju ke tahap hipotesis (pretest). Dalam penggunaan Pilot Studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan oleh peneliti terdahulu dari literatur-literatur yang berkaitan. Selanjutnya , pengukuran terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.

BAB III

PENUTUP

A. Simpulan

Reliabilitas diartikan dengan keajekan (konsistensi) bila mana tes tersebut diuji berkali-kali hasilnya relatif sama, artinya setelah hasil tes yang pertama dengan tes yang berikutnya dikorelasikan terdapa hasil korelasi yang signifikan.Jenis-jenis uji reliabilitas yang dibagi menjadi 3 jenis yaitu : Reliabilitas Stabil(Stability Reliability); Reliabilitas Terwakili (Representative Reliability);Reliabilitas Seimbang (Equivalence Reliability.

Methode-methode yang diguanakan untuk mengukur tingakat reliabel antara lain: Dengan metode dua tes, Dengan metode satu tes, Metode spit half (masih dengan 1 tes), Dengan methode kuder-Richardo. Tingkat reliabilitas suatu instrumen atau tes dipengaruhi oleh banyak hal antara lain: Jumlah butir soal, Homoginitas soal test, Waktu yang diperluka untuk menyelesaikan test, Keseragaman kondisi pada saat test diberikan, Kecocokan tingkat kesukaran terhadap peserta test, Heteroginitas kelompok, Motivasi individu.

Perhitungan reliabilitas tes yang objektif terdiri dari perhitungan belah dua dan non belah dua. Reliabilitas dan kehandalan suatu tes memberikan informasi tentang besarnya kesalahan pengukuran. Kehandalan pengukuran dapat dikategorikan menjadi 3 kehandalan pengukuran yaitu kehandalan internal, stabilitas dan antar penilai.

B. Saran

Tingkat kesukaran dari suatu tes berbeda-beda bagi siswa, oleh karenanya tingkat reliabilitasnya pun juga akan tidak sama, hal tersebut memerlukan tindakan uji coba tes yang berkelanjutan.

DAFTAR PUSTAKA

Arikunto, Suharsimi. 2002. Prosedur Penelitian : Suatu Pendekatan Praktek. Jakarta: Rineka Cipta.

Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

Fuadi, Atok. 2006. Sistem Pengembangan Evaluasi. Ponorogo: ponorogo press.

Purwanto, Ngalim. 2002. Prinsip-prinsip Dan Teknik Evaluasi PengajaranBandung: Remaja Rosdakarya.

Saifuddin, Azwar. 2003. Reliabilitas dan Validitas. Yogyakarta: Pustaka pelajar.

Sudjana, Nana. 1995. Penilaian Hasil Proses Belajar Mengajar. Bandung: RemajaRosdakarya.

http://evaluasipendidikan.blogspot.com/2008/04/reliabilitas-pendekatan-tes-ulang_10.html diakses pada 9 November 2011.

http://kti-skripsi.blogspot.com/2009/06/metode-analisis-data.html diakses pada 9 November 2011.

http://widhiarso.staff.ugm.ac.id/files/bab_2_estimasi_reliabilitas_via_spss.pdf diakses pada 9 November 2011.

http://id.wikipedia.org/wiki/Reliabilitas diakses pada 9 November 2011.

Mari Belajar IPS

Kamis, 21 November 2013

Reliabilitas Suatu Tes

Tidak ada komentar:

Posting Komentar