Selasa, 29 September 2009

PERFORMANCE ASSESSMENT

PENILAIAN KINERJA (PERFORMANCE ASSESSMENT)


Definisi:
Danielson S. A Collection of Performance Task And Rubriks. http://www.assesment.com/Danielson/ 10/4/2006, mendefinisikan penilaian unjuk kerja sebagai “Performance assesment means any assesment of student learning that requires the evaluation of student writing, product, or behavior. That is, it includes all assesment with the exeption of multiple choice, matching, true/false testing, or problem with a single correct answer”.(penilaian unjuk kerja adalah penilaian belajar siswa yang meliputi semua penilaian dalam bentuk tulisan, produk atau sikap kecuali bentuk pilihan ganda, menjodohkan, benar-salah, atau jawaban singkat.
Fitzpatrick dan Morison (1971) berpandangan bahwa penilaian kinerja (performance assessment) sebenarnya tidak memiliki perbedaan yang begitu besar dengan tes lainnya yang dilaksanakan di dalam kelas, hal ini menurut mereka tergantung dari sejauhmana tes itu dapat mensimulasikan situasi dari kriteria-kriteria yang diharapkan.
Trespeces (1999) mengatakan bahwa “performance assessment” adalah berbagai macam tugas dan situasi dimana peserta tes diminta untuk mendemonstrasikan pemahaman dan pengaplikasian pengetahuan yang mendalam, serta keterampilan di dalam berbagai macam konteks. Jadi boleh dikatakan bahwa “performance assessment” adalah suatu penilaian yang meminta peserta tes untuk mendemonstrasikan dan mengaplikasikan pengetahuan ke dalam berbagai macam konteks sesuai dengan kriteria yang diinginkan.
Wangsatorntanakhum (1997) menyatakan bahwa assessment kinerja terdiri dari dua bagian yaitu “clearly defined task and a list of explicit criteria for assessing student performance or product”. Lebih lanjut dinyatakan pula bahwa assessment kinerja diwujudkan berdasarkan “empat asumsi” pokok, yaitu: 1) performance assessment didasarkan pada partisipasi aktif mahasiswa/siswa, 2) tugas-tugas yang diberikan atau dikerjakan oleh siswa/mahasiswa yang merupakan bagian yang tidak terpisahkan dari keseluruhan proses pembelajaran, 3) performance assessment tidak hanya untuk mengetahui posisi siswa pada suatu saat dalam proses pembelajaran, tetapi lebih dari itu, assessment juga dimaksudkan untuk memperbaiki proses pembelajaran itu sendiri, dan 4) dengan mengetahui lebih dahulu kriteria yang akan digunakan untuk mengukur dan menilai keberhasilan proses pembelajarannya, siswa akan secara terbuka dan aktif berupaya untuk mencapai tujuan pembelajaran.
Seringkali “performance assessment” ini dikaitkan dengan suatu kriteria yang diinginkan dalam praktek kehidupan sehari-hari. Hal tersebut dikenal dengan nama “Authentic Assessment (penilaian autentik)” Jadi pengertian dari “authentik assessment” ini selalu melibatkan peserta tes di dalam mengaplikasikan pengetahuan dan keterampilan yang diperlukan dalam praktek kehidupan mereka sehari-hari.

Karakteristik Penilaian Kinerja
Performance assessment memiliki karakteristik dasar yaitu : 1) peserta tes diminta untuk mendemonstrasikan kemampuannya dalam mengkreasikan suatu produk atau terlibat dalam suatu aktivitas (perbuatan), misalnya melakukan eksperimen untuk mengetahui tingkat penyerapan dari kertas tisue, 2) produk dari performance assessment lebih penting daripada perbuatan (performan)-nya. (Maertel, 1992)
Dalam hal memilih, apakah yang akan dinilai itu produk atau performance (perbuatan) tergantung pada karakteristik domain yang diukur (Messirh, 1994). Dalam bidang seni misalnya, seperti acting dan menari, perbuatan dan produknya sama penting, tetapi dalam creative writing mengukur produk adalah fokus yang utama.

Bagaimana mengetahui kualitas penilaian kinerja?
Untuk mengetahui apakah penilaian kinerja (performance assessment) dapat dianggap berkualitas atau tidak, terdapat tujuh kriteria yang perlu diperhatikan oleh evaluator. Ketujuh kriteria ini sebagaimana diungkap oleh Popham (1995) yaitu:
Generability : apakah kinerja peserta tes (students performance) dalam melakukan tugas yang diberikan tersebut sudah memadai untuk digeneralisasikan kepada tugas-tugas lain? Semakin dapat digeneralisasikan tugas-tugas yang diberikan dalam rangka penilaian keterampilan atau penilaian kinerja (”performance assessment) tersebut, dalam artian semakin dapat dibandingkan dengan tugas yang lainnya maka semakin baik tugas tersebut. Hal ini terutama dalam kondisi bila peserta tes diberikan tugas-tugas dalam penilaian keterampilan (performance assessment) yang berlainan.
Authenticity: apakah tugas yang diberikan tersebut sudah serupa dengan apa yang sering dihadapinya dalam praktek kehidupan sehari-hari?
Multiple foci: apakah tugas yang diberikan kepada peserta tes sudah mengukur lebih dari satu kemampuan-kemampuan yang diinginkan (more than one instructional outcomes)?
Teachability: apakah tugas yang diberikan merupakan tugas yang hasilnya semakin baik karena adanya usaha mengajar guru di kelas? Jadi tugas yang diberikan dalam penilaian keterampilan atau penilaian kinerja (performance assessment) adalah tugas-tugas yang relevan dengan yang dapat diajarkan guru di dalam kelas.
Fairness: apakah tugas yang diberikan sudah adil (fair) untuk semua peserta tes. Jadi tugas-tugas tersebut harus sudah dipikirkan tidak ”bias” untuk semua kelompok jenis kelamin, suku bangsa, agama, atau status sosial ekonomi.
Feasibility: apakah tugas-tugas yang diberikan dalam penilaian keterampilan atau penilaian kinerja (performance assessment) memang relevan untuk dapat dilaksanakan mengingat faktor-faktor seperti biaya, ruangan (tempat), waktu, atau peralatannya?
Scorability: apakah tugas yang diberikan nanti dapat diskor dengan akurat dan reliabel? Karena memang salah satu yang sensitif dari penilaian keterampilan atau penilaian kinerja (performance assessment) adalah penskorannya.

Langkah-Langkah Penilaian Kinerja

Beberapa langkah yang perlu diperhatikan dalam melakukan penilaian kinerja (performance assessment) adalah:
Identifikasi semua langkah-langkah penting yang diperlukan atau yang akan mempengaruhi hasil akhir (output) yang terbaik.
Tuliskan perilaku kemampuan-kemampuan spesifik yang penting dan diperlukan untuk menyelesaikan tugas dan menghasilkan hasil akhir (output) yang terbaik.
Usahakan untuk membuat kriteria-kriteria kemampuan yang akan diukur tidak terlalu banyak sehingga semua kriteria tersebut dapat diobservasi selama siswa melaksanakan tugas.
Definisikan dengan jelas kriteria kemampuan-kemampuan yang akan diukur berdasarkan kemampuan siswa yang harus dapat diamati (observable) atau karakteristik produk yang dihasilkan.
Urutkan kriteria-kriteria kemampuan yang akan diukur berdasarkan urutan yang dapat diamati
Kalau ada, periksa kembali dan bandingkan dengan kriteria-kriteria kemampuan yang sudah dibuat sebelumnya oleh orang lain di lapangan.
Untuk menjaga obyektifitas dan keadilan (fair) sebaiknya penilai atau evaluator lebih dari satu orang sehingga penilaian mereka menjadi lebih valid dan reliabel.

Masalah Validitas, Reliabilitas dan Fairness

a. Validitas
Kompleksnya tugas dan kemampuan yang akan diukur dalam performance assessment dapat menimbulkan masalah dalam penskoran dan keterwakilannya domain yang hendak diukur.
Suatu tugas dalam penilaian unjuk kerja atau kinerja yang kompleks tentunya memerlukan proses penilaian yang kompleks juga, dan sebaliknya ada tugas yang memerlukan lebih dari satu kemampuan, seperti kompetensi bahasa dan kemampuan matematik. Problem soalnya dalam matematika memerlukan domain pengetahuan yang relevan dan keterampilan dalam menggunakan informasi tentang komponen-komponen kemampuan yang akan diukur. Selain penskorannya juga harus direview untuk melihat sejauhmana penskoran tersebut sudah mencakup kemampuan yang kompleks.

b. Reliabilitas
Masalah reliabilitas juga menjadi pertanyaan pokok dalam penilaian unjuk kerja, yaitu sejauhmana skor siswa dapat merefleksikan kemampuan siswa yang sebenarnya (true ability) dan bukan akibat dari kesalahan pengukuran. Tujuan dari pengembang tes adalah mendesain penulisan, membuat kondisi pelaksanaan tes dan penskorannya tidak terhambat pada situasi yang tidak berkembang dengan kemampuan yang hendak diukur. Masalah pada penilaian performance biasanya adalah:
penskoran (rating) dari pemberi skor performance assessment.
Siswa tidak mengenali alat-alat performance assessment yang dimanipulasi.
Siswa tidak mengenal topik yang ditingkatkan dalam performance assessment.
Akan tetapi kesalahan yang disebabkan oleh penskor (rater) dapat diminimalkan apabila pedoman penskoran performance asssessment dibuat & didefinisikan sebaik mungkin dan juga sebelum dimulai penskoran diadakan pelatihan penskoran (rater) terlebih dahulu.

c. Fairness
Permasalahan yang berhubungan dengan fairness dalam performance assessment adalah 1) perbandingan dalam penulisan, 2) ketersediaan alat-alat yang diperlukan, 3) kesempatan untuk belajar atau berlatih. Apabila tugas dalam performance assessment ada beberapa pilihan, maka harus ada bukti validitas perbandingan dari tugas-tugas tersebut.

Sumber Kesalahan Penskoran dalam Penilaian Kinerja
Masalah utama dalam penilaian kinerja adalah masalah penskorannya. Dikarenakan banyak factor yang mempengaruhi pada hasil penskoran penilaian keterampilan atau penilaian kinerja (performance assessment). Masalah penskoran pada penilaian keterampilan atau penilaian kinerja lebih kompleks daripada penskoran pada bentuk soal uraian.
Popham (1995) menguraikan tiga sumber utama kesalahan penskoran penilaian kinerja, yaitu:
Masalah dalam instrument: instrumen pedoman penskoran tidak jelas sehingga sukar digunakan oleh penilai. Selain itu komponen-komponen yang harus dinilainya juga sukar untuk diskor, umumnya karena komponen-komponen tersebut sukar untuk diamati (unobservable). Hal yang demikian tentunya akan mengakibatkan hasil penskoran yang tidak valid, dan tidak akurat (tidak reliabel).
Masalah prosedural: prosedur yang digunakan dalam penilaian keterampilan atau penilaian kinerja tidak baik sehingga juga mempengaruhi hasil penskoran. Masalah yang biasanya terjadi adalah penskor (rater) harus menskor komponen-komponen yang terlalu banyak. Bagi penskor sebenarnya semakin sedikit komponen yang harus dinilai semakin baik, tetapi pembuat pedoman penskoran tetap harus membuat pedoman penskoran yang dapat mewakili semua komponen-komponen penting yang mempengaruhi kualitas hasil akhir. Masalah lain dari prosedur ini adalah umumnya penskor (rater) hanya satu orang, sehingga sukar untuk dapat membandingkan hasil pertimbangan (adjustment) penskoran dengan orang lain.
Masalah penskor yang bias: penskor (rater) cenderung untuk sukar menghilangkan masalah, ”personal bias”. Sewaktu menskor hasil pekerjaan peserta tes ada kemungkinan penskor (rater) mempunyai masalah ”generosity error” artinya penskor cenderung memberi nilai yang tinggi-tinggi, walaupun kenyataan yang sebenarnya hasil pekerjaan peserta tes tidak baik. Kemungkinan juga penskor mempunyai masalah ”severity error” artinya penskor cenderung memberi nilai yang rendah-rendah, walaupun kenyataannya hasil pekerjaan peserta tes tersebut baik. Kemungkinan lain penskor juga cenderung dapat memberi nilai yang sedang-sedang saja, walaupun pada kenyataannya hasil pekerjaan peserta tes ada yang baik dan ada yang tidak baik. Masalah lain adalah adanya kemungkinan penskor tertarik atau simpati pada peserta tes sehingga sukar baginya untuk memberi nilai yang objektif (hallo efect)

Rubrik Penilaian
Konten ini dapat anda baca di konten dengan judul ”Tugas dan Penyusunan Kriteria Penilaian (Rubrik)” di www.forumpenelitian.blogspot.com/tugas+dan+penyusunan+penilaian+rubrik

Bahan bacaan:
Popham, W. James. 1995. Classroom Assessment: What Teacher Need to Know. Needham Heights, MA: Allyn & Bacon, A Simmon & Schuster Company.
Danielson S. A Collection of Performance Task And Rubriks. http://www.assesment.com/Danielson/ 10/4/2006
Nitco, A.J. & Hsu. T. 1996. Teacher’s Guide to Better Classroom Testing A Judgemental Approach. Jakarta: Madecor Career System and Pusat Pengembangan Agribisnis.

1 komentar:

Anonim mengatakan...

Hi I'm new. Excellent forum. Just found it on Bing. Thank you 4 the Excellent community we have here :)

gonna check for the [url=http://atomtv.info/]latest trends[/url] now, hope it's not Justin Bieber again :\