Tes Kemampuan Akademik (TKA) merupakan instrumen evaluasi yang digunakan untuk mengukur penguasaan kompetensi akademik esensial peserta didik secara objektif dan terstandar. Dalam teori evaluasi pendidikan, kualitas suatu tes sangat ditentukan oleh kualitas butir soal yang menyusunnya. Soal yang disusun tanpa memperhatikan kaidah ilmiah berpotensi menghasilkan data yang bias dan tidak mencerminkan kemampuan akademik peserta didik yang sesungguhnya. Oleh karena itu, penyusunan soal TKA SMP/MTs harus mengacu pada prinsip-prinsip pengukuran pendidikan yang telah dikembangkan para ahli.
Salah satu syarat utama soal TKA yang baik adalah validitas, baik validitas isi maupun validitas konstruk. Menurut Crocker dan Algina (2008), validitas isi menunjukkan sejauh mana butir soal merepresentasikan kompetensi atau domain materi yang hendak diukur, sedangkan validitas konstruk berkaitan dengan kemampuan soal dalam mengukur kemampuan psikologis atau akademik tertentu, seperti penalaran dan pemecahan masalah. Nitko dan Brookhart (2011) menegaskan bahwa tes yang tidak memiliki validitas konstruk yang baik tidak dapat digunakan untuk menarik kesimpulan yang sahih tentang kemampuan peserta didik. Oleh karena itu, soal TKA harus disusun berdasarkan kompetensi yang jelas dan terukur sesuai standar nasional pendidikan.
Selain validitas, soal TKA harus mampu mengukur kemampuan berpikir, bukan sekadar kemampuan menghafal. Anderson dan Krathwohl (2001) melalui Taksonomi Bloom revisi menjelaskan bahwa proses kognitif peserta didik meliputi berbagai tingkatan, mulai dari mengingat hingga mengevaluasi. Tes kemampuan akademik idealnya menekankan proses berpikir tingkat menengah hingga tinggi, seperti menganalisis dan mengevaluasi. Hal ini sejalan dengan pandangan Nitko dan Brookhart (2011) yang menyatakan bahwa asesmen modern harus dirancang untuk mengukur bagaimana peserta didik menggunakan pengetahuan, bukan hanya seberapa banyak pengetahuan yang diingat.
Syarat berikutnya adalah penggunaan stimulus yang kontekstual dan bermakna. Soal TKA yang baik disusun dengan stimulus berupa teks, tabel, grafik, atau ilustrasi yang relevan dengan kehidupan nyata peserta didik. Menurut panduan penyusunan soal Higher Order Thinking Skills (HOTS) yang dikeluarkan oleh Kementerian Pendidikan dan Kebudayaan, stimulus kontekstual berfungsi untuk mendorong peserta didik berpikir kritis dan mengaitkan konsep akademik dengan situasi nyata (Kemendikbud, 2017). OECD (2019) dalam kerangka literasi sains juga menekankan pentingnya konteks nyata dalam asesmen agar hasil tes mencerminkan kemampuan peserta didik dalam menghadapi permasalahan kehidupan sehari-hari.
Dari segi bahasa, soal TKA harus menggunakan bahasa yang jelas, komunikatif, dan sesuai dengan tingkat perkembangan peserta didik. Nitko dan Brookhart (2011) menyatakan bahwa kejelasan bahasa merupakan faktor penting dalam penyusunan soal karena bahasa yang ambigu dapat menyebabkan kesalahan jawaban yang tidak berkaitan dengan kemampuan akademik. Pada jenjang SMP/MTs, penggunaan istilah teknis harus disesuaikan dengan tingkat pemahaman peserta didik agar soal tidak menimbulkan bias linguistik.
Soal TKA yang baik juga harus memiliki tingkat kesukaran yang proporsional. Arikunto (2018) menjelaskan bahwa tes yang berkualitas memiliki distribusi tingkat kesukaran yang seimbang agar mampu membedakan peserta didik dengan kemampuan tinggi, sedang, dan rendah. Crocker dan Algina (2008) menambahkan bahwa tingkat kesukaran yang ekstrem—terlalu mudah atau terlalu sulit—akan menurunkan daya guna tes sebagai alat ukur kemampuan akademik.
Aspek penting lainnya adalah objektivitas dan bebas dari bias. Menurut Nitko dan Brookhart (2011), instrumen asesmen harus dirancang agar adil bagi semua peserta didik, tanpa dipengaruhi latar belakang budaya, sosial, maupun gender. OECD (2019) juga menegaskan bahwa asesmen yang bias dapat menghasilkan interpretasi yang keliru dan memperlebar ketimpangan pendidikan. Oleh karena itu, konteks dan bahasa soal harus dipilih secara hati-hati agar tidak menguntungkan atau merugikan kelompok tertentu.
Selain itu, soal TKA harus disesuaikan dengan alokasi waktu pengerjaan. Crocker dan Algina (2008) menyatakan bahwa waktu tes harus proporsional dengan kompleksitas kognitif dan panjang stimulus soal. Nitko dan Brookhart (2011) menekankan bahwa keterbatasan waktu yang tidak wajar dapat mengurangi validitas tes karena hasilnya lebih mencerminkan kecepatan membaca daripada kemampuan berpikir. Dengan demikian, keseimbangan antara jumlah soal, panjang stimulus, dan waktu pengerjaan menjadi syarat penting kualitas TKA.
Terakhir, soal TKA yang baik harus memiliki daya pembeda yang memadai. Menurut Arikunto (2018), daya pembeda menunjukkan kemampuan soal dalam membedakan peserta didik yang memiliki kemampuan akademik tinggi dan rendah. Crocker dan Algina (2008) menegaskan bahwa daya pembeda merupakan indikator utama kualitas butir soal dalam teori tes klasik. Soal dengan daya pembeda yang baik akan menghasilkan informasi yang lebih akurat untuk pemetaan kemampuan akademik peserta didik.
Berdasarkan uraian tersebut, dapat disimpulkan bahwa penyusunan soal Tes Kemampuan Akademik SMP/MTs harus mengacu pada prinsip-prinsip evaluasi pendidikan yang meliputi validitas, pengukuran kemampuan berpikir, konteks yang bermakna, kejelasan bahasa, tingkat kesukaran yang proporsional, objektivitas, kesesuaian waktu, dan daya pembeda. Pemenuhan syarat-syarat tersebut akan menjadikan TKA sebagai instrumen evaluasi yang sahih, adil, dan bermakna dalam mendukung peningkatan mutu pendidikan.
PPTKA ke 2 di propinsi DIY dilaksanakan pada bulan januari 2026. Untuk mapel IPA di Sleman jumlah soal 40 butir dengan waktu pengerjaan 80 menit. Di Kabupaten Bantul, Kodya dan Gunung Kidul jumlah soal IPA 30 butir dengan waktu pengerjaan 60 menit. Untuk satu soal teralokasi waktu 2 menit. Soal-soal PPTKA rata-rata cukup panjang, untuk 40 butir soal PPTKA Kab Sleman terdiri dari 33 halaman, 30 butir soal Kabupaten yang lain sekitar 20 sampai 23 halaman. Selain naskah soal yang panjang, soal PPTKA juga terdiri dari banyak soal HOTS yang membutuhkan penalaran tingkat tinggi.
Hasil PPTKA ke 2 khususnya di Kabupaten Sleman masih jauh dari harapan atau dengan kata lain masih sangat mengecewakan guru, orang tua maupun siswa. Hasil asesmen atau nilai yang diperoleh siswa dipengaruhi oleh berbagai faktor internal dan eksternal yang saling berkaitan. Faktor internal meliputi kemampuan kognitif, tingkat penguasaan materi, motivasi belajar, kesiapan belajar, serta kondisi fisik dan psikologis siswa saat asesmen berlangsung. Sementara itu, faktor eksternal mencakup kualitas instrumen asesmen, kejelasan bahasa dan stimulus soal, kesesuaian alokasi waktu, serta kualitas proses pembelajaran yang diterapkan guru. Menurut Nitko dan Brookhart (2011), instrumen asesmen yang tidak valid atau tidak reliabel dapat menghasilkan nilai yang tidak merefleksikan kemampuan akademik siswa secara akurat. Selain itu, Crocker dan Algina (2008) menegaskan bahwa tekanan waktu dan kompleksitas soal yang tidak proporsional dapat memengaruhi performa siswa dan menurunkan validitas hasil tes. Dengan demikian, interpretasi nilai siswa perlu mempertimbangkan keterpaduan antara karakteristik individu siswa, mutu pembelajaran, dan kualitas asesmen agar hasil penilaian benar-benar mencerminkan capaian kompetensi akademik siswa.
Saat ditanya mengapa nilainya tidak sesuai harapan, Empat kelas 9 di MTsN 10 Sleman yang terdiri dari 125 siswa semua mengatakan bahwa salah satu faktornya adalah kurangnya waktu pengerjaan. Pada dua kelas siswa kelas 9B dan 9D diberikan satu file soal PPTKAD ke 2 dari kabupaten Kota yang berisi 30 butir soal, selanjutnya siswa disuruh membaca soal dari nomor 1 sampai nomor 30 dan diminta mencatat waktu yang dibutuhkan untuk membaca soal, hanya membaca saja dan tidak memahami, tidak mengerjakan. Dari dua kelas yang terdiri dari 56 siswa didapatkan rata-rata waktu 29,71 menit untuk 30 butir soal,dengan rentangan 22 menit untuk waktu paling sedikit dan waktu terbanyak 42 menit. Dari data ini berarti untuk satu butir soal rata-rata membutuhkan 0,99 menit untuk membaca saja. Hal ini berarti siswa hanya memiliki waktu 1 menit untuk memahami dan mengerjakan sampai menemukan jawaban untuk setiap butir soal yang rata-rata naskahnya panjang.
Dari data hasil observasi di MTsN 10 Sleman ini, ada baiknya dilakukan obserbvasi hal yang sama di Madrasah yang lain dan di kabupaten yang lain juga. Apabila fenomena “kurang waktu” ini ternyata memang merupakan salah satu variabel kekurang berhasilan nilai PPTKA maka hal ini dapat menjadi umpan balik pada institusi yang berwenang maupun pembuat soal terkait pembuatan soal PPTKA. Dengan demikian PPTKA menjadi lebih valid dan bermakana sebagai alat evaluasi.
Daftar Pustaka
Anderson, L. W., & Krathwohl, D. R. (2001). A taxonomy for learning, teaching, and assessing: A revision of Bloom’s taxonomy of educational objectives. New York, NY: Longman.
Crocker, L., & Algina, J. (2008). Introduction to classical and modern test theory. Mason, OH: Cengage Learning.
Crocker, L., & Algina, J. (2008). Introduction to classical and modern test theory. Mason, OH: Cengage Learning.
Kementerian Pendidikan, Kebudayaan, Riset, dan Teknologi Republik Indonesia. (2021). Asesmen Nasional: Laporan kebijakan dan kerangka asesmen. Jakarta: Pusat Asesmen Pendidikan.
Nitko, A. J., & Brookhart, S. M. (2011). Educational assessment of students (6th ed.). Boston, MA: Pearson Education.

Penulis : Sri Sumarmi, S.Pd. M.Si ,Guru MTsN 10 Sleman ,
alumni S2 Biologi UGM Yogyakarta