Bireye Uyarlanmış Testlerin Uygulama Alanları

Bireye uyarlanmış testin kökenleri, Binet ve Simon'un 1905 yılında bir zeka testi tasarladıkları çalışmalarına kadar uzanmaktadır (van der Linden ve Glas, 2010). Binet ve Simon bu çalışmalarında, önceden kalibre edilmiş madde havuzu, başlangıç kuralı ve sonlandırma kuralı gibi çeşitli bireye uyarlanmış test bileşenlerini içeren bir yaklaşım geliştirmiştir. Bu çalışmada, test katılımcılarının önceki test maddelerindeki performansı, sonraki soruların seçimini belirlemiştir. Uygun yaş seviyesindeki soruların çoğu veya tamamı doğru yanıtlanırsa, bir sonraki aşamada genellikle daha yüksek yaş seviyesindeki sorular yöneltilmiştir. Belirli bir yaş seviyesindeki soruların çoğu yanlış cevaplandığında ise, bir sonraki aşamada daha düşük yaş seviyesindeki sorular uygulanmıştır. Dolayısıyla, bireye uyarlanmış testlerin temel kavram ve ilkeleri 1900'lerin başındaki bu öncü çalışma ile oluşturulmuştur.

Madde Tepki Kuramının (MTK) ortaya atılması daha hassas ve etkili bireye uyarlanmış testler yapılmasını kolaylaştırmış ve önceki yaklaşımlara kıyasla test katılımcılarının yetenek düzeylerinin daha doğru tahmin edilmesini sağlamıştır (Kim vd., 2015; van der Linden ve Glas, 2010; Weiss, 1982). Bununla birlikte, bireye uyarlanmış testlerin geniş ölçekli değerlendirmelerde kullanımı, başlangıçta yetersiz bilgi işlem gücü ve gelişmiş algoritmaların eksikliği nedeniyle sınırlı kalmıştır. Ancak, 1990'larda internetin ve ağ bağlantılı bilgisayarların daha erişilebilir hale gelmesi, bireye uyarlanmış testlerin çok sayıda test katılımcısına verimli bir şekilde sunulmasını mümkün kılmıştır. Sonuç olarak, araştırmalar bireye uyarlanmış test yöntemlerinin avantajlarını ortaya koydukça, dil yeterliliği ve askeriye için işe alım süreçleri dahil olmak üzere çeşitli alanlar, uyarlanabilir testleri değerlendirme yaklaşımlarına dahil etmiştir.

Bireye uyarlanmış testlerin öncü uygulamaları şunlardır:

The National Council Licensure Examination (NCLEX)- Ulusal Hemşirelik Lisans Sınavı

NCLEX, 1982'den beri Amerika Birleşik Devletleri'nde hemşirelik lisansı almak için uygulanan bir sınavdır. Kanada’da 2015, Avustralya’da ise 2020’de uygulanmaya başlamıştır.
Hemşirelik eğitimini tamamlayan öğrencilerin hemşirelik lisansı alabilmeleri için bu sınavı geçmeleri gerekir.
Ulusal Hemşirelik Kurulları Konseyi (NCSBN), 1994 yılında NCLEX’i Bilgisayar Ortamında Bireye Uyarlanmış Test (BOBUT) test formatına dönüştürmüştür.

Armed Services Vocational Aptitude Battery (ASVAB)- Silahlı Hizmetler Mesleki Yeterlilik Testi

Silahlı Hizmetler Mesleki Yeterlilik Testi (ASVAB), askeriye için işe alım süreçlerinde kullanılan ve adayları yeteneklerine uygun rollere yerleştiren bir testtir.
1996 yılında adaptif bir format olan CAT-ASVAB'ye geçilmiştir ve halen ABD Savunma Bakanlığı tarafından uygulanarak askeri işe alımda kritik bir araç olmayı sürdürmektedir.

Bireye uyarlanmış testlerin kullanıldığı yaygın eğitimde ölçme ve değerlendirme uygulamaları şunlardır:

Graduate Record Examination (GRE)- Lisansüstü Kayıt Sınavı

GRE Programı, ABD'deki lisansüstü programların öğrenci seçimini desteklemek amacıyla çeşitli değerlendirmeler sunar. Bu sınavlar arasında geniş bir yetenek yelpazesini ölçen GRE Genel Testi ve Mühendislik, Psikoloji gibi alanlardaki başarıyı değerlendiren Konu Testleri yer almaktadır (Mills & Steffen, 2000).
GRE Genel Testi, 1993 yılında uyarlanabilir test formatına geçmiştir ve başlangıçta tüm sınav BOBUT formatında uygulanmıştır (Mills & Steffen, 2000). 2011 yılında ise, önceki bölümlerdeki performansa dayalı olarak zorluk seviyesini ayarlayan çok aşamalı bireye uyarlanmış test (MST) formatına geçilmiştir.
Böylece GRE, bölüm bazında uyarlanabilir hale gelmiştir. Yalnızca puanlanan iki matematik ve iki sözel bölüm uyarlanabilir olup, analitik yazma ve puanlanmayan deneysel/araştırma bölümleri bu özelliğe sahip değildir (Woodbury-Stewart vd., 2023).

Graduate Management Admission Test (GMAT)- Lisansüstü Yönetim Kabul Testi

GMAT, işletme okullarına kabul sürecinde önemli bir değerlendirme sınavıdır.
Üç ana bileşeni bulunmaktadır: Analitik Yazma Değerlendirmesi (AWA), Sayısal bölüm ve Sözel bölüm.
1997 yılında ise GMAT, adaptif test formatını benimsemiştir (Rudner, 2009).

Test of English as a Foreign Language (TOEFL)

TOEFL, ana dili İngilizce olmayan bireyler için dünya çapında tanınan bir İngilizce yeterlilik sınavıdır.
TOEFL iBT, klasik anlamda tamamen uyarlanabilir bir format kullanmasa da, okuma ve dinleme bölümlerinde uyarlanabilir unsurlar içermektedir (Alderson, 2009). Bu bölümler, test katılımcısının önceki alt bölümlerdeki performansına göre zorluk seviyesi değişen sorularla alt bölümlere ayrılmaktadır.

Duolingo İngilizce Testi (DET)

Uyarlanabilir bir dil yeterlilik testi olan Duolingo İngilizce Testi, 2016 yılında başlatılmıştır. Test, katılımcıların performansına göre soruların zorluk seviyesini gerçek zamanlı olarak ayarlamakta ve üniversite kabulleri ile iş başvuruları için erişilebilir, düşük maliyetli bir seçenek olarak popülerlik kazanmıştır.
Ayrıca, "Duolingo" mobil uygulaması da, kullanıcıların seviye atlayabilmesi için önce içeriği başarıyla tamamlamalarını gerektiren uyarlanabilir bir sistem kullanmaktadır (Teske, 2017).

Programme for International Student Assessment (PISA)- Uluslararası Öğrenci Değerlendirme Programı

PISA, 15 yaşındaki öğrencilerin okuma, matematik ve fen bilgilerini, gerçek hayattaki sorunları çözme yeteneklerini ölçen uluslararası bir değerlendirme testidir (OECD, 2018).
2018 yılında PISA, okuma değerlendirmesine çok aşamalı bireye uyarlanmış testi (MST) dahil etmiş ve 2022 yılında bu yaklaşımı matematik alanına da genişletmiştir (OECD, 2023).

Scholastic Assessment Test (SAT)

Amerika Birleşik Devletleri'nde üniversiteye kabul için yaygın olarak kullanılan standartlaştırılmış bir sınav olan SAT, 2023'ten itibaren çok aşamalı bireye uyarlanmış test (MST) yöntemini kullanmaktadır.
Her test bölümü (Okuma ve Yazma ile Matematik) eşit uzunluktaki ve ayrı sürelerle zamanlanan iki modüle ayrılmıştır. Sınav katılımcıları önce ilk modüldeki soruları yanıtlar ve ikinci modüldeki sorular, ilk modülde gösterilen performansa göre belirlenir (“What Is Digital SAT Adaptive Testing?”, 2023).

Türkiye'de de adaptif testlerin uygulanabilirliğini inceleyen çok sayıda çalışma bulunmaktadır (Aybek & Çıkrıkçı, 2018; Bulut & Kan, 2021; Çıkrıkçı ve diğerleri, 2020; Demir & Atar, 2021; Kalender & Berberoğlu, 2017; Şimşek & Tavşancıl, 2022). Bulut ve Kan (2012), BOBUT prosedürünün Türkiye'deki Akademik Personel ve Lisansüstü Eğitimi Giriş Sınavı’nda (ALES) nasıl uygulanabileceğini ve geleneksel kağıt-kalem formatına kıyasla daha az maddeyle doğru yetenek tahminleri sağlayabildiğini ortaya koymuştur. Benzer şekilde, Kalender ve Berberoğlu (2017), Türkiye'deki üniversite giriş sınavlarında kişiselleştirilmiş değerlendirme ve ölçüm doğruluğunu artırmak açısından BOBUT'un uygulanabilir bir alternatif olduğunu göstermiştir. Çıkrıkçı ve diğerleri (2020) tarafından yapılan başka bir çalışma ise, Türkiye'deki Sürücü Belgesi Adayları Sınavı'nın BOBUT versiyonunun, teorik sürüş bilgisine dayalı olarak katılımcılar arasında güvenilir bir ayrım sağladığını ve doğru değerlendirme için sağlam bir temel oluşturduğunu ortaya koymuştur. Son dönemde ise BounAdaptiveTestLab, 4. sınıf öğrencilerinin matematiksel yeteneklerini değerlendirmek için bir BOBUT geliştirmiştir. Testin demo sürümüne şu bağlantıdan ulaşabilirsiniz: DemoCat.

Sonuç olarak, BOBUT ve MST gibi bireye uyarlanmış test yöntemleri üzerine yapılan araştırmalar, bu yöntemlerin farklı alanlardaki uygulanabilirliğini giderek artırmaktadır. Bu nedenle, araştırmacıların ve politika yapıcıların bu gelişmeleri yakından takip etmeleri ve adaptif test yöntemlerini farklı uygulamalara entegre etmenin yollarını keşfetmeleri büyük önem taşımaktadır.

KAYNAKÇA

Alderson, J. C. (2009). Test review: Test of English as a Foreign Language TM: Internet-based Test (TOEFL iBT®). Language Testing, 26(4), 621-631. https://doi.org/10.1177/0265532209346371

Aybek, E. C., & Çıkrıkçı, R. N. (2018). Kendini Değerlendirme Envanteri’nin bilgisayar ortamında bireye uyarlanmış test olarak uygulanabilirliği. DergiPark (Istanbul University). https://dergipark.org.tr/tr/pub/tpdrd/issue/40299/481364

Binet, A., & Simon, T. (1905). New methods for the diagnosis of the intellectual level of subnormals. In H. H. Goddard (Ed.), Development of intelligence in children (the Binet-Simon Scale). Baltimore: Williams & Wilkins.

Bulut, O., & Kan, A. (2012) Application of computerized adaptive testing to entrance examination for graduate studies in Turkey. Egitim Arastirmalari-Eurasian Journal of Educational Research, 49, 61-80.

Burr, S. A., Gale, T., Kisielewska, J., Millin, P., Pêgo, J. M., Pinter, G., Robinson, I. M., & Zahra, D. (2023). A narrative review of adaptive testing and its application to medical education. MedEdPublish, 13, 221. https://doi.org/10.12688/mep.19844.1

Cikrikci, N., Yalçin, S., Kalender, İ., Gül, E., Ayan, C., Uyumaz, G., Kürşad, M. Ş., & Kamis, O. (2020). Development of a computerized adaptive version of the Turkish Driving Licence Exam. International Journal of Assessment Tools in Education, 7(4), 570–587. https://doi.org/10.21449/ijate.71617

Demir, S. & Atar, B. (2021). Investigation of Classification Accuracy, Test Length, and Measurement Precision at Computerized Adaptive Classification Tests. Journal of Measurement and Evaluation in Education and Psychology, 12(1), 15-27. doi: 10.21031/epod.787865

Kalender, I., & Berberoglu, G. (2017). Can computerized adaptive testing work in students’ admission to higher education programs in Turkey? Educational Sciences: Theory & Practice, 17, 573–596. http://dx.doi.org/10.12738/estp.2017.2.0280

Kim, S., Moses, T., & Yoo, H. (2015). A comparison of IRT proficiency estimation methods under adaptive multistage testing. Journal of Educational Measurement, 52(1), 70–79. https://doi.org/10.1111/jedm.12063

Koşan, A. M. A., Koç, N., Elhan, A. H., & Öztuna, D. (2020). Developing an item bank for progress tests and application of computerized adaptive testing by simulation in medical education. International Journal of Assessment Tools in Education, 6(4), 656–669. https://doi.org/10.21449/ijate.635675

Mills, C. N., & Steffen, M. (2000). The GRE Computer Adaptive Test: Operational issues. In Springer eBooks (pp. 75–99). https://doi.org/10.1007/0-306-47531-6_4

NCSBN Historical Timeline | NCSBN. (n.d.). https://web.archive.org/web/20150316220546/https://www.ncsbn.org/70.htm

OECD (2019), PISA 2018 Assessment and Analytical Framework, PISA, OECD Publishing, Paris, https://doi.org/10.1787/b25efab8-en.

OECD (2023), "Adaptive testing in PISA 2022", in PISA 2022 Results (Volume I): The State of Learning and Equity in Education, OECD Publishing, Paris, https://doi.org/10.1787/89c0f253-en.

Rudner, L.M. (2009). Implementing the Graduate Management Admission Test Computerized Adaptive Test. In: van der Linden, W., Glas, C. (eds) Elements of Adaptive Testing. Statistics for Social and Behavioral Sciences. Springer, New York, NY. https://doi.org/10.1007/978-0-387-85461-8_8

Şimşek, A. S. & Tavşancıl, E. (2022). Applicability and Efficiency of a Polytomous IRT-Based Computerized Adaptive Test for Measuring Psychological Traits. Journal of Measurement and Evaluation in Education and Psychology , 13 (4) , 328-344. DOI: 10.21031/epod.1148313

Teske, K. (2017). Duolingo. CALICO Journal, 34(3), 393–401. https://www.jstor.org/stable/90014704

van der Linden, W. J., & Glas, C. A. W. (2010). Elements of adaptive testing. (Statistics for Social Behavioral Sciences). Springer. https://doi.org/10.1007/978-0-387-85461-8

Weiss, D. J. (1982). Improving Measurement Quality and Efficiency with Adaptive Testing. Applied Psychological Measurement, 6(4), 473–492. https://doi.org/10.1177/014662168200600408

What is Digital SAT Adaptive Testing? (2023, August). What is Digital SAT Adaptive Testing? Retrieved July 30, 2024, from https://blog.collegeboard.org/what-digital-sat-adaptive-testing

Woodbury-Stewart, S., Woodbury-Stewart, S., & Woodbury-Stewart, S. (2023, April 30). Is the GRE Adaptive? | GRE Adaptive Scoring | TTP GRE Blog. TTP GRE Blog. https://gre.blog.targettestprep.com/is-the-gre-adaptive/#:~:text=The%20GRE%20is%20section%2Dadaptive.,research%20sections%20are%20not%20adaptive

Belgin Eriz, Boğaziçi University, MSc

26.09.2024