EĞİTİMDE ÖLÇME ve DEĞERLENDİRMENİN İŞLEVLERİ


Eğitimin başarısı hakkında herkesi bilgilendirir. Öğrenci hakkında verilecek kararlara dayanak oluşturur. Öğrenciyi tanıma, geliştirme ve düzeyini görmemizi sağlar. Başarılı öğrenciyi motive eder. Öğretmenin kendi başarısını görmesini sağlar.

ÖLÇME


Varlıkların ya da olayların özelliklerinin gözlenerek gözlem sonuçlarının sayı veya sembolle ifade edilmesidir. Ölçmenin öğeleri: Varlık, ölçme aracı, ölçme sunucudur

ÖLÇÜM

Ölçme işlemi sonucunda elde edilen sayı veya semboldür.

ÖLÇME KURALI

Ölçmeye konu olan özelliğin hangi miktarına ne değer verileceğinin belirlenmesidir.

ÖLÇMEDE BİRİM


Ölçme araçlarının sayısal değerle ifade edilebilen en küçük parçasıdır. Birim küçüldükçe ölçme aracının duyarlılığı artar, hata miktarı azalır. Ölçmede birim doğal ve tanımlanmış olmak üzere ikiye ayrılır. Bir değişkenin hangi miktarına 1 birim denileceği tanımlanmamış olan birime doğal birim denir. Örneğin: Bir sınıftaki öğrenciler sayılırken her öğrenci 1 birim olarak kabul edilir. Tanımlanmış birim ise bilim adamları tarafından sınırları belirlenmiş olan birimlerdir: saat, lira, puan, metre tanımlanmıştır. Ölçme araçlarının özellikleri: Eşitlik, kullanışlılık, genellik

ÖLÇMEDE SIFIR

Doğal ve tanımlanmış olmak üzere iki boyutta ele alınabilir. Bir değişkenin miktar olarak gerçekten yokluğunun ifade eden sıfıra doğal (mutlak) sıfır denir. Bir değişkenin hangi miktarına sıfır denileceği uzmanlarca tanımlanmışsa buna tanımlanmış (göreceli) sıfır adı verilir: sıcaklık, başarı, zeka gibi özellikler tanımlanmış sıfıra göre ölçülür.

ÖLÇME TÜRLERİ

Doğrudan, dolaylı ve türetilmiş olmak üzere üç tür ölçme vardır. Doğrudan Ölçme: Ölçülecek özelliğin doğrudan gözlenerek ölçme aracıyla birebir eşleştirilmesi şeklinde yapılan ölçmedir. Ölçülen özellikle ölçme aracı üzerindeki gözlenen özellik aynıdır. Ağırlık ağırlık ile, uzunluk da uzunluk ile eşleştirilir. Dolaylı Ölçme: Ölçülecek özelliğin dolaylı olarak gözlenmesi şeklinde yapılan ölçmedir. Ölçülen özellikle ölçme aracı üzerindeki gözlenen özellik aynı değildir. Ölçülecek özellik doğrudan değil de kendisiyle ilgili olduğu kabul edilen başka bir değişken gözlenerek ölçülür. Ağırlık hem doğrudan hem de dolaylı olarak ölçülür. Sıcaklık dolaylı ölçmedir. Türetilmiş Ölçme: Dolaylı ölçmenin farklı bir türüdür. Ölçmek istediğimiz özellik üzerinde herhangi bir işlem yapmadan bu özellikle ilgili başka değişkenler üzerinde matematiksel işlemler yapılarak elde edilen ölçümlerdir. Örneğin yoğunluğun kütle ve hacim bağıntısından, hızın yol ve zaman bağıntısından ölçülmesi, zekânın IQ formülünden ölçülmesi.

ÖLÇME HATASI

Ölçülen özelliğin gerçek değeriyle ölçme aracından elde edilen değer arasındaki farka ölçme hatası denir. Hata artı veya eksi yönde olabilir. Ölçmede sabit, sistematik ve tesadüfî hata olmak üzere üç tür hata vardır. Sabit Hata: Bütün ölçümlerde miktar olarak aynı olan hatalardır. Örneğin terazinin tarttığı her nesneyi 50 gr. Eksik tartması, öğretmenin bütün sınıfa 10 puan fazla vermesi. Sistematik Hata: Ölçmeden ölçmeye belli oranda artan ya da azalan hatalardır. Eğitimde öğretmenin yanlı davranması da sistematik hata kapsamında ele alınır. Tesadüfi Hata: Ölçme sonuçlarına belirsiz şekilde karışan hatalardır. Hatanın kaynağı belli olmadığı için bazen eksik bazen fazla ölçüm söz konusu olabilir. Öğretmenin sınavları puanlarken toplama hatası yapması, şans başarısı, öğrencinin sınav günü hasta olması… Not: Sabit ve sistematik hatalar ölçme araçlarının güvenirliği üzerinde bir etkiye sahip değildir. Güvenirlik yalnızca tesadüfi hatalardan etkilenir.

ÖLÇEK


Belli bir büyüklüğü küçültme oranı, birim veya ölçme aracı olarak kullanılmaktadır. Varlıkların özelliklerini belirlerken kullanılan sayı ve sembolleri açıklamak aracıyla kullanılan açıklamalardır. Sınıflama, sıralama, eşit aralıklı ve eşit oranlı olmak üzere 4 tür ölçek vardır. Sınıflama (Adlandırma) Ölçekleri: Nesnelerin genel olarak birbirlerine göre benzerlik ve farklılıklarını belirlemek ve sınıflandırmak amacıyla kullanılan ölçeklerdir. Bir sınıftaki öğrencilerin evli-bekâr, kadın-erkek, A-B, 1-2 olarak sınıflandırılması. Bu ölçekte kullanılan sayıların sayısal değeri yoktur. İki temel özelliği vardır: Simetrilik ve geçişlilik. A=B ise B=A , A=B ve B=C ise A=C. Sıralama Ölçeği: Varlıkları belli bir özelliğe sahip oluş miktarları bakımından büyükten küçüğe ya da küçükten büyüğe doğru sıralamak amacıyla kullanılan ölçeklerdir. Başlangıç noktaları değişkendir. Ölçme aracı üzerindeki aralıklar birbirine eşit değildir. Asimetrilik ve geçişlilik özelliği vardır. Eşit Aralıklı Ölçekler: Varlıkları belirli bir başlangıç noktasına göre belli bir özelliğe sahip oluş dereceleri bakımından eşit aralıklarla sıralamak amacıyla kullanılan ölçeklerdir. Bu ölçeklerdeki başlangıç noktası sabittir, aralıklar da eşittir. Termometre, takvim, başarı, zekâ, tutum vs. Oranlı Ölçekler: Eşit aralıklı ölçekler üzerindeki sıfır noktası gerçek sıfır olarak tanımlanan ve doğal sıfırdır. Metre, kilogram, amper, saat vs.

ÖLÇÜT

Ölçme sonucunu karşılaştırdığımız değerdir. Mutlak ve bağıl olmak üzere 2 tür ölçüt vardır. Değerlendirilecek grup dikkate alınmadan önceden kesin olarak belirtilen ölçüte mutlak ölçüt denir. Grubun ortalama başarısı gibi grup performansından çıkarılan ve norm şeklinde ifade edilen ölçüte bağıl ölçüt denir.

DEĞERLENDİRME

Ölçme sonuçlarının bir ölçütle karşılaştırılarak bir değer yargısına ve karara varma sürecidir. Öğrencilerin başarılı/başarısız ya da geçip kaldıklarına karar vermek bir değerlendirmedir. Değerlendirme kullanılan ölçüte ve yönelik olduğu amaca göre ikiye ayrılır: Kullanılan Ölçüt: Norma Dayalı, Hedefe Dayalı Değerlendirme Yönelik Olduğu Amaç: Tanımaya (Diagonastic), Biçimlendirmeye (Formative), Düzey Belirlemeye (Summative) Yönelik Değerlendirme Norma Dayalı Değerlendirme: Bağıl ölçütle yapılır. Hedefe Dayalı Değerlendirme: Mutlak ölçütle yapılır.

ÖLÇME ve DEĞERLENDİRME KAVRAMLARININ KARŞILAŞTIRILMASI

Ölçme bir gözlem ve betimleme, değerlendirme ise yargıdır. Önce ölçme, sonra değerlendirme yapılır. Değerlendirme ölçmeyi kapsar. Ölçme miktar belirtme, değerlendirme ise miktarın yeterliliğine karar vermedir. Ölçme objektif, değerlendirme sübjektiftir.

BİR ÖLÇME ARACINDA BULUNMASI GEREKEN TEMEL ÖZELLİKLER

Geçerlik (Amaca Hizmet), Güvenirlik (Karalılık, tutarlılık, doğruluk), Kullanışlık (Kolaylık, ekonomiklik)

GEÇERLİK

Bir ölçme aracının ölçme amacına uygunluğu ve hizmet etme derecesidir. Bir ölçme aracı amaca hizmet ettiği oranda geçerlidir. Geçerlik bir derece sorunudur. Bu yüzden bir testin geçerliliği korelasyon katsayısı şeklinde teorik olarak düşünülebilir. Bu katsayı -1 ile +1 arasında değişen değerler alabilir. Bir testin geçerliliğini belirlemek için kullanılan farklı 4 yöntem vardır, bunlar kapsam, ölçüt, yapı ve görünüş geçerliliğidir. Kapsam Geçerliliği: Ölçme aracının ölçülmek istenilen davranışların hepsini kapsama derecesidir. Bir ölçme aracı ölçme kapsamında yer alan bütün hedefleri örneklendirdiği oranda kapsam geçerliliği vardır. Kapsam geçerliliği mantıksal olarak belirlenmeye çalışılır. Bu amaçla iki şey yapılır: Soruların testin kapsamını tam olarak ölçme durumunun belirlenmesi, testteki her bir maddenin ölçmek istediği özelliklere uygunluğunun belirlenmesi Belirtke Tablosu: Hedeflerin düzeyini gösterir. Zamanın düzenlenmesine katkı sağlar. Hedeflerle içerik arasındaki ilişkiyi özetler. Ölçme araçlarının kapsam geçerliliğinin sağlanmasında kullanılır. Ölçüt Geçerliliği: Geçerliği çalışılan bir ölçme aracıyla aynı özellikleri ölçen ve geçerli olduğu kabul edilen bir başka ölçme aracının aynı kişilere uygulanması sonucunda elde edilen ölçümler arasındaki korelasyona ölçüt geçerliliği denir. İkinci yol, aynı testin düzeyleri farklı olduğu bilinen iki farklı gruba uygulanması. Ölçüt geçerliliği 2 farklı şekilde belirlenebilir, buna istatistiksel olarak ölçüt geçerliliğin belirlenmesi adı verilir. Yeni geliştirilen test ile daha önceden hazırlanmış ve yeni testle aynı amaca hizmet eden geçerli olduğu bilinen diğer bir test aynı gruba uygulanır ve sonuçları karşılaştırılır. Sonuçlar birbirine benzediği oranda geçerliliği yüksektir. Bu geçerlilik belirleme yöntemine uyum (uygunluk) geçerliliği adı verilir. Ayrıca yeni geliştirilen test ölçülmek istenen özellik açısından yüksek ve düşük düzeyde olduğu bilinen 2 farklı gruba uygulanır. Sonuçlar karşılaştırılır. Not: Bir testin gelecekteki başarıyı tahmin etme düzeyine yordama (tahmin) geçerliliği adı verilir. Yordamada da ölçüt geçerliliği söz konusudur. Yapı Geçerliliği: Bir ölçme aracının teorik bir yapıyı destekleme veya özellikleri gerçekten ölçme düzeyinin belirlenmesidir. Bir testteki sorular birbiriyle ilişkili olmalı ve aynı yapıyı oluşturmalıdır. Bir test yapı olarak homojenleştiği/benzeştiği oranda geçerlilik yükselir. Sosyoloji Testi >Sözel Test>ÖSS.. Faktör Analizi: Testteki maddelerin yapı geçerliliğini belirlemek amacıyla kullanılan istatistiksel olarak faydalanılan tekniktir. Testteki sorular uzmanlara inceletilebilir. Soruların birbiriyle olan ilişkisine bakılabilir. Görünüş Geçerliliği: Bir testin kapağında ne yazıyor ise onu ölçüyor görünmelidir. 

GÜVENİRLİK

Bir ölçme aracının ölçtüğü özelliği, kararlı, tutarlı ve duyarlı bir şekilde ölçebilmesidir. Bir ölçme aracının güvenirliğinin belirlenmesinde kullanılan farklı 2 yaklaşım vardır. Bunlar: Ölçme aracının güvenirlik katsayısının hesaplanması Ölçmenin standart hatasının hesaplanması

GÜVENİRLİK KATSAYISI

Bir ölçme aracının farklı ölçümlerden elde edilen sonuçlarının tutarlılığının test edilmesidir. Güvenirlik katsayısı 0 ile 1 arasında değişen değerler alabilir. 1’e yaklaştıkça güvenirlik yüksek, 0’a yaklaştıkça düşük olarak ifade edilir. Güvenirlik katsayısını hesaplamak amacıyla kullanılan 3 farklı yöntem vardır. Bunlar: test –tekrar test, paralel testler ve test yarılama yöntemleridir. Test-Tekrar Test Yöntemi: Bir test bir gruba kısa aralıklarla 2 kez uygulanır. Sonuçlar karşılaştırılır. Elde edilen katsayıya kararlılık/tutarlılık katsayısı denir. Paralel Testler Yöntemi (Eşdeğer Testler): A ve B gibi eşdeğer olan 2 farklı test aynı gruba uygulanır. Test sonuçlarına bakılır. Elde edilen katsayıya eşdeğerlilik katsayısı denir. Test Yarılama Yöntemi: 1 test 1 gruba 1 defa uygulandıktan sonra 2 yarıya bölünür. 2 bölüm arasındaki tutarlılığa bakılır. Elde edilen katsayıya iç tutarlılık katsayısı adı verilir. (En çok kullanılan ve en güvenilir yöntemdir.)

SPEARMAN-BROWN FORMÜLÜ


Spearman-Brown= Kr/(1+(K-1)r) (r: Güvenirlik katsayısı∈(0,1), K: Alt test sayısı (Yeni soru sayısı)/(Eski soru sayısı) ) Soru: Test yarılama yöntemiyle güvenirlik katsayısı 0,70 olarak hesaplanan bir testin tam***** ait güvenirlik katsayısı kaçtır? (Cevap: 0,82) Soru: 7 alt testten oluşan bir testin güvenirlik katsayısı 0,60 olarak hesaplanmıştır. Bu testin tam***** ait güvenirlik katsayısı kaçtır? (Cevap: 0,91) Soru: 100 maddelik bir testin güvenirlik katsayısı 0,50’dir. Bu teste 50 madde daha eklenirse güvenirlik katsayısı kaç olur? (Cevap: 0,60)

TEST YARILAMA YÖNTEMİYLE GÜVENİRLİK BELİRLEME AMACIYLA KULLANILAN FORMÜLLER

Kuder-Richardson: 20 ve 21 Formülleri (KR20, KR21) Bu formüller testteki her bir maddenin aynı değişkeni ölçtüğü, testin homojen olduğu varsayımına dayanır. Bir test yaklaşık olarak sınıfın tamamınca yanıtlanmış ve testteki her bir madde sadece doğru ve yanlış şeklinde puanlanmışsa KR20 formülü kullanılır. Eğer testteki soruların güçlük dereceleri birbirinden önemli ölçüde farklı değil ise KR20 yerine KR21 formülü de kullanılabilir. KR20= K/(K-1) (1-(∑▒pq)/〖S_x〗^2 ) K: Testteki madde sayısı p: Testteki her bir sorunun doğru cevaplanma oranı q: Testteki her bir sorunun doğru cevaplanma oranı S_x: Standart sapma KR21= K/(K-1) (1-(KX ̅-X ̅^2)/〖〖K.S〗_x〗^2 ) X ̅: Aritmetik ortalama (KR21<KR20) Soru: 10 sorudan oluşan bir testin madde varyansları toplamı 1,9 ve standart sapması 2 ise bu testin güvenirlik katsayısı kaçtır? (Cevap: 0,58) Alfa Güvenirlik Katsayısı: Ağırlıklı puanlama veya dereceleme yöntemiyle puan verildiği zaman kullanılabilecek bir güvenirlik hesaplama tekniğidir. Psikomotor becerilerin ölçülmesinde ve tutumların ölçülmesinde çoğunlukla bu katsayı kullanılır. α=K/(K-1) (1-(∑▒S_j )/〖S_x〗^2 ) S_j: Her bir maddenin varyansı

ÖLÇMENİN STANDART HATASI

Ölçümlerin güvenirliğinin belirlenmesinde güvenirlik katsayısı dışında kullanılan bireysel ölçümlerdeki standart hatanın belirlenmesidir. Standart hata, grubun değişkenliğinden, güvenirlik katsayısına göre daha az etkilenir. Şu formülle hesaplanır: SEM=S_x √(1-r) Soru: güvenirlik katsayısı 0,64, standart sapması 5 olan bir testin standart hatası kaçtır? (Cevap 3) Bu testten 60 alan bir öğrencinin gerçek puanının düşeceği aralıkları %68, %95 ve %99 ihtimale göre hesaplayınız. (Cevap: (57,63), (54,66), (51,69)) Not: Bu tip soruların çözümünde normal dağılım eğrisinden yararlanılır. (Gauss Eğrisi) Normal dağılım eğrisi matematiksel olarak -∞ ile +∞ arasında tanımlanmasına rağmen istatistiksel olarak çoğunlukla -3 standart sapma ile +3 standart sapma aralığında tanımlanır. Soru: Güvenirlik katsayısı 0,19 olan standart sapması 5 olan bir testten 55 puan alan bir öğrencinin puanının gerçek sınırlarını %95 ihtimale göre hesaplayınız. Not: Standart hata, standart sapmayla doğru, güvenirlik katsayısıyla ters orantılıdır.


GÜVENİRLİĞİ ETKİLEYEN FAKTÖRLER

Bir testteki soru sayısı arttıkça güvenirlik de artar. Testteki maddelerin açık ve anlaşılır olması güvenirliği yükseltir. Bir test, bilenle bilmeyeni ayırt ettiği oranda güvenilirliği yükselir. Ölçülen davranış bakımından homojen maddelerden oluşan bir testten elde edilen puanlar, heterojen bir testten elde edilenden daha güvenlidir. Puanlaması objektif olan testlerin güvenirliği, sübjektif testlere göre daha yüksektir. Sınavın uygulama koşulları güvenirlik üzerinde etkilidir. Kopya çekme, şans başarısı güvenirliği düşürür. Öğrencinin sınava karşı tutumu, yorgunluk ve hastalık gibi özellikleri de güvenirlik üzerinde etkilidir.

GÜVENİRLİK VE GEÇERLİK ARASINDAKİ İLİŞKİ

Güvenirlik, geçerlik için bir ön koşuldur. Bir ölçme aracının güvenilir olması her zaman geçerli olduğu anl***** gelmez. Geçerlilik, güvenirliği kapsayan bir kavramdır. Bu yüzden geçerli bir ölçme aracının, aynı zamanda güvenilir olduğu söylenebilir. Geçerlilik her türlü hatadan etkilenmesine rağmen, güvenirlik yalnızca tesadüfî hatadan etkilenir. Bir testin geçerliliği güvenirlikten etkilenir, bu yüzden testin geçerlilik katsayısı, güvenirlik katsayısının karekökünden daha büyük olamaz.

KULLANIŞLIK

Geçerlilik ve güvenirlikten sonra bir testin sahip olması gereken 3. Özellik kullanışlıktır. Bir testin kullanışlılığı, onun geliştirilmesi, çoğaltılması, uygulanmasının kolay ve ekonomik olmasıdır.


TEST PLANI


Amaçların belirlenmesi Ölçülecek davranışların belirlenmesi Belirtke tablosunun hazırlanması Soru türünün belirlenmesi Soru sayısının belirlenmesi Soruların güçlük derecelerine karar verilmesi Sınav süresinin belirlenmesi Soruların yazılması Puanlama işlemlerinin belirlenmesi

EĞİTİMDE KULLANILAN TESTLER

3 Yaklaşım vardır. Psikometrik Yaklaşım: Nicel, sonuç, objektif ölçme kaygısı İzlenimci Yaklaşım: Nitel, süreç, sübjektif, üst düzey Uzlaştırıcı (Eklektik) Yaklaşım: Süreç ve sonuç, tümel değerlendirme, portfolyo (öğrenci ürün dosyası), puanlama anahtarı (Rubrik)

SÖZLÜ TESTLER

Soruların ve cevapların sözlü ifade edildiği testlerdir. Kullanılan en eski test türüdür. Olumsuz yanı en fazla olan testlerdir. Anında geri bildirim verilebilir. Sözel ifade yeteneğini geliştirir. Tekrar niteliği taşır. Düzenli kullanılırsa öğrencilerin derse hazırlıklı gelmesini sağlar. Kopya riski yoktur. Sadece sözlüye bakılarak not verilmez, geçerliliği yoktur. YAZILI (KLASİK) TESTLER Essay tipi, Kompozisyon tipi gibi soru hazırlaması kolay, puanlaması zordur. Üst düzey davranışları etkili olarak ölçebilir. Ezberden çok, derinlemesine öğrenme söz konusudur. Şans başarısı düşüktür. Kapsam geçerliliği düşüktür. Uzun cevaplı az soru yerine, kısa cevaplı çok soru tercih edilmelidir. Sınava giren kişi sayısı az ise kullanılmalıdır. Sorular açık, kısa ve anlaşılır olmalıdır. Konu başlıkları soru olarak sorulmamalıdır. Cevap anahtarı önceden hazırlanmalıdır. Puanlanırken kullanılan 4 farklı yöntem vardır: Genel İzlenimle Puanlama Sınıflama Yoluyla Puanlama Sıralama Yoluyla Puanlama Anahtarla Puanlama (1’den 4’e doğru güvenirlik ve geçerlilik artar.)


OBJEKTİF TESTLER

Kısa cevaplı, Doğru/Yanlış, Eşleştirmeli, Çoktan Seçmeli testlerdir. Kısa Cevaplı Testler: Cevabı bir kelime, bir cümle, ya da bir rakam olan cümlelerdir. Boşluk doldurmalı ya da tamamlamalı testler adı verilir. Doğru/Yanlış Testleri: Öğrencilerin belirli konulardaki doğru veya yanlışları ayırt etme düzeyini belirlemek amacıyla kullanılan doğru ve yanlış şeklindeki cümlelerden oluşturulan testlerdir. Puanlaması objektiftir. Hazırlanması, cevaplanması, puanlaması kolaydır. Öğretimin her basamağında kullanılabilir. Şans başarısının en yüksek olduğu testlerdir. (%50) Yanlış öğrenmeleri teşhis etmek güçtür. Bilişsel alanın bilgi basamağı üzerinde soru yazmak zordur. Her madde açık ve anlaşılır olmalı, tek ve kesin bir fikri belirmelidir. Soru cümlesi yoruma açık olmamalıdır. Bir maddenin yanlışlığı önemsiz ya da aldatıcı yanda olmamalıdır. Olumsuz önermelerden oluşan, özellikle de çift olumsuz ifade içeren maddeler kullanılmamalıdır. Testteki doğru ve yanlış sayısı aynı olmalıdır. Eşleştirmeli Testler: İki grup ya da sütun halinde verilen ve birbiriyle ilgili olan kelime, sembol, numara ya da cümlelerin eşleştirilmesi şeklinde hazırlanan cümlelerdir. Soru sayısı 6 ile 15 arasında olmalıdır. Çoktan Seçmeli Testler: Çoktan seçmeli testler, cevaplarını belirli sayıdaki seçenekler arasından bir tanesinin seçilmesini gerektiren testlerdir. Bir soru kökü ve buna uygun seçenekler vardır. Kapsam geçerliliği yüksektir, objektiftir, testler içerisinde geçerliliği ve güvenirliği en yüksek olandır. Doğru yanış dışındaki tüm seçenekler (şıklar) çeldirici olarak adlandırılır. İş-Performans Testleri: Özellikle öğrencilerin psikomotor becerilerini ölçmek amacıyla kullanılan testlerdir. Öğrencilerin becerilerinin çeşitliliği bakımından ne derece yeterli olduklarının belirlenmesi, eksikliklerinin görülüp giderilmesi amacıyla kullanılırlar. Genellikle bu tip testler 3 bölümden oluşur. Bunlar, becerinin yapılmasında izlenen yol, becerinin yapılma hızı ve sonuçta ortaya çıkan işin kalitesinin belirlenmesidir. Performans Değerlendirmede Kullanılan Ölçme Araçları: Portfolyo: Öğrencilerin öğrenme süresince yaptıkları çalışmaları, geliştirdikleri ürünleri ve bu ürünleri geliştirirken izledikleri yolları bir bütün olarak yansıtan öğrenci ürün dosyalarıdır. 4 tür portfolyo vardır, bunlar: Belgesel Kanıt Dosyaları, Süreç Dosyaları, Vitrin Dosyaları, Arşiv Dosyaları. Öğrencinin gelişim aşamalarının bütünsel olarak görülmesini sağlar, tümel değerlendirme imkânı verir, süreçle sonucu birleştirir. Üst düzey davranışlarının gelişmesini sağlar ve gösterir. Kalabalık gruplarda uygulanması zordur, puanlaması zordur, performansı tam yansıtan örnek bulmak zordur. Kontrol Listeleri (Check List): Öğrenci performansı, mevcut ya da eksik noktalarını belirlemek amacıyla kullanılan araçlardır. Ölçülmek istenen özellik var-yok, evet-hayır, 1-0 şeklinde değerlendirilir. Dereceli Puanlama Anahtarı (Rübrik): Öğrenci performansını, yeterlilik düzeyini, önceden hazırlanmış olan derecelendirilmiş ölçekler aracılığıyla ayrıntılı bir şekilde gösteren ölçme araçlarıdır. Öncekinden farkı, performans düzeyini ayrıntılı olarak göstermesidir. Rübrikler, Holistik ve Analitik olmak üzere 2’ye ayrılır. Holistik Rübrikler sonucu, Analitik Rübrikler süreci ölçmek için kullanılır. Öz Değerlendirme ve Akran Değerlendirme: Öğrencinin kendi performansının değerlendirmesine öz değerlendirme, arkadaşlarının performansını değerlendirmesine ise akran değerlendirme denir. Yukarıdaki ölçme araçları dışında performans değerlendirmek amacıyla gözlem ve görüşme formları da kullanılabilir.