第十二章 教学测验评量Word文档下载推荐.docx
《第十二章 教学测验评量Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《第十二章 教学测验评量Word文档下载推荐.docx(10页珍藏版)》请在冰点文库上搜索。
課程的設計與實施的評量、教師教學效率的評量、學生學習成就的評量
真實評量
直接測量學生某課程實際表現,強調於班級活動中,直接評量ex.實作評量、直接評量
實作評量
評量具體成果及應用過程
檔案評量
※卷宗評量
※真實評量
※非總結性評量
以學生檔案評鑑他們的學習情況,呈現生長過程
1.學生不再是「被評量者」,必須擔任協助工作,學生主導評量,由資料選取與省思過程中,學生學習主動分析自己的長處與缺失
2.整體動態評鑑
3.尊重個別差異※「非」配合全班教學實施
動態評量
時間連續性、成長連貫性
※依學生不同能力給予各種提示
※根據Vygotsky認知發展論之「可能發展區」、「社會中介」(個體認知能力需中介者協助促成)、「內化」等概念發展
生態評量
個體與環境交互作用產生,直接對個體、環境進行評量
1.評量地點選擇以學生可能接觸的各種環境為主
2.個別化的評量
※教學檔案:
教師利用教學資料的整理與反省過程,紀錄和展現教師在一段期間中的教學成效和專業發展情形
※再認法:
測學習者對於學過的教材能保留多少
【測驗特性】
優良評量
具備信度、效度、常模、實用性
測驗功能
1.認知測驗:
測量心理能力※最高表現
ex.智力(測未來學習)、成就(測目前學習)、
性向(普通&
特殊的學習潛力,有興趣不一定有潛力)、安置性測驗
2.情意測驗:
測量個人人格特質※典型表現
ex.態度、動機、人格測驗、自我觀念測驗、情境測驗
※墨漬測驗屬於人格測驗
測驗類型
1.客觀測驗:
選擇、是非、配合、填充、解釋
※選擇題為最佳題型
※配合題命題:
同一題各題項與選項性質力求相同、問題項目與反應項目數量不宜相同、反應項目按邏輯順序排列
※解釋性題目:
新穎,簡短、與課程目標相符、符合學生程度、「避免」是學生學過的
2.主觀測驗:
口試、申論、簡答
測驗依循
1.避免雙重否定語法、避免暗示答案的線索、避免以上皆非或以上皆是、同一題避免包含兩個概念
2.每個題目獨立,只呈現一個問題
測驗誤差
1.系統誤差(常誤或偏誤):
固定、一致方式、不同情境對不同學生影響都是一致,影響效度不影響信度
ex.學生學習、訓練、遺忘、生長
2.非系統誤差(機誤):
隨機、沒有規則、不可預測,影響效度與信度ex.測驗動機、情境、試題
標準化測驗
1.正式測驗(標準測驗):
經由標準化編造的測驗
2.非正式測驗(非標準測驗):
教師自編
※標準化測驗:
測驗的實施步驟、方法、陳述語皆有一致規範,讓測驗結果可以相互比較,傳達統計意義
信度、效度、常模、易施測、易計分、易解釋
教學診斷功能
1.預備測驗(教學前實施)
2.診斷測驗(補救教學)
※語意區分測驗:
使用兩相對形容詞構成的量尺,要求受試者對某一概念加以評定
※Holland興趣量表:
實際型(體力型,不與人接觸)、研究型、藝術型、社會型、企業型(領導能力及口才)、傳統型(注意細節、事務技能)
【評量方式】Glasser分為常模參照與標準參照;
我國學科→百分制,品德操性→廢除成績等第,改以依具體行為描述
常模參照評量※排名、等第
個人在團體中相對分數的位置(無法了解學習困難的地方),分班、編組功能
※高中聯考、標準化智力測驗、學校模擬考試、升學考試※常模是指心理測驗後,用來評定和解釋測驗分數的標準
1.百分等級常模:
百分比分數為一種原始分數(答對題數佔總題數的百分比表示)
百分等級為分數在團體中所佔的地位(無法告知熟練程度)→沒有百分等級100或0
※百分位帶:
得分上下一個測驗標準誤之內
2.標準分數常模:
平均數為參照點,離均差表相對位置
(1)Z分數:
等距量尺標準差=1,平均數=0ex.等距量表、比率量數
※Pearson經驗法則:
(2)T分數:
10Z+50標準差=10,平均數=50
(3)AGCT:
20Z+100標準差=20,平均數=100ex.團體智力測驗
(4)CEEB:
100Z+500標準差=100,平均數=500ex.GRE
(5)離差智商:
a.比西智力量表:
IQ=16Z+100標準差=16,平均數=100
b.魏氏智力量表:
IQ=15Z+100標準差=15,平均數=100
(6)標準九分:
等距分化九段標準差=2個標準差,平均數=5,半個標準差為一個單位
ex.6分→面積佔17%
標準參照評量※效標參照:
通過一門檻
由教師設定標準,達到標準則是「精熟」;
未達者是「非精熟」,診斷、補救教學、檢定功能
※精熟:
得到85%或90%以上測驗分數
※大專學力鑑定考試屬標準參照,因為在檢定出具有大專學歷水準以上的受試者
1.百分比(PA)一致性:
測驗的品質、團體的成分
2.測量標準誤:
測量一個人多次後的平均分數與真實分數之間的誤差
※某測量標準誤=3,甲生在此測驗得分72分,以95%的信賴區間而言,真正分數大約落入何範圍內?
※國中學策:
以潛在特質為基礎作測驗、用量尺分數(1~60級分)為次序變數、標準化測驗、常模參照測驗(標準分數、級分)
【信度】>
0.80才可信
意義
一群人在同一測驗上數次測量結果的一致性,為真正分數變異量與實得分數總變異量所佔的比例
類型
1.再測信度:
同一測驗對同一群受試者前後測驗兩次,並計算其相關係數
時間
同一群人同一群人
2.複本信度(最好的信度):
兩份試題相當,此兩份試題對同一群人進行測驗,並計算其相關係數
同一群人
3.內部一致性信度:
(1)折半信度:
同一測驗中,題目分兩半估計之間內容是否一致※題目與總分相關(內部一致性)
(2)庫李信度:
根據內容的所有題目一致性估計信度,適用非對即錯、二分法測驗
(3)係數:
4.評分者信度:
同樣份數的測驗卷,給不同人改,每份測驗卷的兩個分數的相關係數
※投射測驗:
信度採評分者信度ex.墨漬測驗
影響因素
1.測驗量、難度2.評分客觀性3.受試者變異性
增加信度的方法
※新增加與原有測驗難度相同的試題,則新測驗信度將提高
1.難度、時間適中2.較大變異性的受試樣本信度越大3.客觀題型ex.是非、選擇
【效度】具真實性,選用、編製測驗時,應先考慮其效度※效度:
共同因素在總變異中所佔的比率
1.能測出其測量的特質or功能的程度(測驗結果正確性的程度)
2.指測驗結果之可靠、正確性,而非工具本身
3.由資料推斷,無法實際測量
1.內容效度(取樣效度、課程效度、邏輯效度):
測驗內容是否符合教材內容與教學目標
※內容效度適合成就測驗ex.雙向細目表:
教學目標
※書局選購測驗卷作為學生的練習作業,應重視內容效度學
※編製測驗或問卷時,邀請學者專家評鑑題目是否合適,是為了提高內容效度內
容
2.效標關聯效度(實證效度、統計效度):
實用性最高的一種效度
a.同時效度:
測驗分數與「當前」實際表現相關係數
(a)合成效度:
預測受試者整體工作效率
(b)區分效度:
以兩種不同性質的職業球相關係數為效標
b.預測效度:
測驗分數與「將來」表現相關係數
※編製教師性向測驗,作為教甄工具,應重視預測效度
c.終極效標:
個人專業生涯成功的評價,是最理想的效標
※編製教師性向測驗,以受試者的實際教學效果作為效標,稱為終極效標
3.建構(構念)效度:
測驗分數能依理論構念加以解釋的程度
※「因素分析法」是考驗心理測驗建構效度的最佳方法
4.表面效度:
測驗給人的第一印象好像是測量某種特質,所以受試者「主觀上」覺得有效的程度,缺乏邏輯分析,不能代替客觀決定的真正效度
※樣本變異數越大越有效
1.品質2.實施3.受試反應4.樣本性質5.效標
【信度與效度】※信度是效度必要條件→無信度則無效度、效度是信度充分條件
效度高→信度高信度高→不一定效度高信度低→效度低
效度低→不一定信度低
【難度、鑑別度】※難度是鑑別度的必要條件
難度
以正確答對的人數百分比來討論題目的或容易
1.順序尺度的難度係數:
P值無法指出難度之間的差異(因為單位不相等)
a.P越大,難度越小,平均數P=0.50
b.
2.等距尺度的難度係數:
△值可以指出難度之間的差異(因為單位相等)
a.△越大,難度越大,平均數△=13
b.△=13+4X
3.測驗總分分布情形可知道測驗難度:
常態分配圖正態分配圖負態分配圖
鑑別度
1.試題能區分受試者優劣好壞,D越大,鑑別度越大※分數變異性越大,鑑別越大
※題目或項目分析,再測驗題目的鑑別度
2.D=PH-PL※-1<D<1
3.當P=0.50(難度適中),D>
0.30(具有較大鑑別度)
※PMax→0.5,DMax→1※知道P值,不一定能判斷D值