第十二章教学测验评量Word文档下载推荐.docx

资源描述

第十二章教学测验评量Word文档下载推荐.docx

《第十二章教学测验评量Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《第十二章教学测验评量Word文档下载推荐.docx（10页珍藏版）》请在冰点文库上搜索。

第十二章教学测验评量Word文档下载推荐.docx

課程的設計與實施的評量、教師教學效率的評量、學生學習成就的評量

真實評量

直接測量學生某課程實際表現，強調於班級活動中，直接評量ex.實作評量、直接評量

實作評量

評量具體成果及應用過程

檔案評量

※卷宗評量

※真實評量

※非總結性評量

以學生檔案評鑑他們的學習情況，呈現生長過程

1.學生不再是「被評量者」，必須擔任協助工作，學生主導評量，由資料選取與省思過程中，學生學習主動分析自己的長處與缺失

2.整體動態評鑑

3.尊重個別差異※「非」配合全班教學實施

動態評量

時間連續性、成長連貫性

※依學生不同能力給予各種提示

※根據Vygotsky認知發展論之「可能發展區」、「社會中介」（個體認知能力需中介者協助促成）、「內化」等概念發展

生態評量

個體與環境交互作用產生，直接對個體、環境進行評量

1.評量地點選擇以學生可能接觸的各種環境為主

2.個別化的評量

※教學檔案：

教師利用教學資料的整理與反省過程，紀錄和展現教師在一段期間中的教學成效和專業發展情形

※再認法：

測學習者對於學過的教材能保留多少

【測驗特性】

優良評量

具備信度、效度、常模、實用性

測驗功能

1.認知測驗：

測量心理能力※最高表現

ex.智力（測未來學習）、成就（測目前學習）、

性向（普通&

特殊的學習潛力，有興趣不一定有潛力）、安置性測驗

2.情意測驗：

測量個人人格特質※典型表現

ex.態度、動機、人格測驗、自我觀念測驗、情境測驗

※墨漬測驗屬於人格測驗

測驗類型

1.客觀測驗：

選擇、是非、配合、填充、解釋

※選擇題為最佳題型

※配合題命題：

同一題各題項與選項性質力求相同、問題項目與反應項目數量不宜相同、反應項目按邏輯順序排列

※解釋性題目：

新穎，簡短、與課程目標相符、符合學生程度、「避免」是學生學過的

2.主觀測驗：

口試、申論、簡答

測驗依循

1.避免雙重否定語法、避免暗示答案的線索、避免以上皆非或以上皆是、同一題避免包含兩個概念

2.每個題目獨立，只呈現一個問題

測驗誤差

1.系統誤差（常誤或偏誤）：

固定、一致方式、不同情境對不同學生影響都是一致，影響效度不影響信度

ex.學生學習、訓練、遺忘、生長

2.非系統誤差（機誤）：

隨機、沒有規則、不可預測，影響效度與信度ex.測驗動機、情境、試題

標準化測驗

1.正式測驗（標準測驗）：

經由標準化編造的測驗

2.非正式測驗（非標準測驗）：

教師自編

※標準化測驗：

測驗的實施步驟、方法、陳述語皆有一致規範，讓測驗結果可以相互比較，傳達統計意義

信度、效度、常模、易施測、易計分、易解釋

教學診斷功能

1.預備測驗（教學前實施）

2.診斷測驗（補救教學）

※語意區分測驗：

使用兩相對形容詞構成的量尺，要求受試者對某一概念加以評定

※Holland興趣量表：

實際型（體力型，不與人接觸）、研究型、藝術型、社會型、企業型（領導能力及口才）、傳統型（注意細節、事務技能）

【評量方式】Glasser分為常模參照與標準參照；

我國學科→百分制，品德操性→廢除成績等第，改以依具體行為描述

常模參照評量※排名、等第

個人在團體中相對分數的位置（無法了解學習困難的地方），分班、編組功能

※高中聯考、標準化智力測驗、學校模擬考試、升學考試※常模是指心理測驗後，用來評定和解釋測驗分數的標準

1.百分等級常模：

百分比分數為一種原始分數（答對題數佔總題數的百分比表示）

百分等級為分數在團體中所佔的地位（無法告知熟練程度）→沒有百分等級100或0

※百分位帶：

得分上下一個測驗標準誤之內

2.標準分數常模：

平均數為參照點，離均差表相對位置

（1）Z分數：

等距量尺標準差=1，平均數=0ex.等距量表、比率量數

※Pearson經驗法則：

（2）T分數：

10Z+50標準差=10，平均數=50

（3）AGCT：

20Z+100標準差=20，平均數=100ex.團體智力測驗

（4）CEEB：

100Z+500標準差=100，平均數=500ex.GRE

（5）離差智商：

a.比西智力量表：

IQ=16Z+100標準差=16，平均數=100

b.魏氏智力量表：

IQ=15Z+100標準差=15，平均數=100

（6）標準九分：

等距分化九段標準差=2個標準差，平均數=5，半個標準差為一個單位

ex.6分→面積佔17%

標準參照評量※效標參照：

通過一門檻

由教師設定標準，達到標準則是「精熟」；

未達者是「非精熟」，診斷、補救教學、檢定功能

※精熟：

得到85%或90%以上測驗分數

※大專學力鑑定考試屬標準參照，因為在檢定出具有大專學歷水準以上的受試者

1.百分比（PA）一致性：

測驗的品質、團體的成分

2.測量標準誤：

測量一個人多次後的平均分數與真實分數之間的誤差

※某測量標準誤=3，甲生在此測驗得分72分，以95%的信賴區間而言，真正分數大約落入何範圍內？

※國中學策：

以潛在特質為基礎作測驗、用量尺分數（1~60級分）為次序變數、標準化測驗、常模參照測驗（標準分數、級分）

【信度】>

0.80才可信

意義

一群人在同一測驗上數次測量結果的一致性，為真正分數變異量與實得分數總變異量所佔的比例

類型

1.再測信度：

同一測驗對同一群受試者前後測驗兩次，並計算其相關係數

時間

同一群人同一群人

2.複本信度（最好的信度）：

兩份試題相當，此兩份試題對同一群人進行測驗，並計算其相關係數

同一群人

3.內部一致性信度：

（1）折半信度：

同一測驗中，題目分兩半估計之間內容是否一致※題目與總分相關（內部一致性）

（2）庫李信度：

根據內容的所有題目一致性估計信度，適用非對即錯、二分法測驗

（3）係數：

4.評分者信度：

同樣份數的測驗卷，給不同人改，每份測驗卷的兩個分數的相關係數

※投射測驗：

信度採評分者信度ex.墨漬測驗

影響因素

1.測驗量、難度2.評分客觀性3.受試者變異性

增加信度的方法

※新增加與原有測驗難度相同的試題，則新測驗信度將提高

1.難度、時間適中2.較大變異性的受試樣本信度越大3.客觀題型ex.是非、選擇

【效度】具真實性，選用、編製測驗時，應先考慮其效度※效度：

共同因素在總變異中所佔的比率

1.能測出其測量的特質or功能的程度（測驗結果正確性的程度）

2.指測驗結果之可靠、正確性，而非工具本身

3.由資料推斷，無法實際測量

1.內容效度（取樣效度、課程效度、邏輯效度）：

測驗內容是否符合教材內容與教學目標

※內容效度適合成就測驗ex.雙向細目表：

教學目標

※書局選購測驗卷作為學生的練習作業，應重視內容效度學

※編製測驗或問卷時，邀請學者專家評鑑題目是否合適，是為了提高內容效度內

容

2.效標關聯效度（實證效度、統計效度）：

實用性最高的一種效度

a.同時效度：

測驗分數與「當前」實際表現相關係數

（a）合成效度：

預測受試者整體工作效率

（b）區分效度：

以兩種不同性質的職業球相關係數為效標

b.預測效度：

測驗分數與「將來」表現相關係數

※編製教師性向測驗，作為教甄工具，應重視預測效度

c.終極效標：

個人專業生涯成功的評價，是最理想的效標

※編製教師性向測驗，以受試者的實際教學效果作為效標，稱為終極效標

3.建構（構念）效度：

測驗分數能依理論構念加以解釋的程度

※「因素分析法」是考驗心理測驗建構效度的最佳方法

4.表面效度：

測驗給人的第一印象好像是測量某種特質，所以受試者「主觀上」覺得有效的程度，缺乏邏輯分析，不能代替客觀決定的真正效度

※樣本變異數越大越有效

1.品質2.實施3.受試反應4.樣本性質5.效標

【信度與效度】※信度是效度必要條件→無信度則無效度、效度是信度充分條件

效度高→信度高信度高→不一定效度高信度低→效度低

效度低→不一定信度低

【難度、鑑別度】※難度是鑑別度的必要條件

難度

以正確答對的人數百分比來討論題目的或容易

1.順序尺度的難度係數：

P值無法指出難度之間的差異（因為單位不相等）

a.P越大，難度越小，平均數P=0.50

2.等距尺度的難度係數：

△值可以指出難度之間的差異（因為單位相等）

a.△越大，難度越大，平均數△=13

b.△=13+4X

3.測驗總分分布情形可知道測驗難度：

常態分配圖正態分配圖負態分配圖

鑑別度

1.試題能區分受試者優劣好壞，D越大，鑑別度越大※分數變異性越大，鑑別越大

※題目或項目分析，再測驗題目的鑑別度

2.D=PH-PL※-1＜D＜1

3.當P=0.50（難度適中），D>

0.30（具有較大鑑別度）

※PMax→0.5，DMax→1※知道P值，不一定能判斷D值

展开阅读全文

第十二章 教学测验评量Word文档下载推荐.docx

第十二章教学测验评量Word文档下载推荐.docx