《心理與教育測量》考試大綱
心理測量圍繞心理量表這個核心主要分為測驗理論和測驗應(yīng)用兩大部分。學(xué)習(xí)理論部分內(nèi)容時,應(yīng)對每部分涉及的知識點進(jìn)行整理和歸納,以系統(tǒng)的觀點來學(xué)習(xí)和運用相關(guān)知識。這一部分中測驗的編制更體現(xiàn)了學(xué)習(xí)的系統(tǒng)性,編制的各個環(huán)節(jié)都是相扣的,一定要聯(lián)系起來掌握,并且需要把握每個環(huán)節(jié)需要注意的問題,在實際操作中能減少一些誤差的產(chǎn)生。這部分中信度、效度、項目區(qū)分度的計算是重點,考生需要掌握幾個常用的公式,理解它們的適用范圍。而心理測量理論的新發(fā)展我們可以適當(dāng)了解,不必深究。
心理測驗的應(yīng)用部分主要是心理測驗在實際中的應(yīng)用??忌鷳?yīng)在學(xué)習(xí)中關(guān)注各類測驗的定義、特點、編制、實施和解釋的內(nèi)容。尤其對一些經(jīng)典的測驗要熟練掌握??傮w來說這部分內(nèi)容既非考查的重點,同時識記難度也不大。
總之,這兩部分中,測驗理論是重點,信度、效度的分析,常模參照測驗與標(biāo)準(zhǔn)參照測驗、測驗的制作過程等重在理解。各種測驗主要是了解每種測驗中有代表性的幾種著名量表。同時特別強調(diào)的是測驗部分很可能會考察它的應(yīng)用方面,所以不僅要再認(rèn)和記憶其中的細(xì)節(jié),也要注意對其應(yīng)用方面的思考和練習(xí)。
第一章 心理與教育測量概述
第一節(jié) 心理與教育測量的相關(guān)概念
一、測量的概念:依據(jù)一定的法則使用量具對事物的特征進(jìn)行定量描述的過程。
二、任何測量都必須具備兩個基本要素:參照點和測量的單位。其中參照點分為絕對參照點和相對參照點。
三、測量的量表:能夠使事物的特征數(shù)量化的數(shù)字的連續(xù)體就是量表。
量表可以分為四種:①命名量表:用數(shù)字代表事物或用數(shù)字對事物進(jìn)行分類。命名量表又分為名稱量表(用數(shù)字指代個別事物)和類別量表(用數(shù)字指代事物種類)。
②順序量表:按照事物的大小,等級,程度而排列數(shù)字的量表。
③等距量表:不僅能夠指代事物的類別,等級而且具有相等的單位。等距量表的數(shù)字是一個真正的數(shù)量,這個數(shù)量中各個部分的單位是相等的。因此可以對其進(jìn)行加減運算。等距量表沒有絕對的零點。它的零點是人們假定的相對零點。對于等距量表的兩個數(shù)不能進(jìn)行乘除運算。
④比率量表:除了具有類別、等級、等距的特征外,還有絕對的零點。
四、影響測量精確的因素
1、測量對象本身的性質(zhì)。①確定型(物體的長度)。②隨機型(人的短時記憶容量)③模糊型,即事物本身的量是模糊不定的(人的性格特征)
2、測量的精確度取決于測量工具的精確性。
3、根據(jù)測量的性質(zhì)和不同的特點,可以將不同形式的測量大致分為4種類型。
①物理測量:及對事物物理特征的測量。長度,重量等。
②生理測量:對機體生理特征的測量。如對動植物各種化學(xué)成分含量的測量。
③社會測量:即對社會現(xiàn)象的測量,如人口普查。
④心理測量:對人的心理特征的測量。如智力、人格測量。
第二節(jié) 心理與教育測量的性質(zhì)
一、心理與教育測量的定義:依據(jù)一定的心理學(xué)和教育學(xué)原理,使用測驗對人的心理特質(zhì)和教育成就進(jìn)行定量描述的過程。
其獨特的性質(zhì):①心理與教育測量依據(jù)的法則在很大程度上只是一種理論,很難達(dá)到如同物理測量依據(jù)的法則那樣普遍被人們接受的水平。② 心理與教育測量的對象是人的心理特質(zhì)和教育成就。③心理與教育測量的量具是有關(guān)領(lǐng)域的專家編制,經(jīng)過長期的試用,修訂,完善而逐漸形成的標(biāo)準(zhǔn)化測驗。他的編制是一門高度專門化的系統(tǒng)工作。④心理與教育測量的目標(biāo)雖然是對人的心理特質(zhì)和教育成就進(jìn)行定量分析,但這種定量分析的精確度遠(yuǎn)不及物理測量的精確度高。
二、心理與教育測量的理論基礎(chǔ):
①人的心理現(xiàn)象和知識水平如同其他一切物理現(xiàn)象一樣是有差異的,有質(zhì)的差異也有量的差異。因為有差異,所以要測定差異的數(shù)量,描述差異的程度。②心理特質(zhì)和知識水平雖然不是物理實體,不能直接測量,卻必然表現(xiàn)于人的外部行為之中,并調(diào)節(jié)著人的外部行為。因此,通過觀測人的外部行為的差異就有可能測量出人的心理特質(zhì)和知識水平的差異。③教育和心理測量的準(zhǔn)確性和可靠性如同其他一切測量技術(shù)一樣是相對的,如同其他一切測量技術(shù)一樣是科學(xué)技術(shù)的進(jìn)步發(fā)展而逐步提高。
三、心理與教育測量中的測驗
測驗:由有關(guān)領(lǐng)域的專家經(jīng)過長期的編制、試用、修訂、完善而逐漸形成的標(biāo)準(zhǔn)化測量工具。
編制一個測驗應(yīng)當(dāng)具備4個基本條件:
①行為樣本(被抽取出來的,作為直接測量對象的行為就是行為樣本)
②標(biāo)準(zhǔn)化。分為:測驗內(nèi)容標(biāo)準(zhǔn)化、施測條件標(biāo)準(zhǔn)化(相同的指導(dǎo)語,相同的測驗情景,相同的測驗時限)、評分規(guī)則的標(biāo)準(zhǔn)化、測驗常模的標(biāo)準(zhǔn)化。
③難度或應(yīng)答率。
④信度和效度。
第三節(jié) 心理及教育測量的種類及其功能
一、心理及教育測驗的種類
1、按測驗功能所作分類:智力測驗 能力傾向測驗 成就測驗 人格測驗
2、按測驗對象所做的分類:個別測驗 團(tuán)體測驗
3、按測驗內(nèi)容的形式所做的分類:文字(紙筆)測驗 非文字(操作)測驗
4、按測驗?zāi)康淖龅姆诸悾好枋鲂詼y驗 診斷性測驗 預(yù)測性測驗
5、按測驗的難度和時限做的分類: 難度測驗與速度測驗
6、按測驗的要求分類:最高作為測驗 典型作為測驗
7、按測驗的性質(zhì)分類:構(gòu)造性測驗 投射性測驗
8、按測驗的標(biāo)準(zhǔn)化程度分類:標(biāo)準(zhǔn)化測驗 非標(biāo)準(zhǔn)化測驗
9、按評價所參照的標(biāo)準(zhǔn):常模參照測驗 目標(biāo)參照測驗 潛力參照測驗
10、按測驗的運用領(lǐng)域分類:教育測驗 職業(yè)測驗 臨床測驗
二、心理與教育測量的功能
(一)理論研究功能:①收集研究資料 ②建立和檢驗理論假設(shè) ③實驗分組
(二)實際應(yīng)用功能:①選拔人才 ②人員安置 ③心理診斷 ④描述評 ⑤心理咨詢 ⑥預(yù)測
第二章 心理與教育測量的誤差
第一節(jié) 測量誤差的定義及分類
一、誤差的定義:在一切測量中,由于各種因素的影響,測量所得的觀測值并不準(zhǔn)確地等于被測之量的真值。二者之差稱為測量誤差。指在測量過程中,那些與測量目的無關(guān)的因素所導(dǎo)致的測量結(jié)果不準(zhǔn)確或不一致的測量效應(yīng)。
二、誤差的種類:根據(jù)測量誤差的性質(zhì)來源,測量誤差可分為系統(tǒng)誤差和隨機誤差。
第二節(jié) 測量誤差的來源及控制
一、測量誤差的來源
常見的影響測驗誤差的因素主要有三方面:測驗工具、施測過程、測量對象。
(一)測驗工具
測驗自身的誤差主要來源于測驗的編制過程,其中項目取樣影響最大。測驗所要測量的內(nèi)容是什么,測驗的項目能否代表這些內(nèi)容,是至關(guān)重要的。當(dāng)測驗的項目較少而取樣缺乏代表性時,被試的反應(yīng)很難代表其真實水平。對于有些類型的項目,例如是非題、選擇題,被試可能憑猜測作答,從而降低分?jǐn)?shù)的可靠性。此外,題目用詞模棱兩可,或?qū)σ髷⑹霾磺宓?,也都會帶來誤差。
(二)施測過程
在測驗的實施過程中可能引起誤差的因素很多,如測試環(huán)境、時間、主試因素、意外干擾、評分記分等。
(三)測驗對象
在測量工作中,最復(fù)雜的和最難控制的是由被試本身引起的各種誤差。測驗中被試的應(yīng)試動機、被試的焦慮、測驗經(jīng)驗、練習(xí)效應(yīng)、反應(yīng)傾向和生理變因等因素都會帶來誤差。
二、測量誤差的控制
要想控制誤差,就必須使測驗標(biāo)準(zhǔn)化,即測驗的編制、施測、評分、解釋都必須標(biāo)準(zhǔn)化,控制導(dǎo)致誤差的因素,減少誤差,使測驗分?jǐn)?shù)更可信、有效。保證有效性和準(zhǔn)確性程度。
第三章 心理與教育測量的信度
第一節(jié) 信度概述
一、信度的定義
信度的描述定義
指測驗結(jié)果的一致性或穩(wěn)定性,其測量定義為一組測量分?jǐn)?shù)的真變異數(shù)與總變異數(shù)(實得變異數(shù))的比率,含義是在實得分?jǐn)?shù)的變異中有多大比例是由真分?jǐn)?shù)的變異決定的。
rxx=S2T/S2x
二、信度系數(shù)的估計(種類)
①重測信度:
a.求法是對同一批被試運用某個測驗實施首測,相隔一段時間后對它進(jìn)行再測,然后計算首測與再測所得分?jǐn)?shù)的相關(guān)(一般是積差相關(guān)),即得重測信度。這種信度能表示兩次測驗結(jié)果有無變動,反映測驗分?jǐn)?shù)的穩(wěn)定程度,故又稱穩(wěn)定性系數(shù)。
b.優(yōu)點:能提供有關(guān)測驗結(jié)果是否隨時間而變異的資料,可作為預(yù)測受測者將來行為表現(xiàn)的依據(jù)。
c.缺點:易受練習(xí)和記憶的影響,前后兩次施測間隔的長短必須適度。如果相隔時間太短,則記憶猶新,練習(xí)的影響較大;如果相隔時間太長,則身心的發(fā)展與學(xué)習(xí)經(jīng)驗的累積等都足以改變測驗分?jǐn)?shù)的意義,而使相關(guān)降低。另外,第一次嘗試所發(fā)現(xiàn)的錯誤也可能導(dǎo)致第二次反應(yīng)的變化而增加誤差變異。
d.誤差來源:時間的不同所帶來的隨機影響,如氣候、偶然的噪音或其他干擾,以及引起被試本身身心狀態(tài)變化的因素如疾病、疲勞、情緒類型、焦慮等。重測信度代表測驗成績能夠應(yīng)用于不同時間的程度,信度越高,受測驗環(huán)境中日常的隨機因素的影響越小。 由于測驗的穩(wěn)定性系數(shù)受時間和其他各種因素的影響,故任何一個測驗都可有不止一個重測信度系數(shù)。所以在測驗手冊中報告此種信度時應(yīng)說明時間間隔以及在此間隔中被試的有關(guān)經(jīng)歷,如受過何種教育訓(xùn)練、心理治療以及有何學(xué)習(xí)經(jīng)歷等。
②復(fù)本信度:
兩個平行測驗測量同一批被試所得結(jié)果的一致性程度,其大小等同一批被試在兩個復(fù)本測驗上所得分?jǐn)?shù)的皮爾遜積差相關(guān)系數(shù)。
a.求法是先運用同一測驗的一型或A型施測,隨后在最短的時間內(nèi)運用二型或B型進(jìn)行再測,然后再求它們得分的相關(guān)系數(shù)。
b.誤差來源:測驗兩種形式是否等值:測題取樣是否匹配,格式是否相同,內(nèi)容、題數(shù)、難度、平均數(shù)、標(biāo)準(zhǔn)差是否一致。再就是被試方面情緒波動、動機變化等,以及測驗情境的變化,偶發(fā)因素的干擾。這些都會引起測量誤差。在報告復(fù)本信度時,也應(yīng)說明兩次施測的間隔,以及在此間隔內(nèi)被試的有關(guān)經(jīng)歷。
③內(nèi)部一致性信度 估計內(nèi)部一致性系數(shù)的方法通常有兩類:一類是分半法,另外一類方法需要對項目反應(yīng)的方差或協(xié)方差進(jìn)行分析。
a.分半法是將一個測驗分裂為兩個假定相等而獨立的部分,然后計算這兩部分的記分的相關(guān)系數(shù)(一般是以項目的奇數(shù)為一組,偶數(shù)為另一組),繼而再用斯皮爾曼-布朗公式來估計整個測驗的信度(斯-布公式要求兩半的變異數(shù)相等)。
缺點:把測驗劃分成兩半的方法實際上有多種,而每一種劃分方法產(chǎn)生的估計都有差別,因此用分半法得到的信度估計值不具備惟一性。
b.克朗巴赫α系數(shù)
適用于非0,1記分的一種內(nèi)在一致性系數(shù),計算公式為:
c.除了以上兩種方法,還有庫德-理查遜公式(只適合于0、1記分的題目);荷伊特信度;因素分析等方法。有些測量學(xué)家認(rèn)為因素分析是決定測驗同質(zhì)性的最好方法。
因素分析方法最初是由心理學(xué)家斯皮爾曼在研究智力理論時提出來的,后來發(fā)展成為一種復(fù)雜的統(tǒng)計技術(shù),用于確定一組變量間的相互關(guān)系最少需要幾個因素來解釋。在測驗上,如果一個因素就足以解釋所有題目分?jǐn)?shù)的變異時,這個測驗就是同質(zhì)的,假如需要一個以上的因素時,則測驗的組成是異質(zhì)的。
d.內(nèi)在一致性信度的優(yōu)點:只需施測一次,就可以估計信度系數(shù),省時節(jié)力。另外用內(nèi)在一致性系數(shù)一般要比重測信度、復(fù)本信度所算出的信度系數(shù)高。
e.不足之處:求分半信度時,分半的方法不同,估計出的信度系數(shù)就不同。而且,測驗須要求具有同質(zhì)性。所以項目異質(zhì)的人格測驗,通常就不能用內(nèi)在一致性系數(shù)來估計信度。
④評分者信度
隨機抽取相當(dāng)份數(shù)的試卷,由兩位評分者按記分規(guī)則分別給分。然后根據(jù)每份試卷的兩個分?jǐn)?shù)計算其相關(guān)系數(shù),即得評分者信度。一般要求在成對的、受過訓(xùn)練的評分者之間平均一致性達(dá)到0.90以上,才認(rèn)為評分是客觀的。
綜上所述,信度高低是用相關(guān)系數(shù)表示的。不同的測驗內(nèi)容,對相關(guān)系數(shù)的要求有所不同。一般說來,標(biāo)準(zhǔn)智力測驗應(yīng)達(dá)到0.85以上,個性測驗和興趣測驗一般應(yīng)達(dá)0.70~0.80水平。學(xué)業(yè)成就測驗要求信度在0.90以上,才能被稱為是一個良好的測驗。
第二節(jié) 信度的影響因素及提高信度的方法
信度與誤差變異之間有密切的關(guān)系。誤差變異越大,信度愈低。凡被試、主試、測驗內(nèi)容和施測情境等各個方面能引起隨機誤差而導(dǎo)致分?jǐn)?shù)不一致的因素,都會降低測驗的信度。
1、被試方面——身心健康狀況、動機、注意力、持久性、求勝心、作答態(tài)度等。
2、主試方面——不按規(guī)定實施測驗,制造緊張氣氛,給予特別協(xié)助,評分主觀等。
3、 測驗內(nèi)容方面——試題取樣不當(dāng),內(nèi)部一致性低,題數(shù)過少,題意模糊等。
4、 施測情境方面——測驗現(xiàn)場條件,如通風(fēng)、溫度、光線、噪音、桌面好壞、空間闊窄等。
5、 除此之外,還有以下幾個因素會影響信度系數(shù)的大?。?①被試樣本 影響信度系數(shù)的一個重要因素是用來確定信度的被試團(tuán)體的特性。 ②團(tuán)體的異質(zhì)性(公式)如同所有相關(guān)系數(shù)一樣,信度系數(shù)受分?jǐn)?shù)的分布范圍影響,而分?jǐn)?shù)范圍與被試團(tuán)體的異質(zhì)程度有關(guān)。一個團(tuán)體越是異質(zhì),其分?jǐn)?shù)范圍越大。而一個經(jīng)過篩選、相對同質(zhì)的團(tuán)體分?jǐn)?shù)則較為均勻。③團(tuán)體的平均水平 信度系數(shù)不僅受被試樣本的個體差異程度的影響,而且受被試團(tuán)體的平均水平的影響。這是因為,對于不同水平的團(tuán)體,題目具有不同的難度。每個題目在難度上的微小差異累積起來便會影響信度。由于信度系數(shù)與被試樣本的異質(zhì)程度和平均水平有關(guān),因此在編制測驗時,應(yīng)把常模團(tuán)體按年齡、性別、文化程度分為更同質(zhì)的亞團(tuán)體,并分別報告每個亞團(tuán)體的信度系數(shù),這樣測驗才能適用于各種團(tuán)體。④題目的數(shù)量(公式) 題目的數(shù)量(亦即測驗的長度)也是影響信度系數(shù)的一個因素。一般說來,在一個測驗中增加同質(zhì)的題目,可以使信度提高。因為增加測驗的長度可以加大分?jǐn)?shù)范圍。這里要注意一點,只有當(dāng)新題目是與原題目選自同一總體,即與原題目具有同質(zhì)性時,增長測驗才能改進(jìn)信度。⑤測驗難度 測驗的難度與信度間沒有簡單的關(guān)系。然而,若測驗對某團(tuán)體太難或太容易,則分?jǐn)?shù)范圍將縮小,從而使信度降低。這表明,要使信度達(dá)到最高,能產(chǎn)生最廣分?jǐn)?shù)分布的難度水平方為合適。 ⑥間隔時間以再測法或復(fù)本法求信度,兩次測驗相隔時間越短,其信度系數(shù)越大;間隔時間越久,其他變因介入的可能性越大,受外界的影響也越多,信度系數(shù)便越低。
第四章 心理與教育測量的效度
第一節(jié) 測量的效度概述
一、效度的定義
1、 效度的測量定義:與測量目標(biāo)有關(guān)的真變異數(shù)與總變異數(shù)的比率,含義是在一組測驗分?jǐn)?shù)中,有多大的比例是由測驗所要測量的目標(biāo)引起的。
2、描述定義:效度是指一個測驗或量具能夠測量出其所要測量目標(biāo)的程度。
第二節(jié) 效度的種類和估計方法
一、測驗的效度分為三大類:內(nèi)容效度、構(gòu)想效度、效標(biāo)效度。
(一)內(nèi)容效度(表面效度)
內(nèi)容效度指的是測驗題目對有關(guān)內(nèi)容或行為范圍取樣的適當(dāng)性。這種測驗的效度主要與測驗內(nèi)容有關(guān),所以叫內(nèi)容效度,指測驗題目在要測量的行為領(lǐng)域的代表性。內(nèi)容效度的評估方法主要應(yīng)用于對學(xué)績測驗的評估。
一個測驗要有內(nèi)容效度必須具備兩個條件:要有定義得完好的內(nèi)容范圍;測驗題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。測驗題目并不需要包羅該范圍的所有材料,而只需包含測驗編制者認(rèn)為是重要的材料。 確定內(nèi)容效度的方法主要有專家判斷、統(tǒng)計分析、經(jīng)驗法等。
a.專家判斷
為了確定一個測驗是否具有內(nèi)容效度,最常用的方法是請有關(guān)專家對測驗題目與原定內(nèi)容范圍的符合性做出判斷。
b.統(tǒng)計分析
內(nèi)容效度可由一組被試在獨立取自同樣內(nèi)容范圍的兩個測驗復(fù)本上得分之相關(guān)來作數(shù)量的估計。若相關(guān)低,說明二者至少有一個缺乏內(nèi)容效度;若相關(guān)高,一般可推論測驗有內(nèi)容效度。
c.經(jīng)驗法
檢查不同年級的學(xué)生在測驗上的得分和在每個題目上的反應(yīng)情況。一般說來,測驗總分和題目通過率隨年級而提高,便是測驗具有內(nèi)容效度的證據(jù)。
(二)構(gòu)想效度
構(gòu)想效度就是測驗對某一理論概念或特質(zhì)測量的程度。研究和考察構(gòu)想效度要回答三個問題:一個測驗測量什么心理構(gòu)想,對這構(gòu)想測得有多好,測驗分?jǐn)?shù)中有多少比例的變異數(shù)是來自測驗所要測的構(gòu)想。 確定構(gòu)想效度的方法主要分為測驗內(nèi)方法、測驗間方法。 a.測驗內(nèi)方法主要是通過研究測驗內(nèi)部構(gòu)造來界定所測量的構(gòu)想的范圍。如確定測驗的內(nèi)容效度,分析被試對題目作反應(yīng)的過程,考察測驗的同質(zhì)性等方式。 b.測驗間是通過研究幾個測驗間的相互關(guān)系,找出他們的共同特點,進(jìn)而推斷出所測的共同特質(zhì)是什么,便可確定這些測驗是否有構(gòu)想效度。如確定相容效度、區(qū)分效度、因素分析效度等方式。
(三)效標(biāo)效度
效標(biāo)效度又稱實證效度,指一個測驗對處于特定情景中的個體的行為進(jìn)行預(yù)測時的有效性,也就是對于研究者所感興趣的行為能夠預(yù)測得怎么樣。其中,被預(yù)測的行為是檢驗測驗效度的標(biāo)準(zhǔn),簡稱效標(biāo)。確定效標(biāo)效度的方法主要有相關(guān)法、區(qū)分法、命中率和功利率等。
a.相關(guān)法 最常用來建立實證效度的方法是求測驗分?jǐn)?shù)與效標(biāo)測量間的相關(guān),所得到的數(shù)量指標(biāo)稱作效度系數(shù)。在測驗手冊中,一般用它來報告測驗對每種效標(biāo)的效度。計算效度系數(shù)最常用的是積差相關(guān)法。
b.區(qū)分法 第二個決定效度的方法是看預(yù)測源的分?jǐn)?shù)是否可區(qū)分由效標(biāo)測量所定義的團(tuán)體。
c.命中率(公式)
當(dāng)測驗用來作取舍的根據(jù)時,其有效性的指標(biāo)就是正確決定的比例(總命中率)。(正命中率和總命中率)
d.功利率
為了確定測驗的功效,人們還常常對使用測驗所花掉的費用與得到的利益進(jìn)行比較,看是否利大于弊。這種效度指標(biāo),叫功利率。
第三節(jié) 效度的影響因素與改進(jìn)
影響測驗效度的因素很多,在編制測驗或選擇標(biāo)準(zhǔn)化測驗時,都應(yīng)該考慮到這些因素,以免影響測驗結(jié)果的有效性。
①測驗本身的因素
a.測題中所用詞匯和句型不能過于困難。測題中的詞匯和句型應(yīng)適于被試的文化水平。 b.試題的意思應(yīng)該清楚。題意含糊,容易產(chǎn)生歧義,以致被試產(chǎn)生誤解也會降低測驗的效度。 c.所編制的測題應(yīng)該適合所要測量的學(xué)習(xí)結(jié)果。 d.測題中不能提供額外線索。若測題為被試提供了額外線索,就無法確認(rèn)測題是否真正測量到了所欲測量的學(xué)習(xí)結(jié)果。 e.測題的編制要合理。一般地,測題以由易到難的順序排列。f.選擇題的正確答案不能有明顯的組型。如果測驗正確答案的位置有明顯的規(guī)律,學(xué)生有可能發(fā)現(xiàn)規(guī)律答對一些原本較難的題目,從而影響測驗結(jié)果的效度。 g.測題數(shù)目。增加測題的數(shù)目(即增加測驗長度)通常可以提高測驗的信度和效度。 h.測題的難度要適當(dāng)。標(biāo)準(zhǔn)參照測驗中的測題平均難度應(yīng)在0.05左右,并有適當(dāng)?shù)碾y度分布,測題太難或太易都無法區(qū)分學(xué)生的優(yōu)劣,從而降低測驗的效度。標(biāo)準(zhǔn)參照測驗并不強調(diào)測驗分?jǐn)?shù)間的差異,也就不需要區(qū)分學(xué)生的優(yōu)劣,這時的測題難度就應(yīng)該與教學(xué)目標(biāo)的要求相一致。
②校標(biāo)因素
③樣本的代表性
④干涉變量
第五章 心理測驗的項目分析
第一節(jié) 題目的難度
一、難度的含義:難度就是項目(或題目)的難易程度。能力測驗中常以該項目的通過(或答對)率表示,即以答對或通過該題的人數(shù)的百分比來表示。
二、難度的計算方法
(一)二分法記分的項目
當(dāng)被試人數(shù)較多時,則可以根據(jù)測驗總成績將被試分成三組:分?jǐn)?shù)最高的27%的被試為高分組(HN),分?jǐn)?shù)最低的27%的被試為低分組(HN),中間46%的被試為中間組。分別計算高分組和低分組的通過率,再求試題的難度:
②非二分法計分的項目當(dāng)測驗項目為問答題或其他不能用二分法計分的形式時,常常對部分正確的反應(yīng)也給一定分?jǐn)?shù)。對于這類項目,一般用下面的公式計算難度:
三、難度水平的確定 ①在測驗編制過程中,分析項目難度主要是為了篩選項目。項目的難度水平多高合適,取決于測驗的目的、項目的形式以及測驗的性質(zhì)。0.5上下浮動0.2。 在教育工作中,有些測驗的目的是為了考查學(xué)生對某些方面的知識、技能是否掌握,此時可以不考慮難度。當(dāng)測驗用于選人時,應(yīng)該比較多地采用那些難度值接近錄取率的項目。 ②作為一個整體的測驗的難度,直接依賴于組成測驗的項目的難度。對整個測驗的難度的綜合性檢驗,可由分?jǐn)?shù)的分布提供。當(dāng)分?jǐn)?shù)分布是正偏態(tài),分?jǐn)?shù)密集在低端,表明測驗的難度偏高。當(dāng)分?jǐn)?shù)分布是負(fù)偏態(tài),分?jǐn)?shù)密集在高端,表明測驗的難度偏低。
第二節(jié) 題目的區(qū)分度
一、概念:區(qū)分度是指項目對所測量的心理特性的區(qū)分程度或鑒別能力,也就是項目的效度。常以高分組與低分組在該項目得分的平均數(shù)的差異表示,或以該項目得分與測驗總分的相關(guān)表示。
二、確定區(qū)分度的方法 確定區(qū)分度常用的是相關(guān)法,即以項目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)(或測驗總分)的相關(guān)作為項目區(qū)分度的指標(biāo),相關(guān)越高,區(qū)分能力越好。
①二列相關(guān)。二列相關(guān)適用于兩個可以連續(xù)測量的變量,但其中有一個由于某種原因被分成兩個類別。
②點二列相關(guān)。點二列相關(guān)適用于一個變量為連續(xù)變量,另一個變量為二分變量的資料。當(dāng)一個變量是雙峰分配時。盡管它并不是真正的二分變量,這種統(tǒng)計方法也適用。
③四分相關(guān)。四分相關(guān)適用于兩個常態(tài)的連續(xù)變量均被人為二分的資料。如果一個題目分?jǐn)?shù)被二分成通過不通過,效標(biāo)成績也被分成通過與不通過,這時就會得到四個類別,從而可組成一個四格表。計算四分相關(guān)最常用的是皮爾遜的余弦公式。
④Φ相關(guān)。相關(guān)的統(tǒng)計方法適用于兩個變量都是點分配的資料,即兩個變量都是二分名義變量。
⑤項目和總分相關(guān)重疊的校正。在做項目分析時,需要經(jīng)常計算項目和總分的相關(guān),這是一種局部和總體的相關(guān),在一個測驗中,只有當(dāng)每一項目的變異數(shù)相同或項目非常多,以致每個項目所貢獻(xiàn)的變異數(shù)比例都很微小時,才能把項目和總分的相關(guān)作為項目區(qū)分度的指標(biāo)。如果不具備這些條件,最好計算每一項目和所有其他項目合成分?jǐn)?shù)之間的相關(guān)。
對于教育成就測驗來說,一般要求項目與總分的相關(guān)達(dá)到0.20以上,高分組與低分組通過率之差達(dá)到0.15~0.20以上。
3、區(qū)分度與難度的關(guān)系 難度和區(qū)分度都是相對的,是針對一定團(tuán)體而言的(絕對的難度和區(qū)分度是不存在的)。一般說來,較難的項目對高水平被試區(qū)分度高,較易的項目對水平低的被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。這與中等難度的項目區(qū)分度最高的說法并不矛盾。由于人的多數(shù)心理特性呈常態(tài)分布,所以項目難度的分布也以常態(tài)為好,即特別難與特別容易的題目較少,越接近中等難度的題目越多,而所有項目的平均難度為0.50。
三、題目的綜合分析和篩選
1、鑒別力
取舍題目時,首先要看鑒別力。按照測題的鑒別指數(shù)與優(yōu)劣之評鑒標(biāo)準(zhǔn),0.30以上的項目是比較好的。
2、難度
P值一般在0.35至0.65之間為好,但就整個測驗而言,難度為0.5的測題應(yīng)居多,也需一些難度較大或較小的測題。
3、選項
項目的選項分析是指對選擇題后面所提供的幾個答案的分析。選項分析的異常情況主要有:正確答案無人選擇,或少于其他選項人數(shù);錯誤答案選的人太多;正確選項上高分組選擇人數(shù)少于低分組;錯誤選項上高分組選擇人數(shù)又多于低分組;某個選項無人選擇;未答的人數(shù)較多。
第六章 測驗分?jǐn)?shù)的合成與解釋
第一節(jié) 測驗分?jǐn)?shù)的合成
一、分?jǐn)?shù)合成的方法
二、分?jǐn)?shù)合成的方法比較
第二節(jié) 測驗分?jǐn)?shù)的解釋
一、呈現(xiàn)常模分?jǐn)?shù)的方法:①分?jǐn)?shù)轉(zhuǎn)換表 ②剖析圖 ③正態(tài)百分位圖表
二、幾種主要的常模分?jǐn)?shù):①發(fā)展量表 ②商數(shù) ③百分等級 ④標(biāo)準(zhǔn)分?jǐn)?shù)
三、標(biāo)準(zhǔn)參照分?jǐn)?shù):①內(nèi)容參照分?jǐn)?shù) ②結(jié)果參照分?jǐn)?shù)
四、分?jǐn)?shù)的解釋與交流
1、解釋分?jǐn)?shù)要注意的問題:
(1)測驗分?jǐn)?shù)是遺傳特征、學(xué)習(xí)與經(jīng)驗以及測驗情境的函數(shù)。
(2)為了對測驗分?jǐn)?shù)做出確切的解釋必須有效度資料。
(3)不要把測驗分?jǐn)?shù)看成確切的點。
(4)對于不同的分?jǐn)?shù)不能直接加以比較
2、如何向當(dāng)事人報告分?jǐn)?shù):
(1)使用當(dāng)事人所理解的語言。
(2)要保證當(dāng)事人知道這個測驗測量或預(yù)測什么。
(3)要使當(dāng)事人認(rèn)識到分?jǐn)?shù)只是一個“最好”的估計。
(4)要使當(dāng)事人知道如何運用他的分?jǐn)?shù)。
(5)要考慮測驗分?jǐn)?shù)將給當(dāng)事人帶來什么心理影響。
(6)要讓當(dāng)事人積極參與測驗分?jǐn)?shù)的解釋。
第七章 測驗的編制
第一節(jié) 標(biāo)準(zhǔn)化測驗的編制程序
一、測驗編制過程
1、三階段六步驟:
(1)準(zhǔn)備階段:確定測驗?zāi)康暮蛿M定計劃兩個步驟;
(2)編制階段:產(chǎn)生測驗題目以及預(yù)測與合成測驗等步驟
(3)完善階段:將測驗使用標(biāo)準(zhǔn)化、評鑒測驗基本特征并編寫測驗說明書等步驟。
2、項目編制的基本原則:
科學(xué)性原則、目的性原則、代表性原則、合理性原則、經(jīng)濟性原則。
3、項目編制的具體要求:
(1)題目格式應(yīng)明確具體,不要讓被試誤解。
(2)題目之間必須彼此獨立,不可互相重復(fù)或牽連,不要使一個題目的回答影響另外一個題目的回答。
(3)題目文句要簡明扼要,即文字應(yīng)該力求淺顯簡短,避免使用孤僻艱深的字句。
(4)題目意義必須明確,不得含糊,盡量避免使用雙重否定句。
(5)題目中不可含有暗示本題或其他題正確答案之線索。
(6)所提問題應(yīng)避免涉及社會禁忌與個人隱私,避免使用主觀性和情緒化的字句,
避免提出令被試為難的問題。
(7)題目應(yīng)有確切答案,沒有引起疑義和歧義的可能,也就是要有不致引起爭論的確定答案(創(chuàng)造力測驗、人格測驗除外)
(8)題目內(nèi)容不要超出受測團(tuán)體的知識、能力范圍,難度要適合被試水平。
(9)盡量做到施測與評分省時。
第八章 測驗的使用
第一節(jié) 測驗的選擇
一、測驗的目的與對象
二、測驗的質(zhì)量
三、選擇測驗應(yīng)考慮的其他因素
第二節(jié) 測驗的實施
第三節(jié) 測驗的管理
第九章 常用心理測驗
第一節(jié) 能力測驗
一、智力測驗(比內(nèi)量表、韋氏智力量表、瑞文標(biāo)準(zhǔn)推理測驗)
二、特殊能力測驗
三、能力傾向測驗
四、創(chuàng)造力測驗
第二節(jié) 人格測驗
一、人格測驗的編制
二、自陳量表(卡特爾16種人格因素測驗、艾森克人格問卷EPQ、愛德華個性偏好量表)
三、投射測驗
四、情境測驗
第三節(jié) 成就測驗
第四節(jié) 態(tài)度測驗
第五節(jié) 教育測驗
第六節(jié) 職業(yè)測驗
一、霍蘭德職業(yè)興趣測驗
第七節(jié) 臨床測驗
一、明尼蘇達(dá)多項人格測驗MMPI
參考書目:鄭日昌主編 心理與教育測量 人民教育出版社2011年6月第1版