內容效度

內容效度

內容效度又稱邏輯效度,是指項目對欲測的內容或行為範圍取樣的適當程度,即測量內容的適當性和相符性。成就測驗和熟練測驗特別注重這種效度。由於這種衡量效度的方法必須針對課程的目標和內容,以系統的邏輯方法詳細分析題目的性能,故又稱課程效度或邏輯效度。

基本介紹

  • 中文名:內容效度
  • 外文名:contentvalidity
  • 套用學科:心理學
  • 套用範圍:實驗心理學
概念,驗證程式,驗證方法,專家判斷法,複本法,再測法,經驗法,套用,與表面效度的區別,

概念

內容效度又稱邏輯效度,是指項目對欲測的內容或行為範圍取樣的適當程度。如,教師為了了解學生在某一學科或某一課題上對知識的掌握情況,若時間許可,可以進行一個全面的考試,包含所有有關的內容,這顯然行不通。於是,就從這一範圍總體中選一樣本,也就是從可能的題目中取樣來編測驗,根據測驗分數推論學生在該範圍總體的知識。若測驗題目是這個範圍的好樣本,則推論將有效;若選題有偏差,則推論將無效。由於這種測驗的效度主要與測驗內容有關,所以叫內容效度。
一個測驗要有內容效度必須具備的條件
1. 要有定義得完好的內容範圍。所謂內容範圍,可以是一個明確而有限的題目總體(如20以內的加減法),也可以是具體的知識和技能,也可以是複雜的行為,如中小學生的心理健康的特點和表現。成就測驗主要目的是測量學生在某一學科中學習的效果,此種測驗的內容範圍容易確定,但人格測驗、興趣測驗等,測驗的內容範圍較難確定。
2.測驗項目應是已界定的內容範圍的代表性樣本。如果把所有的內容視為一個總體,那么測驗項目可以視為一個樣本,這個樣本要具有代表性,這個樣本能夠代表總體的程度就是內容效度。在正式編制測驗時,要做到這一點非常不容易。成就測驗好像較能夠做到這一點,但光是從形式上做到這一點還是不行,因為學生對知識的掌握程度不僅取決於對學習內容的記憶,還有理解和套用等,因此,如果只從對知識的記憶上去取樣,那就是有偏的樣本,還得考慮理解、套用等方面。對於智力測驗、人格測驗、興趣測驗等就更難解決。如,智力測驗,智力結構十分複雜,內容異常豐富,要用若干題目來代表全部智力,確實難度較大。著名的斯坦福-比奈量表經過了5年潛心研究和大規模的測試,才編制了這個測驗。另外,由於智力和知識的密切的關係,有的智力測驗的題目不能代表智力內容,實際上測量的是人的知識水平,這樣的項目就不具有代表性。

驗證程式

驗證測驗內容效度的一般程式
以教育測驗為例
1、確定所要測量的全部內容範圍;
2、將測驗目的具體化為不同層次的測驗目標;
3、確定每一層測驗目標在整個測驗中的比重;
3、編制雙向細目表;
4、確定每一小格中的測題數量;
5、按比例隨機抽取測驗題目;
6、請專家對測題的代表性、適合性進行分析,並作必要的修改,直到大多數專家滿意為止。

驗證方法

專家判斷法

確定測驗內容效度常用的方法是由專家對測驗項目與所涉及的內容範圍進行符合性判斷,這是一種定性分析的方法。對於成就測驗來說,學科專家要先對教學大綱或教材有全面了解,然後與測驗題目進行系統比較,看題目是否能代表所規定的內容。具體方法步驟如下:
①定義好內容總體,並描繪出有關知識與技能的輪廓;
②劃分細綱目,並根據重要性規劃好各個綱目的加權比例,作出儘可能詳細的描述;
③確定每道題所測的知識與技能,將自己的分類與測驗編制者的綱目作比較;
④制訂評定量表,從各方面對測驗作出評定。

複本法

克倫巴赫認為,內容效度可由一組被試在取自同樣內容範圍的兩個測驗複本上得分的相關來作數量上的估計。如果相關低則說明兩個測驗中至少有一個缺乏內容效度,但無法確定究竟哪一個缺乏內容效度。當相關高時,一般推論測驗具有內容效度,但也可能出現兩個測驗有相同偏差的情況。

再測法

先將測驗施測於被試,由於被試對測驗內容了解甚少,因而得分較低,然後對他們進行教學訓練,結束時再測一次,如果成績提高很大,則說明測驗對於教學具有較高的內容效度。

經驗法

不同的被試團體在測驗上的得分和對每題的反應存在較大差異,一般說,高年級比低年級的水平要高,如果總分和題目的通過率隨著年級而增高,則說明測驗對於教學具有內容效度

套用

作為一種方法,內容效度較為適合於評價教育成就測驗和職業選拔測驗。在這種測驗中,測驗內容應是知識、技能和實際工作的代表性樣本。內容效度不僅是評價教育成就測驗和職業選拔測驗的較好方法,而且也是編制任何測驗都應加以考慮的基本方面。內容效度對標準參照測驗更為重要,因為在標準參照測驗中我們主要關心的是被試對一定範圍內的知識、技能掌握得如何。
內容效度對能力傾向測驗人格測驗不是很合適,因為它們要測量的往往是較抽象的特質,其範圍難以明確界定,沒有明確的內容範圍,就無法考證測驗項目是否具有代表性。缺點:缺乏理想的數量指標,因而妨礙了信息交流和各測驗的相互比較。
在實際套用中,內容效度容易與表面效度相混淆。所謂表面效度指的是外行人從表面上看測驗是否有效。表面效度不是效度客觀指標,它不能真正反映測量的有效程度,但是它能影響被試的動機,從而影響測驗的效果。所以在編制測驗時,表面效度是一個必須考慮的問題。
內容效度既具有一定的優點,也有一定的局限。它的主要缺點是缺乏可靠的數量指標,因而妨礙了各測驗間的相互比較。

與表面效度的區別

表面效度(Face Validity):指外行人從表面上看測驗是否有效,測驗題目與測驗目的是否一致。表面效度不是真正的效度指標,但它容易和內容效度搞混。
表面效度是外行對測驗作表面上的檢查確定的,而內容效度是專家對測驗進行詳盡的、系統的評價建立的。
雖然兩者都是對測驗內容作出的主觀判斷,但判斷的標準不同。前者只考慮測驗項目與測驗目的之間的明顯的、直接的關係,後者則同時考慮到測驗項目與測驗目的和總體內容之間的邏輯的本質的聯繫。
表面效度高的題目內容效度不一定高,表面效度低的項目內容效度也不一定低。如,明尼蘇達個性調查表中有這樣的題目:“我的喉嚨里總好像有一塊東西堵著似的。”表面上看來這種題目似乎與個性無關,但在臨床上,回答“是”的人很可能是癔病或神經衰弱患者。
測驗對表面效度的考慮
表面效度不是效度客觀指標,不能保證測驗的正確性,但能對受測者的動機產生影響,因而也會影響到測驗的效度。如,智力測驗、成就測驗,受測者看出測驗題目反應自己的智力、能力,受測者會盡力去完成這些題目,最大限度地表現自己的能力和水平,對於某些人格測驗、態度測驗,被試如果看出這些項目與自己的人格缺陷、品德有關,被試會有意地掩蓋自己的缺點,從而產生虛假反應,如,:“我偷過東西。”讓被試判斷是否,被試即使偷過也會說否。
因此,編制測驗時應根據編制測驗的要求提高或降低表面效度,如人格測驗,表面效度應該低,使被試看不出來,從而讓被試作出真實的反應,能力測驗應該提高表面效度,以激發被試的答題動機。

相關詞條

熱門詞條

聯絡我們