定義
廣義
廣義的實驗設計指
科學研究的一般程式的知識,它包括從問題的提出、假說的形成、變數的選擇等等一直到結果的分析、論文的寫作一系列內容。它給研究者展示如何進行
科學研究的概貌,試圖解決研究的全過程。
狹義
狹義的實驗設計特指實施實驗處理的一個計畫方案以及與計畫方案有關的統計分析。
狹義的實驗設計著重解決的是從如何建立統計假說到作出結論這一段。
基本類型
常用的心理實驗設計有幾種基本類型,而這些類型常常是被綜合使用的。
單組設計與對比設計
根據是否設定控制組(對照組)劃分的兩種基本設計類型。①單組設計。在所選被試編組時不設定控制組,其基本模式是前測-處理-後測,通過前後兩次測量的差異檢驗實驗處理的效果。統計結果一般採用t檢驗法。單獨使用這種類型的實驗設計已不多見。因為在前測與後測中間有許多因素,如成熟、前測對後測的影響、測量工具的變形、情境的改變等,與實驗處理的效果相混淆,從而降低實驗的內在效度。
②對比設計。這是心理實驗最基本的設計之一。它把被試分為兩組,一組為實驗組,施以實驗處理(也稱處理);另一組為控制組,不加實驗處理。為使兩組被試儘量同質,便於比較,一般採用隨機分派法分組,通過測量兩組的差異檢驗實驗處理的效果。其基本模式如Ⅰ。即使隨機分派被試,但
樣本不很大時也很難保證兩組在處理前同質,因而兩組測量的差異不一定全是處理的結果。為了彌補這一不足,常在處理前先對兩組進行測量,即模式Ⅱ。如果前測的結果相近,可直接比較兩組的後測,並用t檢驗法檢驗其差異,這時的差異即可認為完全是由處理造成的。如果兩個前測不同,就要把前測作為共變數,進行獨立
樣本單因素的共變數分析。這種設計的優點是克服了大部分影響內在效度的無關變數。但由於有前測,又增加了前測的反作用效果,使外在效果有所降低。所謂測驗的反作用效果是指處理前進行的前測可能增加或減少被
試對處理的敏感性。
兩種基本設計類型
根據分組與處理方式劃分的兩種基本設計類型。
①完全隨機化設計。又稱被試間設計或獨立組設計。它起源於抽樣理論,即依據
機率統計的原則,把被試隨機分派到各組,接受各組應進行的處理。由於是隨機分派,所以在理論上各組接受處理前各方面是相等的。如果在同樣條件下對兩個或兩個以上組施以相同處理,則各組效果的平均數在統計上應沒有顯著差異;如果對兩個或兩個以上組分別施以不同的處理,所得效果平均數的差異可被斷定是由於處理的不同而造成的。這種設計的實驗結果一般採用獨立
樣本的t檢驗或
方差分析。在對比設計中所列的模式Ⅲ和Ⅳ,都可以說是完全隨機化設計,也可以算作對比設計。模式Ⅲ的特點是實驗組不進行前測,控制組不進行後測。由於被試是隨機分派的,實驗組與控制組被看作同質,所以比較控制組的前測與實驗組的後測,即可推斷處理的效果。這種交叉前後測法雖在理論上能克服前測的不良影響,但較為理想的隨機對比設計則是模式Ⅳ。它是把被試隨機分為4組,即兩個實驗組和兩個控制組,每兩個之中都是一個有前測另一個無前測。模式表中的Y1、Y2、Y3、Y4均為後測的結果。用獨立
樣本2×2
方差分析法檢驗“前測與無前測的差異”、“實驗處理與無處理的差異”以及“前測與處理互動作用是否顯著”,就能既克服前測存在的反作用,又防止實驗組與控制組可能出現不同質的狀況。這種設計雖然比較理想,但它的被試有4組,人數多、實驗次數也多,因而不夠經濟。
②
隨機區組設計。又稱被試內設計。它先把被試按某些特質分到不同區組,使各區組內的被試更接近同質,而區組間的被試更加不同。然後將各區組內的被試隨機分派接受不同的處理,或按不同順序接受所有的處理。這樣,對於一個區組來說是接受所有處理的。這一點與完全隨機化設計不同。完全隨機化設計中各組只分別接受各自所應該接受的處理。Ⅴ是
隨機區組設計的基本模式。它與完全隨機化設計的不同還表現在把“區組”這一變數也納入了實驗設計。這樣,總變異就可以分成“處理間”、“區組間”及“
誤差”。與完全隨機化設計相比,它能把由個別差異造成的變異估計出來。劃分區組的依據與要考察的反應變數密切相關,即當同一區組的被試在第1個實驗處理中得分高於其他區組時,在第2個處理中的得分也同樣高。因此,
隨機區組設計的
統計方法一般用
相關樣本的t檢驗或
方差分析。另外,如果
隨機區組設計中的每一區組都進行所有的處理,便稱為完全區組設計;如果每區組所進行的處理數小於總的處理數,則稱為不完全區組設計。後者雖然每一區組不進行所有的處理,但每一處理所在的區組數須相同。大部分心理學家在實驗中的處理數都不太多,基本上是用完全區組設計。若處理數很多(農業實驗中常遇到這種情況),由於實驗的總實施次數很大,限於人力、財力及時間,則須採用不完全區組設計。
因素設計
這兩種設計是根據實驗中自變數的多少來劃分的。
①單因素設計。它的自變數只有一個,其他能影響結果的因素均作為無關變數而加以控制。這種設計簡明易行,但由於在實際生活中影響心理活動的因素常不止一個,所以當情況比較複雜時,最好使用多因素實驗設計。
②多因素設計。自變數為兩個或兩個以上的實驗設計。常用的多因素設計有完全隨機化、隨機區組和拉丁方等。完全隨機化多因素設計根據自變數及每個自變數的變化水平(處理)的多少進行隨機分組。在2×2因素設計中,有兩個自變數因素A、B,每個因素又有兩種水平,共有 4種可能的處理,即A1B1、A1B2、A2B1、A2B2。這就必須隨機地把被試分為4組,每組接受一種處理,即模式Ⅵ。通過獨立
樣本的2×2因素
方差分析,可以分析出因素A或B的單獨作用及A與B的互動作用。隨機區組多因素設計則需在2×2因素設計中選一組被試,讓每一個被試都接受4種處理,在次序上哪個人先接受哪種處理用隨機法決定,這樣,每一個人的4種處理結果就是一個區組。該設計所採用的
統計方法用
相關樣本的
方差分析。
拉丁方實驗設計能以較少的實驗次數完成實驗目的。例如,A、B、C3種因素各有3個水平,需做33=27次實驗。若採用拉丁方設計就不必做那么多次。在這種設計中,A、B兩個因素的安排如Ⅶ。
根據這樣的安排,共9次實驗。同時還要考慮C,要使它的每一水平與其他兩個因素的不同水平各組合1次,總實驗次數仍為9次如Ⅷ。
由於此設計常用拉丁字母,故稱這種排列方式為拉丁方。其
統計方法是拉丁方變異數分析。這種設計除了可減少總實驗次數外,還有一個最大的優點,即能平衡實驗順序的影響。但利用它時必須符合一定的條件,即假設各因素之間沒有互動作用,且因素的個數必須與實驗處理水平數相同。
準實驗設計
當研究者事先已認識到某些無關變數會影響實驗結果但實際上卻又難以妥善控制時,可採用準實驗設計。準實驗的主要特點是沒有採用隨機化程式,即被試的選擇和編組、處理分配等都不是隨機安排的。
準實驗設計的主要類型
①間歇時間序列設計:指在實施處理前後的一段時間裡對一個被試組進行多次重複觀測,通過比較整個時間序列的觀測結果來確定處理的效果。所得結果的分析,需要對處理前後的一系列觀測值作出檢驗和比較,通常採用
相關樣本t檢驗法。
②相等時間
樣本設計:指在兩段相等的時間裡測量一個被試組,其中的一段時間給予處理,另一段時間不給予處理,然後對在兩段相等時間裡得到的觀測值進行檢驗和比較③非同質控制組前測後測設計:其基本模式如下:從表面上看,該模式與對比設計中的模式Ⅱ相同,但由於沒有採用隨機化程式,實驗組和控制組是非同質的,對結果的統計處理所常用的方法是基礎
方差分析和協方差分析等。
④平衡對抗設計:指在實驗處理的順序上提供控制,以抵消處理先後順序的影響所產生的順序
誤差。在單組僅有後測的實驗中,如果有兩種處理A和B,採用平衡對抗設計就是按ABBA的順序進行處理。
非實驗設計
通常是一種自然描述,用來確定自然存在的臨界變數及其相互關係。非實驗研究的方法很多,如自然觀察法、相關法、
訪談法、
問卷法、測驗法、個案法和
傳記法等。在非實驗研究中,研究者既不採用隨機化程式,也不能主動操縱自變數和控制其他無關變數。
非實驗設計的主要類型
①單組後測設計:對一個被試組給予一次處理和一次後測。②單組前測後測設計:對一個被試組進行前測、處理和後測。這兩個研究設計都沒有控制組。③靜態組比較設計:對在處理前已經
組織起來的兩個原組(非隨機選擇的)中的一個原組給予處理和後測,而對另一原組不給予處理僅作後測,然後比較兩組的結果。④事後回溯設計:在一事件發生之後才著手收集有關此一事件的各種資料,分析此一事件的效果和原由。由於非實驗設計是真實驗設計的組成部分或重要元素,所以也稱為前實驗設計。
主要步驟
研究者在實驗前根據研究目的擬定的實驗計畫及方法策略。其主要內容是合理安排實驗程式,並提出將如何對實驗數據作統計分析、心理實驗設計的主要步驟可歸納為:①根據研究目的提出假設;②擬定驗證假設的方法、程式;③選擇適當的處理、分析實驗數據的
統計方法。
活動
包括如下:
1.建立與研究假說有關的統計假說;
2.確定實驗中使用的實驗處理(自變數)和必須控制的多餘條件(額外變數);
3.確定實驗中需要的實驗單元(被試)的數量及被試抽樣的
總體;
4.確定將實驗條件分配給被試的方法;
5.確定實驗中每個被試要記載的測量(因變數)和使用的統計分析。
實驗設計的優點
· 科學合理地安排實驗,從而減少實驗次數、縮短實驗周期,提高了經濟效益。
· 從眾多的影響因素中找出影響輸出的主要因素。
· 分析影響因素之間互動作用影響的大小。
· 找出較優的參數組合,並通過對實驗結果的分析、比較,找出達到最最佳化方案進一步實驗的方向。
· 對最佳方案的輸出值進行預測。
功能
實驗設計的主要功能是對變數的控制,首先是在控制條件下有效地操縱或改變自變數,使因變數(即反應變數)的變化得到觀察。例如,研究兩種教學方法對兒童學業成就的影響時,實驗設計者應安排使其他條件儘量相同,如選擇家庭和學校環境相似、學業基礎相似,年齡相同的兩組兒童,只控制使用兩種不同的教學方法,然後考查二者對學習結果的影響。
實驗控制法
良好的實驗設計主要表現在合理安排實驗程式,對無關變數進行有效的控制。心理學實驗中的無關變數,有些可以象理化實驗那樣通過一定的實驗儀器及技術予以排除,但大部分難以排除,因而必須依靠實驗設計平衡或抵消其影響。這種控制方法稱作實驗控制法,常用的有幾種:
①消除或保持恆定法:主要利用實驗室條件排除無關變數的干擾,對於不能排除的年齡、體重、實驗環境、被試水平等變數,則設法使其保持恆定;
②平衡法:即按隨機原則將被試分為實驗組與控制組,使無關變數對兩組的影響均等;
③
抵消法:其目的在於控制由於實驗順序造成的影響,主要採用循環方式(只有兩個實驗處理時採用AB、BA法);
④納入法:即把某種無關變數當作自變數處理,使實驗從單因素變為多因素設計,然後對結果進行
多元統計分析,從中找出每個自變數的單獨作用及互動作用。還有一些無關變數,雖然明知它對結果有影響,但限於實驗條件,不可能用實驗控制法加以平衡或抵消,而只能在實驗結束後,用統計的方法分析出來,從結論中排除。這種控制方法叫做統計控制法。常用的統計控制法主要是協
方差分析或稱共變數分析。當研究工作由於事實上的困難或行政上的理由不能以個人為單位進行隨機抽樣、必須保持其團體的完整性(如以班級為單位)時,常使用這種方法。
實驗設計評價標準
評價一個實驗設計可以有許多標準,但主要是看其能否充分發揮以下功能:①恰當地解決研究者所要解決的問題,即實驗設計必須與研究問題匹配;②有較好的“內在效度”,即能夠有效地控制無關變數,使反應變數的變化完全由自變數決定;③實驗結果應具有一定的科學性、普遍性,能夠推論到其他被試或其他情境,即有較高的“外在效度”。
把數學上最佳化理論、技術套用於試驗設計中,科學的安排試驗、處理試驗結果的方法。 採用科學的方法去安排試驗,處理試驗結果,以最少的人力和物力消費,在最短的時間內取得更多、更好的生產和科研成果的最有效的技術方法。
最佳化試驗設計方法的起源
上世紀30年代,由於農業試驗的需要,費歇(R.A.Fisher)在試驗設計和統計分析方面做出了一系列先驅工作,從此試驗設計成為統計科學的一個分支。 上世紀40年代,在二次世界大戰期間,美國軍方大量套用試驗設計方法。 隨後,F.Yates,R.C.Bose,O.Kempthome,W.G.Cochran,D.R.Cox和G.E.P.Box對試驗設計都作出了傑出的貢獻,使該分支在理論上日趨完善,在套用上日趨廣泛。 50年代,日本統計學家田口玄一將試驗設計中套用最廣的正交設計表格化,在方法解說方面深入淺出為試驗設計的更廣泛使用作出了眾所周知的貢獻。
我國最佳化試驗設計方法
60末期代,華羅庚教授在我國倡導與普及的“優選法”,如黃金分割法、分數法和斐波那契數列法等。
數理統計學者在工業部門中普及 “正交設計”法 。
70年代中期,優選法在全國各行各業取得明顯成效。
1978年,七機部由於飛彈設計的要求,提出了一個五因素的試驗,希望每個因素的水平數要多於10,而試驗總數又不超過50,顯然優選法和正交設計都不能用,隨後,方開泰教授(中國科學院套用數學研究所)和王元院士提出 “均勻設計”法,這一方法在飛彈設計中取得了成效。
最佳化試驗設計試驗設計在科學研究中的地位與意義 :
1. 試驗設計方法是一項通用技術,是當代科技和工程技術人員必須掌握的技 術方法。
2. 科學地安排實驗,以最少的人力和物力消費,在最短的時間內取得更多、 更好的生產和科研成果。簡稱為:多、快、好、省。
最佳化試驗設計試驗設計可套用於:
提高試驗效率、最佳化產品設計、改進工藝技術、強化質量管理。 試驗設計在工業生產和工程設計及科學研究中能發揮重要的作用,例如: 提高產量 減少質量的波動,提高產品質量水準 大大縮短新產品試驗周期 降低成本 延長產品壽命 多用在化工、電子、材料、建工、建材、石油、冶金、機械、交通、電力„