超普通心理學/心理學研究法

本章節將以常見的五種心理學研究法：個案研究法、實驗法、觀察法、相關法、調查法，分別討論其優缺點與研究時的注意事項，並舉出這些方法在生活中運用的例子，讓讀者能夠了解心理學在社會上的應用與價值。另外，本章也提供最新及本土學界的研究供參考。

心理學研究又分為質性取向與量化取向。質性取向的心理學研究，意指以田野調查、訪談法等方式取得的資料來進行研究；量化取向的心理學研究，則是指以統計方法或數學模型所得出的資料來進行研究。在今日的心理學中，兩者間的差異已不再由研究主題決定，而是由研究方法決定。

心理學研究的目的

心理學的研究包括基礎研究和應用研究。

研究名稱	重視的方向	研究方式	例子
基礎研究(basic research)	重視理論性	科學性的探討，為獲得關於現象或可觀察事實的基本原理，進行實驗性或理論性的研究，終用於解釋、預測和控制行為。	1. 什麼樣的因素會導致憂鬱症？ 2. 什麼樣的因素可能會導致暴力行為？
應用研究(applied research)	重視實用性	將心理學建立的原理和方法加以實踐，來克服其他領域中實際的問題，以提升人類生活品質為目標。	1. 調查怎麼樣的治療方式對減輕憂鬱症最有效 2. 調查怎麼樣的計劃可以減少學生在學校的暴力行為

儘管不同領域的心理學研究對象不盡相同，但其目的都可被歸類為對心理與行為作出描述、解釋、預測、控制。（於心理學緒論中有詳細介紹過）

心理學研究的原則

研究心理學的方法眾多，然其主要遵守下列五大基本原則：

原則名稱	強調	注意方向
客觀性原則	以客觀觀察，不主觀臆測	外部條件、客觀指標、嚴謹態度、數據透明性
發展性原則	重視研究對象的變化性	階段性發展、縱橫向對比
系統性原則	重視各個因素的相互作用的關係	其他因素對事情本身的連帶影響
教育性原則	重視研究方法對受試者的影響	不影響受試者身心，是否有教育意義
專業原則	遵守心理學專業人員倫理準則	人道尊嚴與社會福祉，私隱與保密，道德與法律，文化與使命，誠信與負責，專業與堅持

客觀性原則: 心理學研究必須真實地反映心理現象的本來面貌。人的心理是客觀現實的反映，一切心理活動都是由內外部刺激引發的，並通過一系列生理變化在外部活動中表現出來。研究人的心理，就是要從這些可以觀察到或能夠進行檢查的活動中研究。研究者在進行心理學研究時，應該客觀地考察、揭示現象的本質，而非以主觀臆測，如此才能得到可靠的心理事實。因此，為了貫徹客觀性原則，研究者需嚴格控制外部條件、確認所要研究的心理現象的客觀指標、抱持嚴謹的態度並提供完整的數據集和分析腳本，以便其他研究者能夠進行重複研究和驗證，才得以如實地得出結論。
發展性原則: 心理學研究應從心理發展史、意識發展、個性心理發展以及環境和教育條件的變化等方面，揭示人的心理發展規律。研究者遵循發展性原則，即是將人的心理活動看成是一個個階段性變化的過程，在不同年齡階段研究個體的心理發展。過程中進行縱向研究，能追蹤同一組個體的心理變化，了解其發展過程中的動態變化；採用橫向研究，對不同年齡組的個體進行比較，以了解不同發展階段的差異。在研究發展中的心理活動時，不僅要求闡明受試者已經形成的心理品質，還要求闡明那些即刻產生、正處於形成狀態的新的心理品質。
系統性原則: 心理學研究應從發展變化和相互聯繫的角度考察心理現象，而非孤立、靜止地研究。任何事物都有可能有所聯繫，且發展變化快速，人的心理現象也不例外。在研究某一心理現象時，需考慮其他心理現象的影響，從整體系統的角度進行分析與綜合。心理與意識雖然都是很複雜的現象，但可以藉由剖析將其分解為各種形式，以進行專門的考察研究，而後通過整合將其看成有機聯繫的整體加以理解。在研究某一種心理形式與現實條件的依存關係時，也可以分別地考察某一條件在其中所起的作用，而後將其揭示的各種規律加以綜合運用。
教育性原則: 要求研究者在選擇心理學研究方法時，要考慮所使用的方法對受試者的身心是否產生不良的影響。尤其是當受試者的身心仍在發展階段時，他們的認知能力較弱，容易受到影響或模仿。有些心理學研究可能就需要涉及一些情緒或壓力等不適感受，這些研究對於理解心理現象和提高心理健康有重要意義。因此，在某些情況下，需在保護受試者並衡量其可接受範圍的前提下，進行一定程度的挑戰性研究，以推動心理學領域的發展。
專業原則: 心理學研究過程中需嚴格遵守專業倫理準則，確保研究對參與者及社會的利益。研究設計與執行必須符合法律及專業團體的道德準則。心理學研究應尊重參與者的尊嚴與福祉。規劃研究時，研究者應先評估該計劃是否合乎「道德」，是否會危害參與者的生理和心理狀態。若有顧慮，研究者應先向相關專家請教，以保障參與者的權益和知情權。

心理學研究的變數

變項（Varible）：被用以表示一個值給定集合（通常指函數的定義域）中不確定元素的數值。研究方法學者 Kerlinger, F.N.認為「變項就是能產生不同數值的特質。」而心理學研究中一般需要分析三種類型的基本變數，分別為機體變數（Organic variable）、刺激變數（Stimulus variable）、反應變數（Response variable），心理學研究的目的在於了解這些變數與引起這些變數的各種因素如何產生聯繫，通過對這三項變數相互關係的研究，來揭示心理活動的規律和機制。

變數名稱	說明	舉例
機體變數	人和動物被試者都存在着個別差異	如遺傳、發育、動機、智力及人格等方面的差異
刺激變數	影響機體反應的種種環境因素	如外界的聲音、光線、生活和工作條件、學習環境以及他人的言語、動作、態度等的變化
反應變數	由刺激引起機體行為上的變化	如反應的速度、次數、正確性、強度等方面的差異

變項量測

許多心理學研究涉及心理屬性(Attribute/Property)的排序或比較。量測(Measurement)是一量化過程，根據物件屬性賦予對應數值(numerical value)，而量尺值(scale value)即所分派之數值(Patrick Suppes & Joseph L. Zinnes, 1963)，也就是一種函數轉換：「f(x)=y，f（物件屬性特徵）=數字」。當心理學朝科學的方向發展，量測由心理屬性構成的變項為關鍵的步驟，且大部分的心理實驗推論來自於量化後的數字資料之統計、檢定。量化後，數字系統能提供共同的語言，處理二元運算相較於屬性或是物件本身要來的單純方便許多。

變項數值化的爭議

物理學界的質疑:社會學（特別是心理學）是否算是科學？

1920 年代，英國物理學家侃伯(Norman R. Campbell)等人發起論戰。他們認為基本物理屬性之所以能夠被測量，是因為具有單位量尺首尾相接的「串接」(Consatenation)操作特性，而心理變項量測不具「串接」特性，故無法執行二元運算及其他衍生運算。

數理心理學家的反駁與共連量測概念

主張「串接」並非心理屬性能否進行科學測量的單一判斷標準。

他們藉由公設法探討其他可行的變相量測方法，其中之一為加成性共連量測(Additive conjoint measurement)的建構。

以下舉例來解釋此概念:

假設我們想量測主觀的「舒適度」屬性，並藉由兩獨立變項（濕度與溫度）的量測，可系統性的操弄二變項而得到一系列的舒適度排序資料，且背後有可對應的心理量尺。在某些公設條件下，濕度與溫度兩變項載舒適度層面的量測皆屬於間距量尺，舒適度可藉由兩變項的量尺加成得到。

應用上，展望理論(Prospect theory)即是基於此共連量測概念為其公式所含之量尺科學化基礎。

心理物理學家的反駁

史提芬斯(Staley S. Stevens)等人反對這種從物理學界跨過來的類比方式。

他們認為，心理學有自成一套的獨特量測規範，其科學性無須遵循或是模仿物理科學的量尺法則。其量尺法則會在下方進行更進一步的敘述。

量尺類型

心理物理學家史提芬斯(Stanley S. Stevens)將量尺分為四種主要類型，分別為名目(nominal)量尺、次序(ordinal)量尺（或順序量尺）、間距(interval)量尺（或區間量尺）與比率(ratio)量尺。此四種量尺的關鍵差異在於所允許的變數轉換(admissible transformation)不同。

量尺種類	說明	舉例
名目量尺	將數字當類別或名稱使用，以區分或標示變項的身分，此量尺值並無大小的意義	如三位候選人的號碼 1、2、3 僅作為標籤用途
次序量尺	除了標籤作用外，還保有次序之分，但沒有間距或比率關係	如你對三位候選人甲、乙、丙的喜好程度為甲>乙>丙，為表達次序我們可以用 f（甲）= 10、f（乙）= 5、f（丙）= 1 表示而得 10 > 5 > 1，在此例中數字只是用來表示次序大小，而未被用來考慮單位數字間的間距
間距量尺	除了保有次序量尺的特性，亦有數字間距相等的性質，因此間距量尺可以做間隔距離的比較。而間距量尺沒有絕對的零值，故無比率的特性。	如溫度、智力商數等。10 ℃、20 ℃、30 ℃ 他們之間都差 10 ℃，但並不會說 20 ℃ 是 10 ℃ 的兩倍。
比率量尺	除了具有間距量尺的特性，並有絕對零值，故可以進行比率或倍數的比較	基本物理刺激的量測如長度、重量皆有此性質，心理學常用的反應時間亦屬於此類

變項量化的意義性(meaningfulness)

心理學十分仰賴量尺數值的大小比較及統計推論，以支持或拒絕其研究議題之假設。即便不論及心理變項量化議題而只是平均數計算之類的系統，其推論也要小心。常見迷思為例，某「甲研究所」有400位男性申請及200位女性申請，而「乙研究所」有150位男性申請及450位女性申請，錄取人數為200位男性及300位女性。簡單運算可知此二研究所之男女錄取率皆相同(甲研究所:1/2，乙研究所:1/3);但加總兩系所資料再做平均卻得男性錄取率為250/550，而女性錄取率為250/650，有違性別平等之嫌。實際上，應使用加重平均來正確計算總體的錄取率，以避免誤解。量尺數值排序比較的陳述(statement)，在經由此量尺的變數轉換後，是否仍保有原陳述的真實性。例如，有時會聽到氣象預報員預測「明天的溫度將比今天上升20%」，這句陳述嚴格而言是無科學意義的，因為溫度的尺度並非比率尺度，除非使用絕對零度作為基準的開氏溫度(Kelvin)，否則此陳述之真實性可因溫度尺度的選擇不同而被違反。

研究程序

任何一門研究都必須經過明確的研究程序進行，以科學方法設計實驗，才能得到可信的結果。除了要確定兩件事的關聯性，更要確認兩者的因果關係，讓其中的關鍵變數被完整地呈現出來。心理學這門科學使用科學方法，並透過實徵研究驗證理念。實徵研究注重證據，藉由觀察及蒐集資料來驗證理論。心理學的研究程序主要可以分成下面幾個步驟：

收集資料、確認研究問題：思考研究目的和可行性，明確定義出所要研究的範圍
文獻回顧：閱讀相關專書論文，找出與研究問題相關之其他研究文獻
提出假設 ：提出一個可被驗證或推翻，且能夠被進行測試的論述
設計研究方法進行控制測試：針對假設以選擇適合的研究法，在不同的組別安排不同的自變項
收集、分析數據：將數據進行統計分析，利用數學方法排除雜訊造成的誤差，找出自變項與應變項之間的關聯性
得到結論：透過數據分析結果驗證實驗是否支持假設
發表理論：接受他人提出的疑問並解釋自己的論述
重複驗證：累積重複成功的證據，使理論更加穩固

而接下來我們再逐項細講：

收集資料、確認研究問題

在開始研究之前，研究者須先收集足夠的資料並回顧現有研究。若已經有其他人做過類似研究，可以參考研究方法、使用其假設或結果。接着思考研究目的和可行性，將大問題縮小，明確定義出所要研究的範圍。

研究問題的功能

有方向性與連貫性的組織計劃
劃定計劃的界線與範圍
讓研究者聚焦問題
提供撰寫計劃的架構
指出所需要蒐集的資料

研究問題的好壞


好的問題（較合適問題）	語意清楚、與文獻或架構契合、提供未來其他研究方向
壞的問題（較不合適問題）	語意不清、與文獻或架構脫鈎、一次問太多問題、問人盡皆知的問題、具誘導性的問題、雙重否定的問題
無法被回答的問題	純粹道德或哲學的問題、非當代科學可以處理的問題

引用格式

在不同的領域，引用格式都各有不同，例如在教育學、心理學、科學領域是採用美國心理學會(American Psychological Association, APA)提出的APA格式；人文與社會科學領域則適用美國現代語言學會(Modern Language Association, MLA)提出的MLA格式；商業、歷史學及美術的引用則是使用芝加哥格式(Chicago style)。下文將對心理學適用的 APA 標準做簡略的介紹。

正文內引

同時引用一位作者的多篇文章時，依照年份先後排列，並用逗號做為區隔。

例如：吳俐君（2002, 2021）

引用多筆參考文獻時，中文使用筆畫排序；英文與使用字母順序。中文在前英文在後，引用之間採用分號做為區隔。

例如：（丁一, 2014; 龍飛鵬, 2001）

(Abelton, 2019; Zaffini, 2000)

(丁一, 2014; Abelton, 2019)

當引用單篇文獻作者有兩位或以下，引用時所有作者均須列出。作者之間以逗號分隔。

當引用單篇文獻有三到五位作者，第一次引用時所有作者仍然均須列出，但第二次以後便只須列出第一位作者。

例如：（丁一等人, 2002）

(Abelton et al., 2000)

當引用單篇文獻作者有六位以上，第一次引用以及後續都只需要列出第一位作者。

例如：（第一作者丁一等人, 2002）

(Abelton et al., 2000)

當引用團體作者時，第一次引用須列出全名及縮寫，第二次可以只寫出縮寫。

例如：(American Psychological Association[APA], 2019)

(APA, 2019)

文末參考文獻

格式：作者（年份）。書名。出版地：出版者。

例：丁一（2002）。如何幫鱷魚做直腸鏡檢查。台北：獸獸出版社。

文獻回顧

研究者需要通過閱讀相關書刊、搜尋專書和論文等資料，找出與研究主題相關的其他文獻。文獻回顧的主要目的是為自己的研究提供合理的理論支持，避免重複他人已經完成的研究工作或是他人已經發現的錯誤。這一過程有助於研究者找到適當的方法論，選擇合適的資料，並確立自己研究的方法。因此，文獻回顧對於研究者來說，是制定和確立研究方法的重要程序。

提出假設

關於生活可能發生的事件，提出一個可被驗證或推翻，且能夠進行測試的論述，被稱為「假設」。在實驗之前須先提出假設的目的有兩個，首先是為了簡化大海撈針的機率，其次是為了有具體的衡量標準，以判斷此次實驗的效度與信度。為了精確量測試這些假設，必須針對實驗中的各項因素清楚地定義其測量的方法，用是非、數據表達來結果，這就是操作型定義。假設必須是一個清楚的陳述，預測自變項如何影響應變項的結果。此外，假設不能是單純陳述價值判斷，或是不可能發生的事件的論述。

下列以「多喝水使老人心平氣和」為例證，協助讀者瞭解操作型定義的理念：

老人的操作型定義：我們無法測試全世界上的所有老人，因此，我們對「老人的操作型定義」，可能為「社區大學內某班高於 65 歲的人」。
多喝水的操作型定義：我們可以界定為「每日喝 30 度溫水 2700 毫升」為「多喝水的定義」。
心平氣和的操作型定義：我們可以以「五點量尺」李克特量表來評估老人心平氣和的程度。

設計研究方法進行控制測試

針對假設選擇適合的研究法，在不同的組別安排不同的自變項。其中，接受假設情境的組別稱為「實驗組」，未受特殊情境的組別稱為「控制組」，作為與實驗組比較的參照物。心理學的研究法十分多元，例如：個案研究法、觀察法、調查法、實驗法、相關法、測驗法以及其他方法。必須注意的是遺漏變數可能會造成的影響，理想的做法可以利用隨機分派，藉由任意地分派樣本到不同組別中，減少該因素造成的影響。而社會心理學家用來測量變因最常使用的分類方法有兩種：自我報告與觀察法。

收集、分析數據

由於我們的實驗結果是可量測的，因此可以將數據進行統計分析，利用數學方法排除雜訊造成的誤差，找出自變項與應變項之間的關聯性。而假設檢定為統計學上用來做顯著性檢驗的方法。
統計學中的假設檢定和型一與型二誤差(Type 1 and Type 2 error)可以對心理學的研究提供幫助。

設立假設

一般使用反證方法驗證理論，並設立虛無假設與對立假設。界定何者應設為虛無假設( $H_{0}$ )，何者應設為對立假設( $H_{1}$ 或 $H_{a}$ )的方式大略可分為三個方向：

將想驗證的結論設為對立假設 $H_{1}$ ，欲推翻、否定的結論設為虛無假設 $H_{0}$ 。
將他人的主張、宣稱做為虛無假設 $H_{0}$ ，亦即假定他人的主張是真實的，而懷疑的可能結論設為對立假設 $H_{1}$ 。
將錯誤的推翻會招致較嚴重後果的結論設為虛無假設 $H_{0}$ ，而相對後果較輕微的設為對立假設 $H_{1}$ 。

應用到心理學的統計與實驗時，通常將欲證的結論設為對立假設

H_{1}

，欲否定的結論設為虛無假設

H_{0}

。對立假設

H_{1}

與虛無假設

H_{0}

為互斥的關係，因此當我們推論發生虛無假設

H_{0}

的機會很小時，我們就推論對立假設

H_{1}

很可能正確。相反的，若是檢定結果為虛無假設

H_{0}

的可能性較大，並不代表虛無假設

H_{0}

是事實，而是代表沒有足夠證據推翻對立假設

H_{1}

。

型一與型二誤差

型一誤差(Type 1 Error)為在虛無假設

H_{0}

為真時，經檢定拒絕虛無假設

H_{0}

。也會被寫作顯著水準（significance level of test）。

型一誤差的機率為α，表示為

α=P(拒絕H₀|H₀為真)

型二誤差(Type 2 Error)為在虛無假設

H_{0}

為假、對立假設

H_{1}

為真時，無法拒絕虛無假設

H_{0}

。

型二誤差的機率以β表示，表示為

β=P(II)=P(不拒絕H₀|H₀為假)

整理後如下表：

	H₀為真	H₁為真
不拒絕 H₀	正確決策（1-α）	型二誤差（β）
拒絕 H₀	型一誤差（α）	正確決策（1-β）

舉例而言，若今天國防部會依據雷達觀察數據判斷是否有共機侵臺、並發送警報，則可能因為型一與型二誤差的存在而導致以下結果：

H_{0}

：一切良好，只是發生偶然干擾

H_{1}

：有敵機來襲

	$H_{0}$ 為真	$H_{1}$ 為真
不拒絕 $H_{0}$	正確決策（沒有敵機來襲）	型二誤差（β），疏忽而未放警報
拒絕 $H_{0}$	型一誤差（α），錯放警報	正確決策（共機繞臺）

因而從以上可以知道，在不同應用場景，可以選擇型一誤差與型二誤差的其中一個作為衡量。舉例來說：在工廠判斷是否有不良品時，比起多花一些成本檢查產品，更不願意將不良品出貨。因而會想降低「將不良品判斷為良品」的機率（型二誤差），而非降低「將良品判斷為不良品」的機率（型一誤差），因而我們會以型二誤差作為目標式。

顯著水準

顯著水準（significance level）指的是樣本統計量與母體參數假設值之間的誤差達到一定程度的機率閾值。在統計檢定中，當樣本數據達到顯著水準的要求時，我們可以判定母體參數的假設值（通常是虛無假設，Null Hypothesis）應該是錯的。顯著水準通常用希臘字母α表示，常見的值有0.05、0.01等。

雖然我們永遠無法確定推論結果的絕對正確性，但我們知道，即使虛無假設是正確的，我們拒絕它的機率（即犯了型I錯誤的機率）也不會大於我們所設定的顯著水準。因此，顯著水準也被稱為檢定人員所能容忍的型I錯誤的最大機率。

例如，當我們設定顯著水準α = 0.05時，這意味着我們可以接受有5%的機會犯型I錯誤，即在虛無假設實際為真時錯誤地拒絕它。這種設定在實際應用中很常見。例如，在醫學研究中，當檢驗某種藥物是否有效時，研究人員可能設定α = 0.05。這意味着，如果藥物實際上無效，那麼在5%的情況下，研究結果可能會錯誤地顯示藥物有效。

資料淨化（data cleaning）

資料淨化是從記錄集、數據庫表或數據庫中檢測和糾正（或刪除）損壞或不準確的記錄的過程，是指辨識數據的不完整、不正確、不準確或不相關部分，然後替換、修改、或刪除髒數據或粗數據。資料淨化可以與數據加工工具互動執行，也可以通過指令碼進行批次處理。

清洗後，一個數據集應該與系統中其他類似的數據集保持一致。檢測到或刪除的不一致可能最初是由用戶輸入錯誤、傳輸或儲存中的損壞或不同儲存中類似實體的不同數據字典定義引起的。數據清理與數據確認(data validation)的不同之處在於，數據確認幾乎總是意味着數據在輸入時被系統拒絕，並在輸入時執行，而不是執行於批次數據。

資料淨化不僅能更正錯誤，同樣加強來自各個單獨資訊系統不同數據間的一致性。專門的資料淨化軟件能夠自動檢測數據檔案，更正錯誤數據，並用全企業一致的格式整合數據。

p值（p-value）:是指當虛無假設 $H_{0}$ 為真時，統計的樣本及其他相同極端樣本出現的機率。p值越小，代表越有信心拒絕虛無假設 $H_{0}$ 。在p值小於0.05的狀況，通常被認為有強烈的統計顯著性可以拒絕虛無假設。

得到結論

經過分析之後，便可以知道這個實驗是否支持假設。若數據支持便可接受該假設，反之則駁斥該假設。

發表理論

研究的結果時常會被發表到專業期刊和研討會，並接受同業的檢驗，在科學社群中互相討論，接受他人提出的疑問並解釋自己的論述。若無法回覆疑問與攻擊，或被找出研究的缺漏之處，就會被淘汰出局，回到先前的步驟重複進行實驗。理論是指一種經過組織化的信條，被用來解釋我們所觀察到的現象，通常受到三個準則來檢核：簡易性、廣泛性及概括性。我們通常希望依靠更精確的「最少的理論」，來陳列出有限、特定的觀點來解決人們為何會有某行為、並為此行為做精準的預測，且可以被實際的研究者所研究。

重複驗證

最後，實驗會經由不斷的重複加以驗證，若其他研究者也能得到相同的結果，藉着測試假設來得知結果，能帶給這個結論更多支持，使理論更加穩固。累積重複成功的證據是科學社群自我修正的方法，而且這是最可能達致其目標，尋求真相的方法。

心理研究法種類

整理

個案研究法 (Case Study)
觀察法 (Observational Method)
調查法 (Survey Method)
實驗法 (Experimental Method)
相關法 (Correlational Method)
測驗法 (Test Method)
心理測驗法
焦點群體法 (Focus group Method)
德懷術 (Delphi Method)
經驗總結法 (為教育心理學常使用之方法)
大數據研究法

個案研究法(Case Study)

個案研究是以個人、團體或機構之狀態或行為，或這些相關因素之間的關係為對象進行更深入的研究，藉由多方面的資料蒐集及分析討論，期待能發現其內隱的特質或規律，最後再以邏輯性導向的思考過程，尋找解決問題的方法。

優勢：

資料幅度大、層次深，使研究者得以提出有效且具體的解決辦法。
由於其主要為研究少數個體，讓研究者相對容易聚焦於某些目標，並深入探索，最後找出真相。
此研究法不需要操作和實驗，適合運用於知識過程中的分類探索、形成假設階段。

劣勢：

歸因於研究本身具有主觀性且樣本小，還缺乏個案變項的控制能力，從而限制了研究者將結果廣泛推論到其他個案的可能性。（所謂主觀性，乃因個案研究法是以經驗為主的調查法，導致不同觀察者所得出的結論可能會有所出入。）
選樣不易，資料不一定具有代表性。如誤以某偶發問題而做概括的結論，則難免以偏概全之弊。

個案研究會透過蒐集的資料而成個案歷史，若蒐集的資料僅有一個人所記錄的，例如傳記，因為是用回憶法，可能會造成曲解或誤失，甚至會面臨文案隱惡揚善的風險，也容易被記錄者的主觀所影響。因此不該僅以傳記這類型的紀錄為資料來源。

心理學家在進行個體研究時，多重且深入的資料來源可以形成更全面、深入的理解，資料來源常用的有文件（documentations）、檔案記錄（archival records）、訪談（interviews）、直接觀察（direct observation）、參與觀察（participant observation）、人工製品（physical artifact）。

文件:如信件、備忘錄、公報、會議記錄、報紙、簡報等等，有助於了解個案的社會、歷史、環境脈絡。
檔案紀錄:包括日常記錄、組織記錄、地方圖表、地圖等等，精確度相較於文件來的更高。
訪談:目的為協助研究者得以獲得只有口頭表達才能獲得的經驗與觀點、補充文件、檔案紀錄缺乏的資料、有助於研究者與研究對象對話、擴展問題的層次等等。訪談類型分為開放式訪談、焦點訪談、結構訪談等等。
直接觀察:直接觀察為觀察研究對象的現象或是情境，例如在會議、示威活動、工廠運作、班級活動等等中觀察，又依據是否會將成果寫出觀察報告分為正式觀察與非正式觀察。

5.參與觀察參與觀察為研究者參與欲觀察的事件之中，學者Patton(1990)認為應不斷協調參與程度才是能蒐集更有意義的資料的方法，而學者陳向明(2002)則認為參與觀察中，觀察者和被觀察者一起生活，對於被觀察者有更具體的認識，可以更深入了解被觀察者的行為意義。 6.人工製品如工具、藝術品、技術發明等等，可以讓研究者了解文化的內涵、技術、發明、藝術等等。

而資料蒐集也應遵守幾項原則: 1.多方蒐集資料蒐集到的資料可能有些許的偏頗、錯誤，會有非常多影響研究的「變數」，所以需要依賴不同來源的證據，利用三角校正法，如果資料結果一致，就有機會發展理論芻型，並進行資料搜集與分析。 2.建立個案研究資料庫從許多個案的資料蒐集整理，一方面當作資料校正的根據、一方面提供研究者更多參考資料 3.保持蒐集到的證據與研究問題間的關連研究者應保持原始資料方便後續歸納，並使資料與研究問題持續具有關聯性，以免研究偏頗。

個案歷史也可能是根據縱貫式的研究而來。縱貫式的研究，是對個體或團體長時間的追蹤、定期評估並探討研究對象在不同時期的演變。所以，個案歷史也是研究者根據個人的計劃，進行實際觀察所構建而成的。

觀察法(Observational Method)

觀察法是在自然情境或預先設置的情境中，對於被觀察者的言行舉止，進行有系統性的觀察，從而了解其心理活動的產生與發展規律。其透過人類感官運用科學的方法，探究一些行為或事件，並對觀察結果做系統化的分析，以及解釋其意義。科學的觀察具有目的性、計劃性、系統性和可重複性。常見的觀察方法有:

核對清單法
級別量表法
記敘性描述

根據研究目的，研究者直接進行觀察並記錄個體或族群的行為活動或表現，從中去分析與解釋發現的相關問題。研究對象多半是難以表達自己心思意念的族群，例如：動物、嬰幼兒、兒童或精神病患等。觀察法也常使用在機構或組織運作中，以及對員工績效的評估。要注意的是，觀察法只能證明兩個變因之間有無「相關性」，無法推導出任何因果關係，也因此若要釐清不同變因之間的因果關係，仍須透過實驗法，且觀察法通常只能觀察到行為和自然的物理過程，無法從中了解被觀察者的動機、態度、想法以及情感，並且觀察法僅限於公開的行為，因此此行為的代表性至關重要。

觀察法廣泛適用於了解某人的心理過程、狀態、個性等，它是教育過程中，教師了解學生心理最主要的方法。例如：教師透過觀察學生在各方面日常生活的表現，可以了解學生的感知、記憶、想像、思維等心理過程以及興趣、性格、能力等心理特徵。此外，觀察法不僅限於觀察行為，還包括了解其他一切有關的材料，例如:日記、回憶錄等等。因此，觀察法有直接觀察和間接觀察之分。根據研究的需要與時間，還可區分為長期觀察與定期觀察。最後，根據觀察的內容，可分為全面觀察與重點觀察。全面觀察會觀察受試者的全部心理表現，重點觀察會選擇某些方面的心理活動進行觀察。

運用觀察法時，觀察者和被觀察者之間的關係有兩種方式：

參與觀察者：觀察者是被觀察者活動中的一個成員。
非參與觀察者：觀察者不參與被觀察者的活動。原則上被觀察者不能發現自己的活動被他人觀察，否則容易使被觀察者產生異於正常情況下的行為，即所謂「霍桑效應」，進而導致觀察結果發生偏差或錯誤。

優點：

具有及時性的優點，並能夠捕捉到正在發生的現象與意料之外的素材。
受客觀環境影響，不便在實驗室中進行者只能用觀察法。
與調查法相較，事先準備好的表格及問題，並不能道出受調查者全部生活或欲知事項，觀察法可補其不足。
在自然狀態下的觀察，能夠獲得更為生動、真實的資料。

缺點：

因觀察者的個別差異與主觀意識，容易產生觀察偏差或錯誤。
真正要觀察的事往往可遇而不可求，有時只好事後訪問。
人類社會有許多現象不適宜或不可能直接觀察。
若欲觀察的事項太複雜，僅能得知其行為表現，並不能完全了解被觀察者的思想意志。
不適合用在大面積、低人口密度的區域。
所需的時間成本較高。
僅能觀察表面上的行為
受觀察對象限制，像一些秘密團夥則不易觀察
無法確實了解被觀察者的動機、想法、情感

依照向度又可將觀察法細分為：

自然觀察法(Naturalistic observation): 研究者在自然環境中直接對研究對象進行觀察、紀錄，和分析解釋以獲得某種心理原則或行為準則。自然觀察法是較傳統的方法,其優點在於它可以通過觀察直接獲得第一手資料。缺點則是觀察將受到觀察者的主觀判斷及分析能力所影響，而且往往研究員想觀察的現象是可遇不可求，其不確定因素較大。; 但相對的，自然觀察法較容易實施且成本也較低，故在開始做嚴謹的實驗研究或相關研究以前，可先以自然觀察法研究來挖掘有關的變項，提供預備的知識，以免後來做實驗研究時知識短缺不足。
設計觀察法: 設計觀察法是指調查機構事先設計模擬一種場景，調查員在一個已經設計好的並接近自然的環境中觀察被調查對象的行為和舉止。所設定的場景越接近自然，被觀察者的行為就越接近真實。
掩飾觀察法: 眾所周知，如果被觀察人知道自己被觀察，其行為可能會有所不同，觀察的結果也就不同，調查所獲得的數據也會出現偏差。掩飾觀察法就是在不為被觀察人、物、或者事件所知的情況下監視他們的行為過程。
機器觀察法: 在某些情況下，用機器觀察取代人員觀察是可能的甚至是所希望的。在一些特定的環境中，機器可能比人員更便宜、更精確和更容易完成工作。
結構性觀察法: 指研究者創造出一個情境，並觀察參與者被此情境引導出的特別行為。例如，學者想研究關於火災發生時人們應對的反應，他只需要一個緊急火災廣播便可以模擬出一個特殊的現場，在進行結構性觀察之前需先提出假設，並列出欲觀察項目的清單。

調查法(Survey Method)

有些問題無法直接觀察研究，因此研究者透過各種形式的調查方式藉此詢問、紀錄、研究受訪者的態度及反應。調查法以大眾所關心的問題為範疇，透過嚴格抽樣設計選擇具代表性的樣本，預先擬定問題收集目標對象的意見，是一種透過抽樣原理與技術追求一般性事實的研究法，而調查結果非常依賴受訪者回答的品質和態度。

主要種類可分為「普查」和「抽樣」：

普查：針對調查母體中的每個元素進行資料的搜集，因此資料較為齊全，同時分析之結果也較接近事實真相；但耗費成本較高，因必須有縝密的事前計劃，在實施過程中也需要動員大量人力，所以並非所有的研究者皆能實現普查；此外，若缺乏適當的管理、追蹤、考核，則會因受訪者良莠不齊而容易產生資料品質不均。
抽樣：從調查母體中抽出一部分的元素進行資料的蒐集。因此調查內容相對較為深入，同時不須耗費大量的人力、金錢及時間。在執行上容易管理且確實，但因樣本僅為全體之局部，必須進行統計推論。在事前計劃中，抽樣方法與樣本數在決定上易有困難，而造成後續估計的誤差問題。

調查的實施方式：

問卷法(Questionnaire Method)：多以問卷的形式進行，提出一系列問題。優點是能夠同時調查較為快速且有效率。缺點是很難控制填寫者的回答狀況以及對題目設計的理解與否，同時取樣上也可能產生偏差，例如：在網絡社群上發佈問卷導致取樣的族群有所偏差，如年齡或是背景相似。因此在問卷設計上需特別留意設計的嚴謹性，同時在取樣上也要注意合理性。相較於訪問法，問卷法較為省時省力，但是沒辦法獲得較深入的資訊。同時亦需要考量問卷回收率，如何提升回收率以利於後續分析。
訪問法(Interview Survey)：通常採面對面、一對一的方式進行，實施成本較高。但缺點在於，訪問結果樣本數不夠時，可能產生結果過於一致，將有參考性不足的問題。與問卷法相比較耗時、費力，在執行上難度較高，且不適合做量化的統計分析，但是可以取得較深入的資訊，並且較能了解受訪者的想法，彌補問卷調查的不足。

我們可以利用調查法來獲得政治傾向、消費偏好、健康看護需求等易取得的資料。一次正確的調查必須事先擬妥問卷、訓練晤談者、慎重選擇樣本、保證研究樣本的反應者能夠代表研究的母群體，並用正確的方法來分析及報告資料，以便能正確地闡釋結果。由於調查法是以樣本行為的特徵來推論母體行為特徵，所以調查法也稱做抽樣調查。

調查法的優點是能以有限的案例得到大量受訪者的資料。但其價值只有在受訪者誠實報告的時候才存在，而使用問卷時用語清楚、表達明確與否都會影響受訪者的回答，因此在製作問卷時，應使受試者均能清楚了解訪問內容，避免使用過多艱難字句或雙重否定等。此外，抽取的樣本是否能夠代表母群體也是相當重要的議題。

前一個段落提到問卷設計時，需要留意語句上需要清楚易懂，問卷格式的「設計與編排」也是影響受試者填答的重要因素。除了問卷設計需要方便受試者閱讀之外，常見的問卷設計方法有兩種。

條件式問題（Contingency Questions）

使用時機：只適合部分受訪者，不適用於其他人。受訪者是否需要回答下一個問題，取決於上一個問題的回答。
編排方式
- 問題：內縮、獨立方框
- 子母題：以箭頭連結
- 用（）說明填答的下一步
範例：你現在有吃檳榔嗎？
- 是（停止作答）
- 否 ↴（第二題）
  - 戒除吃檳榔的習慣多久了？
    - 一個月
    - 三個月
    - 半年
    - 半年以上
優點：可以篩選適合的受試者，較經濟的方式。
缺點：填答方式相對複雜。

矩陣式問項（Matrix Questions）

使用時機：相同答案的問項，例：題項皆使用李克特氏量尺。
編排方式
- 問題：通常至於列
- 答案：通常至於欄
- 勾逐題圈選對應的分數
範例：
- 你對現任總統的滿意度相當滿意？同意 1 2 3 4 5 不同意
- 你對前任總統的滿意度相當滿意？同意 1 2 3 4 5 不同意
優點：快速地完成一組問題，方便瀏覽先前回答作為後面回答的參考。
缺點：忽略題項最適合的填答方式，助長「同一反應傾向（response set）」。

實驗法(Experimental Method)

實驗法的重點在於對實驗情境的高度控制，以便我們對感興趣的因素加以操弄，進而找出兩變數間的關係。科學家會操控其中一個變項 X 使它變動，觀察變項 X 的改變對於另一個變項 Y 所造成的影響。例如：睡眠時間與工作效率又有什麼樣的關係？若是以前述的例子來說，睡眠時間是變項 X ，那麼工作效率即是變項 Y 。建立實驗假說，也就是對於特定因素所產生之結果的預測，有助於釐清不同變項的因果關係。

名詞介紹

相關系數(correlation coefficient)

在統計上，時常使用皮爾森積動差相關系數來衡量兩個變量之間的相關程度。相關的大小以相關系數(r)來表現。當 r 值大於零是正相關，等於零是無相關，小於零是負相關；|r|< 0.4 為低度線性相關，0.4≤|r|< 0.7 之間為顯著線性相關，0.7≤|r|< 1 之間為高度線性相關。相關實務研究上，相關性設計比真正實驗設計或準實驗設計還要容易被執行。但是，經驗不足的研究者容易被變項間的相關度所誤導，進而誤認為兩者間有其因果關係。

決定系數(Coefficient of determination)

又稱判定系數(以R²或r²表示)，與相關系數(r)的涵義不太相同，在統計上用於衡量自變數X對應變數Y的解釋程度，也可以說是模型的擬合程度。範圍在介於0和1之間，決定系數愈接近1代表模型的可信度愈高、解釋效果愈好。

自變項(Independent variable)、應變項(Dependent variables)

實驗目的為找出一個變項 X 的變化如何會對另一個變項 Y 造成影響，那麼 X 就是實驗中的自變項，而 Y 為實驗中的應變項。故自變項為實驗者自行控制的變因，而應變項則是自變項改變後所產生相應變化的項目。

另外也需要考慮控制變量，也就是其他可能影響實驗結果的變量。通常我們無法找到與控制全部的因素，所以實驗上一定會有誤差，因此要盡可能降低錯誤，才能有客觀的實驗結果。

實驗組(treatment group)與控制組(control group)

在實驗中，通常會將受試者分成兩個或以上不同的組別，不同組別之間在自變項的部分有着不一樣的處理，分別稱其為實驗組與控制組，兩者之間以實驗目的做出區別。有了控制組與實驗組進行對照，就可能了解自變項究竟會對應變項造成什麼樣的影響。

在進行實驗時，實驗組與控制組兩者，除了自變項之外的條件皆要維持一樣，或至少要盡可能地相似。若以數學函數的方式來解釋的話，可以這麼理解，設有一多變數函數

y=f(x_{1},x_{2},x_{3},...)

，若是我們想要找出

y

和

x_{1}

的關係，就必須要固定其他的變數

x_{2}

，

x_{3}

，...；那麼「自變項」就是選取的不同

x_{1}

值，而「應變項」就是獲得的不同函數值

y

。

外在變項(exogenous variable)與干擾變項(confounding variable)

如同先前提到，實驗時必須確保實驗組與控制組除了自變項以外，其餘條件皆要相同，然而這在實際情況中幾乎不可能達成。在Stanley Schachter的實驗中，實驗者不可能找到兩組年齡、膚色、頭髮長度、學歷、家庭、性格、智商、內涵等條件完全一樣的人，儘管如此，有些變因事實上幾乎不會影響實驗結果。因此科學家會特別注意幾個可能會影響結果的變項，讓實驗組和操作組在這方面盡可能的相同。先前提到的雙胞胎實驗便是如此，即使同卵雙胞胎擁有 100%相同的基因，也不會擁有完全相同的成長歷程，因此無可避免表觀遺傳學所造成的基因調控端誤差，而實驗者仍盡可能減少基因造成誤差，並討論這些誤差可能對實驗結果造成何種影響。

外在變項的一個常見的例子就是抽煙（自變項）會致癌（應變項），但是吃燒烤物（外在變項）也會致癌，所以在進行實驗時會盡量將這些影響排除掉；否則兩個變項同時存在時，將無法確認到底是哪個變項影響結果。干擾變項也可以舉一個簡單的例子，假如有人要調查穿短褲的人數比例（自變項）與雪糕銷量（應變項）之間的關係，實際上，雪糕銷量與氣溫也有關係，然而天氣熱時穿短褲的人亦會增加，因此氣溫便是這個實驗中的干擾變項。

外在變項時常造成實驗的失敗，因此科學家和心理學家需仔細思考並盡量排除掉該變項的影響。使用隨機分配為一種降低外在變項影響的方式，也就是每一個受試者會有相同的機率分到任意一組。如此一來，實驗組和操控組的受試者的所有條件，在平均而言會接近一致，如此在進行實驗時，結果的真實與正確性即大幅提升。

實驗設計方法

進行實驗設計時，依據受試者接受一種或多種實驗處理，可分為受試者間設計(或稱獨立組設計:independent-groups design)、以及受試者內設計；依據受試者的分組方式，還可分為隨機組設計、配對組設計。實驗設計需考量受試者的招募、實驗成本、或最小化實驗次數等等，選擇適合的實驗方法。

受試者間設計(Between-subjects design)：將所有受試者分組，一組給予一種處理，每組的處理方式皆不同。
受試者配對設計(Matched subjects design) ：每個測試使用單獨的一個實驗組，每個實驗組內每位受試者與另一組中具等效的受試者進行配對。
受試者內設計(within-subjects design)：不將受試者分組，對於同一批受試者施予多種實驗處理。
混合設計(mixed design)：當實驗中有一個以上的變項時，針對不同變相採用受試者間設計或受試者內設計。
隨機組設計(random-groups design)：將受試者隨機分派到不同的組，在統計學上期待受試者平均的分佈。
配對組設計(matched-groups design)：將受試對象按某些特徵或條件配成對，然後分別把每對中的兩個受試對象隨機分配到不同處理組。
自然組配對(natural-groups design)：進行配對的條件為自然的特徵。

受試者間設計(Between-subjects design): 意指實驗中所有受試者將進行分組，每一組僅實施一種實驗操作，且每一組的實驗操作皆不同。此方法的優點是較為簡單且安全，因為受試者只會在其分派到的組別做某一個特定實驗，可以有效減少實驗操作而產生的變項。然而，此方法對於不同組之間的差異十分敏感，因此除了招募受試者可能較為困難且關鍵，也需透過謹慎的方法進行分組，以減少組間差異。; 在某些情況下，只能採用受試者間設計，不可使同一批受試者接受所有實驗處理，像是要量測不同環境下受試者完成一份試題所需要的時間時，受試者便可能因為熟能生巧而使後來的測驗時間縮短，導致實驗錯誤。另外，進行多變項實驗時，使用受試者間設計也較為適合、簡便。

受試者配對設計(Matched subjects design): 意指每位受試者或每個自變項僅接受一個層次測試，且在另一組有等效配對對象，統計方法為相依樣本 T 檢定。使用此設計的優點是可將受試者變項，如性別、年齡、階級、教育程度、智力、性格傾向等影響減至最低，缺點是配對不易。以一項比較兩種新的閱讀教學方法的研究為例，研究人員想要比較兩種方法，近代和現在的教學方法，並選擇兩組兒童，根據他們上次閱讀理解測試的結果將兩組兒童配對。若研究人員想測試另一種方法，則必須再找到三個可比較的孩子來比較三組。受試者配對設計也可以同時配對多個變量，例如在規律運動是否能改善療養院居民心血管健康之研究中，研究者可以配對受試者的年齡和性別。

受試者內設計(Within-subjects design): 意指受試者將不會被分組，而是利用同一組受試者接受所有的實驗操作。此方法最顯著的好處，是可以排除絕大多數的個體變異，使得受試者招募條件簡單。然而，此方法較為複雜且不安全，因為同個受試者經過前面的實驗操作後，可能影響後來實驗的表現，雖然可透過延長兩個實驗間的時間，使實驗的順序或彼此的影響的程度降低，或改變不同受試者之間實驗的進行順序，進行對稱式的實驗，在實驗設計與數據分析時仍需特別謹慎。; 以探討老師的表現與學生暴力傾向的實驗為例，由於實驗與個體本身的個性息息相關，找到兩組條件相當的受試者將十分困難，若採用受試者內設計，即可有效解決。然而，若時序較早的實驗中，老師展現了暴力傾向，影響受試者的個性，即使在後來的實驗中，老師被要求不能展現暴力傾向，前面實驗所造成的影響卻可能還存在着，使實驗結果出現偏差。

多個自變項

有時候科學家也會選擇使用多個自變項來進行實驗，而其中一個好處就是看到這兩個變項會不會交互影響。舉例來說，若要探討溫度（自變項一）與打字速度（應變項一）的關係，不妨再加入一個螢幕亮度（自變項二），那麼實驗者可能會發現只有當螢幕很亮時，溫度才會對打字速度造成影響，如此我們可以發現兩個自變項的交互關係。（自變項：溫度、螢幕亮度；應變項：打字速度）

多個應變項

在一個實驗中，結果可能不只含有一個變項，科學家也常透過同時觀察多個不同應變項，來獲得更全面的資料。以上述探討溫度（自變項一）與打字速度的關係的實驗來說，實驗者可能除了打字速度（應變項一）外，同時也會記錄受試者拼音的正確性（應變項二），以得出溫度對於打字「表現」的影響。『自變項：溫度；應變項：打字速度、拼音正確性』

測量與統計

實驗法不外乎也是遵循着先前所提到的研究程序，當要研究一個心理學議題時，會先觀察現象、蒐集資料、形成假說並設計一個可行的實驗，而在進行實驗時一個最重要的部份便是「測量」。

測量是一套將變項數值化的方法。在心理學研究中，有時實驗者可以使用物理方法直接進行量測，例如藥劑的投放量、受試者的血壓、心跳等數值；然而有些變項難以使用儀器量測的，例如受試者對一個外在刺激感到疼痛的程度，由於感受是一種抽象的東西，實驗者往往需要透過一些系統化的手法將此變項量化，而一種常見的方法是 5 點量表，或稱李克特量表(Likert Scale[1])，主要用來測量受試者對於一項描述的主觀或客觀判斷，通常是對該描述同意或不同意的程度，典型的李克特量表將受試者的判斷結果分為五種：非常不同意(very unsatisfied)、不同意(unsatisfied)、無意見(neutral)（即不同意也不反對）、同意(satisfied)、非常同意(very satisfied)。藉由上述所提及的方法即可達到將變項量化的目的。

Rate your experience about using our products
Very unsatisfied	Unsatisfied	Neutral	Satisfied	Very Satisfied
○	○	○	○	○

通常實驗者在蒐集到資料以後便進行數據分析，會使用統計(statistics)的方法來歸納並解釋。當科學家說研究結果具有統計學意義時，這意味着觀測方法、相關研究和實驗產生的數據為得出有關它們的結論提供基礎。這些數據可能代表種種統計資料，例如智力測驗的分數、血液樣本中的荷爾蒙的量、檢測視覺信號所需時間的微小差異或心理學家可能正在研究的任何其他內容等。與其他科學家一樣，心理學家使用描述性和推論性統計數據，來歸納數據並且解釋其中的含義。

描述性統計(Descriptive Statistics)

一個常用的描述性統計值是平均數(mean)，即將一組的數值全部加總再除以個數。將實驗組與控制組的平均值進行比較，即可發現自變項與應變項的關係。例如，一組學生在測試中的表現可以通過該組的平均得分衡量。通過將所有得分相加並將總數除以得分數來確定平均值，並且描述男女的表現差異也可以透過計算兩者平均分的差異來表達。

然而有一個需要特別注意的地方：量測時必定存在着誤差，而且有時會有極端值的產生，因此若是兩者平均值的差異極小，會讓實驗者難以判斷結果的正確性。因此唯有當控制組的平均值之間的差異達到一定程度，才會稱之具有「統計顯著性(Statistical significance)」，表示結果受極端值之機率極低，如此一來研究者才可相信兩者的差異來自於自變項之影響。此外，心理學家想要描述兩個變量之間的關係時，他們使用描述性統計量，並將它稱之為相關系數。

一般而言，常用做為描述統計量數的包括：

次數分配(frequency distribution)：包括次數分配表、莖葉圖(stem and leaf display)、及各種圖示法(graphic representation)。　
集中量數(measure of central tendency)：包括平均數(Mean)、中位數(Median)、眾數(Mode)等。　　
變異量數(measure of variability)：包括全距、平均差、四分差、標準差及變異數。
相對地位量數(measure of relative position)：包括百分等級、百分位數、及各種標準分數。

推論性統計(Statistical inference): 幫助心理學家做出推論的數學操作，亦即從他們的數據中得出結論並使假設成為可能。例如，假設一組創傷後壓力症候群(PTSD)受害者在接受眼動脫敏再處理(EMDR)治療後，其焦慮測試的平均得分低於 10 分，並且未治療的對照組中受害者的平均得分下降了一點。; 然而，推論統計數據使得研究人員估計兩組平均得分之間的差異是由於偶然的因素引起的，而非由於他們接受了不同治療所導致的影響。其他推論統計也可以幫助心理學家決定：兩個變量之間的相關性顯著到足以表明兩變量間確實存在某種關係，而非僅只是一種僥倖。; 當推論統計的數據表明相關系數大於預期時，科學家們就會認為結果具有統計學意義。雖然僅憑統計顯著性並不能確保最終假設一定成立，但其所帶來的發現是值得關注的。

實驗法的優缺點

優點:可以找出一個事件的「因」與「果」，比起其他的研究法，受試者是在一個經過設計、小心監控的環境下進行實驗的，得出的結果是可以較為準確的，因此心理學家通常會比較偏好使用實驗法來進行研究。

缺點:實驗法有其限制，會有道德問題或實驗誤差等狀況。舉例來說，若要研究家庭環境對小孩智力發展的影響，實驗者不能直接將一群嬰兒在人為刻意營造的環境下養育成人，其代表着貧窮家庭的受試嬰兒挨餓，而富裕家庭的受試嬰兒則過分溺愛、任其予取予求，這是非常不道德的。另外，有些情況下，實驗的觀測反而會干擾到受試者，成為一個外在變項，進而影響結果。比如說，如果要觀察一般人是否會在四下無人時選擇闖紅燈，在進行實驗時，受試者若知道自己正在被觀察著，部分的人可能會因此選擇遵守交通規則。在這個例子中，實驗並不能正確的模擬「無人監測」的情境，且導致實驗結果的誤差。再者，實驗法可能會受期待效應影響，受試者可能會根據已知的期待做出回應造成實驗誤差。上述情況中，實驗法顯然是不適用的，因此心理學家便只能依靠其他研究法繼續進行研究；舉例來說，研究者可用雙盲(double-blind)實驗排除期待效應，讓實驗者和受試者都不知道現在正進行的實驗內容。

內部一致性：

評分者間信度（不同評分者評分之相關性）
折半法（將研究項目分成平分兩部分之間的相關性）
Cronbach's α 系數（平均所有可能的折半組合之系數）

長期穩定性：再測信度（藉由再次的施測或觀察,計算分數間的相關性）
等值性：複本信度（計算相似但不相同的兩份測驗施測後得到分數間的相關性）

衡量信度的方法：

・評分者間信度(Inter-rater reliability)：由於個人因素的影響（如情緒、既有觀念等），有些測驗不能以客觀的方法進行鑑定，例如作文考試。所評的分數通常受評分者的主觀感受而受到影響，因此要由 2 人或以上各自根據標準評分，再求大家分數是否大致相同。

・折半信度(Split-Half Reliability)：折半信度是將受測題目分成前後兩半，再求取前半段與後半段之題目的相關程度，若相關程度很高就代表折半信度很高，是考驗衡量的同質性。由於此相關只是半個測驗分數求得的，並非整個測驗的信度，其信度還必須使用「斯布公式」(Spearman–Brown prediction formula)等加以校正，才能求得正確的信度。

     斯布公式(Spearman-Brown formula)的一般形式為: $\mathbb {R} _{xx'}={\frac {n\cdot r_{xx'}}{1+(n-1)\cdot r_{xx'}}}$  ，其中 $\mathbb {R} _{xx'}$ 是可測試的信度，n是新測驗的長度相對於原測驗的倍數，r_xx'是原測驗的可信度。

・內部一致性信度(Internal consistency reliability)：同一個測驗中不同子項目是否一致，例如量度「外向」，可以用「朋友數目」、「友善程度」、「經常笑」等來測。一般可用克隆巴赫系數(英語：Cronbach's alpha)來檢驗。

     克隆巴赫係數，又稱 alpha 信度(alpha reliability)：對於同一個概念經常存在多道不同的題目，或甚至有多份不同的量表；不同題目或不同量表所測出結果的一致性，以相關係數之期望值表示，就是它們的「alpha 信度」。一般認為「alpha 信度」的值具有下列意義：

Cronbach's alpha	Internal consistency
α >= 0.9	Excellent
0.8 <= α < 0.9	Good
0.7 <= α < 0.8	Acceptable
0.6 <= α < 0.7	Questionable
0.5 <= α < 0.6	Poor
α < 0.5	Unacceptable

・再測信度(Retest Reliability)：再測信度是讓同一組受測者，於前後兩個不同時刻做兩次測驗，再求兩者結果的相關系數，此系數就稱為再測信度。此系數可以表示測驗結果的穩定性，故又稱為穩定系數(coefficient of stability)。最適當的時間間隔依測驗的目的和性質而異，通常少則兩週，長則六個月。

・複本信度(Equivalent-form Reliability)：複本信度是設計者有時候會在同測驗中有兩種以上的複本，受試者先用其中一卷進行測試，同組人或另外一個人再用另一卷進行測試，而這兩種測驗結果的相關系數即為複本信度，目的是為了讓不同程度的受測者能夠明確知道問卷題目之用意。

效度(validity)

即有效性，評量一測驗或工具是否能滿足其測驗意圖。最主要的概念為建構效度（Constructive Validity），指測量工具能測量理論的程度，其中有六種效度類型：表面效度、內容效度、同時效度、預測效度、聚合效度和區別效度，進一步可以大致分為兩類：翻譯效度（Translation Validity）和效標關聯效度（Criterion-related validity）。

翻譯效度（Translation Validity）

翻譯效度意指將建構概念準確地「翻譯」為可操作化的程度，其重點在於可操作化是否良好反映了建構概念的真實含義。以下分為兩類：

表面效度(Face Validity)：指測量工具經由受試者或研究者主觀覺得與研究主題相關。泛指受試者一看到測量工具，就知道研究者在測量什麼的問卷。高表面效度的問卷更能獲得受試者的合作並提高作答意願，不過在某些測驗會忌諱高表面效度，例如有關人格的測驗，高表面效度受試者越可能虛偽作答。因此對於這些有可能存在表面效度的調查時，應該避免而另尋解法。

範例：設計一份「案主對機構服務的滿意度」問卷時，案主或你的同事一看到問卷內容就知道是在做滿意度調查，具高表面效度。

內容效度(Content Validity)：指某測驗之題目內容是否周延、具代表性、具適切性並確實包含所欲測量主題的內涵。為了讓問卷具有內容效度，研究者會去詢問專家的意見或參考相關文獻。

範例：設計憂鬱症量表時，我們可以根據 DSM-IV，將憂鬱症所包含行為及心情等表徵納入問卷設計中；設計「同性戀者對社會適應的程度」的問卷量表，由於現有文獻不是非常充足，所以可以諮詢專家的意見，使量表更周延、適切。

建構效度(Construct Validity)

指某種測驗能去測量某個理論的程度。如果測量工具與想要的概念相關聯性很高，我們稱為聚合效度(Convergent Validity)；反之，若測量工具與目標概念不具相關性則稱為分歧效度(Discriminant Validity)。實務工作者通常不太使用這個方法，只有需要測量理論的學者較常使用。

範例：設計一份關於「自尊」的問卷以了解自尊的概念，由於我們知道自尊跟「自信」的概念很相似（正相關；即自尊越高，自信越高），跟「自卑」的概念剛好相反（負相關；即自尊越多，自卑越少），透過文獻找出測量的量表，讓同一群受試者填寫。若你設計的自尊量表與自信量表測出的結果有高度正相關，與自卑量表呈現負相關，即表示量表具有建構效度中的聚合效度。

效標關聯效度(Criterion-related Validity)：指該測驗分數與效標(具高效度的衡量工具)之間相關系數的高低。效標關聯效度是在測量具體的行為與實證資料上，其中分為下列四種。（效標：指測量工具所欲測量之特質的獨立量數，即檢定測量工具效度的標準。）
同時效度（concurrent validity）：衡量測驗工具之可操作化程度與現有實驗結果之關聯性，藉由同時進行兩種測量，比較兩份分數間的相關性。例如：給受試者聽一段含有次聲波的音樂，同時觀察其腦部情緒反應，以及詢問心理恐懼程度。
預測效度(predictive validity）：衡量測驗工具之可操作化程度與理論上可預測的實驗結果之關聯性，換句話說為某測驗與一段時間後另一變項的相關性。

範例：將設計的問卷 A 跟他人設計的問卷 B，同時或在不同時間給受試者填寫，把兩次的結果 A1 & B1 進行相關系數的比較。又稱實徵效度(Empirical validity)或統計效度(Statistical validity)。效標即可顯示測驗所欲測量或預測的特質之獨立量數，作為檢定效度的參照標準。

聚合效度（convergent validity）：是指衡量工具與實驗目標有較高的關聯。來自相同構面(潛變數)的項目，彼此之間的相關性要高，不會有效度不足的現象。

以相同方法衡量相同特質所得到的分數之間，相關性要高。以不同方法衡量相同特質所得的分數之間，應具有次大的相關性。

區別效度（discriminate validity）：指衡量工具應該與實驗目標無關。來自不同構面(潛變數)的項目，彼此之間的相關性要低，不會有效度污染的現象。

以相同方法衡量不同特質所得到的分數之間，相關性要低。以不同方法衡量不同特質所得的分數之間，相關性要最低或是無意義。

信度與效度的分別

可信度高並不意味着測量方式更準確，測量方式的準確度是效度(validity)的問題。可信度所討論的是針對相同或類似的現象，是否能透過同一種測量方式得出相同的結論；而效度討論的則是能否測量想要量度的問題，例如運用天秤來測量高度就是一種效度差的測量方式。可信度高並不完全代表着有效度高（如一個秤磅每次顯示的公斤數都比實際上的數值多一公斤，顯示其可信度很高，但由於其並非顯示真實的數值，因此其效度並不高），儘管如此，可信度在某方面依然可以保證一種測量方式的有效度。然而，若一個測試的可信度較低，則其就一定沒有高的效度。

其他-心理測驗法、焦點群集法、德懷術、經驗總結法等

德懷術(Delphi Technique)：於 1960 年由美國蘭德公司發明，是一種尋求共識的研究方式。Delphi」是源自於古希臘阿波羅(Apollo)神殿中著名的「德懷神諭」(Delphi Oracle)，是一種典型的廟堂上用來預測未來的工具，故因此取名。其大略的進行方式為請多位專家同時以匿名、書面方式，針對一個特定的主題表達意見，經過多次的討論與整合，是一種使專家們得以彙整各方面不同的意見及專業知識，逐步地達成共識，進而解決複雜議題的一種研究方法。
德懷術的基本意義與基本原理: 德懷術是一種群體決定的方法，它使用問卷調查方式，但卻與傳統的問卷調查有所不同，傳統的問卷調查只要實施一次問卷，就算完成調查工作；然而德懷術則需進行一連串密集的問卷，直到調查項目達到一致性之後，才能完成其調查研究。德懷術提供多次的回饋意見，具有會議的溝通作用，但卻不像會議一樣必須全體共聚一堂，而擔心受到權威者的影響。換言之，德懷術擷取問卷調查和會議二者之優點的一種探究方法(Linstone，1978；Roweetal.，1991)，其原理是建立在「結構化的資訊流通」、「匿名化的群體決定」、及「專家判斷」的三大基礎上。 德懷術的實施原則如下:

匿名原則：所有參與調查的人員在不受干擾的情形下，自由發表個人的意見。
重複原則：不是一次調查就結束，而是由主持人針對相同的對象反覆實施調查。
回饋原則：每次調查都將其他人的意見提供給所有受調查者參考，以作為進一步填答的依據。
共識原則：主要目的在於獲得專家群的共識，以作為決定的依據，所以德懷術最後一定要到獲得一致的意見為止。

實施步驟

德懷術的優點在於它能夠有效地排除研究不夠嚴謹的缺點，對於具不明確性、複雜度高、具爭論性的議題可應用德懷術尋求出專家的共識。此方法與傳統的對談式討論不同，這些參與討論的專家都是以匿名的方式進行，因此所有人不會受到任何外界的干擾或影響，得以自由地發表意見並參與討論，同時也不受限於時間與空間的因素，任何時刻都可以進行討論。在現今，此種方法在軍事、商業、工業、政治、經濟、醫藥和教育等方面都有着廣泛的應用。德懷術的施行步驟如下：

確定所要探討的主題，並以問卷的方式列出問題。
尋求適合的專家組成德懷術小組，參與討論主題。
發送問卷，進行四回合的調查。
第一回合調查：詳細說明討論的問題與研究目的，請接受問卷的專家針對問題提出其看法或解決途徑，回收問卷並進行第二回合。
第二回合調查：整合第一回合的調查結果，再重新發送問卷給受調查者，提出贊成、反對程度或遺漏的部分。
第三回合調查：將第二回合的問卷調查結果以等第的方式進行排序。此回合的主要目的是希望受調查者將自己的看法與大眾的看法相互比較，再依照此一對比的結果，決定要堅持原先的看法，或者是被大眾說服，改變自己的立場。
第四回合調查：內容主要為前三次問卷中受調查者所做出的各種選擇，其目的在於讓專家們在參考過此次問卷的資料之後，做最後的決定。最後一回合的調查結果是為研究最終採用的依據，也是專家們共同討論、協調之後所達成的共識。
若四回合後受調查者仍無法達成共識，則可以再持續進行幾個回合，直到獲得共識為止，最終所獲得的結論採用眾數或中位數作為實驗結果的依據。

心理測驗法：根據已被標準化的實驗工具（如量表），刺激和引起被測試者的反應，所引發的反應結果由被測試者自己或其他人記錄，再通過一定的方法進行處理，給以量化，描繪行為的軌跡，並對其結果進行分析。這種方法的最大特點是對被測試者的心理現象或心理品質進行定量分析，具有很強的科學性。

經驗總結法—為教育心理學常使用之方法

經驗總結法：歸納以及分析各種活動中的具體情形，使其系統化。整理前人的經驗，並且將好的部分長期運用，是目前相當行之有效的方法。

經驗：在活動中取得的知識或技能，這種經驗通常不是刻意安排的，常常是個人或是團體因為某一種際遇或是碰巧達到某種特殊條件而取得，因此科學性不高，但是如果經過理論研究者和實驗者不斷地把觸發這種經驗的人做整理、驗證、提煉以及加工，經驗就可能變成具有科學性的事實，而這種經驗一般會是在實施之後發現有良好效果後再統整，要能樹立正確的指導思想。此種經驗必須具備觀點鮮明、正確、先進、科學以及可以成為代表性的特性等。

經驗總結法的實踐步驟：

使用經驗總結要注意：對象具代表性、依據客觀事實並和定性定量結合、觀察全面、能區分現象和本質、具創新精神

經驗總結法在教育方面是歷史悠久的研究方法，後來教育心理學也有使用這個方法來研究，因為人類的教育思想有很大的一部分都是來自先人的智慧，不管在國內或是國外皆然，在教育科研發展迅速的現代，經驗總結法的科學化和規範化也不斷提高，此方法已經變成教育科研以及教育心理學專家發展研究的重要方法。

經驗總結法的重要作用

可以協助轉變教育觀念，透過不斷地進步提升教育的地位與影響力
揭示教育規律，可以極大的豐富教育理論，賦予科學意義
協助教育相關部門和領導者更加了解教育體系的優劣，正確地執行教育方針並制定政策
加強教師素質並提高教育品質
提高教育工作者的教育水準和教育科學研究水準

大數據研究法

透過以上幾種研究方法，從質化研究（觀察法、訪談法等）的文字訊息得知如何運用量化研究（實驗法、測驗法等）將數據數字化。當研究對象從 N=1 的個案研究到 N>>1 時就變為大數據研究。但當研究的個體數量增加，就可能會出現個體差異導致的選擇性偏差(Selection bias)或是相關非因果的偏誤等問題，皆會影響信度與效度，因此要能發揮大數據研究的優勢，對高技術性實驗方法的要求也更高。

搜尋論文、期刊的方法

Google 學術搜尋

Google 有一個特別的功能叫做 Google學術搜尋(Google scholar)，裏面囊括了世界上絕大部分出版的學術期刊，只要輸入關鍵字就可以找到相關的論文或書籍。另外，加上一些更細節的關鍵字，可以使得搜尋範圍變小，使搜尋更有效率、更快找到需要的論文。

APA PsycNET資料庫

在心理學研究領域有一個比較專門的網站APA PsycNET，APA 是美國心理學會(American Psychological Association)的英文縮寫，當中涵蓋心理學、社會學、神經科學等領域，具有相當可觀的資料量。

各大專院校資料庫

各大專院校所發行之學報期刊、中華心理學刊等重要研究成果文獻皆為國內學術專業期刊可供人參考。若想尋找學術論文，則可前往資料庫進行搜尋，如華藝線上圖書館、或是進入大專院校的圖書館系統之資料庫查詢，其中便包含全球許多地區的學術論文及期刊平台，此外台灣博碩士論文知識加值系統中可查詢各大學校的碩博士論文以此進行參考，以上方法為搜尋台灣的研究文獻。

中國知識基礎設施工程

是中華人民共和國的一項知識工程，由清華大學直接領導。若想搜集對岸的論文期刊則可前往中國知網，平台提供海內外讀者一些重要的中國學術文獻及期刊。

PQDT資料庫

如果想找尋美加地區的博碩士論文，可透過PQDT(ProQuest Dissertations & Theses)資料庫查詢論文索引摘要，裏面包含了商學財經類、綜合學科、人文藝術類、應用科技類等多種類型的資料庫，並可由數碼化論文典藏聯盟資料庫查得數位博碩士論文。

DART-Europe E-theses Portal

搜尋歐洲地區之論文可前往DART-Europe E-theses Portal歐洲公開取用博碩士論文網進行搜尋。

研究的時間面向

橫斷面的研究

橫斷面(cross-sectional，CS)的研究是指一個研究在同一個時間點對受試者所做的觀察，這些群體都具有某些相同的控制變因，例如社會經濟地位、性別、智力、教育背景和種族等。此類的資料中，每個觀察單元只存在空間上的差異。

優點

可以在短時間，像是一年內收集到不同年齡層的樣本資料，不只省時、省力還省錢。
這些受試者只需參加這一次的實驗，不需要再做實驗後的追蹤，所以不會有流失受試者的困擾。
可以運用最新的理論。
可以研究目前有興趣的研究。
不用擔心對同一樣本反覆施測所產生的練習效果。

應用

在某一特定時間對某一定範圍內的人群，以個人為單位收集和描述人群的特徵以及疾病或健康狀況。它是描述流行病學中套用最為廣泛的方法。

問題與缺點

無法觀察個別差異的跨時穩定性：橫斷面的研究是在同一時間對不同樣本所做的測量，不同年齡層的資料不是來自同一個樣本，因此我們無法解決個別差異是否有跨時穩定性的問題。
可能的解決方案：在蒐集橫斷面的資料時應盡可能地包含貫時性性質的資料。

貫時性的研究

貫時性的研究是指一個研究對其所欲觀察的對象，進行橫跨一段時間的觀察，同時也能蒐集長期的變遷。其下又分為：

時間序列研究(time-series，TS)：研究者每隔一段時間收集一次橫斷面樣本資料，藉此瞭解這些資料在不同時間上所呈現的差異；研究對象不需是相同人群或樣本。
世代研究：（Cohort study）是一種觀察性研究設計，用於研究特定群體（世代）隨時間變化的特定結果或疾病的發展。研究者通常選擇一個或多個群體，在這些群體中的成員在研究開始時未出現研究關注的結果或疾病。研究者隨後追蹤這些群體一段時間，觀察並記錄相關的健康結果或其他相關變量。而世代研究又分為兩種類型：

(1)前瞻性世代研究：在這種類型的研究中，研究者在研究開始時選定參與者，並在此後的時間點追蹤他們，收集數據。這種研究可以提供有關因果關係的證據，因為研究者能夠在時間序列上追蹤暴露和結果之間的關聯。

(2)回顧性世代研究：在這種類型的研究中，研究者使用過去的數據來確定誰暴露於特定的風險因素，並追溯這些人的健康記錄以確定結果。這種研究通常依賴於既有的數據，因此可能受到數據質量和可用性的限制。

追蹤研究(time-series-cross-sectional，TSCS，又稱縱橫研究或縱貫性研究)：對同一批研究對象在不同時間進行調查與研究，觀察單元間可能存在時間與空間上的差異。相較於時間序列研究，追蹤研究的困難度更高，也需耗費更多成本，因為追蹤的樣本很可能隨時間消失或變得無法聯繫。值得注意的是，樣本追蹤研究與世代研究不同之處在於，前者並不強調世代，並能清楚了解變遷的軌跡。例如：〈都是為了孩子？父母離婚負面影響之重新評估〉（陳婉琪，2014）。不過，隨着時間拉長，實驗者可能難以找到每一個受試者進行追蹤研究，這也是「固定樣本追蹤研究」的困難之處。

優點

能測量研究對象於不同時間之生理、心理、社會之變化。

問題與缺點

因縱貫性研究設計須長期於相同樣本上進行研究，故研究期間部份樣本可能因為遷徙、死亡等因素而流失或減少，使得研究結果受到影響。
需要花費較多的時間與經費，如果無法大量取樣可能會影響研究結果的推論性。

研究的誤差

所有的實驗都會發生誤差，例如，程序設計、儀器操作、樣品取樣、人為觀察等等。而所有環節都有可能出現偏誤，影響實驗結果的信度與效度，因此才更需要嚴謹的設計實驗，以減少誤差出現的機率和誤差對實驗結果的影響。心理學的實驗也不例外，而且更容易受到實驗參與者的情緒狀況所影響。以下介紹對實驗效度的威脅以及其改善方法，而後提及影響實驗效度的具體例子。實驗效度可分為兩類，外部效度和內部效度。內在效度是指實驗研究所操縱的實驗變項對依變項所造成影響的真正程度。外在效度是指實驗結果的可推論性程度，實驗結果的可推論性愈大，亦即其適用性、代表性愈大，越可推論到研究對象以外的其他受試者。

內部/外部效度
效度種類	說明
內部效度	實驗操作變因對「實驗內」應變變因造成影響的程度
外部效度	實驗內所得的結果，對於「實驗外」對象的適用程度

常見對內部效度的威脅有隨機化失敗、無法遵循實驗章程、損耗性偏差、實驗性效應影響、小樣本。

隨機化失敗(Failure to randomize)

The differences estimator
$Y_{i}=b_{0}+b_{1}X_{1}+u_{i},i=1,2,...,n,X$ 是有無接受試驗的類別變項， $b_{1}$ 則表達處理效應(Treatment effect)或因果關係(Causality)。
根據 OLS 及後續討論，如果 $X$ （有無接受試驗）是隨機指定，則 $u_{i}$ 對 $X_{i}$ 的條件期望值為零， $b_{1}$ 成為對因果關係的一個不偏且具一致性的估計式(Estimator)。但是一般而言，非隨機分配(Nonrandom assignment)常常造成估計式的偏誤，而導致結果受到受試者特徵或偏好的影響。
可以將有無接受試驗這個類別變項對個體特徵(Individual characteristic)作線性回歸以檢測試驗是否隨機(Randomly assigned)。
$X_{i}=b'_{0}+b'_{1}W_{ri}+u'_{i},W$ 代表個體特徵的有無或多寡，特徵種類有 $r$ 個。接着，透過 F 檢定檢測 W 的系數是否全為零。若接受虛無假設，則可推論試驗接受與否是隨機指定。另外，如果已知 randomization conditional on covariates，則這些 covariates 須包含於上述的 W 中做回歸，而進行 F 檢定部參與系數檢定。

無法遵循實驗章程(Failure to follow the treatment protocol)

在真實實驗中，人們有時無法百分之百遵循實驗章程（如控制組可能或多或少被試驗），這種情況稱為 Partial compliance，從而可能導致 treatment 與否與 error 產生關聯造成結果偏誤。

補救方法：

如果有 treatment actually received 和 intial random assignment 的資料，研究者可使用 TSLS estimator(two stage least square estimator)，以 initial random assignment 作為工具變數(instrumental variables)，找出 X 對工具變數的迴歸關係式，以此迴歸關係式創造

X'

(在給定工具變數值下的 X 估計值)，尋找因果關係和試驗效力。工具變數需具有兩個特性，以確保不偏性和有效性，其一是相關性(relevance)，工具變數須 X 有高解釋效力（高度相關），常用的準則是一階 OLS 的 F 統計量需大於 10；另外一個是外生性(exogeneity)，工具變數需與 error 項不相關，通常需要專業領域知識的主觀判定，或在工具變數的數量多於內生變數的數量時引入 J 統計量來確定是否具外生性。

損耗性偏差(Attrition)

指在實驗過程，受試者有可能因外在因素而未繼續參與試驗，而導致觀察、研究的對象與比較基準的改動。若這些改變與結果相關，則這些影響將會造成最後實驗結果偏誤。

實驗性效應影響(Experimental effects)

實驗者的期待效應、受試者的安慰劑效應（可見後文說明）。

小樣本(Small samples)

由於進行人體試驗比較昂貴，通常樣本很小。小的樣本不會影響估計的不偏性，但會造成因果關係的建立與衡量不精確並影響信心水準和假設檢定的有效性，因為基於臨界值(normal critical values)和異方差性(heteroskedasticity-robust standard error)的統計推論只有於大樣本才具合理性。小樣本的推計推論，常常在引入錯誤(errors)為常態分佈的前提下進行分析，然而，在現實狀況下，常態分佈的假設有些過度理想化。

註：
關於估計(Estimator)的一些性質：

不偏性(Unbiased)：簡單來說，估計量是一個隨機變數，若其期望值和母體系數相等，則我們稱此估計具不偏性。
有效性(Efficient)：對估計式減去母體系數取二階動差。二階動差較小者，我們稱此估計式相較於另一個估計式具有效性；另外當某一個不偏性估計(unbiased estimator)的變異數剛好等於 Cramer-Rao lower bound，便可稱此 esimator 為最小變異不偏估計式。
一致性(Consistency)：當估計式可機率收斂(convergence in probability)到母體系數，我們稱此估計式具一致性。另外如果估計式為樣本平均值或其函數，根據 SLLN(Convergent Almost Surely)或 WLLN(Weak Law of Large Numbers)可獲得更強的收斂性質。

常見對外部效度的威脅有非代表性樣本、非代表性流程：

非代表性樣本(Non-representative sample)：研究的母群體(population)和感興趣的母群體(population of interest)需具足夠地相似性以確保實驗結果可一般化使用。
非代表性流程(Non-representative program or policy)：要一般化施行實驗中的 treatment，因為規模擴大控管降低或時間拉長，實驗中所獲得的效果不一定能在現實狀況中重現。

抽樣偏誤(Sampling Bias)

抽樣是從較大團體（抽樣母群體）中選擇部分個體（樣本）的過程，並以此為基礎，估計或預測此一較大團體的事實、情況或結果。

在研究過程中採用抽樣，主要有下列四個原因：經濟、時效、無法普查（難以接觸）、毀滅性之避免。

抽樣偏誤是抽樣調查時產生的偏誤。原因出在抽樣對象數量的不足，對象之間有一定的關聯性，使其無法代表整個母群。

舉例來說，在台北車站進行關於金錢使用的問卷調查，隨機選擇路人作為調查對象。但是在台北車站聚集的人，其收入可能因為城鄉差距而高於全台灣的平均值，年齡層也可能集中在青年到壯年之間，職業分佈也有所偏頗。因此得到的數據不能代表全台灣的實驗結果。美國心理學家羅伯特·V·格恩里(Robert_V._Guthrie Robert Guthrie)曾出過一本著作《Even the Rat Was White》，書中指出西方的心理實驗主要是以白人、特別是以白人的大學生作為取樣對象，因此實驗結果無法套用到其他族群之中。

除了採集更多樣本和更精準定義抽樣對象以外，能夠減少抽樣偏誤的方法為選擇抽樣的方式。選擇分層隨機抽樣或叢集抽樣，並將母體依照性質分成各類別的小團體，再從團體中進行隨機抽樣。這樣一來，不但能減少抽樣偏誤造成的影響，還能觀察樣品的性質差異對於結果的關聯性，有助於研究的精確度。常見抽樣方法有以下幾種：

抽樣方法	說明
簡單隨機抽樣 (simple random sampling)	母體中所有元素被抽出的機率均相等的抽樣方法。由簡單隨機抽樣法所得到的樣本稱為簡單隨機樣本(simple random sample)。
分層抽樣 (stratified sampling)	將母體依照其特性或與調查目的有關的性質分成幾個類或幾個組，每個類組稱為一層(stratum)，母體中的每一個元素都屬於其中的一層，而且是唯一的一層。分層之後再從各層簡單隨機抽取樣本。
部落抽樣 (cluster sampling)	先將母體中相鄰的某些群體劃分為 n 個不同的群體(cluster)，母體中的每個元素均屬於其中的一個部落，且是唯一的一個部落，然後再從這些部落中隨機抽取部落，並對部落進行普查的抽樣方法。
系統抽樣 (systematic sampling)	又稱「等距抽樣」，自母體自然隨機排列的資料中，每隔一定間隔選取一元素，直至抽滿 n 個元素為止的抽樣法。
分段抽樣 (multistage sampling)	將母體按照某些特性或某種分類標準分為數個群體或層別，先由這些群體或層別中抽出幾個群體或層別，此為第一段。然後以特性或分類標準，再從已經抽出的群體或層別中，抽出群體或層別，此為第二段。如此依序為之，最後再以隨機或系統抽樣或其他抽樣方法抽出樣本。

反應偏誤(Response_bias)

個人面對試題時，可能並非根據模擬情境，而是根據過去的作答模式來回答，此狀況被稱為反應偏誤。比如面對不清楚的問題時，傾向選擇否定的回答、或是刻意讓是與非的回答各佔一半的填卷方式，都是反應偏誤造成的現象之一。欲減少反應偏誤，需要良好的命題技巧，以及減輕作答者對於作答結果的壓力。

反應偏差可以由許多因素引起，因為受試者會主動整合多個訊息，以在給定情況下產生反應，並非被動地對刺激做出反應。^[1]正因如此，實驗條件幾乎任何方面都可能使受訪者產生反應偏誤。

當受試者傾向於選擇積極的選項時，這種反應偏誤被稱為默認偏差(Acquiescence bias)^[2]。另外，若受到社會主觀規範的影響而傾向給予符合大眾刻板印象的回答，這被稱為社會性喜好反應偏誤(Socially Desirable Responding Bias)。例如：當我們參與關於環保或犯罪的公開問卷調查時，較不會做出違反環保或道德的回答；面對像是性愛等私隱性問題較不會精準回答本人的狀況。對於會造成反應偏誤的調查，可採匿名測驗；若需要更加嚴謹，可依靠測謊的儀器或手段。

[註]無反應誤差: 並非反應偏誤之相反詞，而是指在統計調查中，有提供答覆的受訪者與沒有提供答覆的受訪者之間，在意見上的差異，是非抽樣誤差之一。

安慰劑效應(Placebo Effect)

安慰劑效應，又名偽藥效應、假藥效應、代設劑效應。指病人雖然獲得無效的治療，但卻「預料」或「相信」治療有效，而讓病患症狀得到舒緩的現象。

安慰劑效應最早由畢闕博士(Henry K. Beecher)在 1955 年所提出，但更早期的文獻中已對此有所記載，且近年研究持續深化我們對此現象的理解。安慰劑效應亦理解為「非特定效應」(Non-specific effects)或「受試者期望效應」(Subject-expectancy effect)。

此效應實驗的對象經常是人類，因為需要受試者模擬效果，而未經訓練的動物難以理解被灌輸的想法。受試者在被告知所服用的藥物為何之下，可能會因為心理作用，導致感受到的藥效與實際情況有所偏差，也就是說心理層面將影響生理層面。即使拿到沒有效果的假藥──醫學上的安慰劑(placebo)來進行實驗，也有可能得到與使用真藥相同的結果。另外，從眾心理和權威者也可以影響實驗結果，當外在的影響足夠強大，就有可能改變觀察目標的想法；過去受宗教勢力掌控的歐洲，就有利用聖水治病的歷史，在教會大力宣傳下成功讓人相信療效。

目前有兩個主要假設說明安慰劑效應如何作用：

制約反應(Conditioned Response)
俄國著名生理學家巴夫洛夫（Иван Петрович Павлов）曾做過狗之唾液制約反射實驗。他在給家中小狗食物前，都會發出鈴聲，在多次反覆操作後，每當鈴聲一響，狗就會自動分泌唾液，原因是狗已經學習到將鈴聲及食物串聯起來。此實驗替古典制約理論打下良好基礎。所謂古典制約，指的是一種關聯性學習，可將原本不存在關聯的兩個事件透過人為干預建立起聯繫。透過此種制約，受試者會學習在特定情形下做出特定反應。據此，有學者推論，安慰劑使病人產生與有效藥物類似的反應，可能是因為制約而造成。
病人期望效應(Subject-expectancy effect)
受試者期望效應屬於認知偏見的一種。在科學實驗中，由於研究人員預期某些研究結果，便無意識地操縱實驗步驟、又或引導實驗人員做出希望得到的結果。而病人期望效應便是其中一例子，此效應會引導病人有意無意地認為自己的病情有獲改善。丹麥醫學研究者Asbjørn Hróbjartsson及Peter C. Götzsche於文章中質疑「大部份病人有禮貌地傾向迎合實驗人員而報告病情得到改善，即使他們並不感到改善。」主觀的偏見亦可能使病人潛意識相信病情因為得到關注及照料而改善。

若要避免安慰劑效應，主要可分三種方法：

單盲法(Single-blind study)：最簡單的方法，就是不告知受試者服用何種藥物。給予實驗組具有效果的真藥，對照組則是不具效果的安慰劑，且不告知受試者本身屬於實驗組還是對照組。即便對照組因為安慰劑效應有些微效果，但若最終實驗組展現出比對照組更高的成果，就能夠證明實驗藥物跟結果間的關聯性。然而，在使用單盲法時，受試者會和實驗人員有所接觸，故仍要避免實驗人員的主觀期望影響到受試者。單盲實驗的典型案例是Pepsi Challenge：百事可樂在商場讓購物者喝用同樣白色杯子裝的百事可樂及可口可樂，並讓他們選擇自己比較喜歡哪一種，而實驗者自己知道哪個杯子是裝哪種可樂。

雙盲法(Double-blind method)：比單盲法更為嚴謹，指在藥物測試中將病人隨機編入對照組及實驗組，實驗過程中，無論是實驗人員或實驗組、對照組，全都不知道是誰獲得真正藥物，直到所有資料都蒐集分析、統計後，受試者和實驗人員才會知道實驗對象所屬組別，如此一來也就不會因為期望效應，使實驗結果產生偏差。

但要做到雙盲，會遇到很多困難，比如：兩種治療型態可能完全不同，如手術和藥物治療；或兩種藥物可能是兩種不同的劑型，雖然用膠囊技術可使兩者無法分辨，但改變劑型可能會改變藥物動力學或藥效學的特性，因此需要建立不同劑型的生物相等性。

有關安慰劑效應的研究及討論正在進行，於醫療應用上使用安慰劑的共識準則於將來應該會出現。一般都同意，在雙盲臨床試實中，安慰劑對照群組對排除幾種試驗中可能出現的偏見是重要的。

三盲法(Triple blinding method)：最為嚴謹，是指實驗開始至結果出爐前，實驗人員、受試者及統計人員三方全都不知哪組是實驗組、對照組。三盲法通過在第一次解盲時，將受試者分為兩組（但統計人員不知哪一組是實驗組或對照組）。在完成資料統計後，再進行第二次解盲，公佈實驗組與對照組。此方法可以有效避免研究人員在統計、分析資料時因期待而產生的偏誤。

安慰劑效應引發的混淆：

因為查找引因有一定困難度，很多現象於統計時被錯誤地歸納入安慰劑效應。

疾病自然地消失。
疾病本有的臨床表現。
錯誤診斷或預測(prognosis)。
病患暫時性改善被混淆為痊癒。

反安慰劑效應(Nocebo Effect)

這個詞彙最早由華特．甘迺迪(Walter Kennedy)提出，其拉丁文原文 Nocebo 源自於拉丁文 nocēbō，意思是「我將傷害」，是與安慰劑效應相對的概念。
它的效果和安慰劑相反：安慰劑效應中，受試者有正面期待，因而得到正面的結果；而反安慰劑效應則是當受試者對於其用藥、治療等有負面期待的時候，受試者將得到本不應該存在的、額外的負面效果。即當被實驗者不相信治療有效時，其病情就有可能會惡化。

這樣的現象大量出現在各式疾病用藥上，研究指出，當病患被告知用藥可能產生之副作用時，不論藥物的真假，病患感受到副作用的可能性就會上升，而這一現象發生的原因不在於藥物，而是病患心理層面對於康復的期望。「電磁波過敏症」也被認為和這樣的反安慰劑效應相關，當受試者越是認為電磁波會造成不良影響，就越受影響。

反安慰劑效應也是一個好的研究題材：透過應用反安慰劑效應，我們可以研究個體的心理活動對於其生理方面的影響。例如: 在一個研究中，健康的成年人被告知將有電流傳導過他們的雙手，儘管這是一個錯誤的訊息，仍有三分之二的人因此而頭痛(Schweiger, Parducci 1981)；而在另一研究中，受試者是在實驗前的皮下注射測試中對某種物質過敏，但對生理食鹽水沒有反應。但在雙盲試驗下重新以相同的條件測試後，在醫患雙方都不知道注射物質的情況下，有 27%受試者對之前引發過敏的物質產生過敏反應，24%受試者對生理食鹽水產生過敏反應。(Jewett & Fein & Greenberg, 1990)。藉由前述兩個例子，我們可以得知心理活動可以影響神經，從而影響到個體的生理活動。

在人類學的範疇中，亞瑟．克萊曼等人類學家認為傳統巫術的操作可能就和反安慰劑效應有關（當然，治療的部分也有心理因素的參與，但是是和安慰劑效應有關），基於巫術的篤信造成對被施巫術的人產生極大的恐懼，甚者因而死亡，原因就是急性的、情緒性的強烈恐懼所引發的身心反應。這個現象在原始部落可謂常見，又名為「巫毒死(Voodoo death)」。

比馬龍效應(Pygmalion Effect)：
比馬龍效應(Pygmalion effect)或羅森塔爾效應(英語：Rosenthal effect)是一種心理現象，在這種現象中，高期望會導致特定領域的績效提高。這種效果以希臘神話中的比馬龍 (Pygmalion) 命名，比馬龍是一位雕塑家，他愛上了自己雕刻的雕像，或以心理學家羅伯特·羅森塔爾 (Robert Rosenthal) 的名字命名。

羅森塔爾和萊諾爾·F·雅各布森(Lenore F Jacobson)在他們的書中將這一想法應用於教師對學生的期望，從而影響學生的表現，這種觀點由於其他研究結果而失去了可信度。比馬龍效應與安慰劑效應的效果十分類似，指個體被外界賦予更高的期待後，往往會表現的更好的一種現象。不同於安慰劑效應，這些期望往往是對受期待的個體有益。隨時間發展，此效應演變出心理學以及管理學上的用途，為自我應驗預言 (self-fulfilling prophecy；又稱「自證預言」) 。

1963 年美國心理學家羅伯特·羅森塔爾嘗試了一個小實驗。他告訴他的學生其中一籠老鼠為特別受訓過的聰明樣本，而另一群則是沒受訓的普通實驗鼠。將老鼠放進迷宮，並記錄每一隻花多少時間找到出路。但他沒跟學生說的是，事實上牠們全都是普通的實驗鼠。但出乎意料的事情發生了，學生所相信比較聰明的那群老鼠，真的表現比較好。那些「聰明」的老鼠儘管和「笨」的同類沒有差別，表現卻是兩倍優秀。一開始，沒人相信羅森塔爾，這樣的實驗結果就連他自己一開始也很難接受。羅森塔爾後來才了解到，他的學生對待「聰明」老鼠──那些他們期望比較高的老鼠──比較溫暖而溫柔。正是這樣的對待改變了老鼠的行為，強化了牠們的表現。

羅森塔爾描述了這項研究的影響：「如果預期中老鼠變得更聰明，那麼認為孩子在老師的期望下變得更聰明也不會太牽強。」羅森塔爾和雅各布森將實驗帶入班級(Pygmalion in the Classroom)，其中一所小學的老師被告知一些學生在學業上準備展現出顯著的成長。實際上，被指定為「進步」的學生是隨機選擇的（每個班級約5名，共18個班，涵蓋5個年級）。在實驗開始前，他們對學生IQ進行測量，並在研究開始後的屢次測試。在8個月內，255名對照組學生的IQ增長了8個IQ點，而65名會進步的學生平均IQ增長了12個IQ點。

在管理學上也有類似應用，上司為了啟發下屬的上進心而將下屬視為出色的人才，他們就較有機會在工作上表現良好，如果將下屬視為庸才，他們也容易如預想一般表現平庸。比馬龍效應指出，管理人若能有效地發揮此效應，令那些被認為具有較好潛能的下屬得到重視和稱許，他們的潛能便可以得到激發，令工作表現得到進步。

比馬龍效應存在許多爭議，有一些研究未能完全複製或支持這一效應。有時候，研究結果可能受到研究方法、樣本特徵等因素的影響，這使得比馬龍效應的一致性受到質疑。雖然一些研究表明高期望可以促進個體的表現，但仍然存在對於因果關係的確認問題。即使觀察到高期望和優秀表現之間存在相關性，也不能確定這種關係是因果性的。其他未考慮到的因素也可能對結果產生影響（如個體對壓力的反應、自我應驗預言等現象）。Pygmalion in the Classroom也受到質疑。首先，有些老師們並無法回憶起哪些學生被指定為潛力巨大的學生，表示操縱變因應無效。（老師在學期初收到一份學生名單；很少能記得名單上的學生名字）。其次，智力測量的有效性也有待商榷，當時使用的智商測試可能對年紀較小的孩子無效。除此之外，本實驗忽略了其他可能影響學生表現的重要因素。例如，學生的自我效能感，即他們對自己能力的信念，會影響他們的學習動機和成果。此外，學生的家庭背景，如父母的教育水平和家庭支持，也對其學業成就有顯著影響。僅強調比馬龍效應而忽視這些因素，可能導致對學生表現的片面理解。

「社會期許」是指在評量個人的性格或態度行為歷程之中，個體常因「假裝完美」(fake good)的動機而作假，傾向選答能令人產生良好印象的內容以符合社會期待，並非本身真實的內在想法或性格態度。這種在作答過程中有意使他人對其產生良好印象，卻非依照本身實際的想法或作法答題的反應傾向，即為「社會期許」。例如過多申報自己的「良好行為」或過少申報自己的「壞行為」、不受歡迎的行為。

這種傾向嚴重影響研究的效度，尤其見於自填問卷，這種偏差會影響樣本的平均數值，亦影響研究受訪者之間的差異，尤其在擁有特定社會期待的議題上，例如受訪者個人的能力、性格、性行為、濫用藥物等議題，須特別留意社會期許誤差，為了防止受測者欺騙或作假的反應，人格測驗中常編寫一些相當不確定或中性的題目編入試題中，以誘導受測者產生社會期許心態高低分數，例如「我有時會心情不好」或「我曾說過別人的閒話」等，如果作答結果社會期許分數過高，表示受測者在問卷中過度掩飾自己的真實想法或感受，該人格測驗的結果不盡可靠，而必須重做或進行其他類型的人格測驗。

這種誤差對不同人口組別的影響可能不同。例如當受訪者申報性伴侶的數目時，男性傾向申報較多，女性申報較少。無論如何，兩個組別的性伴侶數目平均值，皆受社會期許誤差影響。

例如當受訪者需要回答：「你是否曾經濫用藥物或不當物質？」受訪者可能基於社會上的壓力或眼光而否認曾經吸食受管制物質（例如大麻），或是嘗試合理化其行為，設立一個較好的形象，如回答：「我只會在有朋友在場時，才吸食」。

常受社會期許誤差影響的議題包括：

個人收入：低收入者傾向高報而高收入者傾向少報
負面情緒：例如沒有自尊、無力感，經常遭否認
沒有依從指示／沒有按時使用藥物：高報配合度
智商及相關成就：往往遭高報
違法行為：常遭全盤否認
排泄功能：受訪者往往不願討論
宗教信仰：受訪者往往不願討論
愛國主義：基於恐懼、審判或旁人目光，而遭高報或否認
暴力：不論實際或想像，往往遭否認
慈善或仁愛：往往遭高報
性取向：非異性戀者往往較為自卑，近年來才稍稍改善

觀察者偏誤(Observer Bias)

觀察者偏誤是因為預期心理(Expectancy Effect)，或稱作期待效應所產生的偏誤。傳遞有利於實驗假設的訊息給受測者，有可能進而影響實驗的結果。

例如著名的聰明漢斯實驗。聰明漢斯是一匹標榜會做簡單的四則運算的馬，但事實上這匹馬不是真的懂算術，一位德國的心理學家Oskar Pfungst發現，唯有飼主知道答案，並且站在漢斯看的到的地方時，漢斯才能回答出正確答案，反之則會失敗。因此得知漢斯是靠訓練員和觀眾在無意識下給予表情或姿勢等等的暗示而選出正確答案。

美國心理學家雨果·明斯特伯格曾經進行一個關於和平的演講，並在演講之後收集各個記者的新聞稿，卻發現記者們寫了相異甚至相反的敘述。這件事證明觀測結果容易受到觀測者的立場，背景，環境，以及對於實驗的預期所影響。這被稱為觀察者偏誤。同樣地，一個裝了半杯水的杯子，根據對照物，觀察者可能會回答出半滿或半空兩種回答，這也是一個觀察者偏誤的例子。

要減少觀察者誤差，所需要的是進行實驗的標準化(Standardization)和操作性定義(Operational Definition)。

標準化(Standardization)：即統一資料收集的所有步驟，無論是測驗還是晤談都採用一貫的程序，讓所有參與實驗的人都經歷相同的實驗條件，以相同的方式發問，以事先建立的規則來評斷。
操作性定義(Operational Definition)：有些標準可能難以統一，例如快樂的程度、過動的定義。為了客觀性的測量，必須先建立一個可觀測的規則來加以界定，這就被稱為操作性定義。也就是說，必須根據某個可以觀察，測量，操作的特徵來定義我們想要觀察的概念，無論是自變項還是應變項，都必須經過操作性定義來使其具有客觀性。

面對這種偏誤，光是上述的實驗的單盲法是不足的，因此有時候會設計連參與實驗的實驗者都不知道實驗目的的實驗，這種被稱為雙盲法(Double-Blind study)。讓實驗者與被實驗者都不知道現在進行的是何種實驗條件，像是實驗者在詢問被驗者的時候，也不知道對方是實驗組還是控制組。或是更根本的，讓實驗觀察者不知道他們需要觀察的對象而客觀的記述所觀察的事物。除此之外，還有三盲法(Triple-Blind study)，即為雙盲再加上資料監測者等也不知情，其雖嚴謹但實行上較為困難。無論是何種方法，對實驗的隱瞞都有所要求，有意的欺瞞有時會觸犯心理實驗的道德規範，這一點在研究的道德爭議章節會做更多描述。

倖存者偏差(Survivorship bias)

倖存者偏差是一種邏輯上的謬誤，因忽略失敗的子群體，而誤將成功的子群體是為全體，造成之偏誤。

其概念起源於二戰時期，美國哥倫比亞大學統計學亞伯拉罕·沃德教授(Wald Ábrahám)接受美國海軍的聘請，運用他在統計方面的專業知識給出關於『飛機應該如何加強防護，才能降低被炮火擊落的機率』的建議，在沃德教授對成功返回的轟炸機進行了分析與統計後得出，機翼是整台飛機中最容易遭受攻擊的位置，然而，有別於直覺上『因為機翼最常受到攻擊，所以我們應該強化機翼的防護』這樣的推論，沃德教授卻給出了『我們應該強化發動機的防護』這樣的建議。其原因來自於雖然機翼遭受了最多攻擊，但卻不影響飛機的返航，反之，之所以較少看到返航的飛機的發動機受到攻擊，極可能是因為若發動機遭受攻擊則飛機將墜毀，根本無法返航所致，所以，該加強的並非機翼而是發動機。軍隊後來採納了教授的建議，後來也驗證教授的決策是完全正確的。因此，倖存者偏差指得是我們往往過度關注倖存者所擁有的特徵，卻忽略了其他更多失敗者的案例。因此，當我們取得的資訊僅來自於倖存者時，此資訊可能會存在與實際情況不同之偏差。這種偏差將會導致各種錯誤結論。

以下為倖存者偏誤在其他領域中的例子: 在金融領域，人們過於關注成功的公司和個人，在新聞媒體中失敗的公司和個人則獲得較少的關注。實際案例如，人們過多關注部份成功的科技企業家未完成大學學業，卻取得相當卓越的成就，造就人們認為大學教育對開始科技業並無幫助的印象。然而，在現實中，絕大多數中途輟學的人並沒有變得富有，而忽略這些可能低估大學學位在創造財富方面的實用性。

霍桑效應

霍桑效應是心理學上的一種實驗者效應，又被稱作被試效應、霍索恩效應，是指被觀察者知道自己成為被觀察對象後認知與態度改變行為傾向的反應所產生的實驗偏差。霍桑效應亦是一種研究的誤差，尤其在使用觀察法的時候容易出現，因為被觀察對象在霍桑效應的影響下做出了實驗者原先不想觀察的行為。

霍桑效應的發現來自一次失敗的管理研究。1924 年 11 月，美國國家研究委員會組織了以哈佛大學心理專家梅奧為首的研究小組進駐了西屋電氣公司(Westinghouse Electric Corporation)的霍桑工廠，研究的初衷是試圖通過改善工作條件與環境等外在因素，找到提高勞動生產率的方法。在這長達八年多（1924~1932）的實驗中有四個主要階段，前兩個階段是有關於「效率」的研究，第三個階段是「訪談」研究，第四個階段是「觀察」研究。

但實驗並不順利，實驗假設的各項條件並非唯一或決定性的影響因素。對此，喬治·埃爾頓·梅奧以及他的助手們所做的解釋是，受試者對於新的實驗處理會產生正向反應，是由於環境改變（試驗者的出現）而改變行為。工人工作效率之所以沒有隨着外部條件改變而改變，是因為工人都知道自己正在被實驗者觀察，因此工人的行為不只是出於環境的改變，還出於他們認知到自己正在進行一項實驗。意即，當女工被抽出來成為實驗對象時，就會意識到自己是特殊的群體，是這些專家一直關心的對象，這種受注意的感覺使得她們加倍努力工作，以證明自己是優秀的，是值得關注的。所以績效的提高，並非由實驗操控造成，這種效果就是我們所稱的「霍桑效應」。

霍桑效應的例子:

教育 : 在教學中，經常會看到霍桑效應的作用。例如，老師可能知道校長或班主任正在觀察他們，所以會在他們的課程計劃和表現上付出額外的努力。
面試 : 作為一個面試的候選人，我們總是想展示自己最好的一面，並掩蓋自己的短處。
心理學治療 : 在心理學治療時，心理學家會問一些個人問題，得到的答案和患者的行為可能會因被特別關注而發生變化，人們往往會隱藏自己的感受。然而，當患者被要求寫下他們真正想法時，結果可能會改變。

區群謬誤(Ecological Fallacy)

又稱生態謬誤、層次謬誤，一種在分析統計資料時常犯的錯誤。和以偏概全相反，區群謬誤是一種以全概偏，如果僅基於群體的統計數據就對其下屬的個體性質作出推論，就是犯了區群謬誤。這類謬誤假設群體中的所有個體都有群體的性質（因此刻板印象也可能犯上區群謬誤）。

通常是以較高層級的分析單位（例如：系所、選區）的資料，對較低層級的分析單位（例如：性別、年齡）作出了錯誤推論。

例一一實驗研究發現 A 國具有憂鬱症的人比 B 國多，且調查發現 A 國的大學生比率比 B 國高，因此直接推論這些憂鬱症的人因其具有大學生的身分，學習壓力較大，因此較可能有憂鬱症。然而，A 國的憂鬱症者很可能不是大學生，大學生也很可能沒有得憂鬱症，要進行剛剛的推論，必須要有更嚴謹的資料佐證，否則這樣的研究推論就是犯了區群謬誤。

例二假設甲城和乙城都各有相同人數的富人和窮人，富人都住在山上，而窮人都住在排放致癌物的工廠附近，故此在兩個城市的窮人癌症發病率都比富人高很多倍。在甲城的都是高增值高污染工業，故此在甲城無論是富人和窮人的平均工資都比乙城高，但同時甲城窮人的癌症發病率也因此比乙城高。一位教授希望找出癌症的風險因素，他在國家統計刊物找到甲城和乙城的癌症發病率和工資中位數，發現工資中位數較高的甲城有更高的癌症發病率，得出高收入是癌症風險因素的結論。然而事實上，貧窮才是癌症的風險因素，區群謬誤帶來相反的結論。

信度(Reliability)與效度(Validity)不足

做研究時，常會需要運用一些測量指標來測量某一個概念。例如在設計心理測驗量表時，實驗者欲透過量表來分析作答者的性格是屬於封閉的或開放的，那麼實驗者不能直接問填答者是屬於哪種性格，而是要透過一些指標(indicator)來測量開放性格這一個概念。在用指標測量概念時，要注意測量的信度與效度。在前段心理研究法種類的測驗法中，有信度、效度的詳細說明。

在心理學實驗中，可能會有很多沒被列入考量的干擾變項會影響實驗參與者的心理狀況，進而影響實驗結果與其信度和效度。例如：在樣本的蒐集中，對於問答的刻板反應、對實驗的預期都可能是造成誤差的原因之一，而有時誤差的原因不只出在受試者身上，還會出現在實驗者身上。因此，在設計實驗的時候，維持實驗步驟與資料收集的統一性，並減少外在因素對於實驗參與者的影響。探討實驗的誤差來源和減輕偏誤的影響也是心理學研究的一項重點。

化約論(Reductionism)

以單一原因（例如：單一分析單位、單一變項）來解釋複雜的現象。又稱還原論，是一種哲學思想，其基本觀念為：複雜的系統、事務、現象等等均可以通過把他們簡化成為各部分之組合的方法，加以描述和理解這已經被拆解成各部分之組合。舉例來說，化約論認為生物學是以化學為基礎，化學是以物理學為基礎。然而在社會科學當中，化約論產出的觀點有很多的爭議。舉例來說，心理學跟生物學、社會學跟心理學，政治學跟社會學，他們的相互關係到底為何，且是否可以將他們簡化成為各部分之組合等等。
關於化約論的分類，可以有下面三種方式:

「本體的化約論」與「理論的化約論」
- 本體的化約論主張這個宇宙的最根本構成事物是基本粒子,而且這些基本粒子的性質或規律,原則上窮盡了其他事物的性質或規律。
- 理論的化約論主張所有的巨觀科學理論,最終都可以被化約到微觀的粒子物理學,任何科學定律最終都可以由物理定律導衍出來。

「大化約論」與「小化約論」
- 大化約論認為自然界之所以是這個樣子,是因為存有簡單的普遍定律,而所有其他的科學定律都能在某種意義下化約到那些基本定律。
- 小化約論則是認為事物之所以有那些行為,是因為它們組成成分的性質使然。

「對大自然的化約觀」與「當作科學研究程式的化約論」
- 所謂對大自然的化約觀又稱做化約論式的世界觀, 是指所有科學領域都是源自於大自然的終極原理, 亦即F. Dyson所謂的「有限數目的基本方程式」
- 當作科學研究程式的化約論則是指將研究命題化約為一些個別的概念,並且逐一加以分析。

虛假關係(spurious relationship)

指在兩個沒有因果關係的事件之間，基於一些其他未見的因素(干擾因素 confounding factor，或潛在變數 lurking variable)，而推斷出因果關係。這會引致「兩個事件是有所聯繫」的假象，但這種聯繫並不能通過客觀的試驗得出，需要在近一步的假設試驗下才能得出正確因果關係。

相關跟因果關係是兩個不同的概念。因果關係是兩個事件之間的關係。而相關是根據實驗結果得出的關聯性。

兩個變數受第三者影響，從而在其間得出誤導的相關系數。即是說，變數 A 和 B 之間可找出相關。所以，有以下的可能性：

$A\rightarrow B$ , A 導致 B
$B\rightarrow A$ , B 導致 A
$A\leftarrow C\rightarrow B$ , C 導致 A 且 C 導致 B (C 為干擾因子 confounding)
$C\rightarrow A\rightarrow B$ , C 導致 A 後間接導致 B (C 為工具變量 instrumental variable, 簡稱 IV)
$A\rightarrow C\rightarrow B$ , A 導致 C 後間接導致 B （C 是中介變量）
$A\rightarrow C\leftarrow B$ , A 導致 C 且 B 導致 C （C 是對撞變量）

前兩種情況是實際的關係，A 跟 B 有因果關係(causal effect)也有相關(association)。

第三種情況是偽關係，A 跟 B 沒有因果關係，但有相關。如果能控制住C變數，X和Y就不再相關。

在第四、第五種情況，A 跟 B 有因果關係也有相關。但如果控制住 C，則 A 跟 B 的關係可能會消失。

在第六種情況，A 跟 B 無因果關係，但有相關。若控制住 C，則 A 跟 B 反而會產生了因果關係。

實驗的再現性

心理學最特殊的地方在於其建立在個體的心理活動上，因此並無法建立絕對的因果關係，即無法保證同一輸入及實驗方法一定會製造出同一個實驗結果。基於上述各項誤差以及個體心理活動的隨機性，使心理學實驗本身的「再現性」備受質疑。
以下是三個可能解釋原研究無法被再現的原：「其一是原研究所得的效應是假陽性結果，這個效應本就不真實，被觀測到純屬偶然。其二則可能是再現研究得到了假陰性結果，而沒有捕捉到真實的效應，又或者，原研究和再現研究的估測都是準確的，可兩者的研究方法在關鍵部分有了差別。」簡而言之，無法再現原研究發現並不意味着原研究是錯誤的。同理，即便結果被成功再現，也不能證明原研究的假設肯定是正確的。
例子：在 2015 年 8 月，開放科學合作組織(Open Science Collaboration，OSC)對 100 項心理學實驗進行再演，重新進行該 100 項心理學實驗，發現可以重新導致相同結果的實驗不足四成。雖然有其他心理學家就開放科學合作組織的實驗方法有所質疑，但該試驗已然足夠顯示心理學實驗的問題所在。

再現性可以用幾個方式衡量:

再測信度(Test-retest Reliability): 用同一測量工具在不同時間點對同一對象進行測量。例如，在某堂體育課與下堂體育課，所測得的體能表現會大致相同。
複本信度(Inter-method Reliability)：用不同相似工具來測驗同一個項目，例如用邁爾斯-布里格斯性格分類測驗(Myers-Briggs Type Indicator)。
內部一致性信度(Interna Consistency Reliability)：同一個測驗中不同子項目是否一致，例如量度「外向」，可以用「朋友數目」、「友善程度」、「經常笑」等來測。一般可用克隆巴赫系數(Cronbach's alpha)來檢驗。
評分者間信度(Inter-rater Reliability)：由於個人因素的影響（如情緒、既有觀念等），有些測驗不能以客觀的方法進行鑑定，例如作文考試。所評的分數通常受評分者的主觀感受而受到影響，因此要由 2 人或以上各自根據標準評分，再求大家分數是否大致相同。

研究的道德爭議

由於心理學的研究對象是有生命的個體，所以在研究倫理的議題方面尤須重視。無論是對於人類或動物的研究，都要尊重並保障其基本權利。美國心理學會(American Psychological Association， APA)為達上述目的，最先發表了「心理學專業人員的倫理信條和守則」(Ethical Principles of Psychologists and Code of Conduct， 2002)。我國也設有研究倫理委員會（或稱人類試驗委員會），對各研究進行研究倫理審查(Institutional Review Board， IRB)，通過審查才能進行研究，同時警戒研究者，對研究過程所獲得有關參與者的資訊必須保密。

以下附錄美國心理學會「心理學專業人員的倫理信條與守則」中對於基本規範的重要準則進行說明：

善行和不傷害(Beneficence and Nonmaleficence)

心理學家致力於使與其合作的人受益，並謹慎避免造成任何傷害。在他們的專業行為中，心理學家致力於保障與其專業互動的人和其他受影響的人的福祉和權利，以及研究動物的福祉。當心理學家的義務或關注之間發生衝突時，他們會嘗試以負責任的方式解決這些衝突，以避免或減少傷害。由於心理學家的科學和專業判斷和行動可能影響他人的生活，他們會警惕並防範個人、財務、社會、組織或政治因素可能導致其影響被誤用。心理學家努力意識到自身的身心健康可能對其幫助與其合作的人的能力產生的可能影響。

忠誠與責任(Fidelity and Responsibility)

心理學家建立起與其合作對象的信任關係。他們認知自己對社會以及所服務的特定社群的專業和科學責任。心理學家堅守專業行為標準，澄清自己的專業角色和義務，對自己的行為承擔適當的責任，並努力管理可能導致濫用或傷害的利益衝突。心理學家與其他專業人士和機構協商、轉介或合作，以滿足與其合作對象的最佳利益所需。他們關注同事在科學和專業行為上的道德合規性。心理學家努力投入自己的專業時間，為了少量或無報酬或個人利益而貢獻自己的一部分。

正直(Integrity)

心理學家致力於在心理學的科學、教學和實踐中促進準確性、誠實性和真實性。在這些活動中，心理學家不偷竊、欺騙或參與欺詐、詭計或故意歪曲事實。心理學家努力遵守他們的承諾，避免不明智或不清晰的承諾。在需要使用欺騙可能是在倫理上可接受的情況下，以最大化利益和最小化傷害時，心理學家有着嚴肅的責任去考慮對這些技術的使用所產生的任何對信任或其他有害影響的需求、可能的後果以及他們負責糾正的責任。

公正(Justice)

心理學家認知到公平和正義使所有人都有權利獲得心理學的貢獻並受益，並且在心理學家進行的過程、程序和服務中，所有人應享有平等的質量。心理學家行使合理的判斷並採取預防措施，以確保他們的潛在偏見、專業能力的界限以及專業知識的局限性不會導致或容忍不公正的做法。

尊重人權與人類尊嚴(Respect for People's Rights and Dignity)

心理學家尊重所有人的尊嚴和價值，尊重個人的私隱、保密權和自主權。心理學家意識到，為了保護那些因脆弱性而影響自主決策的人或社群的權利和福祉，可能需要特殊的保障措施。心理學家意識到並尊重文化、個人和角色差異，包括基於年齡、性別、性別認同、種族、族裔、文化、國籍、宗教、性取向、殘疾、語言和社會經濟地位等因素，並在與這些群體的成員合作時考慮這些因素。心理學家努力消除基於這些因素的偏見對其工作的影響，並且不會有意參與或容忍基於這些偏見的活動。

心理實驗的倫理標準

今日我們遵循的倫理標準其實是來自 1970 年代奠定的基礎，當時的研究員們列出了一張清單，細數着保護自願受試人們的私隱安全的規則。這張清單報告就是貝爾蒙特報告(Belmont report)，簡單概括其內容就是所有涉及人類的研究都要遵守 3 個主要的倫理原則。

對受試者的尊重：也就是強調受試者要在知情同意的情況下進行實驗，實驗研究人員不得對受試者有所隱瞞，他們有權利在簽署加入實驗的合約前就清楚地了解當中的風險或利益。
行善原則：基本上要表達的就是研究者應該盡量避免對受試者產生任何的負面影響，應該將受試者的福祉納入實驗設計的考量。核心的概念可以用三個字簡單概括，即 "Do No Harm"，不要造成任何的傷害，心靈上亦或是生理上的傷害皆涵蓋在範圍內。
正義原則：也就是研究人員有義務確保受試者不被剝削、迫害，或是在逼迫的情況下接受實驗的要求。此外，研究人員還被要求確認該實驗的負擔或是利益是均勻且公平地分配的。舉例而言，在早期的研究中，受試者通常是較貧窮的，基於經濟上的負擔而加入實驗承擔其風險；而受益的通常卻是較富有的那個階層，透過實驗分析到的結果得出結論，造福較富有的那一方，這樣不均勻、不公平的實驗風險分配是不被接受的。

以上列出的倫理標準適用於任何涉及人類的研究，包含心理學的研究。然而，即便指標和原則(Ethical principles)已訂立清楚，操行準則(Code of conduct)卻未有明確的定義，即能意會卻無法清楚地知道該如何將此核心概念付諸實踐。因此，在操行準則(Code of conduct) 確立前，一堆受質疑的研究已經進行並完成了。

實驗案例

以下幾個例子皆為歷史上知名的爭議性心理學實驗，讀者可以觀察未遵守倫理上的原則可能帶來的結果。

實驗一：小艾伯特實驗(Little Albert experiment)

由於實驗者並未去除受試者、嬰兒小艾伯特的條件反射，恐有造成其心理永久負面影響之嫌；且作為小艾伯特監護人的母親是否真的知情，或有無受到脅迫，至今仍無定論。

實驗二：米爾格倫的服從權威實驗(Obedience to Authority Study)

或對實驗參與者施加過多心理壓力，以科學權威裹脅其繼續進行實驗，儘管部分參與者已出現身心極度不適的反應。

實驗三：旁觀者效應(The By-stander Effect)

其中最出名的案例，《紐約時報》所報道的1964年3月13日紐約調酒師遭當街性侵並刺死，38名目擊者冷眼旁觀事件，實際上被過度誇大與扭曲。2007年《美國心理學家》指出，當時目擊者遠少於38人，有報警紀錄，且大部分人並無親眼目睹。

實驗四：史丹佛監獄實驗(The Stanford Prison Experiment)

造成部分參與者生理與精神上的損害，且其並未獲得先前承諾的自主權，不能隨時決定中止參與實驗離開。

實驗五：哈洛的恆河猴實驗(Harry F. Harlow)

違反動物倫理，造成受試動物身心重創。

實驗六：安慰劑效應(placebo effect)

受試者並未知情同意，除了可能傷害醫病關係，也有侵害病人自主權的疑慮。

動物實驗的研究

動物試驗（英語：animal testing）、動物實驗（英語：animal experimentation）或動物研究（英語：animal research），是指利用人類以外的動物進行科學實驗，以驗證個別因素對接受測試的動物在生理或行為上的影響，並與同種類之生物在自然環境下的狀態進行比對。用於動物實驗的動物稱為「實驗動物」（英語：laboratory animals）。其目的是為了生理學、病理學或心理學的研究。動物的實驗研究通常在綜合大學、醫學院、製藥公司、國防機構以及為各行各業提供動物測試服務的商業設施中進行。動物試驗的重點在於純粹研究的連續性，側重於發展有機體的基礎知識、應用研究，也可能側重於回答一些具有重大實際意義的問題，例如尋找治癒疾病的方法。這項研究應用的具體例子包括測試疾病的治療方法、選育、國防研究和毒理學（英語：Toxicology testing），甚至還包括化妝品測試。在教育領域，動物試驗有時也是生物學或者心理學課程的一部分。這些實踐操作在不同國家受到不同程度的監管。

微生物等級分類

依據體內寄生的微生物種類，實驗動物按從低到高的標準可分為：

普通級（conventional，可縮寫為CV）：不攜帶主要人畜共患病和動物烈性傳染病的病原。

清潔級動物（Clean animals，CL）：除不能攜帶主要人畜共患病和動物烈性傳染病的病原外，不能攜帶對動物危害大和對科研干擾大的病原。

無特定病原體級（specific pathogen free，可縮寫為「SPF」）：除一、二級動物應排除的病原外，不攜帶主要潛在感染或對研究干擾大的病原。使用SPF動物可以確保不會有特定的疾病對試驗結果造成干擾。SPF動物可以通過剖宮產並進行特別護理來獲得，這樣新生動物就不會得到感染，例如使用帶正壓差的無菌塑膠袋。由於（在皮膚、腸道或呼吸道）不存在可以進行保護的細菌群落，這樣做的缺點是任何病原的接觸都是致命的。

無菌級（germ free，可縮寫為GF）不攜帶可檢出的一切病原體。這些生物通常是通過各種方法培育的，以控制它們暴露於病毒、細菌或寄生蟲等微生物的機會。當已知的微生物群體被引入到一個無菌生物體內時，通常被稱為一個悉生生物體(gnotobiotic organism)，但從技術上來說，無菌生物也是悉生生物，因為其微生物群體的狀態是已知的。由於缺乏微生物群體，許多無菌生物會表現出健康缺陷，例如免疫系統缺陷和能量獲取困難。通常，無菌生物用於微生物群落的研究，需要對外部污染物進行仔細控制。限菌動物（Gnotobiotes animals，GA）則是在無菌動物物體內移入一種或幾種已知微生物後的動物，亦為悉生生物。

普通級的實驗動物的飼養環境無任何防護措施。無特定病原體級的實驗動物是受國際認可的標準動物模型。這類實驗動物飼養在達到一定條件的動物房中，飼養環境能阻止特定病原體在這類實驗動物中寄生，以減少對實驗結果的影響。而無菌級的實驗小鼠需要生活在無菌環境中，體內不含有任何微生物。

以上文字多轉述自維基百科Specific-pathogen-free -- https://en.wikipedia.org/wiki/Specific-pathogen-free#:~:text=t%20e%20Specific-pathogen-free%20%28SPF%29%20is%20a%20term%20used,specified%20diseases%20do%20not%20interfere%20with%20an%20experiment 與Germ-free animal -- https://en.wikipedia.org/wiki/Germ-free_animal

為何要進行動物實驗？原因如下：

動物比較容易在受控制的環境中成長，心理學家因此能辨別各種因素對於動物的行為跟功能的影響。
動物的系統可作為人類的模型，且其基本歷程（例如：感覺、學習、記憶）較人類單純且易於研究，有助於我們進一步瞭解人類的功能。
動物的繁衍速度較快，使心理學家得以探討好幾個世代間才有辦法觀察到的發展歷程。
許多心理學家研究動物行為並非為了人類的利益，僅是為了探討各物種的行為特徵、習性。

動物實驗缺點：

結果緩慢且昂貴，缺乏效率：用動物做實驗是用電腦模擬的成本的 300-500 倍。
應用於人類的問題，即使動物系統基本歷程類似，但是否可以類比到人類上仍屬問題。

動物實驗的利益包括藥物的測試及發現，事實上，動物實驗對於了解及治療精神疾病、藥物成癮方面有重大功用，例如焦慮(anxiety)、憂鬱症、阿茲海默症等等。另外，動物研究也對動物本身有利，相關研究已經可以幫助動物園裏的動物緩解其被監禁的壓力；對於動物社會組織及行為的研究也可以幫助人類改良動物設施的設計，進一步確保動物的健康。

儘管如此，動物實驗的正當性依舊受到部分人士的質疑。他們認為，對人類有益並不能成為人類進行動物實驗的充分理由。同時，近年來心理學及醫學越來越重視實驗動物的關照。美國心理學學會(American Psychological Association, APA)倫理準則更要求，若要施加痛苦或有害程序在動物上，必須充分說明實驗所能得到的知識，且提供動物人道的對待，盡可能減輕其痛苦，另外也有一套嚴格的準則(Novak & Suomi, 1988)規範實驗動物的飼養環境。

1900 年起開始有許多動物實驗開始進行，因而引發道德上的爭議。科學家拉塞爾(W. M. S. Russell)和伯奇(R. L. Burch)在 1959 年提出針對實驗動物的 3R 原則：

替代(Replacement)：以非活體或是演化程度較低的動物進行實驗。
減量(Reduction)：使用較少動物或用最低實驗使用數量取得所需數據。
精緻化(Refinement)：改進、完善實驗程序，使實驗中動物所受的疼痛與壓迫得到減輕。

而英國農場動物福利委員會於 1967 年，訂定動物福利五大自由原則，分別為：

免於飢渴的自由(Freedom from Hunger and Thirst)：必須提供動物乾淨的飲水及飼料以維持健康及活力。
免於生理不適的自由(Freedom from Discomfort)：必須提供適當的飼育環境及舒適的休息場所。
免於痛苦、傷害及疾病的自由(Freedom from Pain, Injury or Disease)：必須提供疾病預防及快速診療的機制。
表現正常行為模式的自由(Freedom to Express Normal Behavior Patterns)：必須提供足夠的飼育空間、適當的硬件設施及適當的同伴。
免於恐懼和壓力的自由(Freedom from Fear and Distress)：必須確認所有作業流程不會造成動物遭受心理苦楚。

雖然現今已有許多法規保障動物實驗中的倫理原則，但仍無法確保這些規則能百分之百被貫徹。2018 年，紐約時報曾報道福斯車廠以實驗猴進行廢氣對健康影響的實驗。2019 年，英國廢除活體解剖聯盟 (Cruelty Free International，CFI)爆料位於德國一間藥物與毒物實驗室的不人道動物實驗，實驗動物們生活毫無福利可言，環境髒污無人清理。
實驗猴以粗魯的方式從籠內移出，被固定在實驗器材上強迫站立。操作過程中動物皆處於清醒狀況，甚至發出痛苦的尖叫。另外，動物實驗是否真的能精確模擬人類的生理反應以預測疾病，一直是爭議點所在。目前國際間一直在發展新的技術，期望能夠減少甚至取代使用動物實驗，包括細胞培養(Cell Culture)、電腦模擬技術(Virtual Physiological Human)、晶片器官(Organ-on-a-Chip)、迷你腦(Mini Brain)等。

小獼猴實驗

以下用心理學家哈里·哈洛(Harry F. Harlow)對小獼猴進行的一系列實驗，來深入解釋何為「違反動物實驗倫理」：

1. 鐵娘子：

在更前面的實驗中，實驗結果發現獼猴對於使用絨布、鐵架、加熱器等製作的「絨布媽媽」產生依賴，並且會獲得安全感。哈里·哈洛在這個「絨布媽媽」產生追加會定期噴射高壓空氣、產生尖刺等等會傷害獼猴小孩的裝置，稱作「鐵娘子」。研究發現即使小獼猴被「鐵娘子」傷害，依然不會放棄對「鐵娘子」—他認為是自己母親的對象的依戀。

2. 社會孤立：

將剛出生的小獼猴放入籠子與外界隔絕，或只能看見外界但無法與其他的獼猴互動，並持續 3~12 個月不等，隨後使其返回與外界互動。研究顯示這樣的社會孤立會使獼猴失去社交能力，對外界的獼猴等一切環境感到恐懼、不安，甚至有類似自閉症的症狀。並且如果與世隔絕的時間越長（例如超過 6 個月），則非常難使獼猴獲得社交能力或治療其自閉、恐懼的症狀。

這個實驗後來還進行了更為慘忍的實驗，使公猴強暴那些失去社交能力的母猴，而這些母猴沒有能力帶給孩子關愛，甚至會對獼猴小孩施暴。這個實驗或許可以使我們思考，一個生命個體如果失去與外界互動或者沒有得到足夠關愛，可能會帶來的影響。

雖然哈里·哈洛的這些實驗帶給人類有關對孩童施暴的父母、社會孤立帶給孩子的影響，但這些實驗顯然已經嚴重傷害的獼猴們的心理健康。

實驗小白鼠

現今大多數實驗都會使用小白鼠作為實驗用動物，使用小白鼠做實驗的優點如下：

飼養成本低：其實不只是小白鼠，包括小白鼠在內，有許多動物都已被當作實驗用動物了，例如猴子、猩猩、狗、甚至是豬。而其中小白鼠的飼養成本最低。
個體差異較小，較容易調控實驗變因：經過百年探索，純系小白鼠的培養方法已經成為固定流程，培養出的小白鼠幾乎沒有個體差異。在實驗中往往需要通過重複多次來驗證其科學性，如果參與實驗的動物個體差異很大的話，對實驗結果影響也很大。因此，這個特性對科學實驗的進行意義重大。再者，小白鼠的體型方便實驗人員進行控制，所需空間也不多，在配合實驗這方面也會順利許多。
繁殖能力強，生長週期短：一般情況下小白鼠六到七週便可以性成熟了，而且還具有產後發情，每次分娩的當天再次合籠交配的話，懷孕率幾乎是百分之百。換言之，小白鼠幾乎可以連續不斷地懷孕生子，一次性排卵更是多達 20 個左右。所以這種全年多發情性，繁殖率又高的動物確實是一種實驗的好材料，足夠滿足實驗室的科研需求。
遺傳上與人類相似：小白鼠是哺乳動物且基因組和人類相似度極高（約 90%）。由於遺傳學實驗效果很好，同時許多人類目前難以治癒的疾病都可以在小白鼠身上找到相似的性狀。通過小白鼠實驗能夠發現病因，研究發病規律和探究治療方法。

實驗狗

前蘇聯學者巴夫洛夫把狗圈禁在固定的籠子裏，先是直接投餵食物，觀察它們分泌唾液的情況;之後在餵食的同時額外增加鈴聲刺激，反覆多次後，狗在只聽到鈴聲的情況下也會像看到食物一樣分泌唾液。但他也發現，如果持續只響鈴不給食物，狗分泌唾液的情況會逐漸消失——也就是說，條件反射也會消退。爭議事件：在20世紀初的布朗狗事件（英語：Brown Dog affair）中，親動物和反動物試驗團體之間的這些分歧首先引起了公眾的注意，當時有數百名醫學生和反活體解剖學家圍繞着一尊為紀念被活體解剖的狗而立的紀念像與警察發生衝突。

實驗貓

美國心理學家愛德華·桑代克提出的學習相關定律。其中最有名的為餓貓迷籠, 他把飢餓的貓禁閉於設了機關的籠子內——餓貓可以通過抓繩或按鈕等三種不同的方式逃出籠外獲得食物。一開始，貓被關進迷籠之後只是盲目地亂撞亂叫、東抓西咬，但會在偶爾做對打開迷籠門的動作後「逃出生天」。桑代克重複這個過程，記錄餓貓逃出迷籠所需的時間，最終得出貓的學習曲線。桑代克發現，貓在進行「嘗試-錯誤」的學習，經過多次的嘗試-錯誤，餓貓學會了打開籠門的動作。

另外，美國行為治療心理學家沃爾普（Joseph Wolfe)曾進行電擊貓實驗。在第一階段，先把貓關在實驗室的籠子之中，餵食時給予電擊，導致貓出現極度焦慮等精神衰弱的反應，就算刺激不再出現或停止，貓的情緒焦慮恐懼仍然存在，此時即使貓處於飢餓的狀態，也不願進食。第二階段主要是消除貓因為電擊造成的焦慮和恐懼，因為貓餓了始終都要進食，於是沃爾普先把貓處置於與實驗室完全不同的房間餵貓，因為外在環境空間的改變，貓的焦慮恐懼情緒有所降低，經過一會兒，開始恢愎進食。再接下來，把餵食的地方移到與實驗室環境相近的地方，貓又開始恐懼焦慮，然而貓因為前一次的經驗，使牠可以克服這一次的恐懼焦慮。

沃爾普把這一種方法做「互動抑制」（reciprocal inhibition)，「減敏感法」（desensitisation)，或者是「系統脫敏法」(systematic desensitization)並運用此技巧治療許多精神官能症。

女性主義對心理學研究方法的影響

女性主義心理學批判以男性為標準的心理研究。後現代女性主義心理學認為，在心理學的研究中，傳統的實驗方法透過實驗條件的安排可以得到實驗者希望得到的結論。

傳統的心理學研究將受試者視為脫離社會和文化背景的抽象的存在，然而事實上實驗者無法脫離社會背景，其行為方式必然受到社會背景的影響。女性與男性在這樣的實驗情境中所產生的行為差異，被解釋為內在的心理特性所造成；研究的結果又被用來解釋女性在某些方面天生不如男性，為維持婦女在社會上的從屬地位提供了科學的根據，這是男性中心主義偏見的例證。因此，傳統實驗方法有其缺陷，應該用其他方法來加以彌補。女性心理學推崇用多元方法來增加研究結論的有效性，以便使心理研究結論更貼近女性生活的現實。

德國精神分析師卡倫·霍尼（Karen Horney，1885~1952）被視為女性心理學的先驅，她不同意弗洛伊德有關男性和女性心理固有差異的觀點（例如：陰莖嫉妒理論），並將這些差異歸因於社會和文化而不是生物學。霍尼因此提出了與弗洛伊德相反的「子宮嫉妒」（womb envy)，認為這類情緒可能助長了對女性的社會地位的壓制，並推動男性在其他生活領域（如商業、法律和政治）取得成功。但她同時認為，子宮嫉妒不是男性天生的心理特徵，而是當男性認為他們並沒有像他們想像中那樣掌控和強大自己的生活時產生的。^[3]當然，這樣的說法可能存在爭議，卻着實在過去以男性心理學家為主的心理學研究上做出了空前的突破。

本土研究

本土心理學崛起：貼近自己的心理學

此篇章中的「本土」意指華人社會。本土心理學研究者楊國樞先生（2005）曾以一段話精闢解釋本土心理學的定位：「本土心理學是一種以科學方法研究某一特定族群團體或社會文化之中人民的心理與行為所發展來的心理學知識體系，但研究歷程中所採用的理論、概念、方法及工具必須與所探討的本土心理或行為現象及其生態的、經濟的、社會的、文化的、及歷史的脈絡高度契合、符合。
自從科學革命、工業革命後，西方國家在國際上佔領優勢地位，而在心理學研究也是如此，率先發展了心理學的科學體系。1970 年代的臺灣學者開始發覺，由於過去的政治與歷史因素，臺灣在各個方面——研究亦然——皆嚴重地受西方影響，其中心理學研究受美國影響尤深。這使得當代心理學研究過度依賴西方理論，缺乏自身獨特性，且忽略了不同社會文化下人類行為的差異。即便研究對象是華人，但研究使用的方法、觀念、理論皆沿襲西方，研究成果可能因此偏頗而無法成為有效的資料，或是無法成功解釋華人文化現象，如同「失去靈魂」。在懷疑西方的心理學研究對當地的適切性之後，港、中、臺學者開啟了尋找「靈魂」的旅程，三地各自有不同的發展，又交互影響激盪，以脫離歐美或非本土的框架、並建立與本土契合的系統。

本土心理學研究條件：本土化契合

身處於相同環境的人們，往往有相近的生活體驗與視野；但散落於世界各地的成員，便不見得擁有相似的經驗。當我們的研究方法是直接套用國外的東西而來，這些西化知識是不是能夠契合我們的社會文化因素，就成為一個爭議點。舉個簡單的例子，2015 年的電影「我的少女時代」勾起台灣民眾的青春集體記憶，橫掃票房、掀起風潮；然而小虎隊、溜冰場等元素在當今其他國家的電影裏，便可能無法引起共鳴。再舉個例子，本章節寫本土研究，即便翻譯成其他語言，一到非華人地區，讀者極有可能興致缺缺、直接跳過。而「本土化契合」正是讓當地人來研究當地人。經由這樣的機制能保證研究者之問題、方法理論，高度契合被研究者。

本土化研究之原則

為了有效進行本土心理學研究，心理學者提了消極性的「七不」與積極性的「十要」準則。前者為消極避免妨礙心理學本土化發展，後者則為有利且積極捍衛心理學的本土化。

秉持這些原則的原因：

心理學畢竟是以人作為研究對像，在研究之前就應該理解個體之間或者文化之間的差異性。更何況是本土心理學研究以地域為主軸的研究，更應該以謹慎的態度選擇理論、方法、變因，避免先入為主。

「七不」

一、不套用他國理論與方法

在進行本土的心理研究時，不要套用他國學者的理論及方法，尤其是針對他國人民行為的研究。

二、不忽略他國理論與方法

本土化並不是全然地排外，學習者依然可以引用外國建立的概念、參考外國文獻，再與本土研究互相對照援引，進而整合成適用於本土之理論。

三、不排斥他人所用之方法

做本土研究的心態應是對於所有方法都持包容態度，只要能有效地探討華人心理，任何研究方法都應予以尊重、悉心探討，避免錯失適用理論。

四、不採用跨文化研究策略

進行研究時，不要與他國文化做比較，否則可能再次陷進西方觀點。

五、不採抽象性過高的項目

不要研究太抽象的題目、或者範圍太大的議題。

六、不要採用外語進行思考

語文對於思考的面向、內涵有很大的影響，研究時應以本土之思維理解、詮釋，以期保有清楚的邏輯。

七、不將學術研究泛政治化

雖政治與生活息息相關、密不可分，但研究者應切記自己立場的中立性，不因個人的主觀意識、利益的影響，而使得研究的方向、理論，偏離了軌道。

「十要」

一、要忍受懸疑未決的狀態

需要研究者耐心地思考當地社會文化因素與研究題目之關聯性。一旦心急，可能會使用西方的現成觀念，不僅失去了研究的本土性，更阻礙了自己本土化的學術思考。

二、要充分反映華人思想

在研究時，須將自己本土性思想、認知充分反映在問題界定、概念分析、方法設計、工具製作、結果解釋之中，以有利開創屬於本土的研究方法。

三、要批判地運用西方理論

在研究的過程中，若真的有採用西方概念的必要，則要以謹慎的態度，仔細地分析所探討之心理與行為，其根本的內涵以及特徵。

四、要強調社會文化的脈絡

考慮到行為發生的背景，才能合理地解釋其因果關係。

五、要研究特有的心理與行為

在選擇研究課題方面，儘量從華人特有的心理與行為來切入（如孝道、關係、緣分、面子、人情等），能避免習慣性套用西方概念，方能再更進一步創造新的本土理論。

而在解釋特有現象的同時，最好能採用其現象在當地的民俗性詞語，如此一來，才可保留概念之本土性及意義。

六、要詳盡描述研究之對象

進行研究的同時，我們需要詳細的資料，也要力求在正當的方法及程序下，紀錄、研究現象的本質。

七、要同樣重視內容與機制

前面有提到應該要詳盡研究之對象，指的是行為的內容；而我們也必須重視行為的原因，即背後社會結構的影響。內容與機制缺一不可，否則建構的理論會較為薄弱。

八、要與華人學術傳統銜接

在學術上，有關華人的心理學術研究，要儘量與華人以往的傳統銜接，而非勉強地和外國的心理學、思想哲學作連結。

九、要兼顧傳統面與現代面

隨着時間推移，傳統與現代的時局不同。以現在的華人作為研究對象，應注意其變遷的過程，兼顧傳統與現代的面向，並探討變遷的因素，確切了解事件的演變。

十、要兼研今人與古人的心理

建立本土理論時，除了要研究現代華人，還要研究古代人的心理，建立更宏觀的本土心理學。

本土研究之目的

有鑑於華人社會的形塑過程與西方歐美國家大相逕庭，華人心理學界希望藉由設計適合東方社會的心理學研究方式，讓研究更貼近真實情況。考慮華人社會的文化、社會體系和心理間的交互作用，掌握華人行動背後的意義，進而找到適合研究華人心理概念的設計，發展一套適用的模型或理論，建立東方的心理學研究體系。因此研究者需要將文化、歷史脈絡放入研究的思考框架中，才能釐清影響個人行為的因素。在研究方法上，應採取「多元典範的觀點」，視問題性質的不同，採用不同的研究典範，盡力於對問題能夠獲得「由不同世界觀源與生俱來的全面性瞭解」，方能彰顯學術主體性及獨立性。

本土心理學與心理學的本土化的問題

心理學的發展經歷了「整合—分裂—再整合」三階段。現今，國內心理學正處於第三階段——再整合。

而國外之研究亦有其不同階段，以及各學派的分立。在了解本土之前，我們亦必須觀察並了解西方心理學的分歧。科學心理學創始人馮特(Wundt)提倡統一的心理學。自馮特以後，心理學逐漸往不同方向發展，大體而言分為實證主義立場的心理學和人本主義立場的心理學此二派。簡單來說，就是以科學或人性為中心的差別。兩種學派各自為陣，互不相讓，然雙方皆是為了把自己的理論成就推向巔峰。不可否認，兩種學派的積極研究為西方心理學的進程做出了巨大貢獻，但另一方面，因兩種學派的堅持己見，雙方始終無法進一步溝通、融合，導致心理學的學科性質越來越不統一，造成「小心理學觀」。而當今學者若想建立起屬於東方、華人自己的心理學，首先必須使研究方法本土化。因研究方法是一套理論體系的標誌，是判斷一套體系是否成熟的關鍵，但若過分着重研究方法的本土化，必然使本土心理學研究形同虛設，無法真正與現實生活契合。此外，研究時也應當銘記西方心理學走向分化的教訓，更多以開放的心胸與其他研究者交流，並時時自省。如此一來我們必能創造更完整、更兼容也更精準之本土心理學知識。

本土心理學之困境

西方心理學的強加使用

將適用於西方人的心理學概念與測量工具加以翻譯，強用於非西方人民，就以爲測到相同的心理結果，是任何研究者都不應犯之研究大忌。因此，本土心理學正是強調不要直接套用美歐心理學的理論、概念、方法及工具。

本土心理學者後繼無人

即便心理學本土化運動如火如荼地進行，黃光國先生不諱言本土心理學的發展遭受許多困難。各國研究本土心理學的學者寥寥無幾，因此當成果遭受許多主流心理學研究者的批判時，也無他人發聲、或繼續鑽研。後繼無人，便無人能繼續開拓研究的深度廣度。菲律賓就是一個佐證，在學術圈最早倡導本土心理學的學者為菲律賓的 Enriquez，當初曾是一位受人景仰的大師，可惜在最燦爛的年華就殞落了，連帶使得當地心理學發展面臨停滯不前的窘境。

不完整的心理輔導諮商系統

楊國樞認為亞洲與華人地區的心理輔導與諮商專業長期引用來自西方的理論與技術。無論在學術研究、課程教學或實務工作上，都以西方的理論學派與研究結果為思考與工作的依據，忽略了東方文化因素，沒有建立起一個符合亞洲與華人地區文化的心理輔導與諮商專業的學術傳統與實務環境。

本土心理學的未來展望

本土心理學將兵分兩路

黃光國先生認為，依目前形勢，在可預見的未來裏，會發展成一派以西方科學實證為宗，重視自然科學研究的成果，異於西方理論的架構，較易為學術主流所接受；另一派以素樸哲學觀為基礎，雖可能較無法與國際心理學家互相交流，然仍有其大放異彩之處。黃光國也建議亞洲與華人地區的本土諮商心理學研究的策略，可以利用東方哲學中的傳統智慧為題材，並以西方科學研究的知識論為基礎，建構一套既能代表普世人類的心智，又能表現特定文化人群的特殊心態之本土心理學理論，最終進行能驗證本土心理學理論的實徵研究。

李瑞玲提出三點未來之展望

應該進行關於中國心理學歷史發展之研究
提出可連結於其他學門，本土心理學的研究層次與方法
建立一套本土心理學研究的方法論

對於最後一點，李瑞玲更強調：「即使在中國土壤孕育出來的方法論，並不應只適用於本土的社會與學術生態。因為學術本土化的目的，並非只是為邊陲社會的學術自主性做民族文化式的訴求，而是經過徹底自我反省後的自我解放」。亦即本土化(Indigenous)研究並非等同於在地化(Localized)研究，而是要建構既能代表普世人類心智，又能表現特定文化族群的特殊心態。此種心理學理論，才是本土心理學研究所要努力方向。

結合西方和本土的策略

鄭伯壎在《華人組織行為研究的方向與策略：由西化到本土化》的論文中提到，華人的本土化研究，可結合西方和本土的策略，進而取長補短：其一為本土化研究策略，另一是跨文化策略，最後為整合性策略。採用本土化策略時，剛開始是以民族誌做參與和觀察，而後以個案研究等質化研究方式，來長期觀察某文化下的組織行為。應先為厚實的描述，再由此歸納出重要的研究構想與命題，進而形成理論，而後進入科學研究歷程的循環。

代表人物、組織、其他發展

代表人物

楊國樞教授
楊教授1959 年畢業於國立臺灣大學心理學系，爾後赴美進修並取得美國伊利諾大學文學碩士學位與哲學博士學位，是台灣第一位心理學博士。楊教授畢生致力於發展人格與社會心理學研究，尤其在本土心理學研究上，楊教授看出華人心理學研究的盲點——全盤套用西方心理學的理論與方法，於是他積極倡導與推動貼進華人社會文化特徵的本土心理學。辛苦耕耘四十多年後，其豐富、多面向的研究成果為臺灣本土心理學的研究奠定紮實、穩固的基礎，相關的理論建構與研究方法亦逐漸發展成熟。楊教授在理論建構方面，建立了「華人社會取向與個人取向理論」與「人類基本需求的雙 Y 理論」等兩項人格與社會心理學理論。在研究方法與工具方面，則編製了家族主義量表、成就動機量表、自尊量表、自我概念量表...等等本土化測量工具。至今，楊教授仍堅守學者崗位，致力於華人本土心理學的發展，包括參與相關研討會與發表著作，更主導多項大型研究計劃，盼能竭盡己力貢獻學界。楊教授跟中研院民族學所的所長文崇一先生合編了一本書「社會及行為科學研究的中國化」，主要思考兩個議題：心理學理論建構的本土化；知識跟理論建構的自主性。

黃光國教授
黃教授從 1980 年代之初，開始參與心理學本土化運動，是「華人本土心理學研究追求卓越計劃」的主持人。他著有《儒家關係主義：哲學反思、理論建構與實徵研究》（黃光國，2009）；《Foundations of Chinese Psychology: Confucian Social Relations》(Hwang, 2012)。在 Foundations of Chinese Psychology 一書中，黃教授所主張的「文化系統」(Culture System)研究取向，將儒家文化視為整體系統，可以避開「泛文化向度」(Pan Cultural Dimensions)研究取向上的缺失。「泛文化向度」研究取向雖然能累積許多瑣碎的實徵研究成果，卻傾向於使非西方文化面貌模糊，喪失其文化的可辨認性(Cultural Identity)。而「文化系統」研究取向則可使華人瞭解其文化傳統，並獲致清晰的文化認同感。此種研究取向以「多重哲學典範」作為基礎，其核心為「本體論的實在論」，有堅實的哲學基礎，可以推廣到其他非西方國家，協助他們建立自主的社會科學。

鄭發育教授
鄭教授畢業於日本京都大學哲學系，拜京都學派西田幾多郎門下，專攻京都學派及德國哲學，戰後專研實驗心理學，是台灣實驗心理學的奠基者，同時也是台灣大學心理系的創立元老。一生不斷培育心理學優秀人才，如吳英璋、余德慧等人。鄭發育早年接觸德國思想例如德國觀念論、完型心理學(Hullian psychology)等，使得從事知覺心理學研究時，大抵以知覺的統覺理論為基礎。曾赴美國耶魯大學心理學實驗室短研一年，接觸到霍爾學派(Hullian psychology)的行為學派，並且設計一系列實驗，為排灣、賽夏、阿美族的色彩好惡、智力、及人格測驗提供比較，也曾將心理設計測驗導入工商適性研究上。

蘇薌雨教授
蘇薌雨（1902 年 9 月 11 日－1986 年 6 月 25 日），名維霖，以字行。北京大學哲學系畢業、東京帝國大學大學院肄業。曾在校師承李大釗、蔡元培、李石曾、陳大齊等，戰後隨國府返臺，任行政長官公署參議，並受聘為國立臺灣大學哲學系正教授，主持哲學繫心理學研究室，後任臺灣大學心理學系創系主任兼圖書館館長，為臺灣心理學及哲學學者。譽為心理學拓荒者的蘇薌雨，赴京就讀哲學時受五四運動影響，積極鼓吹白話文，主張中國白話文做為臺人書寫系統，並受胡適、陶行知、金岳霖等實用主義者影響，專研發展及教育心理學[5][6]，著有《心理學原理》、《心理學新論》、《心理學新論增訂本》等。治學嚴謹、待人謙和，與楊國樞等後進有亦師傅亦友的關係，「但欲培植佳子弟，富貴於我如浮雲」為其一生最佳寫照。

余德慧教授
余德慧（1951年1月10日—2012年9月7日，被譽為華人心理學大師。畢業於國立臺灣大學臨床心理學博士，1987年赴美國加州柏克萊大學進行博士後研究。1989年，返國任教於國立臺灣大學心理學研究所，他與恩師楊國樞教授在臺大心理學系開設了全臺灣第一門「生死學」課程，深受學生喜愛。曾擔任台灣第一本人文心理雜誌《張老師月刊》總編輯，開創了新穎的本土心理學研究領域，多次獲得行政院新聞局頒發的雜誌類金鼎獎。其作品包括《生命夢屋》、《情話色語》、《觀山觀雲觀生死》、《生命宛若幽靜長河》、《生命史學》和《生死無盡》等。

組織

華人本土心理學基金會：1997 年由一群從事華人心理與行為研究的工作者所發起成立。其性質為一非營利的學術公益團體。此會主旨在於促進華人心理學家以本土研究定向，進而發展能夠貼切描述及瞭解華人心理、行為及生活的學科，並憑以貢獻本地社會。此會提倡的「本土研究定向」是有鑑於有關華人心理之研究深受西方心理學的概念及方法之束縛，其成果常與當地社會的實際情況及需要脫節，因而易淪為點綴的學科，不能憑之造福自己的社會。採取本土研究定向，需要研究者攝取本土哲學、宗教、歷史等人文科學及社會學、心理學、人類學等社會科學的養份，以全面了解華人的心理、行為及生活。此基金會因此認為加強各人文暨社會科學的合作及交流，是推動本土研究必須走的道路。現今幾個華人社會具有其共同的文化傳統，但也各自生活在當地特殊的政治、經濟、社會體系之中。在這些地區進行合作或跨地區的比較研究，可以多方面了解傳統文化在現代社會所扮演的角色，使華人本土研究的內容更豐富、更完整。同時，各華人社會也可彼此借鏡，以提昇其研究水平。

華人本土心理學推動委員會：持續推廣有關華人本土心理學的相關理念知識和理論。

其他發展

《本土心理學研究》期刊：華人本土心理研究基金會出版，1993 年創刊，半年一刊。為純學術性的中文期刊，主要發表採取本土化研究觀點與策略所完成的論文。目前仍持續出刊。

「華人本土心理學研究追求卓越計劃」：總計劃主持人黃光國教授，向教育部申請參加「追求卓越」的計劃，提出「華人關係主義」做為理論架構，並建立了一套自我規約的機制，希望能促進華人本土心理學研究水準的大幅提昇。

本土心理學學案

本土心理學學案研究一: 楊中芳教授與她的中庸心理學研究

楊中芳，台灣大學心理學學士，芝加哥大學心理學博士。先後任教於美國、台灣中正大學和陽明大學、以及香港大學。退休後在中國廣州中山大學和中國社會科學院推動西方心理學教學及本土化心理學研究。楊中芳的代表性著作有《如何研究中國人》、《如何理解中國人》以及《中國人的人際關係、情感及信任》等。

作為華人本土心理研究基金（香港）的主持人，楊中芳晚年最重要的本土心理學研究，乃探索中國傳統文化的核心部分，即所謂中庸的思想對中國人心理與行為的影響。

楊中芳和趙誌裕於1997年提出採用心理學構念化的方式，將傳統思想的中庸構想為類似於元認知的一套「實踐型」思維方式，稱之為中庸實踐思維。此後，楊中芳對這個「中庸實踐思維」不斷細化、更新，擴展為一套包含集體文化思維、個體心理思維（生活哲學、具體事件處理、事後反思/修正）和心理健康等三大層面的中庸實踐思維體系，並孕育影響了3種中庸思維量表的開發。

楊中芳強調中庸心理學的研究初心並不在復古，而是在於探研一個仍然在當今華人生活中發揮重要作用的思維方式、價值觀以及行動策略。故中庸心理學研究雖然採用西方實證研究方式及量表開發，但偏重的卻是本土化心理學的研究思路, 即楊國樞所說的，是用華人自身的思維方式及價值體系，來理解華人生活現象的心理意義。

生活應用

心理學研究法最常被使用的研究法分成五種。分別是個案研究法、實驗法、觀察法、相關法、調查法，以下一一介紹並舉出生活實際應用案例。

個案研究法

研究案例──研究法的謬誤-藥越貴越有效？

在醫學和心理學的許多療法中，安慰劑效應（Placebo Effect）是一個著名且常見的現象。安慰劑效應指的是病人在服用沒有藥理作用的物質後，僅僅因為相信它能治病而出現療效的現象。反安慰劑效應（nocebo effect）則是指人們預期會有負面結果，因而促成相應的症狀或負面效應，甚至導致原有症狀惡化。例如，有些人對於價格較低或體積較小的藥物，較不相信其效用；或者認為價格較高的藥物會有更大的副作用。

美國辛辛那提大學（University of Cincinnati）的神經學家Alberto Espay針對安慰劑效應進行了一項實驗。他挑選了12位罹患巴金森氏症（Parkinson’s disease, PD）的病人，先讓他們停用原本的藥物「左旋多巴」（Levodopa），並告知他們有兩種新藥可以幫助製造多巴胺。實際上，這兩種「藥物」都只是生理食鹽水。研究結果顯示，在運動技能測試中，接受較高費用藥物治療的病人，其測試結果比接受低費用藥物治療的病人較佳，顯示病人主觀上相信服用較貴的藥物會得到較好的結果。然而，不論哪種安慰劑，其效果仍不及服用常規藥物左旋多巴。

安慰劑效應在心理治療中也很常見。許多有輕度和中度心理問題的人，在接受心理治療後表示他們的情況好轉，但控制研究證明：這部分康復比例是安慰劑效應與時間推移（自然康復現象）共同作用的結果。大多數有療效的治療方法都是原有療效和安慰劑效應的結合。

實驗法

赫爾曼．艾賓豪斯的「遺忘曲線」

赫爾曼．艾賓豪斯(Hermann Ebbinghaus，1850-1909)是德國的心理學家，也是第一個用實驗方法研究記憶衰退的心理學家。為了能夠客觀地研究記憶與遺忘，記憶的實驗必須採用標準化、一致性的測驗項目。因此艾賓豪斯發明了兩千多個無意義單字，把一個母音嵌入兩個子音之中，並隨機抽出若干字來做為記憶實驗的內容。他以自己為實驗對象，每次實驗取出若干單字，隨機排序後，測驗自己需要重複幾次才能完全記住這些字序，並間隔不同的時間測驗自己的記憶與遺忘狀況。同時也測驗複習之後，需要多久時間才能再重新完全記住這些字序。艾賓豪斯從實驗結果得到了一些遺忘規律，得出著名的「遺忘曲線」，是使用科學實驗方法，成功用量化呈現遺忘的特性的案例。
(請注意：雖然艾賓豪斯的遺忘曲線是一個被多次驗證和應用，且被視為可複製的心理學現象，但其也存在一些問題，包含：
1. 外部效度的問題：艾賓豪斯的原始實驗主要是針對他自己進行的，因此實驗結果若要推廣到其他人身上，在外部效度上會有一定的限制。
2. 實驗設計的問題：許多後續研究指出，遺忘曲線可能受到實驗設計的影響，例如學習材料的性質、學習方式等，這些因素可能會影響遺忘曲線的形狀和速度。
3. 個體差異的問題：每個人的記憶和遺忘模式皆存在差異，因此遺忘曲線在不同個體間的適用性可能會有所不同。
因此，遺忘曲線雖是一個被廣泛研究和討論的現象，但在應用和推廣時需要考慮到不同的情況和限制，以確保其可靠性和準確性。)

上圖為《艾賓豪斯的遺忘曲線》：用於表述記憶中的中長期記憶的遺忘率的一種曲線。

觀察法

企業界的「神秘客」

《遠見》雜誌每年發佈的「服務品質調查」，共動員二十名具國際證照的「神秘客」實地調查十九類不同行業企業。主要觀察員工服務態度、熱誠表現，約佔總評分七成五，出狀況測試的魔鬼題佔總評分二成五。2021 年共評比兩百八十三家企業門市，規模歷年最大。以神祕客至 LEXUS 測試為例，保養過程中神祕客宣稱手機沒電，LEXUS 維修技師立刻大方出借他的手機，令神祕客感受到「把客人當朋友」的服務態度。除此，神祕客保養汽車離去後，還去電指稱於車內撿到螺絲，車廠接到通知後便立刻安排再次入廠檢修。

值得留意的是，神秘客觀察法亦有其侷限性，即實驗設計與樣本採取上可能有所不足，所得出之結果未必具有普遍性。例如：在神秘客觀察法中，研究者無法控制所有影響服務體驗的變數，比如店鋪繁忙程度、員工個人狀態、其他顧客行為干預等，這使得很難斷定測試結果是由於實際服務品質本身還是外部因素介入。此外，因為培訓神秘客並進行消費測試需要相當的時間與金錢成本，所以神秘客觀察法只能獲取少數樣本，進而可能導致測試結果的代表性受到質疑，蓋其無法覆蓋所有潛在的顧客消費體驗

餐飲界的「神秘客」

《米其林指南》是餐飲界中相當具有權威的一美食評鑑書刊。透過動員受過法國完善訓練的「神秘客」實地走訪各種不同的餐廳，依照五項標準選出餐廳名單，包含食材品質、食物準備技巧與口味融合、創新程度與廚師理念。且為了保持客觀、公正，「神秘客」之身份、行為皆與一般顧客相同，並不會有故意掉落叉子等引發餐廳（受試者）注意的刻意行為。

遊戲界的「作弊問題」

「懷維爾」(Whyville)是1999年創立的一款為8歲以上兒童而設的教育遊戲，它似乎不像是一個需要調查作弊的地方。但是據《作弊：在電玩中佔便宜》(Cheating: Gaining Advantage in Videogames)一書的作者、加拿大蒙特利爾市康考迪亞大學(Concordia University)的遊戲研究與設計和傳播研究教授米婭·康薩爾沃(Mia Consalvo)說，它卻成為了作弊無處不在的一個證據。「懷維爾」的開發者在開發過程中發現了一些不尋常的事——這是一款68%的受眾為8－13歲女性的遊戲，但是作弊在當中卻相當盛行。針對這個現象，康薩爾沃提出一種叫做遊戲資本的概念，以解釋發生作弊的原因。在遊戲中玩得好會得到社交聲望，提升在群體的地位，因此好的玩家想要維持她的地位，害怕失去現有的資本，所以有時就必須透過作弊的手段保住一切。而「為了保持地位而作弊」的想法其實有證據支持，比如:來自加拿大圭爾夫大學的凱利‧里奇曾研究出大多數的作弊行為都是由成績較好的學生作出的（60%的違規者分數都在80%或以上）。

調查法

焦點訪談

使用焦點訪談法，研究者會挑選一群研究對象進行訪談。一般來說，會精心挑選 6~10 位對象進行訪談，並由一位熟知該研究主題的主持人帶領大家討論。比起其他的研究方法，「焦點訪談」能更了解研究對象的行為動機，但因為樣本數少，且又帶入研究對象的主觀想法，因此不具有完全的代表性。此外需考量研究者的能力，是否能夠掌控一群訪問者，不讓場面失控又能問到欲了解的主題。

問卷抽獎

在許多地方都可以看到一些調查問卷，這便是生活中運用調查法的實例。在這類型的網絡問卷中，調查的範圍十分廣泛，例如:生活習慣造成哪方面的影響、對同志婚姻的看法、消費者購買物品的心理因素、自殺防治等相關議題都有。在此類的問卷調查方式中，都會配合「填寫後可參加抽獎」的方法，只要獎品足夠吸引人，就能增加填寫人數，一旦樣本數量足夠龐大，便具有統計學上的意義。但在此類的社群網站或社團發佈問卷調查，也有其缺點。例如接受調查的族群，幾乎都是同年齡層的大學生，較缺少社會大眾多數族群對議題的看法，缺乏普遍性。故若能在各類年齡群及不同職業的人群間使用此法，即可帶來較具普遍性的實驗結果。

服務滿意度調查

在餐廳用完餐或是使用電話客服後常常可以看到有關服務滿意度的調查問卷。調查的範圍涉及對服務的滿意度、服務人員的態度等。透過此類的問卷調查，業者可以分析調查數據來研究如何增加顧客的忠誠度以及滿意度，再根據不足之處進行改進以增加營收。而由於此種問卷調查方式可以直接地獲得使用者的反饋，並馬上進行處理或是改進，所以已經被眾多服務業所採用。但其也具有一些缺點，例如

填答意願低落造成樣本不足，而使其不具統計學上的意義。
填答時容易受服務員左右而導致不能忠實的呈現結果。

書籍影音

書籍

1.《這才是心理學（增訂版）》 作者：Keith E. Stanovich 譯者：楊中芳出版社：遠流
史坦諾維奇教授為了讓心理學家的研究成果能受到應得的重視及合理的應用，以富有邏輯又不失風趣的方式，搭配簡潔具體的實例和最新的研究資料，說明研究者如何透過系統化的實徵研究、可公開重複驗證與評鑑的程序，逐步描繪出人類心智的真實面貌。
2.《心理與教育研究法》 作者：董奇，申繼亮出版社：東華

3.《這才是做研究的王道》 作者：Howard S.Becker 譯者：呂姿吟/郭錦媛出版社：群學
作者援引超過數十年的教學與研究經驗，給予學生寶貴的建言。這些忠告簡單的如改變訪談提問，到困難的像是操作真假值表，誘導出許多新的想法。

4.《史上最偉大的心理學實驗最新完整版：原來人性心理是這樣！》 作者：田秋出版社：達觀
書中收錄了八十餘則著名的心理學實驗，通過這些有趣的實驗讓讀者發現人們行為背後受到一些奇妙的心理規律所支配的；進而發現，生活中那麼多的道理都有據可依。
5.《趣味心理實驗》 作者：渋谷昌三出版社：小倉書房
本書以心理學的實驗為例，來探討我們身邊的話題及社會問題，並希望能以科學方式剖析人心。由這些知識，能了解以往不怎麼清楚認識的自己，以及和朋友、同事之間的言行。相信對一些社會事件也將能更向下挖掘，深入了解其背後真正的理由。
6.《實驗心理學（第四版）》 作者：朱瀅出版社：北京大學
實驗心理學是將實驗研究方法應用於心理學各個領域的一個心理學分支。本書在介紹實驗設計、心理物理學方法和反應時間等基礎知識後，對各個重要的心理學研究領域作較系統的講解，如視覺與聽覺、注意、記憶、思維、心理語言學、社會認知、意識等。
7.《生活中的趣味心理學》 作者：田秋出版社：金城
本書通過心理學實驗，讓你清楚地看到人在特定情境脈絡中的好惡、恐懼、順從、怯懦等心理特質，從而幫助我們梳理在日常生活中經常忽略的行為背後複雜微妙的心理因素，使我們能更加清楚地檢視自我、了解他人。
8.《怎樣洞察別人》 作者：G.I. Nierenberg 譯者：蔡慶蘭出版社：遠流出版
本書所探討的是洞察別人行為姿態的問題，幫助讀者探測人際關係的海洋，確實看清他人行為姿態所透露的訊息。
9.《研究方法：實徵性研究取向（第二版）》 作者：周文欽出版社：心理

影音

1.科學方法的步驟

2.個案研究：Genie Wiley

3.自然觀察法

4.相關法

5.心理學實驗法

6.Correlation vs. Causation

7.Descriptive Methods

8.The Little Albert Experiment

9.Finding Little Albert - The Brain: A Secret History - BBC Four

10.Placebo Effect

11.Delphi Technique

12.the Nocebo Effect

13.Observer Bias

14.The Hawthorne Effect

15.Ecological Fallacy

16.The Monster Study

17.THE BYSTANDER EFFECT

參考資料

核心觀念

Susan Nolen-Hoeksema, Barbara L. Fredrickson, Geoffrey R. Loftus, Christel Lutz（2015）。心理學導論（危芷芬譯，第二版）。雙葉書廊。（原著出版於1953年）
Richard J. Gerrig（2014）。心理學（游恆山譯，第六版）。五南圖書出版。（原著出版於2013年）
溫世頌（2016）。心理學導論（5-14頁）。三民書局。
賴惠德（2016）。心理學：認知．情緒．行為（13-21頁）。雙葉書廊。ISBN 9789865668396。
Philip G. Zimbardo, Robert L. Johnson, Vivian McCann（2012）。Zimbardo’s 普通心理學：核心概念（張文哲、洪光遠、邱發忠、蘇文賢譯，第六版，11-22頁）。學富文化。（原著出版於2008年）ISBN 9789866624636。
陳皎眉、張滿玲、徐富珍、林宜旻、孫旻暐（2015）。心理學（第二版，22-29頁）。雙葉書廊。ISBN: 9789865668259。
John W. Santrock（2012）。心理學概論：心靈與生活探索（黎士鳴等譯，11-22頁）。東華書局。（原著出版於2002年）ISBN 9789863411499。
Beck, H. P., Levinson, S., & Irons, G.(2009). Finding Little Albert: A Journey to John B. Watson’s Infant Laboratory. American Psychologist, 64, 605-614.
Watson, J. B., & Rayner, R. (1920). Conditioned emotional reactions. Journal of Experimental Psychology, 3, 1–14.
王克先（1989）。學習心理學。桂冠。ISBN 9789575512651。
梁庚辰（2018）。心理學:身體、心靈與文化的整合（第二章，13.3.3）。臺大出版中心。ISBN 9789863502920。
鄭雅淳、呂芷晴（2019）。實驗動物與他們的產地。窩窩，檢自https://wuo-wuo.com/topics/experiment-animals/experiment-animal-and-their-living
Encyclopaedia Britannica(2019) Gustav Fechner - German psychologist and physicist. *https://www.britannica.com/biography/Gustav-Fechner

華人本土心理學學案書籍

高尚仁（1991）。中國人、中國心：傳統篇。遠流。
高尚仁（1992）。書法藝術心理學。文化教育出版社。
高尚仁（2000）。書法心理治療。香港大學出版社。
楊中芳（2001）。如何理解中國人：文化與個人論文集。遠流。
楊中芳（2001）。中國人的人際關係, 情感與信任: 一個人際交往的觀點。遠流。
楊中芳（2001）。如何研究中國人：心理學研究本土化論文集。桂冠圖書。

跨文化研究

黃光國，〈心理學本土化運動的過去、現在與未來〉，《人文與社會科學短訊》第 3 期（2004 年，台北），頁 29-42。
黃光國，〈「華人本土心理學研究追求卓越計劃」的總回顧〉，《本土心理學研究》第 22 期（2004 年，台北），頁 3-10。
葉啓政編，《從現代到本土》（台北：遠流，2002 年），黃囇莉著，〈孰可忍？孰不可忍？從現代化的「批判」到本土化的「堅忍」之間〉，頁 5-14。
楊中芳，〈試論如何深化本土心理學研究：兼評現階段之研究成果〉，《本土心理學研究》第 1 期（1993 年，台北），頁 122-183。
楊國樞，〈我們為什麼要建立中國人的本土心理學〉，《本土心理學研究》第 1 期（1993 年，台北），頁 6-88。
徐詩淳與黃詩婕盛（民 100 年 10 月 21 日）。人物專訪－楊國樞老師。台大心理系季報。
簡晉龍與黃囇莉（民 101）。華人權威取向之概念建構與實徵研究：本土心理學研究取徑（博士論文）。
華人本土心理研究基金會

相關系數	意義	說明
r = +1	表示在二個變項之間，有着完全的正相關。	假若體重和身高完全正相關，那麼若已知一個人的身高，便可正確地說出其體重。當相關為正，通常把「+」省略。
r = -1	表示完全負相關。	例如，車齡越久，其價格越低，同樣若車齡已知，則價格亦可得知。而車齡和其價格間的關係，可用相關系數 r=-1 來表示。
r = 0	表示毫無關係（零相關）。	意指知道一個變項的值，對另一個變項的預測毫無幫助。
-1< r <1	表示不完全相關。	相關程度由相關系數絕對值接近 1 的程度來決定。同樣大小的正相關或負相關，代表相同的關係程度。

心理學研究的目的

心理學研究的原則

心理學研究的變數

變項量測

變項數值化的爭議

量尺類型

變項量化的意義性(meaningfulness)

研究程序

收集資料、確認研究問題

研究問題的功能

研究問題的好壞

引用格式

文獻回顧

提出假設

設計研究方法進行控制測試

收集、分析數據

得到結論

發表理論

重複驗證

心理研究法種類

整理

個案研究法(Case Study)

觀察法(Observational Method)

調查法(Survey Method)

實驗法(Experimental Method)

名詞介紹

實驗設計方法

測量與統計

實驗法的優缺點

相關法(Correlational Method)

相關系數的定義

相關法的優缺點

測驗法

信度(reliability)

效度(validity)

信度與效度的分別

其他-心理測驗法、焦點群集法、德懷術、經驗總結法等

經驗總結法—為教育心理學常使用之方法

大數據研究法

搜尋論文、期刊的方法

Google 學術搜尋

APA PsycNET資料庫

各大專院校資料庫

中國知識基礎設施工程

PQDT資料庫

DART-Europe E-theses Portal

研究的時間面向

橫斷面的研究

優點

應用

問題與缺點

貫時性的研究

優點

問題與缺點

研究的誤差

抽樣偏誤(Sampling Bias)

反應偏誤(Response_bias)

安慰劑效應(Placebo Effect)

反安慰劑效應(Nocebo Effect)

社會期許誤差(Social-desirability bias)

觀察者偏誤(Observer Bias)

倖存者偏差(Survivorship bias)

霍桑效應

區群謬誤(Ecological Fallacy)

信度(Reliability)與效度(Validity)不足

化約論(Reductionism)

虛假關係(spurious relationship)

實驗的再現性

研究的道德爭議

心理實驗的倫理標準

實驗案例

動物實驗的研究

最新研究

神經成影技術：原理以及其研究應用

前言

原理

利用神經成影技術研究情感效價理論

簡介

實驗方法

結果