超普通心理學/心理學研究法

維基教科書,自由的教學讀本

本章節將以常見的五種心理學研究法:個案研究法實驗法觀察法相關法調查法,分別討論其優缺點與研究時的注意事項,並舉出這些方法在生活中運用的例子,讓讀者能夠了解心理學在社會上的應用與價值。另外,本章也提供最新及本土學界的研究供參考。

心理學研究又分為質性取向量化取向。質性取向的心理學研究,意指以田野調查、訪談法等方式取得的資料來進行研究;量化取向的心理學研究,則是指以統計方法或數學模型所得出的資料來進行研究。在今日的心理學中,兩者間的差異已不再由研究主題決定,而是由研究方法決定。

心理學研究的目的[編輯]

心理學的研究包括基礎研究應用研究

研究名稱 重視的方向 研究方式 例子
基礎研究(basic research) 重視理論性 科學性的探討,為獲得關於現象或可觀察事實的基本原理,進行實驗性或理論性的研究,終用於解釋、預測和控制行為。 1. 什麼樣的因素會導致憂鬱症?
2. 什麼樣的因素可能會導致暴力行為?
應用研究(applied research) 重視實用性 將心理學建立的原理和方法加以實踐,來克服其他領域中實際的問題,以提升人類生活品質為目標。 1. 調查怎麼樣的治療方式對減輕憂鬱症最有效
2. 調查怎麼樣的計劃可以減少學生在學校的暴力行為

儘管不同領域的心理學研究對象不盡相同,但其目的都可被歸類為對心理與行為作出描述、解釋、預測、控制。(於心理學緒論中有詳細介紹過)

心理學研究的原則[編輯]

研究心理學的方法眾多,然其主要遵守下列四大基本原則:

原則名稱 強調 注意方向
客觀性原則 以客觀觀察,不主觀臆測 外部條件、客觀指標、嚴謹態度
發展性原則 重視研究對象的變化性 研究對象的心理活動
系統性原則 重視各個因素的相互作用的關係 其他因素對事情本身的連帶影響
教育性原則 重視研究方法對受試者的影響 不影響受試者身心,是否有教育意義
專業原則 遵守心理學專業人員倫理準則 人道尊嚴與社會福祉,私隱與保密,道德與法律,文化與使命,誠信與負責,專業與堅持


客觀性原則
對於任何心理現象皆必須按它本來的面貌加以研究和考察,不可附加任何主觀意識。人的心理是客觀現實的反映,一切心理活動都是由內外刺激所引起的,並通過一系列的生理變化,在人的外部活動中表現出來。研究人的心理,就是要從這些可以觀察到或能夠進行檢查的活動中研究。研究者在進行心理學研究時,應該客觀地考察、揭示現象的本質,而非以主觀臆測,如此才能得到可靠的心理事實。因此,為了貫徹客觀性原則,研究者需嚴格控制外部條件、確認所要研究的心理現象的客觀指標、抱持嚴謹的態度如實地得出結論。
發展性原則
要求心理學的研究從心理史發展、意識發展、個性心理發展以及環境和教育條件變化等不同方面,揭示人的心理發展規律。研究者遵循發展性原則,即是將人的心理活動看成是一個變化的過程,在發展過程中研究個體在不同年齡階段上心理的發展。在研究發展中的心理活動時,不僅要求闡明受試者已經形成的心理品質,還要求闡明那些即刻產生、正處於形成狀態的新的心理品質。
系統性原則
要求我們進行心理學研究時,必須從發展變化與互相聯繫去考察心理現象,而非孤立、靜止地進行研究。任何事物都有可能有所聯繫,且發展變化快速,人的心理現象也不例外。當我們研究某一心理現象時,一定要注意其他心理現象對它的影響,在整體的系統之下,才能更好地進行分析與綜合。心理與意識雖然都是很複雜的現象,但可以藉由剖析將其分解為各種形式,以進行專門的考察研究,而後通過整合將其看成有機聯繫的整體加以理解。在研究某一種心理形式與現實條件的依存關係時,也可以分別地考察某一條件在其中所起的作用,而後將其揭示的各種規律加以綜合運用。
教育性原則
要求研究者在選擇心理學研究方法時,要考慮所使用的方法對受試者的身心是否產生不良的影響。尤其當受試者的身心仍處於發展階段時,由於其認知能力較差,容易受到影響或是容易模仿。有些心理學研究可能就需要涉及一些情緒或壓力等不適感受,這些研究對於理解心理現象和提高心理健康有重要意義。因此,在某些情況下,可能需要在保護受試者並衡量其可接受之範圍的前提下,進行一定程度的挑戰性研究,以推動心理學領域的發展。
專業原則
在研究的過程要嚴格遵守心理學專業人員倫理準則,以確保研究對當事人以致社會的利益。此外研究的設計與執行必須符合「法律」與「研究者所屬專業團體的道德準則」。心理學研究應尊重參與者的尊嚴與福祉。規劃研究時,研究者應先評估該計劃是否合乎「道德」,是否會危害參與者的生理和心理狀態。當一項科學研究有上述顧慮時,研究者應先向有關人士請教,以保障參與者的權益與知情。

心理學研究的變數[編輯]

變項(Varible):被用以表示一個值給定集合(通常指函數的定義域)中不確定元素的數值。研究方法學者 Kerlinger, F.N.認為「變項就是能產生不同數值的特質。」 而心理學研究中一般需要分析三種類型的基本變數,分別為機體變數(Organic variable)刺激變數(Stimulus variable)反應變數(Response variable),心理學研究的目的在於了解這些變數與引起這些變數的各種因素如何產生聯繫,通過對這三項變數相互關係的研究,來揭示心理活動的規律和機制。

變數名稱 說明 舉例
機體變數 人和動物被試者都存在着個別差異 如遺傳、發育、動機、智力及人格等方面的差異
刺激變數 影響機體反應的種種環境因素 如外界的聲音、光線、生活和工作條件、學習環境以及他人的言語、動作、態度等的變化
反應變數 由刺激引起機體行為上的變化 如反應的速度、次數、正確性、強度等方面的差異

科學研究[編輯]

自然科學的研究目的是藉由因果關係的決定論,描述與解釋現象的規則。

從心理學史的角度來看,一百多年前科學成功的發展,對當代心理學的研究走向與方向影響甚大。

現象的規則性[編輯]

表象世界中的一切事物看起來是恆常不變的,但實則是一個不穩定、易變的、相對的世界。自古以來,人類就在探索發現並歸類自然現象中的規則性,像是中國古人發明二十四節氣以輔助人們辨別周而復始的季節時令;在近代,西方科學藉助數學的發展,得以用較精簡的方式描述和解釋現象的規則性。最有名的例子即為牛頓,他與萊布尼茨共同發展了微積分以描述物體與力之間的關係。 如今,心理學學者企圖對人類心智行為的諸多現象找出規則與規律,以著成言簡意賅、容易瞭解的學問。早期有某些心理學家對心理學上的現象規則性做過歸納:

表示在一個感官刺激中需要被檢測到的最小變化量。其歸納出現象的規則性,並建立了韋伯定律。(詳見感覺與知覺

  • 赫爾曼·艾賓豪斯(Hermann Ebbinghaus)於 1879 年進行了記憶實驗,其在這個記憶實驗中保留所有無意義音節列表的原始順序,並以恆定的速度記住每個列表。然後,艾賓浩斯會反覆閱讀該列表,並確保按照原始​​順序背誦,同時記錄完美背誦無意義音節需要進行多少次嘗試,並研究了速度、重複次數和單字數量如何影響記憶。他發現記憶遺忘的資料呈現某種規則性,從而歸納出遺忘曲線遺忘曲線(Forgetting curve)是用於表述記憶中的中長期記憶的遺忘率的一種曲線。這一曲線是赫爾曼·艾賓豪斯通過自己1880年到1885年的實驗提出。在這一實驗中,艾賓豪斯使用了一些毫無意義的字母組合。通過記憶這些字母組合,並在一系列時間間隔後檢查遺忘率,得到了這一曲線。因此,這一曲線又叫艾賓豪斯遺忘曲線。

因果關係的決定論[編輯]

現象的產生必有其因果關係,而科學研究之目的在於尋求並解釋導致此現象的原因。這些現象通常隱含「有限原因」(Finite causality)。因果關係推論遵循「若 P 則 Q」的邏輯,探討學說是否能正確預測真實世界的現象,即為演繹推論

實作上是用實驗所得的資料 Q 來驗證學說 P,不過,就邏輯推論而言,「若 P 則 Q」的等同句並非「若 Q 則 P」,而是「若非 Q 則非 P」。也就是說,經實驗而得的資料 Q,僅表示學說 P 未被推翻而有成立的可能性,而非表示 P 就是絕對唯一的原因,因為可能有其他學說 P*也能推導出 Q;但若實驗得出非 Q,則學說 P 必然有誤。當此情況發生時,科學家需要另尋出路,對其研究對象提出其他的解釋。

從上述描述中,我們知道一個好的假說雖然難以被證明為事實,但應容許被證明真偽。在沒有其他更好的解釋前,科學家只是暫時相信目前的理論,但這理論可以在任意時刻因為新實驗證據的出現而被推翻。這就是所謂科學理論的可否證性

實用主義是判斷理論科學性的首要標準,證偽主義與實證主義則次之

因此「科學並非揭示真理,只是實用工具」,我們可以說一個理論目前缺乏科學性,卻不能肯定它是錯誤的。

實用的意思是,在眾多假設中,我們會選擇能夠解釋已有觀測數據,且盡量簡單與有盡量多可證偽的之處的理論。

如果認為科學只能透過實證主義或證偽主義來開展,而忽略實用主義便會把本是科學的理論除在定義之外。

確認一理論科學性最好的方法不在於它可否完全證偽,而是進行大樣本隨機雙盲實驗

實證主義可以追朔到英國13世紀的經驗主義學者羅傑·培根,由法國哲學家奧古斯特·孔德發揚。孔德說:「無論發現這些原則的方式如何,是推理的或是實驗的,其科學效能總是在於與所觀察的現象直接或間接相符」 。即根據實證主義,所有的科學經驗都必須有事實來證明它的正確性,而科學是實證的。

但由於黑天鵝理論、享普爾悖論等的反駁,證實一個理論基本上是不可能的,所以波普爾提出了證偽主義,即可被證偽的才能稱為科學的,以證偽替代證實主義的邏輯實證主義思想。

例如波普爾在接觸了佛洛伊德的精神分析理論後發現無論病人有任何狀況(如做各種夢等),分析家都能"強行"以佛洛伊德的理論解釋,使理論不和現實產生衝突。故波普認為不能說佛洛伊德的精神分析是現實的真實反映,他提出科學理論的關鍵在於理論能否有被證偽。

但證偽本身也是極困難的,有以下幾個原因。

1.科學哲學家伊姆雷·拉卡托斯批判並修正了波普爾的科學哲學理論。拉卡托斯將湯瑪斯‧庫恩和波普的觀點結合,提出在任何科學理論中有許多互相競爭的"研究綱領"。每套研究綱領都有一個"理論核心",它是綱領的基礎,也是不可證偽的,而次要理論組成了"保護帶"。保護帶是可以證偽的,因為這不會對核心造成嚴重打擊。拉卡托斯說,有科學性的研究綱領應該是可以向外擴展次要理論而解釋更多數據,但每個新的次要理論都要經過嚴格證偽檢驗。

事實上19世紀的科學家相當信賴牛頓的理論,因此天文學家才能透過天王星異常的運動成功預測了海王星的存在,是唯一事先經由計算預言其存在並預測其位置,才被發現的行星。

但與之相反的例子是水星,在1859年,法國天文學家發現水星的運動和經典力學理論計算出的結果有微小偏差。科學家認為這是一顆沒被發現的水星衛星的引力所造成的。但他們根本觀測不到這顆衛星,便依牛頓力學提出大量理論解釋為何不能觀測這顆衛星。

1905年出現的相對論與先前牛頓力學延伸出的眾多解釋中都能解決了水星誤差的問題,但其他假說在當時較不複雜,又沒有破壞牛頓理論,而相對論則破壞了經典力學的當時的絕對性。相對論後來被承認是因為背離經典力學而符合相對論的觀測數據越來越多,使牛頓理論延伸出的次要理論比相對論更加複雜。

雖然在海王星的時候科學家的判斷沒有錯,但是到了水星的這個例子裏,實驗數據已經失去糾正科學理論的功能了。故我們原則上又不太可能檢測所有次要理論是否成立(其中一個原因是阿格里帕三難困境)。當觀測到否定證據時,邏輯上無法確認該被否證的是輔助/次要理論還是理論核心。也就是「杜恆-蒯因論題(Duhem–Quine thesis)」

科學理論的典範轉移是一個漸變的過程,隨着反對舊理論、支持新理論的證據越來越多,為舊理論建立的輔助理論比新理論還複雜、理論核心就被改寫了。

所以科​​學理論互相取代,最重要的依據是實用主義

從實證主義到證偽主義,再到實用主義。這就是科學哲學的發展。前面的種種例子都顯示了,科學是個講究實用與否的工具。

2.證偽主義的另一個問題是有些命題的證偽成本過高。

如「「就算世界所有的核彈一起引爆,人類也不會滅亡」這個命題,是不可證偽的。因為要證偽這句話,就必須把所有的核彈一起引爆,看看人類滅亡了沒有。且不說沒有人會幹這種蠢事,就算乾了,證明這個命題錯了,那時候人類也可能滅亡了,也就沒人會出來宣佈這個命題錯了。……我們可以從實用主義的角度考慮這個問題:我們為什麼要知道所有核彈引爆的後果?…為了勸告各國政府,千萬別打核戰啊,打起來大家都完蛋。…事實上今天就有人質疑,冷戰時期對核戰的恐怖後果被過度誇大了。從這個角度說,實用主義是證偽主義很好的補充,可以讓證偽主義免去討論那些因為條件所限、難以被證偽的理論。」— 林欣浩

保羅•費耶阿本德(1924-1994)認為任何認為科學只能透過實證主義或證偽主義來開展,而忽略實用主義的解釋都註定要失敗,因為這將把本是科學的理論除在定義之外。

最好的檢驗科學性方法是「大樣本隨機雙盲實驗」。有些人因為精神分析理論的理論核心不能證偽而否認其科學性,除非他們能讓精神分析理論與別的理論體系進行大樣本隨機雙盲實驗,否則我們不能斷言精神分析理論是不科學的。從實踐是檢驗真理的標準到可證偽是檢驗真理的標準,再到實用是檢驗真理的標準,這就是科學本身的限制與科學哲學的發展。

通常因果關係的判斷標準有:

  • 變項間必須有相關:兩變項非完全獨立。
  • 變項具有時序關係:原因必須出現在結果之前。
  • 變項間不是假性的關係:通常在兩變項間觀察到的相關性,並不必然能建立其因果關係。有時候我們觀察到的相關,實際上是其他因果關係所伴隨的結果,會涉及到其他變項。

研究通則[編輯]

科學研究的通則中,表象世界的某些面向常藉實驗方法所獲之資料結構來顯現其規則性。然而資料的規則性,需要輔以理論或學說的解釋,才能幫助心理學的進展。心理學家嘗試根據現象與資料之規則性建構理論,並作推導、預測。資料與理論相輔相成,而理論亦須經過推導、形成預測,才得以解釋資料。
大部分心理學理論或學說以文字敘述居多,而在某些研究領域可用數理「模式」表示。費希納即使用數理模式推導其「心理物理對數法則」(logarithmic law of psychophysics)的方法。
費區納提出心理感覺量尺(scale)的公設(axiom):假設在「恰辨差」(Just-noticeable difference, JND)為時,外在物理刺激與心理感覺的對應函數是等距的:

即外在物理刺激與心理感覺的關係不受刺激強度的大小影響,僅與有關,最後再用微積分推導其法則。
後來學者進一步指出,恰辨差的定義應將機率納入判斷標準,因為不同機率下的恰辨差值也不同。費區納的心物量尺核心理念建構出一種量尺表徵:

為刺激比刺激大的主觀機率,為絕對遞增函數,即探究此表徵所含量尺的存在性與獨特性,又稱之為「費希納表徵」(Fechnerian representation)。其與瑟思通(Louis L. Thurstone)模式及「訊號檢測理論」(signal detection theory,SDT)皆有關聯。

變項量測[編輯]

許多心理學研究涉及心理屬性(Attribute/Property)的排序或比較。量測(Measurement)是一量化過程,根據物件屬性賦予對應數值(numerical value),而量尺值(scale value)即所分派之數值(Patrick Suppes & Joseph L. Zinnes, 1963),也就是一種函數轉換:「f(x)=y,f(物件屬性特徵)=數字」。 當心理學朝科學的方向發展,量測由心理屬性構成的變項為關鍵的步驟,且大部分的心理實驗推論來自於量化後的數字資料之統計、檢定。量化後,數字系統能提供共同的語言,處理二元運算相較於屬性或是物件本身要來的單純方便許多。

變項數值化的爭議[編輯]

  • 物理學界的質疑:社會學(特別是心理學)是否算是科學?
1920 年代,英國物理學家侃伯(Norman R. Campbell)等人發起論戰。他們認為基本物理屬性之所以能夠被測量,是因為具有單位量尺首尾相接的「串接」(Consatenation)操作特性,而心理變項量測不具「串接」特性,故無法執行二元運算及其他衍生運算。
  • 數理心理學家的反駁與共連量測概念
主張「串接」並非心理屬性能否進行科學測量的單一判斷標準。
他們藉由公設法探討其他可行的變相量測方法,其中之一為加成性共連量測(Additive conjoint measurement)的建構。
以下舉例來解釋此概念:
假設我們想量測主觀的「舒適度」屬性,並藉由兩獨立變項(濕度與溫度)的量測,可系統性的操弄二變項而得到一系列的舒適度排序資料,且背後有可對應的心理量尺。在某些公設條件下,濕度與溫度兩變項載舒適度層面的量測皆屬於間距量尺,舒適度可藉由兩變項的量尺加成得到。
應用上,展望理論(Prospect theory)即是基於此共連量測概念為其公式所含之量尺科學化基礎。
  • 心理物理學家的反駁
史提芬斯(Staley S. Stevens)等人反對這種從物理學界跨過來的類比方式。
他們認為,心理學有自成一套的獨特量測規範,其科學性無須遵循或是模仿物理科學的量尺法則。其量尺法則會在下方進行更進一步的敘述。

量尺類型[編輯]

心理物理學家史提芬斯(Stanley S. Stevens)將量尺分為四種主要類型,分別為名目(nominal)量尺次序(ordinal)量尺(或順序量尺)、間距(interval)量尺(或區間量尺)與比率(ratio)量尺。此四種量尺的關鍵差異在於所允許的變數轉換(admissible transformation)不同。

量尺種類 說明 舉例
名目量尺 將數字當類別或名稱使用,以區分或標示變項的身分,此量尺值並無大小的意義 如三位候選人的號碼 1、2、3 僅作為標籤用途
次序量尺 除了標籤作用外,還保有次序之分,但沒有間距或比率關係 如你對三位候選人甲、乙、丙的喜好程度為甲>乙>丙,為表達次序我們可以用 f(甲)= 10、f(乙)= 5、f(丙)= 1 表示而得 10 > 5 > 1,在此例中數字只是用來表示次序大小,而未被用來考慮單位數字間的間距
間距量尺 除了保有次序量尺的特性,亦有數字間距相等的性質,因此間距量尺可以做間隔距離的比較。而間距量尺沒有絕對的零值,故無比率的特性。 如溫度、智力商數等。10 ℃、20 ℃、30 ℃ 他們之間都差 10 ℃,但並不會說 20 ℃ 是 10 ℃ 的兩倍。
比率量尺 除了具有間距量尺的特性,並有絕對零值,故可以進行比率或倍數的比較 基本物理刺激的量測如長度、重量皆有此性質,心理學常用的反應時間亦屬於此類

變項量化的意義性(meaningfulness)[編輯]

量尺數值排序比較的陳述(statement),在經由此量尺的變數轉換後,是否仍保有原陳述的真實性。

研究程序[編輯]

任何一門研究都必須經過明確的研究程序進行,以科學方法設計實驗,才能得到可信的結果。除了要確定兩件事的關聯性,更要確認兩者的因果關係,讓其中的關鍵變數被完整地呈現出來。心理學這門科學使用科學方法,並透過實徵研究驗證理念。實徵研究注重證據,藉由觀察及蒐集資料來驗證理論。心理學的研究程序主要可以分成下面幾個步驟:

  1. 收集資料、確認研究問題:思考研究目的和可行性,明確定義出所要研究的範圍
  2. 提出假設 :提出一個可被驗證或推翻,且能夠被進行測試的論述
  3. 設計研究方法進行控制測試:針對假設以選擇適合的研究法,在不同的組別安排不同的自變項
  4. 收集、分析數據:將數據進行統計分析,利用數學方法排除雜訊造成的誤差,找出自變項與應變項之間的關聯性
  5. 得到結論:透過數據分析結果驗證實驗是否支持假設
  6. 發表理論:接受他人提出的疑問並解釋自己的論述
  7. 重複驗證:累積重複成功的證據,使理論更加穩固

而接下來我們再逐項細講:

收集資料、確認研究問題[編輯]

在開始研究之前,研究者須先收集足夠的資料並回顧現有研究。若已經有其他人做過類似研究,可以參考研究方法、使用其假設或結果。接着思考研究目的和可行性,將大問題縮小,明確定義出所要研究的範圍。

研究問題的功能[編輯]

  • 有方向性與連貫性的組織計劃
  • 劃定計劃的界線與範圍
  • 讓研究者聚焦問題
  • 提供撰寫計劃的架構
  • 指出所需要蒐集的資料

研究問題的好壞[編輯]

好的問題(較合適問題) 語意清楚、與文獻或架構契合、提供未來其他研究方向
壞的問題(較不合適問題) 語意不清、與文獻或架構脫鈎、一次問太多問題、問人盡皆知的問題、具誘導性的問題、雙重否定的問題
無法被回答的問題 純粹道德或哲學的問題、非當代科學可以處理的問題

引用格式[編輯]

在不同的領域,引用格式都各有不同,例如在教育學心理學科學領域是採用美國心理學會(American Psychological Association, APA)提出的APA格式人文與社會科學領域則適用美國現代語言學會(Modern Language Association, MLA)提出的MLA格式商業歷史學及美術的引用則是使用芝加哥格式(Chicago style)。下文將對心理學適用的 APA 標準做簡略的介紹。

  • 正文內引
  • 同時引用一位作者的多篇文章時,依照年份先後排列,並用逗號做為區隔。
例如:吳俐君(2002, 2021)
  • 引用多筆參考文獻時,中文使用筆畫排序;英文與使用字母順序。中文在前英文在後,引用之間採用分號做為區隔。
例如:(丁一, 2014; 龍飛鵬, 2001)
(Abelton, 2019; Zaffini, 2000)
(丁一, 2014; Abelton, 2019)
  • 當引用單篇文獻作者有兩位或以下,引用時所有作者均須列出。作者之間以逗號分隔。
  • 當引用單篇文獻有三到五位作者,第一次引用時所有作者仍然均須列出,但第二次以後便只須列出第一位作者。
例如:(丁一等人, 2002)
(Abelton et al., 2000)
  • 當引用單篇文獻作者有六位以上,第一次引用以及後續都只需要列出第一位作者。
例如:(第一作者丁一等人, 2002)
(Abelton et al., 2000)
  • 當引用團體作者時,第一次引用須列出全名及縮寫,第二次可以只寫出縮寫。
例如:(American Psychological Association[APA], 2019)
(APA, 2019)
  • 文末參考文獻
  • 格式:作者(年份)。書名。出版地:出版者。
例:丁一(2002)。如何幫鱷魚做直腸鏡檢查。台北:獸獸出版社。

提出假設[編輯]

關於生活可能發生的事件,提出一個可被驗證或推翻,且能夠進行測試的論述,被稱為「假設」。在實驗之前須先提出假設的目的有兩個,首先是為了簡化大海撈針的機率,其次是為了有具體的衡量標準,以判斷此次實驗的效度與信度。為了精確量測試這些假設,必須針對實驗中的各項因素清楚地定義其測量的方法,用是非、數據表達來結果,這就是操作型定義。假設必須是一個清楚的陳述,預測自變項如何影響應變項的結果。此外,假設不能是單純陳述價值判斷,或是不可能發生的事件的論述。

下列以「多喝水使老人心平氣和」為例證,協助讀者瞭解操作型定義的理念:

  • 老人的操作型定義:我們無法測試全世界上的所有老人,因此,我們對「老人的操作型定義」,可能為「社區大學內某班高於 65 歲的人」。
  • 多喝水的操作型定義:我們可以界定為「每日喝 30 度溫水 2700 毫升」為「多喝水的定義」。
  • 心平氣和的操作型定義:我們可以以「五點量尺」李克特量表來評估老人心平氣和的程度。

設計研究方法進行控制測試[編輯]

針對假設選擇適合的研究法,在不同的組別安排不同的自變項。其中,接受假設情境的組別稱為「實驗組」,未受特殊情境的組別稱為「控制組」,作為與實驗組比較的參照物。心理學的研究法十分多元,例如:個案研究法觀察法調查法實驗法相關法測驗法以及其他方法。必須注意的是遺漏變數可能會造成的影響,理想的做法可以利用隨機分派,藉由任意地分派樣本到不同組別中,減少該因素造成的影響。而社會心理學家用來測量變因最常使用的分類方法有兩種:自我報告觀察法

收集、分析數據[編輯]

由於我們的實驗結果是可量測的,因此可以將數據進行統計分析,利用數學方法排除雜訊造成的誤差,找出自變項與應變項之間的關聯性。而假設檢定為統計學上用來做顯著性檢驗的方法。
統計學中的假設檢定和型一與型二誤差(Type 1 and Type 2 error)可以對心理學的研究提供幫助。

  • 設立假設
一般使用反證方法驗證理論,並設立虛無假設對立假設。界定何者應設為虛無假設(),何者應設為對立假設()的方式大略可分為三個方向:
  • 將想驗證的結論設為對立假設,欲推翻、否定的結論設為虛無假設
  • 將他人的主張、宣稱做為虛無假設,亦即假定他人的主張是真實的,而懷疑的可能結論設為對立假設
  • 將錯誤的推翻會招致較嚴重後果的結論設為虛無假設,而相對後果較輕微的設為對立假設
應用到心理學的統計與實驗時,通常將欲證的結論設為對立假設,欲否定的結論設為虛無假設。對立假設與虛無假設為互斥的關係,因此當我們推論發生虛無假設的機會很小時,我們就推論對立假設很可能正確。相反的,若是檢定結果為虛無假設的可能性較大,並不代表虛無假設是事實,而是代表沒有足夠證據推翻對立假設
  • 型一與型二誤差
型一誤差(Type 1 Error)為在虛無假設為真時,經檢定拒絕虛無假設。也會被寫作顯著水準(significance level of test)。
型一誤差的機率為α,表示為

α=P(拒絕H0|H0為真)

型二誤差(Type 2 Error)為在虛無假設為假、對立假設為真時,無法拒絕虛無假設
型二誤差的機率以β表示,表示為

β=P(II)=P(不拒絕H0|H0為假)


整理後如下表:

H0為真 H1為真
不拒絕 H0 正確決策(1-α) 型二誤差(β)
拒絕 H0 型一誤差(α) 正確決策(1-β)
舉例而言,若今天國防部會依據雷達觀察數據判斷是否有共機侵臺、並發送警報,則可能因為型一與型二誤差的存在而導致以下結果:
:一切良好,只是發生偶然干擾
:有敵機來襲
為真 為真
不拒絕 正確決策(沒有敵機來襲) 型二誤差(β),疏忽而未放警報
拒絕 型一誤差(α),錯放警報 正確決策(共機繞臺)

因而從以上可以知道,在不同應用場景,可以選擇型一誤差與型二誤差的其中一個作為衡量。舉例來說: 在工廠判斷是否有不良品時,比起多花一些成本檢查產品,更不願意將不良品出貨。因而會想降低「將不良品判斷為良品」的機率(型二誤差),而非降低「將良品判斷為不良品」的機率(型一誤差),因而我們會以型二誤差作為目標式。

顯著水準指的是樣本統計量與母體參數假設值之間的誤差,必須達到顯著水準的要求,才能判定母體參數假設值應該是錯的。雖然我們永遠不知道推論結果的對錯,但是我們知道就算虛無假設是對的,但我們卻拒絕犯了型I錯誤的機率,不會大於我們所設定的顯著水準,因此顯著水準又稱為檢定人員所能容忍的型I錯誤的最大機率。以α表示。
  • 資料淨化
資料淨化是從記錄集、數據庫表或數據庫中檢測和糾正(或刪除)損壞或不準確的記錄的過程,是指辨識數據的不完整、不正確、不準確或不相關部分,然後替換、修改、或刪除髒數據或粗數據。資料淨化可以與數據加工工具互動執行,也可以通過指令碼進行批次處理。
清洗後,一個數據集應該與系統中其他類似的數據集保持一致。 檢測到或刪除的不一致可能最初是由用戶輸入錯誤、傳輸或儲存中的損壞或不同儲存中類似實體的不同數據字典定義引起的。 數據清理與數據確認(data validation)的不同之處在於,數據確認幾乎總是意味着數據在輸入時被系統拒絕,並在輸入時執行,而不是執行於批次數據。
資料淨化不僅能更正錯誤,同樣加強來自各個單獨資訊系統不同數據間的一致性。專門的資料淨化軟件能夠自動檢測數據檔案,更正錯誤數據,並用全企業一致的格式整合數據。
  • p值(p-value):是指當虛無假設為真時,統計的樣本及其他相同極端樣本出現的機率。p值越小,代表越有信心拒絕虛無假設。在p值小於0.05的狀況,通常被認為有強烈的統計顯著性可以拒絕虛無假設。

得到結論[編輯]

經過分析之後,便可以知道這個實驗是否支持假設。若數據支持便可接受該假設,反之則駁斥該假設。

發表理論[編輯]

研究的結果時常會被發表到專業期刊和研討會,並接受同業的檢驗,在科學社群中互相討論,接受他人提出的疑問並解釋自己的論述。若無法回覆疑問與攻擊,或被找出研究的缺漏之處,就會被淘汰出局,回到先前的步驟重複進行實驗。理論是指一種經過組織化的信條,被用來解釋我們所觀察到的現象,通常受到三個準則來檢核:簡易性廣泛性概括性。我們通常希望依靠更精確的「最少的理論」,來陳列出有限、特定的觀點來解決人們為何會有某行為、並為此行為做精準的預測,且可以被實際的研究者所研究。

重複驗證[編輯]

最後,實驗會經由不斷的重複加以驗證,若其他研究者也能得到相同的結果,藉着測試假設來得知結果,能帶給這個結論更多支持,使理論更加穩固。累積重複成功的證據是科學社群自我修正的方法,而且這是最可能達致其目標,尋求真相的方法。

心理研究法種類[編輯]

整理[編輯]

  1. 個案研究法 (Case Study)
  2. 觀察法 (Observational Method)
  3. 調查法 (Survey Method)
  4. 實驗法 (Experimental Method)
  5. 相關法 (Correlational Method)
  6. 測驗法 (Test Method)
  7. 心理測驗法
  8. 焦點群體法 (Focus group Method)
  9. 德懷術 (Delphi Method)
  10. 經驗總結法 (為教育心理學常使用之方法)
  11. 大數據研究法

個案研究法(Case Study)[編輯]

個案研究是以個人、團體或機構之狀態或行為,或這些相關因素之間的關係為對象進行更深入的研究,藉由多方面的資料蒐集及分析討論,期待能發現其內隱的特質或規律,最後再以邏輯性導向的思考過程,尋找解決問題的方法。


優勢:

  • 資料幅度大、層次深,使研究者得以提出有效且具體的解決辦法。
  • 由於其主要為研究少數個體,讓研究者相對容易聚焦於某些目標,並深入探索,最後找出真相。
  • 此研究法不需要操作和實驗,適合運用於知識過程中的分類探索、形成假設階段。

劣勢:

  • 歸因於研究本身具有主觀性且樣本小,還缺乏個案變項的控制能力,從而限制了研究者將結果廣泛推論到其他個案的可能性。(所謂主觀性,乃因個案研究法是以經驗為主的調查法,導致不同觀察者所得出的結論可能會有所出入。)
  • 選樣不易,資料不一定具有代表性。如誤以某偶發問題而做概括的結論,則難免以偏概全之弊。

個案研究會透過蒐集的資料而成個案歷史,若蒐集的資料僅有一個人所記錄的,例如傳記,因為是用回憶法,可能會造成曲解或誤失,甚至會面臨文案隱惡揚善的風險,也容易被記錄者的主觀所影響。因此不該僅以傳記這類型的紀錄為資料來源。

心理學家在進行個體研究時,多重且深入的資料來源可以形成更全面、深入的理解,資料來源常用的有文件(documentations)、檔案記錄(archival records)、訪談(interviews)、直接觀察(direct observation)、參與觀察(participant observation)、人工製品(physical artifact)。

1.文件 如信件、備忘錄、公報、會議記錄、報紙、簡報等等,有助於了解個案的社會、歷史、環境脈絡。 2.檔案紀錄 包括日常記錄、組織記錄、地方圖表、地圖等等,精確度相較於文件來的更高。 3.訪談 目的為協助研究者得以獲得只有口頭表達才能獲得的經驗與觀點、補充文件、檔案紀錄缺乏的資料、有助於研究者與研究對象對話、擴展問題的層次等等。訪談類型分為開放式訪談、焦點訪談、結構訪談等等。 4.直接觀察 直接觀察為觀察研究對象的現象或是情境,例如在會議、示威活動、工廠運作、班級活動等等中觀察,又依據是否會將成果寫出觀察報告分為正式觀察與非正式觀察。 5.參與觀察 參與觀察為研究者參與欲觀察的事件之中,學者Patton(1990)認為應不斷協調參與程度才是能蒐集更有意義的資料的方法,而學者陳向明(2002)則認為參與觀察中,觀察者和被觀察者一起生活,對於被觀察者有更具體的認識,可以更深入了解被觀察者的行為意義。 6.人工製品 如工具、藝術品、技術發明等等,可以讓研究者了解文化的內涵、技術、發明、藝術等等。

而資料蒐集也應遵守幾項原則: 1.多方蒐集資料 蒐集到的資料可能有些許的偏頗、錯誤,會有非常多影響研究的「變數」,所以需要依賴不同來源的證據,利用三角校正法,如果資料結果一致,就有機會發展理論芻型,並進行資料搜集與分析。 2.建立個案研究資料庫 從許多個案的資料蒐集整理,一方面當作資料校正的根據、一方面提供研究者更多參考資料 3.保持蒐集到的證據與研究問題間的關連 研究者應保持原始資料方便後續歸納,並使資料與研究問題持續具有關聯性,以免研究偏頗。

個案歷史也可能是根據縱貫式的研究而來。縱貫式的研究,是對個體或團體長時間的追蹤、定期評估並探討研究對象在不同時期的演變。所以,個案歷史也是研究者根據個人的計劃,進行實際觀察所構建而成的。

觀察法(Observational Method)[編輯]

觀察法是在自然情境或預先設置的情境中,對於被觀察者的言行舉止,進行有系統性的觀察,從而了解其心理活動的產生與發展規律。其透過人類感官運用科學的方法,探究一些行為或事件,並對觀察結果做系統化的分析,以及解釋其意義。科學的觀察具有目的性、計劃性、系統性和可重複性。常見的觀察方法有:

  • 核對清單法
  • 級別量表法
  • 記敘性描述

根據研究目的,研究者直接進行觀察並記錄個體或族群的行為活動或表現,從中去分析與解釋發現的相關問題。研究對象多半是難以表達自己心思意念的族群,例如:動物、嬰幼兒、兒童或精神病患等。觀察法也常使用在機構或組織運作中,以及對員工績效的評估。要注意的是,觀察法只能證明兩個變因之間有無「相關性」,無法推導出任何因果關係,也因此若要釐清不同變因之間的因果關係,仍須透過實驗法,且觀察法通常只能觀察到行為和自然的物理過程,無法從中了解被觀察者的動機、態度、想法以及情感,並且觀察法僅限於公開的行為,因此此行為的代表性至關重要。

觀察法廣泛適用於了解某人的心理過程、狀態 、個性等,它是教育過程中,教師了解學生心理最主要的方法。例如:教師透過觀察學生在各方面日常生活的表現,可以了解學生的感知、記憶、想像、思維等心理過程以及興趣、性格、能力等心理特徵。此外,觀察法不僅限於觀察行為,還包括了解其他一切有關的材料,例如:日記、回憶錄等等。因此,觀察法有直接觀察和間接觀察之分。根據研究的需要與時間,還可區分為長期觀察與定期觀察。最後,根據觀察的內容,可分為全面觀察與重點觀察。全面觀察會觀察受試者的全部心理表現,重點觀察會選擇某些方面的心理活動進行觀察。

運用觀察法時,觀察者和被觀察者之間的關係有兩種方式:

  1. 參與觀察者:觀察者是被觀察者活動中的一個成員。
  2. 非參與觀察者:觀察者不參與被觀察者的活動。原則上被觀察者不能發現自己的活動被他人觀察,否則容易使被觀察者產生異於正常情況下的行為,即所謂「霍桑效應」,進而導致觀察結果發生偏差或錯誤。

優點

  • 具有及時性的優點,並能夠捕捉到正在發生的現象與意料之外的素材。
  • 受客觀環境影響,不便在實驗室中進行者只能用觀察法。
  • 與調查法相較,事先準備好的表格及問題,並不能道出受調查者全部生活或欲知事項,觀察法可補其不足。
  • 在自然狀態下的觀察,能夠獲得更為生動、真實的資料。

缺點

  • 因觀察者的個別差異與主觀意識,容易產生觀察偏差或錯誤。
  • 真正要觀察的事往往可遇而不可求,有時只好事後訪問。
  • 人類社會有許多現象不適宜或不可能直接觀察。
  • 若欲觀察的事項太複雜,僅能得知其行為表現,並不能完全了解被觀察者的思想意志。
  • 不適合用在大面積、低人口密度的區域。
  • 所需的時間成本較高。
  • 僅能觀察表面上的行為
  • 受觀察對象限制,像一些秘密團夥則不易觀察
  • 無法確實了解被觀察者的動機、想法、情感


依照向度又可將觀察法細分為:

自然觀察法(Naturalistic observation)
研究者在自然環境中直接對研究對象進行觀察、紀錄,和分析解釋以獲得某種心理原則或行為準則。自然觀察法是較傳統的方法,其優點在於它可以通過觀察直接獲得第一手資料。缺點則是觀察將受到觀察者的主觀判斷及分析能力所影響,而且往往研究員想觀察的現象是可遇不可求,其不確定因素較大。
但相對的,自然觀察法較容易實施且成本也較低,故在開始做嚴謹的實驗研究或相關研究以前,可先以自然觀察法研究來挖掘有關的變項,提供預備的知識,以免後來做實驗研究時知識短缺不足。
設計觀察法
設計觀察法是指調查機構事先設計模擬一種場景,調查員在一個已經設計好的並接近自然的環境中觀察被調查對象的行為和舉止。所設定的場景越接近自然,被觀察者的行為就越接近真實。
掩飾觀察法
眾所周知,如果被觀察人知道自己被觀察,其行為可能會有所不同,觀察的結果也就不同,調查所獲得的數據也會出現偏差。掩飾觀察法就是在不為被觀察人、物、或者事件所知的情況下監視他們的行為過程。
機器觀察法
在某些情況下,用機器觀察取代人員觀察是可能的甚至是所希望的。在一些特定的環境中,機器可能比人員更便宜、更精確和更容易完成工作。
結構性觀察法
指研究者創造出一個情境,並觀察參與者被此情境引導出的特別行為。例如,學者想研究關於火災發生時人們應對的反應,他只需要一個緊急火災廣播便可以模擬出一個特殊的現場,在進行結構性觀察之前需先提出假設,並列出欲觀察項目的清單。

調查法(Survey Method)[編輯]

有些問題無法直接觀察研究,因此研究者透過各種形式的調查方式藉此詢問紀錄研究受訪者的態度及反應。調查法以大眾所關心的問題為範疇,透過嚴格抽樣設計選擇具代表性的樣本,預先擬定問題收集目標對象的意見,是一種透過抽樣原理與技術追求一般性事實的研究法,而調查結果非常依賴受訪者回答的品質和態度。

主要種類可分為「普查」和「抽樣」:
  • 普查:針對調查母體中的每個元素進行資料的搜集,因此資料較為齊全,同時分析之結果也較接近事實真相;但耗費成本較高,因必須有縝密的事前計劃,在實施過程中也需要動員大量人力,所以並非所有的研究者皆能實現普查;此外,若缺乏適當的管理、追蹤、考核,則會因受訪者良莠不齊而容易產生資料品質不均。
  • 抽樣:從調查母體中抽出一部分的元素進行資料的蒐集。因此調查內容相對較為深入,同時不須耗費大量的人力、金錢及時間。在執行上容易管理且確實,但因樣本僅為全體之局部,必須進行統計推論。在事前計劃中,抽樣方法與樣本數在決定上易有困難,而造成後續估計的誤差問題。
調查的實施方式:
  • 問卷法(Questionnaire Method):多以問卷的形式進行,提出一系列問題。 優點是能夠同時調查較為快速且有效率。缺點是很難控制填寫者的回答狀況以及對題目設計的理解與否,同時取樣上也可能產生偏差,例如:在網絡社群上發佈問卷導致取樣的族群有所偏差,如年齡或是背景相似。因此在問卷設計上需特別留意設計的嚴謹性,同時在取樣上也要注意合理性。相較於訪問法,問卷法較為省時省力,但是沒辦法獲得較深入的資訊。同時亦需要考量問卷回收率,如何提升回收率以利於後續分析。
  • 訪問法(Interview Survey):通常採面對面、一對一的方式進行,實施成本較高。但缺點在於,訪問結果樣本數不夠時,可能產生結果過於一致,將有參考性不足的問題。與問卷法相比較耗時、費力,在執行上難度較高,且不適合做量化的統計分析,但是可以取得較深入的資訊,並且較能了解受訪者的想法,彌補問卷調查的不足。

我們可以利用調查法來獲得政治傾向、消費偏好、 健康看護需求等易取得的資料。一次正確的調查必須事先擬妥問卷、訓練晤談者、慎重選擇樣本、保證研究樣本的反應者能夠代表研究的母群體,並用正確的方法來分析及報告資料,以便能正確地闡釋結果。由於調查法是以樣本行為的特徵來推論母體行為特徵,所以調查法也稱做抽樣調查

調查法的優點是能以有限的案例得到大量受訪者的資料。但其價值只有在受訪者誠實報告的時候才存在,而使用問卷時用語清楚、表達明確與否都會影響受訪者的回答,因此在製作問卷時,應使受試者均能清楚了解訪問內容,避免使用過多艱難字句或雙重否定等。此外,抽取的樣本是否能夠代表母群體也是相當重要的議題。

實驗法(Experimental Method)[編輯]

實驗法的重點在於對實驗情境的高度控制,以便我們對感興趣的因素加以操弄,進而找出兩變數間的關係。科學家會操控其中一個變項 X 使它變動,觀察變項 X 的改變對於另一個變項 Y 所造成的影響。例如:睡眠時間與工作效率又有什麼樣的關係?若是以前述的例子來說,睡眠時間是變項 X ,那麼工作效率即是變項 Y 。建立實驗假說,也就是對於特定因素所產生之結果的預測,有助於釐清不同變項的因果關係。

名詞介紹[編輯]

  • 相關系數(correlation coefficient)
在統計上,時常使用皮爾森積動差相關系數來衡量兩個變量之間的相關程度。相關的大小以相關系數(r)來表現。當 r 值大於零是正相關,等於零是無相關,小於零是負相關;|r|< 0.4 為低度線性相關,0.4≤|r|< 0.7 之間為顯著線性相關,0.7≤|r|< 1 之間為高度線性相關。相關實務研究上,相關性設計比真正實驗設計或準實驗設計還要容易被執行。但是,經驗不足的研究者容易被變項間的相關度所誤導,進而誤認為兩者間有其因果關係。
  • 決定系數(Coefficient of determination)
又稱判定系數(以R2r2表示),與相關系數(r)的涵義不太相同,在統計上用於衡量自變數X對應變數Y的解釋程度,也可以說是模型的擬合程度。範圍在介於0和1之間,決定系數愈接近1代表模型的可信度愈高、解釋效果愈好。
  • 自變項(Independent variable)、應變項(Dependent variables)
實驗目的為找出一個變項 X 的變化如何會對另一個變項 Y 造成影響,那麼 X 就是實驗中的自變項,而 Y 為實驗中的應變項。故自變項為實驗者自行控制的變因,而應變項則是自變項改變後所產生相應變化的項目。
另外也需要考慮控制變量,也就是其他可能影響實驗結果的變量。通常我們無法找到與控制全部的因素,所以實驗上一定會有誤差,因此要盡可能降低錯誤,才能有客觀的實驗結果。
  • 實驗組(treatment group)與控制組(control group)
在實驗中,通常會將受試者分成兩個或以上不同的組別,不同組別之間在自變項的部分有着不一樣的處理,分別稱其為實驗組與控制組,兩者之間以實驗目的做出區別。有了控制組與實驗組進行對照,就可能了解自變項究竟會對應變項造成什麼樣的影響。
在進行實驗時,實驗組與控制組兩者,除了自變項之外的條件皆要維持一樣,或至少要盡可能地相似。若以數學函數的方式來解釋的話,可以這麼理解,設有一多變數函數 ,若是我們想要找出 的關係,就必須要固定其他的變數 ,...;那麼「自變項」就是選取的不同 值,而「應變項」就是獲得的不同函數值
  • 外在變項(exogenous variable)與干擾變項(confounding variable)
如同先前提到,實驗時必須確保實驗組與控制組除了自變項以外,其餘條件皆要相同,然而這在實際情況中幾乎不可能達成。在Stanley Schachter的實驗中,實驗者不可能找到兩組年齡、膚色、頭髮長度、學歷、家庭、性格、智商、內涵等條件完全一樣的人,儘管如此,有些變因事實上幾乎不會影響實驗結果。因此科學家會特別注意幾個可能會影響結果的變項,讓實驗組和操作組在這方面盡可能的相同。先前提到的雙胞胎實驗便是如此,即使同卵雙胞胎擁有 100%相同的基因,也不會擁有完全相同的成長歷程,因此無可避免表觀遺傳學所造成的基因調控端誤差,而實驗者仍盡可能減少基因造成誤差,並討論這些誤差可能對實驗結果造成何種影響。
外在變項的一個常見的例子就是抽煙(自變項)會致癌(應變項),但是吃燒烤物(外在變項)也會致癌,所以在進行實驗時會盡量將這些影響排除掉;否則兩個變項同時存在時,將無法確認到底是哪個變項影響結果。干擾變項也可以舉一個簡單的例子,假如有人要調查穿短褲的人數比例(自變項)與雪糕銷量(應變項)之間的關係,實際上,雪糕銷量與氣溫也有關係,然而天氣熱時穿短褲的人亦會增加,因此氣溫便是這個實驗中的干擾變項。
外在變項時常造成實驗的失敗,因此科學家和心理學家需仔細思考並盡量排除掉該變項的影響。使用隨機分配為一種降低外在變項影響的方式,也就是每一個受試者會有相同的機率分到任意一組。如此一來,實驗組和操控組的受試者的所有條件,在平均而言會接近一致,如此在進行實驗時,結果的真實與正確性即大幅提升。

實驗設計方法[編輯]

進行實驗設計時,依據受試者接受一種或多種實驗處理,可分為受試者間設計(或稱獨立組設計:independent-groups design)、以及受試者內設計;依據受試者的分組方式,還可分為隨機組設計、配對組設計。實驗設計需考量受試者的招募、實驗成本、或最小化實驗次數等等,選擇適合的實驗方法。

  • 受試者間設計(Between-subjects design):將所有受試者分組,一組給予一種處理,每組的處理方式皆不同。
  • 受試者配對設計(Matched subjects design) :每個測試使用單獨的一個實驗組,每個實驗組內每位受試者與另一組中具等效的受試者進行配對。
  • 受試者內設計(within-subjects design):不將受試者分組,對於同一批受試者施予多種實驗處理。
  • 混合設計(mixed design):當實驗中有一個以上的變項時,針對不同變相採用受試者間設計或受試者內設計。
  • 隨機組設計(random-groups design):將受試者隨機分派到不同的組,在統計學上期待受試者平均的分佈。
  • 配對組設計(matched-groups design):將受試對象按某些特徵或條件配成對,然後分別把每對中的兩個受試對象隨機分配到不同處理組。
  • 自然組配對(natural-groups design):進行配對的條件為自然的特徵。
受試者間設計(Between-subjects design)
意指實驗中所有受試者將進行分組,每一組僅實施一種實驗操作,且每一組的實驗操作皆不同。此方法的優點是較為簡單且安全,因為受試者只會在其分派到的組別做某一個特定實驗,可以有效減少實驗操作而產生的變項。然而,此方法對於不同組之間的差異十分敏感,因此除了招募受試者可能較為困難且關鍵,也需透過謹慎的方法進行分組,以減少組間差異。
在某些情況下,只能採用受試者間設計,不可使同一批受試者接受所有實驗處理,像是要量測不同環境下受試者完成一份試題所需要的時間時,受試者便可能因為熟能生巧而使後來的測驗時間縮短,導致實驗錯誤。另外,進行多變項實驗時,使用受試者間設計也較為適合、簡便。
受試者配對設計(Matched subjects design)
意指每位受試者或每個自變項僅接受一個層次測試,且在另一組有等效配對對象,統計方法為相依樣本 T 檢定。使用此設計的優點是可將受試者變項,如性別、年齡、階級、教育程度、智力、性格傾向等影響減至最低,缺點是配對不易。以一項比較兩種新的閱讀教學方法的研究為例,研究人員想要比較兩種方法,近代和現在的教學方法,並選擇兩組兒童,根據他們上次閱讀理解測試的結果將兩組兒童配對。若研究人員想測試另一種方法,則必須再找到三個可比較的孩子來比較三組。受試者配對設計也可以同時配對多個變量,例如在規律運動是否能改善療養院居民心血管健康之研究中,研究者可以配對受試者的年齡和性別。
受試者內設計(Within-subjects design)
意指受試者將不會被分組,而是利用同一組受試者接受所有的實驗操作。此方法最顯著的好處,是可以排除絕大多數的個體變異,使得受試者招募條件簡單。然而,此方法較為複雜且不安全,因為同個受試者經過前面的實驗操作後,可能影響後來實驗的表現,雖然可透過延長兩個實驗間的時間,使實驗的順序或彼此的影響的程度降低,或改變不同受試者之間實驗的進行順序,進行對稱式的實驗,在實驗設計與數據分析時仍需特別謹慎。
以探討老師的表現與學生暴力傾向的實驗為例,由於實驗與個體本身的個性息息相關,找到兩組條件相當的受試者將十分困難,若採用受試者內設計,即可有效解決。然而,若時序較早的實驗中,老師展現了暴力傾向,影響受試者的個性,即使在後來的實驗中,老師被要求不能展現暴力傾向,前面實驗所造成的影響卻可能還存在着,使實驗結果出現偏差。
  • 多個自變項
有時候科學家也會選擇使用多個自變項來進行實驗,而其中一個好處就是看到這兩個變項會不會交互影響。舉例來說,若要探討溫度(自變項一)與打字速度(應變項一)的關係,不妨再加入一個螢幕亮度(自變項二),那麼實驗者可能會發現只有當螢幕很亮時,溫度才會對打字速度造成影響,如此我們可以發現兩個自變項的交互關係。(自變項:溫度、螢幕亮度;應變項:打字速度)
  • 多個應變項
在一個實驗中,結果可能不只含有一個變項,科學家也常透過同時觀察多個不同應變項,來獲得更全面的資料。以上述探討溫度(自變項一)與打字速度的關係的實驗來說,實驗者可能除了打字速度(應變項一)外,同時也會記錄受試者拼音的正確性(應變項二),以得出溫度對於打字「表現」的影響。『自變項:溫度;應變項:打字速度、拼音正確性』

測量與統計[編輯]

實驗法不外乎也是遵循着先前所提到的研究程序,當要研究一個心理學議題時,會先觀察現象、蒐集資料、形成假說並設計一個可行的實驗,而在進行實驗時一個最重要的部份便是「測量」。

測量是一套將變項數值化的方法。在心理學研究中,有時實驗者可以使用物理方法直接進行量測,例如藥劑的投放量、受試者的血壓、心跳等數值;然而有些變項難以使用儀器量測的,例如受試者對一個外在刺激感到疼痛的程度,由於感受是一種抽象的東西,實驗者往往需要透過一些系統化的手法將此變項量化,而一種常見的方法是 5 點量表,或稱李克特量表(Likert Scale[1]),主要用來測量受試者對於一項描述的主觀或客觀判斷,通常是對該描述同意或不同意的程度,典型的李克特量表將受試者的判斷結果分為五種:非常不同意(very unsatisfied)、不同意(unsatisfied)、無意見(neutral)(即不同意也不反對)、同意(satisfied)、非常同意(very satisfied)。藉由上述所提及的方法即可達到將變項量化的目的。

Rate your experience about using our products
Very unsatisfied Unsatisfied Neutral Satisfied Very Satisfied


通常實驗者在蒐集到資料以後便進行數據分析,會使用統計(statistics)的方法來歸納並解釋。當科學家說研究結果具有統計學意義時,這意味着觀測方法、相關研究和實驗產生的數據為得出有關它們的結論提供基礎。這些數據可能代表種種統計資料,例如智力測驗的分數、血液樣本中的荷爾蒙的量、檢測視覺信號所需時間的微小差異或心理學家可能正在研究的任何其他內容等。與其他科學家一樣,心理學家使用描述性和推論性統計數據,來歸納數據並且解釋其中的含義。

描述性統計(Descriptive Statistics)
一個常用的描述性統計值是平均數(mean),即將一組的數值全部加總再除以個數。將實驗組與控制組的平均值進行比較,即可發現自變項與應變項的關係。例如,一組學生在測試中的表現可以通過該組的平均得分衡量。通過將所有得分相加並將總數除以得分數來確定平均值,並且描述男女的表現差異也可以透過計算兩者平均分的差異來表達。
然而有一個需要特別注意的地方:量測時必定存在着誤差,而且有時會有極端值的產生,因此若是兩者平均值的差異極小,會讓實驗者難以判斷結果的正確性。因此唯有當控制組的平均值之間的差異達到一定程度,才會稱之具有「統計顯著性(Statistical significance)」,表示結果受極端值之機率極低,如此一來研究者才可相信兩者的差異來自於自變項之影響。此外,心理學家想要描述兩個變量之間的關係時,他們使用描述性統計量,並將它稱之為相關系數。
莖葉圖
 
一般而言,常用做為描述統計量數的包括:
  1. 次數分配(frequency distribution):包括次數分配表、莖葉圖(stem and leaf display)、及各種圖示法(graphic representation)。  
  2. 集中量數(measure of central tendency):包括平均數(Mean)、中位數(Median)、眾數(Mode)等。   
  3. 變異量數(measure of variability):包括全距、平均差、四分差、標準差及變異數。
  4. 相對地位量數(measure of relative position):包括百分等級、百分位數、及各種標準分數。
推論性統計(Statistical inference)
幫助心理學家做出推論的數學操作,亦即從他們的數據中得出結論並使假設成為可能。例如,假設一組創傷後壓力症候群(PTSD)受害者在接受眼動脫敏再處理(EMDR)治療後,其焦慮測試的平均得分低於 10 分,並且未治療的對照組中受害者的平均得分下降了一點。
然而,推論統計數據使得研究人員估計兩組平均得分之間的差異是由於偶然的因素引起的,而非由於他們接受了不同治療所導致的影響。其他推論統計也可以幫助心理學家決定:兩個變量之間的相關性顯著到足以表明兩變量間確實存在某種關係,而非僅只是一種僥倖。
當推論統計的數據表明相關系數大於預期時,科學家們就會認為結果具有統計學意義。雖然僅憑統計顯著性並不能確保最終假設一定成立,但其所帶來的發現是值得關注的。

實驗法的優缺點[編輯]

  • 優點:可以找出一個事件的「因」與「果」,比起其他的研究法,受試者是在一個經過設計、小心監控的環境下進行實驗的,得出的結果是可以較為準確的,因此心理學家通常會比較偏好使用實驗法來進行研究。
  • 缺點:實驗法有其限制,會有道德問題或實驗誤差等狀況。舉例來說,若要研究家庭環境對小孩智力發展的影響,實驗者不能直接將一群嬰兒在人為刻意營造的環境下養育成人,其代表着貧窮家庭的受試嬰兒挨餓,而富裕家庭的受試嬰兒則過分溺愛、任其予取予求,這是非常不道德的。另外,有些情況下,實驗的觀測反而會干擾到受試者,成為一個外在變項,進而影響結果。比如說,如果要觀察一般人是否會在四下無人時選擇闖紅燈,在進行實驗時,受試者若知道自己正在被觀察著,部分的人可能會因此選擇遵守交通規則。在這個例子中,實驗並不能正確的模擬「無人監測」的情境,且導致實驗結果的誤差。再者,實驗法可能會受期待效應影響,受試者可能會根據已知的期待做出回應造成實驗誤差。上述情況中,實驗法顯然是不適用的,因此心理學家便只能依靠其他研究法繼續進行研究;舉例來說,研究者可用雙盲(double-blind)實驗排除期待效應,讓實驗者和受試者都不知道現在正進行的實驗內容。

相關法(Correlational Method)[編輯]

對於一些實驗而言,實驗者難以對其做到精準控制,例如對於人腦功能感興趣的實驗者,並不能直接對腦的任何部位來進行實驗。但是藉由觀察腦部受損所影響到的行為,便可得知腦部對應部位的功能。這種沒有實驗控制的配對組合方法,稱為相關法。基於過去的觀察、個案研究、或是進行問卷調查得到的資料,當有大量的資料可運用時,若是明確想了解兩個變項之間的關聯程度,通常會藉由相關法來進行研究。相關法雖能得知一個變項是否伴隨着另一變項改變,但無法保證其間具有某一因素的改變可「引發」另一因素改變的因果關係。

此方法通常是發現關係的最佳方法。假若我們有進入大學的高中生的成績記錄,則發現高中成績與大一新生成績之間關係的最佳方法,就是求兩者間的相關;也就是看是否高中成績較好的學生,在大學的成績亦較佳。

至於某相關是否具有顯著性差異,則必須要有更多的補充資料。前述問題和「兩個平均數間的差異是否顯著?」的問題一樣。舉例來說,若研究的案例很少,而且呈現高度的相關,此相關的統計顯著性或許不佳,因為若研究的案例剛好是母體中的少數,則在所有的母群體當中,研究得出的高度相關可能是不存在的。因此統計學家已發展出許多公式,來說明相關的顯著性。值得注意的是實驗法和相關法間的不同:在實驗法中,一個變項(自變項)受到系統性地操弄,以決定它對某些變項(應變項)的影響效果。同樣的因果關係,不見得可以從相關法的研究裏推測出來。

相關系數的定義[編輯]

兩個變項之間的關聯程度可以用相關系數 (correlation coefficient ) 來估計,符號通常用 r 表示,其值介於 -1.00 與 1.00 之間,數值(絕對值)代表着相關程度,符號代表着相關方向,常用於計算相關系數的公式為

一般而言,科學家會依據相關系數的大小將兩個變項之相關程度做分級。相關系數的表示,可由實際測驗結果的圖表表達得更為清楚。以下為相關系數幾個主要的定義:

相關系數 意義 說明
r = +1 表示在二個變項之間,有着完全的正相關。 假若體重和身高完全正相關,那麼若已知一個人的身高,便可正確地說出其體重。當相關為正,通常 把「+」省略。
r = -1 表示完全負相關。 例如,車齡越久, 其價格越低,同樣若車齡已知,則價格亦可得知。而車齡和其價格間的關係,可用相關系數 r=-1 來表示。
r = 0 表示毫無關係(零相關)。 意指知道一個變項的值,對另一個變項的預測毫無幫助。
-1< r <1 表示不完全相關。 相關程度由相關系數絕對值接近 1 的程度來決定。同樣大小的正相關或負相關,代表相同的關係程度。

相關系數並非百分比,因此 r = 0.25 不能解釋為 r = 0.50 的一半。至於相關系數間的關係,是以平方來表示。例如, r = 0.70 (0.70^2 = 0.49)表示其關係近乎 r = 0.50 (0.50^2 = 0.25)的兩倍 ( )。並且,對於不同實驗而言,r的值也並非完全可以做比較,當資料庫大小較大時,其r值也會越精準,而每個實驗也有不同對應的r值。

相關法的優缺點[編輯]

相關法的優點是在某些不能使用實驗法的情況下可以協助進行研究。例如「有被虐待經驗的孩童,其腦部發展是否會比一般孩童遲緩」等,這種如果用實驗法會違反施測倫理的研究,便可用相關法代替。然而其缺點在於不論兩個變項之間是呈正相關或是負相關,研究者皆無法確認何者為因、何者為果。因此,若缺乏實驗證據,就不能以相關證據推論其因果關係,這是非常重要的一點。

舉例來說,街上柏油的柔軟度和中暑病例的數目有相關, 但這並不是說柔軟的柏油會散發某些毒素使人中暑,炎熱的太陽使得柏油軟化,同時也可能是造成中暑病例的原因,這兩個原因可能相關也可能無關。當兩個變項互有相關時,一個變項的改變可能是另一個變項的原因。但缺乏證據時,便不能下這種結論。

測驗法[編輯]

以現階段的心理學而言,測驗是一種重要的研究方式。其可用來測量各種能力、興趣、態度及成就。測驗法給予心理學家一個不干預大眾生活的途徑以獲取資料,且不必花費大量時間和心力裝設實驗設備。測驗法為提供一致的情境給一群人,研究這群人在各種情境下(如智力、手的靈巧度、焦慮及知覺技巧等)的反饋差異,分析測驗分數與受測者特性之間的關係。

然而,測驗的建構及運用並不簡單,包括準備題目、量尺化及建立常模等許多步驟。

信度(reliability)[編輯]

指的是測量方法的品質,即對同一現象進行重複觀察之後是否可以得到相同資料值。科學研究者試圖使用一系列的指標來測量個人或社會現象。可信度概念是研究者們提出用來測量的量度工具穩定的程度。比如說如果用磅秤來測量一個人的體重,如果第一次稱重是 100 公斤,而第二次稱重是 150 公斤,那麼很明顯用這台磅秤來反應體重不是很可信的辦法。這個類比也適用於其他的社會科學測量方式,比方各種問卷調查、心理量表、以及更廣義上的觀察。

  • 基本原理
  • 從受試者內在的變異加以分析,用測量標準誤說明可靠性的大小。
  • 從受試者相互間的變異加以分析,用相關系數表示信度的高低。
  • 類型
  • 內部一致性
  • 評分者間信度(不同評分者評分之相關性)
  • 折半法(將研究項目分成平分兩部分之間的相關性)
  • Cronbach's α 系數(平均所有可能的折半組合之系數)
  • 長期穩定性:再測信度(藉由再次的施測或觀察,計算分數間的相關性)
  • 等值性:複本信度(計算相似但不相同的兩份測驗施測後得到分數間的相關性)
  • 衡量信度的方法:
・評分者間信度(Inter-rater reliability):由於個人因素的影響(如情緒、既有觀念等),有些測驗不能以客觀的方法進行鑑定,例如作文考試。所評的分數通常受評分者的主觀感受而受到影響,因此要由 2 人或以上各自根據標準評分,再求大家分數是否大致相同。
・折半信度(Split-Half Reliability):折半信度是將受測題目分成前後兩半,再求取前半段與後半段之題目的相關程度,若相關程度很高就代表折半信度很高,是考驗衡量的同質性。由於此相關只是半個測驗分數求得的,並非整個測驗的信度,其信度還必須使用「斯布公式」(Spearman–Brown prediction formula)等加以校正,才能求得正確的信度。
     斯布公式(Spearman-Brown formula)的一般形式為: ,其中是可測試的信度,n是新測驗的長度相對於原測驗的倍數,rxx'是原測驗的可信度。
・內部一致性信度(Internal consistency reliability):同一個測驗中不同子項目是否一致,例如量度「外向」,可以用「朋友數目」、「友善程度」、「經常笑」等來測。一般可用克隆巴赫系數(英語:Cronbach's alpha)來檢驗。
     克隆巴赫係數,又稱 alpha 信度(alpha reliability):對於同一個概念經常存在多道不同的題目,或甚至有多份不同的量表;不同題目或不同量表所測出結果的一致性,以相關係數之期望值表示,就是它們的「alpha 信度」。一般認為「alpha 信度」的值具有下列意義:
Cronbach's alpha Internal consistency
α >= 0.9 Excellent
0.8 <= α < 0.9 Good
0.7 <= α < 0.8 Acceptable
0.6 <= α < 0.7 Questionable
0.5 <= α < 0.6 Poor
α < 0.5 Unacceptable
・再測信度(Retest Reliability):再測信度是讓同一組受測者,於前後兩個不同時刻做兩次測驗,再求兩者結果的相關系數,此系數就稱為再測信度 。此系數可以表示測驗結果的穩定性,故又稱為穩定系數(coefficient of stability)。最適當的時間間隔依測驗的目的和性質而異,通常少則兩週,長則六個月。
・複本信度(Equivalent-form Reliability):複本信度是設計者有時候會在同測驗中有兩種以上的複本,受試者先用其中一卷進行測試,同組人或另外一個人再用另一卷進行測試,而這兩種測驗結果的相關系數即為複本信度,目的是為了讓不同程度的受測者能夠明確知道問卷題目之用意。

效度(validity)[編輯]

即有效性,評量一測驗或工具是否能滿足其測驗意圖。最主要的概念為建構效度(Constructive Validity),指測量工具能測量理論的程度,其中有六種效度類型:表面效度、內容效度、同時效度、預測效度、聚合效度和區別效度,進一步可以大致分為兩類:翻譯效度(Translation Validity)和效標關聯效度(Criterion-related validity)。

  • 翻譯效度(Translation Validity)
翻譯效度意指將建構概念準確地「翻譯」為可操作化的程度,其重點在於可操作化是否良好反映了建構概念的真實含義。以下分為兩類:
  • 表面效度(Face Validity):指測量工具經由受試者或研究者主觀覺得與研究主題相關。泛指受試者一看到測量工具,就知道研究者在測量什麼的問卷。高表面效度的問卷更能獲得受試者的合作並提高作答意願,不過在某些測驗會忌諱高表面效度,例如有關人格的測驗,高表面效度受試者越可能虛偽作答。因此對於這些有可能存在表面效度的調查時,應該避免而另尋解法。
範例:設計一份「案主對機構服務的滿意度」問卷時,案主或你的同事一看到問卷內容就知道是在做滿意度調查,具高表面效度。
  • 內容效度(Content Validity):指某測驗之題目內容是否周延、具代表性、具適切性並確實包含所欲測量主題的內涵。為了讓問卷具有內容效度,研究者會去詢問專家的意見或參考相關文獻。
範例:設計憂鬱症量表時,我們可以根據 DSM-IV,將憂鬱症所包含行為及心情等表徵納入問卷設計中;設計「同性戀者對社會適應的程度」的問卷量表,由於現有文獻不是非常充足,所以可以諮詢專家的意見,使量表更周延、適切。
指某種測驗能去測量某個理論的程度。如果測量工具與想要的概念相關聯性很高,我們稱為聚合效度(Convergent Validity);反之,若測量工具與目標概念不具相關性則稱為分歧效度(Discriminant Validity)。實務工作者通常不太使用這個方法,只有需要測量理論的學者較常使用。
範例:設計一份關於「自尊」的問卷以了解自尊的概念,由於我們知道自尊跟「自信」的概念很相似(正相關;即自尊越高,自信越高),跟「自卑」的概念剛好相反(負相關;即自尊越多,自卑越少),透過文獻找出測量的量表,讓同一群受試者填寫。若你設計的自尊量表與自信量表測出的結果有高度正相關,與自卑量表呈現負相關,即表示量表具有建構效度中的聚合效度。
  • 效標關聯效度(Criterion-related Validity):指該測驗分數與效標(具高效度的衡量工具)之間相關系數的高低。效標關聯效度是在測量具體的行為與實證資料上,其中分為下列四種。(效標:指測量工具所欲測量之特質的獨立量數,即檢定測量工具效度的標準。)
  • 同時效度(concurrent validity):衡量測驗工具之可操作化程度與現有實驗結果之關聯性,藉由同時進行兩種測量,比較兩份分數間的相關性。例如:給受試者聽一段含有次聲波的音樂,同時觀察其腦部情緒反應,以及詢問心理恐懼程度。
  • 預測效度(predictive validity):衡量測驗工具之可操作化程度與理論上可預測的實驗結果之關聯性,換句話說為某測驗與一段時間後另一變項的相關性。
範例:將設計的問卷 A 跟他人設計的問卷 B,同時或在不同時間給受試者填寫,把兩次的結果 A1 & B1 進行相關系數的比較。又稱實徵效度(Empirical validity)或統計效度(Statistical validity)。效標即可顯示測驗所欲測量或預測的特質之獨立量數,作為檢定效度的參照標準。
  • 聚合效度(convergent validity):是指衡量工具與實驗目標有較高的關聯。來自相同構面(潛變數)的項目,彼此之間的相關性要高,不會有效度不足的現象。
以相同方法衡量相同特質所得到的分數之間,相關性要高。以不同方法衡量相同特質所得的分數之間,應具有次大的相關性。
  • 區別效度(discriminate validity):指衡量工具應該與實驗目標無關。來自不同構面(潛變數)的項目,彼此之間的相關性要低,不會有效度污染的現象。
以相同方法衡量不同特質所得到的分數之間,相關性要低。以不同方法衡量不同特質所得的分數之間,相關性要最低或是無意義。

信度與效度的分別[編輯]

可信度高並不意味着測量方式更準確,測量方式的準確度是效度(validity)的問題。可信度所討論的是針對相同或類似的現象,是否能透過同一種測量方式得出相同的結論;而效度討論的則是能否測量想要量度的問題,例如運用天秤來測量高度就是一種效度差的測量方式。可信度高並不完全代表着有效度高(如一個秤磅每次顯示的公斤數都比實際上的數值多一公斤,顯示其可信度很高,但由於其並非顯示真實的數值,因此其效度並不高),儘管如此,可信度在某方面依然可以保證一種測量方式的有效度。然而,若一個測試的可信度較低,則其就一定沒有高的效度。

其他-心理測驗法、焦點群集法、德懷術、經驗總結法等[編輯]

德懷術(Delphi Technique):於 1960 年由美國蘭德公司發明,是一種尋求共識的研究方式。其大略的進行方式為請多位專家同時以匿名、書面方式,針對一個特定的主題表達意見,經過多次的討論與整合,是一種使專家們得以彙整各方面不同的意見及專業知識,逐步地達成共識,進而解決複雜議題的一種研究方法。
德懷術的實施原則如下:

  1. 匿名原則:所有參與調查的人員在不受干擾的情形下,自由發表個人的意見。
  2. 重複原則:不是一次調查就結束,而是由主持人針對相同的對象反覆實施調查。
  3. 回饋原則:每次調查都將其他人的意見提供給所有受調查者參考,以作為進一步填答的依據。
  4. 共識原則:主要目的在於獲得專家群的共識,以作為決定的依據,所以德懷術最後一定要到獲得一致的意見為止。

實施步驟

德懷術的優點在於它能夠有效地排除研究不夠嚴謹的缺點,對於具不明確性、複雜度高、具爭論性的議題可應用德懷術尋求出專家的共識。此方法與傳統的對談式討論不同,這些參與討論的專家都是以匿名的方式進行,因此所有人不會受到任何外界的干擾或影響,得以自由地發表意見並參與討論,同時也不受限於時間與空間的因素,任何時刻都可以進行討論。在現今,此種方法在軍事、商業、工業、政治、經濟、醫藥和教育等方面都有着廣泛的應用。德懷術的施行步驟如下:

  1. 確定所要探討的主題,並以問卷的方式列出問題。
  2. 尋求適合的專家組成德懷術小組,參與討論主題。
  3. 發送問卷,進行四回合的調查。
  4. 第一回合調查:詳細說明討論的問題與研究目的,請接受問卷的專家針對問題提出其看法或解決途徑,回收問卷並進行第二回合。
  5. 第二回合調查:整合第一回合的調查結果,再重新發送問卷給受調查者,提出贊成、反對程度或遺漏的部分。
  6. 第三回合調查:將第二回合的問卷調查結果以等第的方式進行排序。此回合的主要目的是希望受調查者將自己的看法與大眾的看法相互比較,再依照此一對比的結果,決定要堅持原先的看法,或者是被大眾說服,改變自己的立場。
  7. 第四回合調查:內容主要為前三次問卷中受調查者所做出的各種選擇,其目的在於讓專家們在參考過此次問卷的資料之後,做最後的決定。最後一回合的調查結果是為研究最終採用的依據,也是專家們共同討論、協調之後所達成的共識。
  8. 若四回合後受調查者仍無法達成共識,則可以再持續進行幾個回合,直到獲得共識為止,最終所獲得的結論採用眾數或中位數作為實驗結果的依據。

心理測驗法:根據已被標準化的實驗工具(如量表),刺激和引起被測試者的反應,所引發的反應結果由被測試者自己或其他人記錄,再通過一定的方法進行處理,給以量化,描繪行為的軌跡,並對其結果進行分析。這種方法的最大特點是對被測試者的心理現象或心理品質進行定量分析,具有很強的科學性。

經驗總結法—為教育心理學常使用之方法[編輯]

經驗總結法:歸納以及分析各種活動中的具體情形,使其系統化。整理前人的經驗,並且將好的部分長期運用,是目前相當行之有效的方法。

經驗:在活動中取得的知識或技能,這種經驗通常不是刻意安排的,常常是個人或是團體因為某一種際遇或是碰巧達到某種特殊條件而取得,因此科學性不高,但是如果經過理論研究者和實驗者不斷地把觸發這種經驗的人做整理、驗證、提煉以及加工,經驗就可能變成具有科學性的事實,而這種經驗一般會是在實施之後發現有良好效果後再統整,要能樹立正確的指導思想。此種經驗必須具備觀點鮮明、正確、先進、科學以及可以成為代表性的特性等。

經驗總結法的實踐步驟:
經驗總結法步驟
經驗總結法步驟
使用經驗總結要注意:對象具代表性、依據客觀事實並和定性定量結合、觀察全面、能區分現象和本質、具創新精神
經驗總結法在教育方面是歷史悠久的研究方法,後來教育心理學也有使用這個方法來研究,因為人類的教育思想有很大的一部分都是來自先人的智慧,不管在國內或是國外皆然,在教育科研發展迅速的現代,經驗總結法的科學化和規範化也不斷提高,此方法已經變成教育科研以及教育心理學專家發展研究的重要方法。
經驗總結法的重要作用
  1. 可以協助轉變教育觀念,透過不斷地進步提升教育的地位與影響力
  2. 揭示教育規律,可以極大的豐富教育理論,賦予科學意義
  3. 協助教育相關部門和領導者更加了解教育體系的優劣,正確地執行教育方針並制定政策
  4. 加強教師素質並提高教育品質
  5. 提高教育工作者的教育水準和教育科學研究水準

大數據研究法[編輯]

透過以上幾種研究方法,從質化研究(觀察法、訪談法等)的文字訊息得知如何運用量化研究(實驗法、測驗法等)將數據數字化。當研究對象從 N=1 的個案研究到 N>>1 時就變為大數據研究。但當研究的個體數量增加,就可能會出現個體差異導致的選擇性偏差(Selection bias)或是相關非因果的偏誤等問題,皆會影響信度與效度,因此要能發揮大數據研究的優勢,對高技術性實驗方法的要求也更高。

搜尋論文、期刊的方法[編輯]

Google 學術搜尋[編輯]

Google 有一個特別的功能叫做 Google學術搜尋(Google scholar),裏面囊括了世界上絕大部分出版的學術期刊,只要輸入關鍵字就可以找到相關的論文或書籍。另外,加上一些更細節的關鍵字,可以使得搜尋範圍變小,使搜尋更有效率、更快找到需要的論文。

APA PsycNET資料庫[編輯]

在心理學研究領域有一個比較專門的網站APA PsycNET,APA 是美國心理學會(American Psychological Association)的英文縮寫,當中涵蓋心理學、社會學、神經科學等領域,具有相當可觀的資料量。

各大專院校資料庫[編輯]

各大專院校所發行之學報期刊、中華心理學刊等重要研究成果文獻皆為國內學術專業期刊可供人參考。若想尋找學術論文,則可前往資料庫進行搜尋,如華藝線上圖書館、或是進入大專院校的圖書館系統之資料庫查詢,其中便包含全球許多地區的學術論文及期刊平台,此外台灣博碩士論文知識加值系統中可查詢各大學校的碩博士論文以此進行參考,以上方法為搜尋台灣的研究文獻。

中國知識基礎設施工程[編輯]

是中華人民共和國的一項知識工程,由清華大學直接領導。若想搜集對岸的論文期刊則可前往中國知網,平台提供海內外讀者一些重要的中國學術文獻及期刊。

PQDT資料庫[編輯]

如果想找尋美加地區的博碩士論文,可透過PQDT(ProQuest Dissertations & Theses)資料庫查詢論文索引摘要,裏面包含了商學財經類、綜合學科、人文藝術類、應用科技類等多種類型的資料庫,並可由數碼化論文典藏聯盟資料庫查得數位博碩士論文。

DART-Europe E-theses Portal[編輯]

搜尋歐洲地區之論文可前往DART-Europe E-theses Portal歐洲公開取用博碩士論文網進行搜尋。

研究的時間面向[編輯]

橫斷面的研究[編輯]

橫斷面(cross-sectionalCS)的研究是指一個研究在同一個時間點對受試者所做的觀察,這些群體都具有某些相同的控制變因,例如社會經濟地位、性別、智力、教育背景和種族等。此類的資料中,每個觀察單元只存在空間上的差異。

優點[編輯]

  • 可以在短時間,像是一年內收集到不同年齡層的樣本資料,不只省時、省力還省錢。
  • 這些受試者只需參加這一次的實驗,不需要再做實驗後的追蹤,所以不會有流失受試者的困擾。
  • 可以運用最新的理論。
  • 可以研究目前有興趣的研究。
  • 不用擔心對同一樣本反覆施測所產生的練習效果。

應用[編輯]

  • 在某一特定時間對某一定範圍內的人群,以個人為單位收集和描述人群的特徵以及疾病或健康狀況。它是描述流行病學中套用最為廣泛的方法。

問題與缺點[編輯]

  • 無法觀察個別差異的跨時穩定性:橫斷面的研究是在同一時間對不同樣本所做的測量,不同年齡層的資料不是來自同一個樣本,因此我們無法解決個別差異是否有跨時穩定性的問題。
  • 可能的解決方案:在蒐集橫斷面的資料時應盡可能地包含貫時性性質的資料。

貫時性的研究[編輯]

貫時性的研究是指一個研究對其所欲觀察的對象,進行橫跨一段時間的觀察,同時也能蒐集長期的變遷。其下又分為:

  • 時間序列研究(time-series,TS):研究者每隔一段時間收集一次橫斷面樣本資料,藉此瞭解這些資料在不同時間上所呈現的差異;研究對象不需是相同人群或樣本。
  • 世代研究:特定的某個世代在不同時間點的變化。
  • 追蹤研究(time-series-cross-sectional,TSCS,又稱縱橫研究縱貫性研究):對同一批研究對象在不同時間進行調查與研究,觀察單元間可能存在時間與空間上的差異。相較於時間序列研究,追蹤研究的困難度更高,也需耗費更多成本,因為追蹤的樣本很可能隨時間消失或變得無法聯繫。值得注意的是,樣本追蹤研究與世代研究不同之處在於,前者並不強調世代,並能清楚了解變遷的軌跡。例如:〈都是為了孩子?父母離婚負面影響之重新評估〉(陳婉琪,2014)。不過,隨着時間拉長,實驗者可能難以找到每一個受試者進行追蹤研究,這也是「固定樣本追蹤研究」的困難之處。

優點[編輯]

  • 能測量研究對象於不同時間之生理、心理、社會之變化。

問題與缺點[編輯]

  • 因縱貫性研究設計須長期於相同樣本上進行研究,故研究期間部份樣本可能因為遷徙、死亡等因素而流失或減少,使得研究結果受到影響。
  • 需要花費較多的時間與經費,如果無法大量取樣可能會影響研究結果的推論性。

研究的誤差[編輯]

所有的實驗都會發生誤差,例如,程序設計、儀器操作、樣品取樣、人為觀察等等。而所有環節都有可能出現偏誤,影響實驗結果的信度與效度,因此才更需要嚴謹的設計實驗,以減少誤差出現的機率和誤差對實驗結果的影響。心理學的實驗也不例外,而且更容易受到實驗參與者的情緒狀況所影響。以下介紹對實驗效度的威脅以及其改善方法,而後提及影響實驗效度的具體例子。實驗效度可分為兩類,外部效度和內部效度。內在效度是指實驗研究所操縱的實驗變項對依變項所造成影響的真正程度。外在效度是指實驗結果的可推論性程度,實驗結果的可推論性愈大,亦即其適用性、代表性愈大,越可推論到研究對象以外的其他受試者。

內部/外部效度
效度種類 說明
內部效度 實驗操作變因對「實驗內」應變變因造成影響的程度
外部效度 實驗內所得的結果,對於「實驗外」對象的適用程度

常見對內部效度的威脅有隨機化失敗、無法遵循實驗章程、損耗性偏差、實驗性效應影響、小樣本。

  • 隨機化失敗(Failure to randomize)

The differences estimator
是有無接受試驗的類別變項,則表達處理效應(Treatment effect)或因果關係(Causality)。
根據 OLS 及後續討論,如果(有無接受試驗)是隨機指定,則的條件期望值為零,成為對因果關係的一個不偏且具一致性的估計式(Estimator)。但是一般而言,非隨機分配(Nonrandom assignment)常常造成估計式的偏誤,而導致結果受到受試者特徵或偏好的影響。
可以將有無接受試驗這個類別變項對個體特徵(Individual characteristic)作線性回歸以檢測試驗是否隨機(Randomly assigned)。
代表個體特徵的有無或多寡,特徵種類有個。接着,透過 F 檢定檢測 W 的系數是否全為零。若接受虛無假設,則可推論試驗接受與否是隨機指定。另外,如果已知 randomization conditional on covariates,則這些 covariates 須包含於上述的 W 中做回歸,而進行 F 檢定部參與系數檢定。

  • 無法遵循實驗章程(Failure to follow the treatment protocol)

在真實實驗中,人們有時無法百分之百遵循實驗章程(如控制組可能或多或少被試驗),這種情況稱為 Partial compliance,從而可能導致 treatment 與否與 error 產生關聯造成結果偏誤。

補救方法:
如果有 treatment actually received 和 intial random assignment 的資料,研究者可使用 TSLS estimator(two stage least square estimator),以 initial random assignment 作為工具變數(instrumental variables),找出 X 對工具變數的迴歸關係式,以此迴歸關係式創造(在給定工具變數值下的 X 估計值),尋找因果關係和試驗效力。工具變數需具有兩個特性,以確保不偏性和有效性,其一是相關性(relevance),工具變數須 X 有高解釋效力(高度相關),常用的準則是一階 OLS 的 F 統計量需大於 10;另外一個是外生性(exogeneity),工具變數需與 error 項不相關,通常需要專業領域知識的主觀判定,或在工具變數的數量多於內生變數的數量時引入 J 統計量來確定是否具外生性。
  • 損耗性偏差(Attrition)

指在實驗過程,受試者有可能因外在因素而未繼續參與試驗,而導致觀察、研究的對象與比較基準的改動。若這些改變與結果相關,則這些影響將會造成最後實驗結果偏誤。

  • 實驗性效應影響(Experimental effects)

實驗者的期待效應、受試者的安慰劑效應(可見後文說明)。

  • 小樣本(Small samples)

由於進行人體試驗比較昂貴,通常樣本很小。小的樣本不會影響估計的不偏性,但會造成因果關係的建立與衡量不精確並影響信心水準和假設檢定的有效性,因為基於臨界值(normal critical values)和異方差性(heteroskedasticity-robust standard error)的統計推論只有於大樣本才具合理性。小樣本的推計推論,常常在引入錯誤(errors)為常態分佈的前提下進行分析,然而,在現實狀況下,常態分佈的假設有些過度理想化。

註:
關於估計(Estimator)的一些性質:

  • 不偏性(Unbiased):簡單來說,估計量是一個隨機變數,若其期望值和母體系數相等,則我們稱此估計具不偏性。
  • 有效性(Efficient):對估計式減去母體系數取二階動差。二階動差較小者,我們稱此估計式相較於另一個估計式具有效性;另外當某一個不偏性估計(unbiased estimator)的變異數剛好等於 Cramer-Rao lower bound,便可稱此 esimator 為最小變異不偏估計式。
  • 一致性(Consistency):當估計式可機率收斂(convergence in probability)到母體系數,我們稱此估計式具一致性。另外如果估計式為樣本平均值或其函數,根據 SLLN(Convergent Almost Surely)或 WLLN(Weak Law of Large Numbers)可獲得更強的收斂性質。

常見對外部效度的威脅有非代表性樣本、非代表性流程:

  • 非代表性樣本(Non-representative sample):研究的母群體(population)和感興趣的母群體(population of interest)需具足夠地相似性以確保實驗結果可一般化使用。
  • 非代表性流程(Non-representative program or policy):要一般化施行實驗中的 treatment,因為規模擴大控管降低或時間拉長,實驗中所獲得的效果不一定能在現實狀況中重現。

抽樣偏誤(Sampling Bias)[編輯]

抽樣是從較大團體(抽樣母群體)中選擇部分個體(樣本)的過程,並以此為基礎,估計或預測此一較大團體的事實、情況或結果。

在研究過程中採用抽樣,主要有下列四個原因:經濟、時效、無法普查(難以接觸)、毀滅性之避免。

抽樣偏誤是抽樣調查時產生的偏誤。原因出在抽樣對象數量的不足,對象之間有一定的關聯性,使其無法代表整個母群。

舉例來說,在台北車站進行關於金錢使用的問卷調查,隨機選擇路人作為調查對象。但是在台北車站聚集的人,其收入可能因為城鄉差距而高於全台灣的平均值,年齡層也可能集中在青年到壯年之間,職業分佈也有所偏頗。因此得到的數據不能代表全台灣的實驗結果。美國心理學家羅伯特·V·格恩里(Robert_V._Guthrie Robert Guthrie)曾出過一本著作《Even the Rat Was White》,書中指出西方的心理實驗主要是以白人、特別是以白人的大學生作為取樣對象,因此實驗結果無法套用到其他族群之中。

除了採集更多樣本和更精準定義抽樣對象以外,能夠減少抽樣偏誤的方法為選擇抽樣的方式。選擇分層隨機抽樣或叢集抽樣,並將母體依照性質分成各類別的小團體,再從團體中進行隨機抽樣。這樣一來,不但能減少抽樣偏誤造成的影響,還能觀察樣品的性質差異對於結果的關聯性,有助於研究的精確度。常見抽樣方法有以下幾種:

抽樣方法 說明
簡單隨機抽樣
(simple random sampling)
母體中所有元素被抽出的機率均相等的抽樣方法。由簡單隨機抽樣法所得到的樣本稱為簡單隨機樣本(simple random sample)。
分層抽樣
(stratified sampling)
將母體依照其特性或與調查目的有關的性質分成幾個類或幾個組,每個類組稱為一層(stratum),母體中的每一個元素都屬於其中的一層,而且是唯一的一層。分層之後再從各層簡單隨機抽取樣本。
部落抽樣
(cluster sampling)
先將母體中相鄰的某些群體劃分為 n 個不同的群體(cluster),母體中的每個元素均屬於其中的一個部落,且是唯一的一個部落,然後再從這些部落中隨機抽取部落,並對部落進行普查的抽樣方法。
系統抽樣
(systematic sampling)
又稱「等距抽樣」,自母體自然隨機排列的資料中,每隔一定間隔選取一元素,直至抽滿 n 個元素為止的抽樣法。
分段抽樣
(multistage sampling)
將母體按照某些特性或某種分類標準分為數個群體或層別,先由這些群體或層別中抽出幾個群體或層別,此為第一段。然後以特性或分類標準,再從已經抽出的群體或層別中,抽出群體或層別,此為第二段。如此依序為之,最後再以隨機或系統抽樣或其他抽樣方法抽出樣本。

反應偏誤(Response_bias)[編輯]

個人面對試題時,可能並非根據模擬情境,而是根據過去的作答模式來回答,此狀況被稱為反應偏誤。比如面對不清楚的問題時,傾向選擇否定的回答、或是刻意讓是與非的回答各佔一半的填卷方式,都是反應偏誤造成的現象之一。欲減少反應偏誤,需要良好的命題技巧,以及減輕作答者對於作答結果的壓力。

反應偏差可以由許多因素引起,因為受試者會主動整合多個訊息,以在給定情況下產生反應,並非被動地對刺激做出反應。[1]正因如此,實驗條件幾乎任何方面都可能使受訪者產生反應偏誤。

當受試者傾向於選擇積極的選項時,這種反應偏誤被稱為默認偏差(Acquiescence bias)[2]。另外,若受到社會主觀規範的影響而傾向給予符合大眾刻板印象的回答,這被稱為社會性喜好反應偏誤(Socially Desirable Responding Bias)。例如:當我們參與關於環保或犯罪的公開問卷調查時,較不會做出違反環保或道德的回答;面對像是性愛等私隱性問題較不會精準回答本人的狀況。對於會造成反應偏誤的調查,可採匿名測驗;若需要更加嚴謹,可依靠測謊的儀器或手段。

[註]無反應誤差: 並非反應偏誤之相反詞,而是指在統計調查中,有提供答覆的受訪者與沒有提供答覆的受訪者之間,在意見上的差異,是非抽樣誤差之一。

安慰劑效應(Placebo Effect)[編輯]

安慰劑效應,又名偽藥效應假藥效應代設劑效應。 指病人雖然獲得無效的治療,但卻「預料」或「相信」治療有效,而讓病患症狀得到舒緩的現象。

安慰劑效應最早由 畢闕博士(Henry K. Beecher)在 1955 年所提出,亦理解為「非特定效應」(Non-specific effects)「受試者期望效應」(Subject-expectancy effect)

此效應實驗的對象經常是人類,因為需要受試者模擬效果,而未經訓練的動物難以理解被灌輸的想法。受試者在被告知所服用的藥物為何之下,可能會因為心理作用,導致感受到的藥效與實際情況有所偏差,也就是說心理層面將影響生理層面。即使拿到沒有效果的假藥──醫學上的安慰劑(placebo)來進行實驗,也有可能得到與使用真藥相同的結果。另外,從眾心理和權威者也可以影響實驗結果,當外在的影響足夠強大,就有可能改變觀察目標的想法;過去受宗教勢力掌控的歐洲,就有利用聖水治病的歷史,在教會大力宣傳下成功讓人相信療效。

目前有兩個主要假設說明安慰劑效應如何作用:

  • 制約反應(Conditioned Response)
    俄國著名生理學家 巴夫洛夫(Иван Петрович Павлов)曾做過狗之唾液制約反射實驗。他在給家中小狗食物前,都會發出鈴聲,在多次反覆操作後,每當鈴聲一響,狗就會自動分泌唾液,原因是狗已經學習到將鈴聲及食物串聯起來。此實驗替古典制約理論打下良好基礎。所謂古典制約,指的是一種關聯性學習,可將原本不存在關聯的兩個事件透過人為干預建立起聯繫。透過此種制約,受試者會學習在特定情形下做出特定反應。據此,有學者推論,安慰劑使病人產生與有效藥物類似的反應,可能是因為制約而造成。
  • 病人期望效應(Subject-expectancy effect)
    受試者期望效應屬於認知偏見的一種。在科學實驗中,由於研究人員預期某些研究結果,便無意識地操縱實驗步驟、又或引導實驗人員做出希望得到的結果。而病人期望效應便是其中一例子,此效應會引導病人有意無意地認為自己的病情有獲改善。丹麥醫學研究者Asbjørn HróbjartssonPeter C. Götzsche於文章中質疑「大部份病人有禮貌地傾向迎合實驗人員而報告病情得到改善,即使他們並不感到改善。」主觀的偏見亦可能使病人潛意識相信病情因為得到關注及照料而改善。

若要避免安慰劑效應,主要可分三種方法:

  • 單盲法(Single-blind study):最簡單的方法,就是不告知受試者服用何種藥物。給予實驗組具有效果的真藥,對照組則是不具效果的安慰劑,且不告知受試者本身屬於實驗組還是對照組。即便對照組因為安慰劑效應有些微效果,但若最終實驗組展現出比對照組更高的成果,就能夠證明實驗藥物跟結果間的關聯性。然而,在使用單盲法時,受試者會和實驗人員有所接觸,故仍要避免實驗人員的主觀期望影響到受試者。單盲實驗的典型案例是Pepsi Challenge:百事可樂在商場讓購物者喝用同樣白色杯子裝的百事可樂及可口可樂,並讓他們選擇自己比較喜歡哪一種,而實驗者自己知道哪個杯子是裝哪種可樂。
  • 雙盲法(Double-blind method):比單盲法更為嚴謹,指在藥物測試中將病人隨機編入對照組及實驗組,實驗過程中,無論是實驗人員或實驗組、對照組,全都不知道是誰獲得真正藥物,直到所有資料都蒐集分析、統計後,受試者和實驗人員才會知道實驗對象所屬組別,如此一來也就不會因為期望效應,使實驗結果產生偏差。
有研究指出,約有 25%丹麥及以色列醫生使用安慰劑作為診斷工具,以斷定病人的症狀是真確或是只是詐病。批評及辯護雙方都同樣認為以安慰劑作這樣用途是不道德的。英國醫學期刊評論文章寫道,「病人接受安慰劑後痛楚得到舒緩並不暗示其痛楚是假的……使用安慰劑去『診斷』痛楚是否真實的做法是被誤導的。」
有關安慰劑效應的研究及討論正在進行,於醫療應用上使用安慰劑的共識準則於將來應該會出現。一般都同意,在雙盲臨床試實中,安慰劑對照群組對排除幾種試驗中可能出現的偏見是重要的。
  • 三盲法(Triple blinding method):最為嚴謹,是指實驗開始至結果出爐前,實驗人員、受試者及統計人員三方全都不知哪組是實驗組、對照組。三盲法通過在第一次解盲時,將受試者分為兩組(但統計人員不知哪一組是實驗組或對照組)。在完成資料統計後,再進行第二次解盲,公佈實驗組與對照組。此方法可以有效避免研究人員在統計、分析資料時因期待而產生的偏誤。

安慰劑效應引發的混淆:

因為查找引因有一定困難度,很多現象於統計時被錯誤地歸納入安慰劑效應。
  • 疾病自然地消失。
  • 疾病本有的臨床表現。
  • 錯誤診斷或預測(prognosis)。
  • 病患暫時性改善被混淆為痊癒。

反安慰劑效應(Nocebo Effect)[編輯]

這個詞彙最早由華特.甘迺迪(Walter Kennedy)提出,其拉丁文原文 Nocebo 源自於拉丁文 nocēbō,意思是「我將傷害」,是與安慰劑效應相對的概念。
它的效果和安慰劑相反:安慰劑效應中,受試者有正面期待,因而得到正面的結果;而反安慰劑效應則是當受試者對於其用藥、治療等有負面期待的時候,受試者將得到本不應該存在的、額外的負面效果。即當被實驗者不相信治療有效時,其病情就有可能會惡化。

這樣的現象大量出現在各式疾病用藥上,研究指出,當病患被告知用藥可能產生之副作用時,不論藥物的真假,病患感受到副作用的可能性就會上升,而這一現象發生的原因不在於藥物,而是病患心理層面對於康復的期望。「電磁波過敏症」也被認為和這樣的反安慰劑效應相關,當受試者越是認為電磁波會造成不良影響,就越受影響。

反安慰劑效應也是一個好的研究題材:透過應用反安慰劑效應,我們可以研究個體的心理活動對於其生理方面的影響。例如: 在一個研究中,健康的成年人被告知將有電流傳導過他們的雙手,儘管這是一個錯誤的訊息,仍有三分之二的人因此而頭痛(Schweiger, Parducci 1981);而在另一研究中,受試者是在實驗前的皮下注射測試中對某種物質過敏,但對生理食鹽水沒有反應。但在雙盲試驗下重新以相同的條件測試後,在醫患雙方都不知道注射物質的情況下,有 27%受試者對之前引發過敏的物質產生過敏反應,24%受試者對生理食鹽水產生過敏反應。(Jewett & Fein & Greenberg, 1990)。藉由前述兩個例子,我們可以得知心理活動可以影響神經,從而影響到個體的生理活動。

在人類學的範疇中,亞瑟.克萊曼等人類學家認為傳統巫術的操作可能就和反安慰劑效應有關(當然,治療的部分也有心理因素的參與,但是是和安慰劑效應有關),基於巫術的篤信造成對被施巫術的人產生極大的恐懼,甚者因而死亡,原因就是急性的、情緒性的強烈恐懼所引發的身心反應。這個現象在原始部落可謂常見,又名為「巫毒死(Voodoo death)」。

社會期許誤差(Social-desirability bias)[編輯]

「社會期許」是指在評量個人的性格或態度行為歷程之中,個體常因「假裝完美」(fake good)的動機而作假,傾向選答能令人產生良好印象的內容以符合社會期待,並非本身真實的內在想法或性格態度。這種在作答過程中有意使他人對其產生良好印象,卻非依照本身實際的想法或作法答題的反應傾向,即為「社會期許」。例如過多申報自己的「良好行為」或過少申報自己的「壞行為」、不受歡迎的行為。

這種傾向嚴重影響研究的效度,尤其見於自填問卷,這種偏差會影響樣本的平均數值,亦影響研究受訪者之間的差異,尤其在擁有特定社會期待的議題上,例如受訪者個人的能力、性格、性行為、濫用藥物等議題,須特別留意社會期許誤差,為了防止受測者欺騙或作假的反應,人格測驗中常編寫一些相當不確定或中性的題目編入試題中,以誘導受測者產生社會期許心態高低分數,例如「我有時會心情不好」或「我曾說過別人的閒話」等,如果作答結果社會期許分數過高,表示受測者在問卷中過度掩飾自己的真實想法或感受,該人格測驗的結果不盡可靠,而必須重做或進行其他類型的人格測驗。

這種誤差對不同人口組別的影響可能不同。例如當受訪者申報性伴侶的數目時,男性傾向申報較多,女性申報較少。無論如何,兩個組別的性伴侶數目平均值,皆受社會期許誤差影響。

例如當受訪者需要回答:「你是否曾經濫用藥物或不當物質?」受訪者可能基於社會上的壓力或眼光而否認曾經吸食受管制物質(例如大麻),或是嘗試合理化其行為,設立一個較好的形象,如回答:「我只會在有朋友在場時,才吸食」。

常受社會期許誤差影響的議題包括:

  • 個人收入:低收入者傾向高報而高收入者傾向少報
  • 負面情緒:例如沒有自尊、無力感,經常遭否認
  • 沒有依從指示/沒有按時使用藥物:高報配合度
  • 智商及相關成就:往往遭高報
  • 違法行為:常遭全盤否認
  • 排泄功能:受訪者往往不願討論
  • 宗教信仰:受訪者往往不願討論
  • 愛國主義:基於恐懼、審判或旁人目光,而遭高報或否認
  • 暴力:不論實際或想像,往往遭否認
  • 慈善或仁愛:往往遭高報
  • 性取向:非異性戀者往往較為自卑,近年來才稍稍改善

觀察者偏誤(Observer Bias)[編輯]

觀察者偏誤是因為預期心理(Expectancy Effect),或稱作期待效應所產生的偏誤。傳遞有利於實驗假設的訊息給受測者,有可能進而影響實驗的結果。

例如著名的聰明漢斯實驗。聰明漢斯是一匹標榜會做簡單的四則運算的馬,但事實上這匹馬不是真的懂算術,一位德國的心理學家Oskar Pfungst發現,唯有飼主知道答案,並且站在漢斯看的到的地方時,漢斯才能回答出正確答案,反之則會失敗。因此得知漢斯是靠訓練員和觀眾在無意識下給予表情或姿勢等等的暗示而選出正確答案。

美國心理學家雨果·明斯特伯格曾經進行一個關於和平的演講,並在演講之後收集各個記者的新聞稿,卻發現記者們寫了相異甚至相反的敘述。這件事證明觀測結果容易受到觀測者的立場,背景,環境,以及對於實驗的預期所影響。這被稱為觀察者偏誤。同樣地,一個裝了半杯水的杯子,根據對照物,觀察者可能會回答出半滿或半空兩種回答,這也是一個觀察者偏誤的例子。

要減少觀察者誤差,所需要的是進行實驗的標準化(Standardization)和操作性定義(Operational Definition)。

  • 標準化(Standardization):即統一資料收集的所有步驟,無論是測驗還是晤談都採用一貫的程序,讓所有參與實驗的人都經歷相同的實驗條件,以相同的方式發問,以事先建立的規則來評斷。
  • 操作性定義(Operational Definition):有些標準可能難以統一,例如快樂的程度、過動的定義。為了客觀性的測量,必須先建立一個可觀測的規則來加以界定,這就被稱為操作性定義。也就是說,必須根據某個可以觀察,測量,操作的特徵來定義我們想要觀察的概念,無論是自變項還是應變項,都必須經過操作性定義來使其具有客觀性。

面對這種偏誤,光是上述的實驗的單盲法是不足的,因此有時候會設計連參與實驗的實驗者都不知道實驗目的的實驗,這種被稱為雙盲法(Double-Blind study)。讓實驗者與被實驗者都不知道現在進行的是何種實驗條件,像是實驗者在詢問被驗者的時候,也不知道對方是實驗組還是控制組。或是更根本的,讓實驗觀察者不知道他們需要觀察的對象而客觀的記述所觀察的事物。除此之外,還有三盲法(Triple-Blind study),即為雙盲再加上資料監測者等也不知情,其雖嚴謹但實行上較為困難。無論是何種方法,對實驗的隱瞞都有所要求,有意的欺瞞有時會觸犯心理實驗的道德規範,這一點在研究的道德爭議章節會做更多描述。

倖存者偏差(Survivorship bias)[編輯]

倖存者偏差是一種邏輯上的謬誤,因忽略失敗的子群體,而誤將成功的子群體是為全體,造成之偏誤。

其概念起源於二戰時期,美國哥倫比亞大學統計學亞伯拉罕·沃德教授(Wald Ábrahám)接受美國海軍的聘請,運用他在統計方面的專業知識給出關於『飛機應該如何加強防護,才能降低被炮火擊落的機率』的建議,在沃德教授對成功返回的轟炸機進行了分析與統計後得出,機翼是整台飛機中最容易遭受攻擊的位置,然而,有別於直覺上『因為機翼最常受到攻擊,所以我們應該強化機翼的防護』這樣的推論,沃德教授卻給出了『我們應該強化發動機的防護』這樣的建議。其原因來自於雖然機翼遭受了最多攻擊,但卻不影響飛機的返航,反之,之所以較少看到返航的飛機的發動機受到攻擊,極可能是因為若發動機遭受攻擊則飛機將墜毀,根本無法返航所致,所以,該加強的並非機翼而是發動機。軍隊後來採納了教授的建議,後來也驗證教授的決策是完全正確的。因此,倖存者偏差指得是我們往往過度關注倖存者所擁有的特徵,卻忽略了其他更多失敗者的案例。因此,當我們取得的資訊僅來自於倖存者時,此資訊可能會存在與實際情況不同之偏差。這種偏差將會導致各種錯誤結論。

以下為倖存者偏誤在其他領域中的例子: 在金融領域,人們過於關注成功的公司和個人,在新聞媒體中失敗的公司和個人則獲得較少的關注。實際案例如,人們過多關注部份成功的科技企業家未完成大學學業,卻取得相當卓越的成就,造就人們認為大學教育對開始科技業並無幫助的印象。然而,在現實中,絕大多數中途輟學的人並沒有變得富有,而忽略這些可能低估大學學位在創造財富方面的實用性。

霍桑效應[編輯]

霍桑效應是心理學上的一種實驗者效應,又被稱作被試效應、霍索恩效應,是指被觀察者知道自己成為被觀察對象後認知與態度改變行為傾向的反應所產生的實驗偏差。霍桑效應亦是一種研究的誤差,尤其在使用觀察法的時候容易出現,因為被觀察對象在霍桑效應的影響下做出了實驗者原先不想觀察的行為。

霍桑效應的發現來自一次失敗的管理研究。1924 年 11 月,美國國家研究委員會組織了以哈佛大學心理專家梅奧為首的研究小組進駐了西屋電氣公司(Westinghouse Electric Corporation)的霍桑工廠,研究的初衷是試圖通過改善工作條件與環境等外在因素,找到提高勞動生產率的方法。在這長達八年多(1924~1932)的實驗中有四個主要階段,前兩個階段是有關於「效率」的研究,第三個階段是「訪談」研究,第四個階段是「觀察」研究。

但實驗並不順利,實驗假設的各項條件並非唯一或決定性的影響因素。對此,喬治·埃爾頓·梅奧以及他的助手們所做的解釋是,受試者對於新的實驗處理會產生正向反應,是由於環境改變(試驗者的出現)而改變行為。工人工作效率之所以沒有隨着外部條件改變而改變,是因為工人都知道自己正在被實驗者觀察,因此工人的行為不只是出於環境的改變,還出於他們認知到自己正在進行一項實驗。意即,當女工被抽出來成為實驗對象時,就會意識到自己是特殊的群體,是這些專家一直關心的對象,這種受注意的感覺使得她們加倍努力工作,以證明自己是優秀的,是值得關注的。所以績效的提高,並非由實驗操控造成,這種效果就是我們所稱的「霍桑效應」。

霍桑效應的例子:
  • 教育 : 在教學中,經常會看到霍桑效應的作用。 例如,老師可能知道校長或班主任正在觀察他們,所以會在他們的課程計劃和表現上付出額外的努力。
  • 面試 : 作為一個面試的候選人,我們總是想展示自己最好的一面,並掩蓋自己的短處。
  • 心理學治療 : 在心理學治療時,心理學家會問一些個人問題,得到的答案和患者的行為可能會因被特別關注而發生變化,人們往往會隱藏自己的感受。然而,當患者被要求寫下他們真正想法時,結果可能會改變。

區群謬誤(Ecological Fallacy)[編輯]

又稱生態謬誤、層次謬誤,一種在分析統計資料時常犯的錯誤。和以偏概全相反,區群謬誤是一種以全概偏,如果僅基於群體的統計數據就對其下屬的個體性質作出推論,就是犯了區群謬誤。這類謬誤假設群體中的所有個體都有群體的性質(因此刻板印象也可能犯上區群謬誤)。

通常是以較高層級的分析單位(例如:系所、選區)的資料,對較低層級的分析單位(例如:性別、 年齡)作出了錯誤推論。

例一 一實驗研究發現 A 國具有憂鬱症的人比 B 國多,且調查發現 A 國的大學生比率比 B 國高,因此直接推論這些憂鬱症的人因其具有大學生的身分,學習壓力較大,因此較可能有憂鬱症。然而,A 國的憂鬱症者很可能不是大學生,大學生也很可能沒有得憂鬱症,要進行剛剛的推論,必須要有更嚴謹的資料佐證,否則這樣的研究推論就是犯了區群謬誤。

例二 假設甲城和乙城都各有相同人數的富人和窮人,富人都住在山上,而窮人都住在排放致癌物的工廠附近,故此在兩個城市的窮人癌症發病率都比富人高很多倍。在甲城的都是高增值高污染工業,故此在甲城無論是富人和窮人的平均工資都比乙城高,但同時甲城窮人的癌症發病率也因此比乙城高。 一位教授希望找出癌症的風險因素,他在國家統計刊物找到甲城和乙城的癌症發病率和工資中位數,發現工資中位數較高的甲城有更高的癌症發病率,得出高收入是癌症風險因素的結論。然而事實上,貧窮才是癌症的風險因素,區群謬誤帶來相反的結論。

信度(Reliability)與效度(Validity)不足[編輯]

做研究時,常會需要運用一些測量指標來測量某一個概念。例如在設計心理測驗量表時,實驗者欲透過量表來分析作答者的性格是屬於封閉的或開放的,那麼實驗者不能直接問填答者是屬於哪種性格,而是要透過一些指標(indicator)來測量開放性格這一個概念。在用指標測量概念時,要注意測量的信度與效度。在前段心理研究法種類的測驗法中,有信度、效度的詳細說明。

在心理學實驗中,可能會有很多沒被列入考量的干擾變項會影響實驗參與者的心理狀況,進而影響實驗結果與其信度和效度。例如:在樣本的蒐集中,對於問答的刻板反應、對實驗的預期都可能是造成誤差的原因之一,而有時誤差的原因不只出在受試者身上,還會出現在實驗者身上。因此,在設計實驗的時候,維持實驗步驟與資料收集的統一性,並減少外在因素對於實驗參與者的影響。探討實驗的誤差來源和減輕偏誤的影響也是心理學研究的一項重點。

化約論(Reductionism)[編輯]

以單一原因(例如:單一分析單位、單一變項)來解釋複雜的現象。又稱還原論,是一種哲學思想,其基本觀念為:複雜的系統、事務、現象等等均可以通過把他們簡化成為各部分之組合的方法,加以描述和理解這已經被拆解成各部分之組合。舉例來說,化約論認為生物學是以化學為基礎,化學是以物理學為基礎。然而在社會科學當中,化約論產出的觀點有很多的爭議。舉例來說,心理學跟生物學、社會學跟心理學,政治學跟社會學,他們的相互關係到底為何,且是否可以將他們簡化成為各部分之組合等等。
關於化約論的分類,可以有下面三種方式:

  • 「本體的化約論」與「理論的化約論」
    • 本體的化約論主張這個宇宙的最根本構成事物是基本粒子,而且這些基本粒子的性質或規律,原則上窮盡了其他事物的性質或規律。
    • 理論的化約論主張所有的巨觀科學理論,最終都可以被化約到微觀的粒子物理學,任何科學定律最終都可以由物理定律導衍出來。
  • 「大化約論」與「小化約論」
    • 大化約論認為自然界之所以是這個樣子,是因為存有簡單的普遍定律,而所有其他的科學定律都能在某種意義下化約到那些基本定律。
    • 小化約論則是認為事物之所以有那些行為,是因為它們組成成分的性質使然。
  • 「對大自然的化約觀」與「當作科學研究程式的化約論」
    • 所謂對大自然的化約觀又稱做化約論式的世界觀, 是指所有科學領域都是源自於大自然的終極原理, 亦即F. Dyson所謂的「有限數目的基本方程式」
    • 當作科學研究程式的化約論則是指將研究命題化約為一些個別的概念,並且逐一加以分析。

虛假關係(spurious relationship)[編輯]

指在兩個沒有因果關係的事件之間,基於一些其他未見的因素(干擾因素 confounding factor,或潛在變數 lurking variable),而推斷出因果關係。這會引致「兩個事件是有所聯繫」的假象,但這種聯繫並不能通過客觀的試驗得出,需要在近一步的假設試驗下才能得出正確因果關係。

相關跟因果關係是兩個不同的概念。因果關係是兩個事件之間的關係。而相關是根據實驗結果得出的關聯性。

兩個變數受第三者影響,從而在其間得出誤導的相關系數。即是說,變數 A 和 B 之間可找出相關。所以,有以下的可能性:

  • , A 導致 B
  • , B 導致 A
  • , C 導致 A 且 C 導致 B (C 為干擾因子 confounding)
  • , C 導致 A 後間接導致 B (C 為工具變量 instrumental variable, 簡稱 IV)
  • , A 導致 C 後間接導致 B (C 是中介變量)
  • , A 導致 C 且 B 導致 C (C 是對撞變量)


前兩種情況是實際的關係,A 跟 B 有因果關係(causal effect)也有相關(association)。

第三種情況是偽關係,A 跟 B 沒有因果關係,但有相關。如果能控制住C變數,X和Y就不再相關。

在第四、第五種情況,A 跟 B 有因果關係也有相關。但如果控制住 C,則 A 跟 B 的關係可能會消失。

在第六種情況,A 跟 B 無因果關係,但有相關。若控制住 C,則 A 跟 B 反而會產生了因果關係。

實驗的再現性[編輯]

心理學最特殊的地方在於其建立在個體的心理活動上,因此並無法建立絕對的因果關係,即無法保證同一輸入及實驗方法一定會製造出同一個實驗結果。基於上述各項誤差以及個體心理活動的隨機性,使心理學實驗本身的「再現性」備受質疑。
以下是三個可能解釋原研究無法被再現的原: 「其一是原研究所得的效應是假陽性結果,這個效應本就不真實,被觀測到純屬偶然。其二則可能是再現研究得到了假陰性結果,而沒有捕捉到真實的效應,又或者,原研究和再現研究的估測都是準確的,可兩者的研究方法在關鍵部分有了差別。」簡而言之,無法再現原研究發現並不意味着原研究是錯誤的。同理,即便結果被成功再現,也不能證明原研究的假設肯定是正確的。
例子:在 2015 年 8 月,開放科學合作組織(Open Science Collaboration,OSC)對 100 項心理學實驗進行再演,重新進行該 100 項心理學實驗,發現可以重新導致相同結果的實驗不足四成。雖然有其他心理學家就開放科學合作組織的實驗方法有所質疑,但該試驗已然足夠顯示心理學實驗的問題所在。

再現性可以用幾個方式衡量:

  • 再測信度(Test-retest Reliability): 用同一個測驗但不同時間點測試同一群受試者[3]。例如,在某堂體育課與下堂體育課,所測得的體能表現會大致相同。
  • 複本信度(Inter-method Reliability):用不同相似工具來測驗同一個項目,例如用邁爾斯-布里格斯性格分類測驗(Myers-Briggs Type Indicator)。
  • 內部一致性信度(Interna Consistency Reliability):同一個測驗中不同子項目是否一致,例如量度「外向」,可以用「朋友數目」、「友善程度」、「經常笑」等來測。一般可用克隆巴赫系數(Cronbach's alpha)來檢驗。
  • 評分者間信度(Inter-rater Reliability):由於個人因素的影響(如情緒、既有觀念等),有些測驗不能以客觀的方法進行鑑定,例如作文考試。所評的分數通常受評分者的主觀感受而受到影響,因此要由 2 人或以上各自根據標準評分,再求大家分數是否大致相同。

研究的道德爭議[編輯]

由於心理學的研究對象是有生命的個體,所以在研究倫理的議題方面尤須重視。無論是對於人類或動物的研究,都要尊重並保障其基本權利。美國心理學會(American Psychological Association, APA)為達上述目的,最先發表了「心理學專業人員的倫理信條和守則」(Ethical Principles of Psychologists and Code of Conduct, 2002)。我國也設有研究倫理委員會(或稱人類試驗委員會),對各研究進行研究倫理審查(Institutional Review Board, IRB),通過審查才能進行研究,同時警戒研究者,對研究過程所獲得有關參與者的資訊必須保密。

以下附錄美國心理學會「心理學專業人員的倫理信條與守則 」中對於基本規範的重要準則進行說明:

  • 自主權
受試者都有權選擇自己是否要參與研究,也可以在研究過程隨時選擇中止並不受到任何處罰。由於受試者的動機不同,主動參與或脅迫參與的結果會有很大的差異,研究者應以鼓勵而非強制的方式使人參與研究,不應為了研究方便而忽視受試者的自由意志。
  • 告知同意(Informed consent)
研究者須對受試者進行充分的說明,並取得其正式同意才能進行實驗。告知的內容通常包括:實驗的進行方式、潛在的風險及預期的效益。受試者簽署同意書,代表其對研究事項已經被充分告知,並同意研究的進行。
  • 有意的欺瞞(Intentional deception)
在進行心理學研究時,有時研究者必須隱瞞真正的實驗目的,因為若事先告知受試者所有的訊息,勢必會對實驗結果造成嚴重的偏差並干擾實驗的進行。但是,若是會影響到受試者權益的訊息便不可隱瞞。例如進行單盲實驗時,為測試口味而隱瞞該產品品牌,卻未告知其成分是否含有過敏原,而導致受試者誤食。另外,研究者須證明除了欺瞞的方法外,沒有其他能達到同樣效果的實驗方式,而且該研究需要具備一定的重要性作為研究者欺瞞的正當性。
  • 風險及獲益的評估(Risk / Gain assessment)
大多數的心理實驗並不會對受試者帶來身理方面的風險,但是倫理所認可的心理壓力限度有時並不清楚。當實驗可能造成受試者心理焦慮或煩亂時,研究者就必須遵守最小風險(Minimal risk)原則,將實驗風險降至最低的程度,並採取適當的預防措施來處理過激的反應。當涉及到風險時,研究者應權衡該研究是否有其必要性。
  • 簡報(Debriefing)
做一項研究可以說是受試者及研究者間的雙向交流,因此在實驗結束後,研究者應該清楚地交代整個實驗的目的、假設、預期結果跟效益,若有刻意隱瞞的實驗程序也需說明隱瞞的理由。另外,研究者亦須確保受試者在實驗過後不再留有負面的情緒,且應主動察覺並抹去可能產生的不良影響。最後,若受試者在簡報後擔心自己的資料被誤用,或覺得自己的權益受到任何不適當的對待,他們有權向研究者要求撤回資料。
私隱權是每個人都應有的權利。研究者在研究中所取得的受試者個人資料(姓名、種族、生日、宗教信仰、家庭背景等)必須保密,若未經過受試者同意,不得任意透露給他人。常見保護受試者個人資料的方法有兩種,一是將足以辨識受試者的資料與研究資料分開存放,而研究資料僅以編號來辨識個體;另一種作法是僅報告整體資料(平均數)以達到保護個體的目的。

心理實驗的倫理標準[編輯]

今日我們遵循的倫理標準其實是來自 1970 年代奠定的基礎,當時的研究員們列出了一張清單,細數着保護自願受試人們的私隱安全的規則。這張清單報告就是貝爾蒙特報告(Belmont report),簡單概括其內容就是所有涉及人類的研究都要遵守 3 個主要的倫理原則。

  1. 對受試者的尊重:也就是強調受試者要在知情同意的情況下進行實驗,實驗研究人員不得對受試者有所隱瞞,他們有權利在簽署加入實驗的合約前就清楚地了解當中的風險或利益。
  2. 行善原則:基本上要表達的就是研究者應該盡量避免對受試者產生任何的負面影響,應該將受試者的福祉納入實驗設計的考量。核心的概念可以用三個字簡單概括,即 "Do No Harm",不要造成任何的傷害,心靈上亦或是生理上的傷害皆涵蓋在範圍內。
  3. 正義原則:也就是研究人員有義務確保受試者不被剝削、迫害,或是在逼迫的情況下接受實驗的要求。此外,研究人員還被要求確認該實驗的負擔或是利益是均勻且公平地分配的。舉例而言,在早期的研究中,受試者通常是較貧窮的,基於經濟上的負擔而加入實驗承擔其風險;而受益的通常卻是較富有的那個階層,透過實驗分析到的結果得出結論,造福較富有的那一方,這樣不均勻、不公平的實驗風險分配是不被接受的。

以上列出的倫理標準適用於任何涉及人類的研究,包含心理學的研究。然而,即便指標和原則(Ethical principles)已訂立清楚,操行準則(Code of conduct)卻未有明確的定義,即能意會卻無法清楚地知道該如何將此核心概念付諸實踐。因此,在操行準則(Code of conduct) 確立前,一堆受質疑的研究已經進行並完成了。

實驗案例[編輯]

以下幾個例子皆為歷史上知名的爭議性心理學實驗,讀者可以觀察未遵守倫理上的原則可能帶來的結果。

實驗一:小艾伯特實驗(Little Albert experiment)

由於實驗者並未去除受試者、嬰兒小艾伯特的條件反射,恐有造成其心理永久負面影響之嫌;且作為小艾伯特監護人的母親是否真的知情,或有無受到脅迫,至今仍無定論。

實驗二:米爾格倫的服從權威實驗(Obedience to Authority Study)

或對實驗參與者施加過多心理壓力,以科學權威裹脅其繼續進行實驗,儘管部分參與者已出現身心極度不適的反應。

實驗三:旁觀者效應(The By-stander Effect)

其中最出名的案例,《紐約時報》所報道的1964年3月13日紐約調酒師遭當街性侵並刺死,38名目擊者冷眼旁觀事件,實際上被過度誇大與扭曲。2007年《美國心理學家》指出,當時目擊者遠少於38人,有報警紀錄,且大部分人並無親眼目睹。

實驗四:史丹佛監獄實驗(The Stanford Prison Experiment)

造成部分參與者生理與精神上的損害,且其並未獲得先前承諾的自主權,不能隨時決定中止參與實驗離開。

實驗五:哈洛的恆河猴實驗(Harry F. Harlow)

違反動物倫理,造成受試動物身心重創。

實驗六:安慰劑效應(placebo effect)

受試者並未知情同意,除了可能傷害醫病關係,也有侵害病人自主權的疑慮。

動物實驗的研究[編輯]

動物試驗(英語:animal testing)、動物實驗(英語:animal experimentation)或動物研究(英語:animal research),是指利用人類以外的動物進行科學實驗,以驗證個別因素對接受測試的動物在生理或行為上的影響,並與同種類之生物在自然環境下的狀態進行比對。用於動物實驗的動物稱為「實驗動物」(英語:laboratory animals)。其目的是為了生理學、病理學或心理學的研究。動物的實驗研究通常在綜合大學、醫學院、製藥公司、國防機構以及為各行各業提供動物測試服務的商業設施中進行。動物試驗的重點在於純粹研究的連續性,側重於發展有機體的基礎知識、應用研究,也可能側重於回答一些具有重大實際意義的問題,例如尋找治癒疾病的方法。這項研究應用的具體例子包括測試疾病的治療方法、選育、國防研究和毒理學(英語:Toxicology testing),甚至還包括化妝品測試。在教育領域,動物試驗有時也是生物學或者心理學課程的一部分。這些實踐操作在不同國家受到不同程度的監管。

微生物等級分類 依據體內寄生的微生物種類,實驗動物按從低到高的標準可分為普通級(conventional,可縮寫為CV)、無特定病原體級(specific pathogen free,可縮寫為「SPF」),以及無菌級(germ free,可縮寫為GF)。普通級的實驗動物的飼養環境無任何防護措施。無特定病原體級的實驗動物是受國際認可的標準動物模型。這類實驗動物飼養在達到一定條件的動物房中,飼養環境能阻止特定病原體在這類實驗動物中寄生,以減少對實驗結果的影響。而無菌級的實驗小鼠需要生活在無菌環境中,體內不含有任何微生物。

為何要進行動物實驗?原因如下:

  1. 動物比較容易在受控制的環境中成長,心理學家因此能辨別各種因素對於動物的行為跟功能的影響。
  2. 動物的系統可作為人類的模型,且其基本歷程(例如:感覺、學習、記憶)較人類單純且易於研究,有助於我們進一步瞭解人類的功能。
  3. 動物的繁衍速度較快,使心理學家得以探討好幾個世代間才有辦法觀察到的發展歷程。
  4. 許多心理學家研究動物行為並非為了人類的利益,僅是為了探討各物種的行為特徵、習性。

動物實驗缺點:

  1. 結果緩慢且昂貴,缺乏效率:用動物做實驗是用電腦模擬的成本的 300-500 倍。
  2. 應用於人類的問題,即使動物系統基本歷程類似,但是否可以類比到人類上仍屬問題。

動物實驗的利益包括藥物的測試及發現,事實上,動物實驗對於了解及治療精神疾病、藥物成癮方面有重大功用,例如焦慮(anxiety)、憂鬱症、阿茲海默症等等。另外,動物研究也對動物本身有利,相關研究已經可以幫助動物園裏的動物緩解其被監禁的壓力;對於動物社會組織及行為的研究也可以幫助人類改良動物設施的設計,進一步確保動物的健康。

儘管如此,動物實驗的正當性依舊受到部分人士的質疑。他們認為,對人類有益並不能成為人類進行動物實驗的充分理由。同時,近年來心理學及醫學越來越重視實驗動物的關照。美國心理學學會(American Psychological Association, APA)倫理準則更要求,若要施加痛苦或有害程序在動物上,必須充分說明實驗所能得到的知識,且提供動物人道的對待,盡可能減輕其痛苦,另外也有一套嚴格的準則(Novak & Suomi, 1988)規範實驗動物的飼養環境。

1900 年起開始有許多動物實驗開始進行,因而引發道德上的爭議。科學家拉塞爾(W. M. S. Russell)和伯奇(R. L. Burch)在 1959 年提出針對實驗動物的 3R 原則:

  1. 替代(Replacement):以非活體或是演化程度較低的動物進行實驗。
  2. 減量(Reduction):使用較少動物或用最低實驗使用數量取得所需數據。
  3. 精緻化(Refinement):改進、完善實驗程序,使實驗中動物所受的疼痛與壓迫得到減輕。

而英國農場動物福利委員會於 1967 年,訂定動物福利五大自由原則,分別為:

  1. 免於飢渴的自由(Freedom from Hunger and Thirst):必須提供動物乾淨的飲水及飼料以維持健康及活力。
  2. 免於生理不適的自由(Freedom from Discomfort):必須提供適當的飼育環境及舒適的休息場所。
  3. 免於痛苦、傷害及疾病的自由(Freedom from Pain, Injury or Disease):必須提供疾病預防及快速診療的機制。
  4. 表現正常行為模式的自由(Freedom to Express Normal Behavior Patterns):必須提供足夠的飼育空間、適當的硬件設施及適當的同伴。
  5. 免於恐懼和壓力的自由(Freedom from Fear and Distress):必須確認所有作業流程不會造成動物遭受心理苦楚。

雖然現今已有許多法規保障動物實驗中的倫理原則,但仍無法確保這些規則能百分之百被貫徹。2018 年,紐約時報曾報道福斯車廠以實驗猴進行廢氣對健康影響的實驗。2019 年,英國廢除活體解剖聯盟 (Cruelty Free International,CFI)爆料位於德國一間藥物與毒物實驗室的不人道動物實驗,實驗動物們生活毫無福利可言,環境髒污無人清理。
實驗猴以粗魯的方式從籠內移出,被固定在實驗器材上強迫站立。操作過程中動物皆處於清醒狀況,甚至發出痛苦的尖叫。 另外,動物實驗是否真的能精確模擬人類的生理反應以預測疾病,一直是爭議點所在。目前國際間一直在發展新的技術,期望能夠減少甚至取代使用動物實驗,包括細胞培養(Cell Culture)、電腦模擬技術(Virtual Physiological Human)、晶片器官(Organ-on-a-Chip)、迷你腦(Mini Brain)等。

小獼猴實驗

以下用心理學家哈里·哈洛(Harry F. Harlow)對小獼猴進行的一系列實驗,來深入解釋何為「違反動物實驗倫理」:

1. 鐵娘子
在更前面的實驗中,實驗結果發現獼猴對於使用絨布、鐵架、加熱器等製作的「絨布媽媽」產生依賴,並且會獲得安全感。哈里·哈洛在這個「絨布媽媽」產生追加會定期噴射高壓空氣、產生尖刺等等會傷害獼猴小孩的裝置,稱作「鐵娘子」。研究發現即使小獼猴被「鐵娘子」傷害,依然不會放棄對「鐵娘子」—他認為是自己母親的對象的依戀。
2. 社會孤立
將剛出生的小獼猴放入籠子與外界隔絕,或只能看見外界但無法與其他的獼猴互動,並持續 3~12 個月不等,隨後使其返回與外界互動。研究顯示這樣的社會孤立會使獼猴失去社交能力,對外界的獼猴等一切環境感到恐懼、不安,甚至有類似自閉症的症狀。並且如果與世隔絕的時間越長(例如超過 6 個月),則非常難使獼猴獲得社交能力或治療其自閉、恐懼的症狀。

這個實驗後來還進行了更為慘忍的實驗,使公猴強暴那些失去社交能力的母猴,而這些母猴沒有能力帶給孩子關愛,甚至會對獼猴小孩施暴。 這個實驗或許可以使我們思考,一個生命個體如果失去與外界互動或者沒有得到足夠關愛,可能會帶來的影響。

雖然哈里·哈洛的這些實驗帶給人類有關對孩童施暴的父母、社會孤立帶給孩子的影響,但這些實驗顯然已經嚴重傷害的獼猴們的心理健康。

實驗小白鼠

現今大多數實驗都會使用小白鼠作為實驗用動物,使用小白鼠做實驗的優點如下:

  1. 飼養成本低:其實不只是小白鼠,包括小白鼠在內,有許多動物都已被當作實驗用動物了,例如猴子、猩猩、狗、甚至是豬。而其中小白鼠的飼養成本最低。
  2. 個體差異較小,較容易調控實驗變因:經過百年探索,純系小白鼠的培養方法已經成為固定流程,培養出的小白鼠幾乎沒有個體差異。在實驗中往往需要通過重複多次來驗證其科學性,如果參與實驗的動物個體差異很大的話,對實驗結果影響也很大。因此,這個特性對科學實驗的進行意義重大。再者,小白鼠的體型方便實驗人員進行控制,所需空間也不多,在配合實驗這方面也會順利許多。
  3. 繁殖能力強,生長週期短:一般情況下小白鼠六到七週便可以性成熟了,而且還具有產後發情,每次分娩的當天再次合籠交配的話,懷孕率幾乎是百分之百。換言之,小白鼠幾乎可以連續不斷地懷孕生子,一次性排卵更是多達 20 個左右。所以這種全年多發情性,繁殖率又高的動物確實是一種實驗的好材料,足夠滿足實驗室的科研需求。
  4. 遺傳上與人類相似:小白鼠是哺乳動物且基因組和人類相似度極高(約 90%)。由於遺傳學實驗效果很好,同時許多人類目前難以治癒的疾病都可以在小白鼠身上找到相似的性狀。通過小白鼠實驗能夠發現病因,研究發病規律和探究治療方法。

實驗狗

前蘇聯學者巴夫洛夫把狗圈禁在固定的籠子裏,先是直接投餵食物,觀察它們分泌唾液的情況;之後在餵食的同時額外增加鈴聲刺激,反覆多次後,狗在只聽到鈴聲的情況下也會像看到食物一樣分泌唾液。但他也發現,如果持續只響鈴不給食物,狗分泌唾液的情況會逐漸消失——也就是說,條件反射也會消退。 爭議事件:在20世紀初的布朗狗事件(英語:Brown Dog affair)中,親動物和反動物試驗團體之間的這些分歧首先引起了公眾的注意,當時有數百名醫學生和反活體解剖學家圍繞着一尊為紀念被活體解剖的狗而立的紀念像與警察發生衝突。

實驗貓

美國心理學家愛德華·桑代克提出的學習相關定律。 其中最有名的為餓貓迷籠, 他把飢餓的貓禁閉於設了機關的籠子內——餓貓可以通過抓繩或按鈕等三種不同的方式逃出籠外獲得食物。一開始,貓被關進迷籠之後只是盲目地亂撞亂叫、東抓西咬,但會在偶爾做對打開迷籠門的動作後「逃出生天」。桑代克重複這個過程,記錄餓貓逃出迷籠所需的時間,最終得出貓的學習曲線。桑代克發現,貓在進行「嘗試-錯誤」的學習,經過多次的嘗試-錯誤,餓貓學會了打開籠門的動作。

另外,美國行為治療心理學家沃爾普(Joseph Wolfe)曾進行電擊貓實驗。在第一階段,先把貓關在實驗室的籠子之中,餵食時給予電擊,導致貓出現極度焦慮等精神衰弱的反應,就算刺激不再出現或停止,貓的情緒焦慮恐懼仍然存在,此時即使貓處於飢餓的狀態,也不願進食。第二階段主要是消除貓因為電擊造成的焦慮和恐懼,因為貓餓了始終都要進食,於是沃爾普先把貓處置於與實驗室完全不同的房間餵貓,因為外在環境空間的改變,貓的焦慮恐懼情緒有所降低,經過一會兒,開始恢愎進食。再接下來,把餵食的地方移到與實驗室環境相近的地方,貓又開始恐懼焦慮,然而貓因為前一次的經驗,使牠可以克服這一次的恐懼焦慮。

沃爾普把這一種方法做「互動抑制」(reciprocal inhibition),「減敏感法」(desensitisation),或者是「系統脫敏法」(systematic desensitization)並運用此技巧治療許多精神官能症。

最新研究[編輯]

神經成影技術:原理以及其研究應用[編輯]

前言[編輯]

以往的許多心理學研究中,都只能從一個人的行為反應,或是個人回報的觀感來收集數據並進行相關分析,然而此種研究方法很可能受到個人主觀情緒影響,造成結果無法客觀呈現。神經成影技術是直接或間接對神經系統的結構、功能進行成像的方法,並直接從圖像中讀取資訊,可以排除受到情緒影響的敘述,使研究結果能更加客觀。

本篇介紹了神經成影技術在不同方面的應用,包括從新的角度解釋舊有基本理論或現象,如:情感效價理論、做白日夢等。透過神經成像的方式,可看到當身體進行所研究的活動時腦區的活化情形,並藉由這些結果做更進一步的分析。神經成影技術亦可應用在疾病的研究上,如:阿茲海默症等。利用造影技術搭配其對應的追蹤劑,便可觀察腦部的生理現象,對人類掌控腦部疾病的發生原因有所助益,且由於神經成影是屬非侵入式的診斷,對人體較不會造成負擔。此外,在對立色彩神經的研究中,經由腦部對於不同顏色產生的訊號強弱差異,讓神經成影技術除了應用在尋找神經反應的位置外,也能應用在確認神經反應的機制上,使目前神經成影技術已經成為心理學上不可或缺的研究方法。

原理[編輯]

神經成影技術(Neuroimaging)是泛指能夠直接或間接對神經系統的功能、結構等進行成像的技術。而根據成像的模式,可大致分為兩類:結構成像及功能成像。

  • 結構成像:用來展現腦的結構,進而在醫學上輔助腦部疾病的治療。
  • 功能成像:用來展現腦部使用時的各種代謝活動(包括感覺、運動、認知、情緒等)。常被應用在國內外心理學的研究上,也是本章主要的討論範圍。

目前研究上較為成熟且運用較廣泛的成像技術有六種:計算機斷面成像(Computed Tomography, CT)、擴散光學成像(Diffusion Optical Imaging, DOI)、核磁共振成像(Magnetic Resonance Imaging, MRI)、功能性核磁共振成像(Functional Magnetic Resonance Imaging, fMRI)、腦磁圖(Magnetoencephalography,MEG)、正電子發射成像(Position Emission Tomography, PET)。

心理學的研究着重於腦部代謝活動的研究,因此會選擇使用為腦部提供功能性造影的成像技術,故常見 fMRI 及 PET 技術被廣泛運用在實驗中。根據實驗設計的不同,實驗者經過分析、比較兩者優缺點後會選擇對研究較有效果的成影技術。而有時也會看見兩個技術相互搭配,再將得到的成像進行整合分析的研究。

利用神經成影技術研究情感效價理論[編輯]

簡介[編輯]

心理學上常以「情感效價」(valence) 的概念來量化某個心理指標,即利用座標正負向來描述一個人的正面及負面情感,或其他的心理意義。雖然情感效價是一個基本的心理學現象,卻一直沒有一個科學性的方法能夠詮釋這個概念。目前心理學上主要有三種解釋情感效價理論的假設:

  • 雙極性假設(Bipolarity hypothesis):認為正、負面情感是由同一個腦區調控,並沿着效價座標單方向地增加或減少。
  • 雙價假設(Bivalent hypothesis):認為正、負面情感是分別由兩個不同的腦區調控,並沿着各自的座標增加或減少,這說明一個人能夠同時感受到正面及負面的情感。
  • 情感空間假設(Affective workspace hypothesis):認為正、負面情感不是由特定的腦區管控。此假設藉由引入「神經座標空間」(Neural reference space)的概念,說明一神經元可能在空間中同時影響正面及負面的情感活動,造成情感效價做出相對應的彈性變化。

本篇介紹北卡羅來納大學(University of North Carolina)的學者們是如何利用 fMRI 及 PET 的整合分析(Meta-analysis)方法,探討三個假設中何者最為合理。

實驗方法[編輯]

研究者利用多級峰值核密度分析(multilevel peak kernel density analysis, MKDA),對空間中的峰值做疊合分析,以研究腦內活動的成像,而其中「一般性效價體素」(valence general voxels)被視為可同時在正、負價環境下被活化的指標,因此研究時需先排除具有該性質的腦區。

多級峰值核密度分析
  • 對雙極性假設進行測試
雙極性假設中,腦區的情感活動會單向沿着情價的座標移動,因此若活性變化情形符合 正作用 > 中性 > 負作用 或者 負作用 > 中性 > 正作用,即表示雙極性假說成立。然而在研究中無法測試「去活性」作用是否存在於正作用或負作用,所以無法觀察到中性 > 正價或中性 > 負價的對比,在這樣的限制下,研究者便利用以下邏輯驗證:若正、負價確實在座標上互為反向,那正價 > 負價的相對差值和正價 > 中性的相對差值便會有很明顯的活性差異,因此若神經對於正、負作用所表現之活性大小差距大於正價與中性、負價與中性之間的差距,便符合雙極性假說。
  • 對雙價假設進行測試
雙價假設中,應有兩互相獨立的腦區分別負責正面的情感及負面的情感,即當情感從負價變化到中性時,同一腦區的正面情感不應產生變化(正價活性不改變),反之亦然。以負面情感腦區為例,由於具有「一般性效價體素」的腦區不符合雙價假說的設定,因此先排除;接着若是能找到負作用 > 中性,且和正作用沒有關聯的腦區,或者正作用 > 中性,且和負作用沒有關聯的腦區,即可說明雙價假設。
  • 對情感空間假設進行測試
情感假設中,體素(voxel)為同時在正、負價環境下活化的腦細胞,然而比起中性,對於正作用或負作用活性較大的體素,仍可能對正、負價其中一方的反應較大。研究中使用到支援向量機(support vector machine, SVM)進行分類分析,隨機抽取各 20 組正、負作用對比中性的資料進行測試,並驗證情感效價的資訊是否符合大腦中的神經活化分佈型態。
結果[編輯]
  • 在大腦喙部前扣帶迴皮質及內側前額葉皮質的腦區中可找到雙極性假設的部分證據
測試雙極性假設的實驗中,可在大腦喙部前扣帶迴皮質(anterior cingulate cortex, ACC)及內側前額葉皮質(medial prefrontal cortex, MPFC)的腦區發現正價相對於負價的活性比起正價相對於中性的活性,有更多的體素顯現,可說明在此兩塊腦區中,符合雙極性的假設。然而在其他的腦區中並沒有發現負價相對於正價活性比負價相對中性的活性差異較大的證據。
  • 無法找出雙價假設的證據
測試雙價假設的實驗中,首先尋找是否存在正面情感腦區,然而卻沒有任何體素顯示正價相對於負價的活性差異比負價相對中性的活性差異來得高,再利用相同的分析方法測試負面情感腦區的存在可能,也依然沒有找到任何證據。這個結果說明了此假設無法合理說明情感效價理論,亦即正面、負面情感並非由兩個腦區獨立進行。
  • 在左杏仁核及左前腦島的腹側、前側腦區可找到情感空間假設的證據
測試情感空間假設的實驗中,先尋找相對於中性,對正價和負價的反應較大的腦區,可說明情感空間腦區確實是由一般性效價的體素組成,而這些體素主要分佈在兩側的前腦島(anterior insula)、外眼眶額葉皮質(lateral orbitofrontal cortex)、杏仁核(amygdala)、腹側紋狀體(ventral striatum)、視丘(thalamus)、背外側前額葉皮質(dorsomedial prefrontal cortex)、上半部前扣帶迴皮質等區域,並可將這些區域合稱為「警覺網絡」(Salience network),從解剖學上可以發現這些區域和自我意識的情緒掌控有着相當大的關聯。
接着,在情緒空間腦區(正、負作用皆大於中性的腦區)中,分別尋找正價對比負價有較高的活性,或者負價對比正價有較高活性的證據,發現具有此種性質的腦區主要分佈在左杏仁核及左前腦島的腹側和前側,在此兩塊腦區中,可發現負作用略大於正作用,並皆大於中性,因此可得出這種正價和負價的活性反應,應存在相對的差異而非絕對的差異,符合情感空間假設。

研究結果顯示,雙極性假設與雙價假設的證據極少,相較之下在具有一般性效價性質的大腦邊緣系統及旁邊緣系統,有較多支持情感空間假設的證據,由此推論情感效價可能在空間中同時影響正面及負面的情感活動,而非在各腦區之間獨立運作。

利用神經成影技術研究 Spontaneous thought[編輯]

簡介[編輯]

Spontaneous thought,又稱為做白日夢、stimulus-independent thought、mind wandering,與日常生活息息相關,深切地影響我們行走時、進行簡單工作時等等的心理狀態,不只對於研究人們解決問題、創意思考有關,對研究憂鬱反芻(Depressive rumination)、創傷後壓力症候群(Post-traumatic stress disorder, PTSD)等等臨床心理狀態也很重要。而此心理狀態與人類大腦預設模式網絡(default mode network, DMN)的活化已經被證實有密切關係。在此介紹,UBC 與 Cornell University 學者綜合分析歷年以神經成影技術研究 Spontaneous thought 的論文,找出此種心理狀態下的大腦活化區域。這項研究展示了 spontaneous thought 與大腦區域、網絡的相關性,除了與大腦預設模式網絡以及額頂控制網絡(Frontoparietal control network),還有在其他腦區的活化為未來研究提供不一樣的研究路線與目標。

實驗方法[編輯]

首先,研究者制定關鍵詞(如 Spontaneous thought、stimulus-independent thought、mind wandering 等等),搜尋歷年相關的論文,並且只選擇使用功能性磁振造影(fMRI)、正子放射造影(PET)作為成影技術的論文。接着制定了五項規則排除不符合的論文:使用 Talairach 或者 Montreal Neurological Institute(MNI)紀錄特定巔峰活化中心(peak foci of activation)、非單一研究對象、研究對象為健康族群、涵蓋研究對象自我檢測 Spontaneous thought 的頻率或深度、研究範圍為全腦。上述篩選方式,最終選出了十篇符合的論文。

研究者接着統合所有座標軸為 MNI 座標。接下來,以高斯函數半峰全寬分析,找出非偶然的活化中心群聚,最終得出 157 個活化中心,然後,使用活化可能性評估(Activation likelihood estimation)進行綜合分析這 157 個活化中心,並且視覺化,如下圖。

Peaks for each of 13 significant meta-analytic clusters of activation associated with mind-wandering and related spontaneous thought processes.
結果[編輯]

右圖顯示 13 個與 spontaneous thought 顯著相關的活化區域,包括部分前額葉皮質、前扣帶皮層、部分後扣帶皮層、雙側下側頂葉小葉、海馬迴旁皮質等等。比較特別的是,研究者發現了數個在大腦預設模式網絡的區域之外的活化區域:右側第二體感皮層、左側中腦島、舌狀迴(Lingual gyrus)等等。這些活化區域在過去研究中比較少受重視,但是也扮演了重要的角色,例如舌狀迴,位於枕葉視覺區,涉及較高階的視覺並且參與夜晚做夢的過程,而分析結果令人意外的顯示夜晚做夢的活化狀態與行走時 spontaneous thought 狀態十分相似。

根據右下圖,分析發現 spontaneous thought 的活化,與大腦預設模式網絡以及額頂控制網絡活化區域重疊,代表兩者之間可能存在相關性。先前提及大腦預設模式網絡 spontaneous thought 的活化已證實相關,而額頂控制網絡與維繫心理健康的活動區域重疊,也暗示了 spontaneous thought 與一些心理疾病的發生可能有關。

Mind-wandering/spontaneous thought brain activations contrasted with the default mode network and frontoparietal control network.

研究者歸納出許多特定區域活化與特定的 spontaneous thought 內容有關,例如:根據中前額葉皮質的活動規律,可以判斷為不同「效度」(valence)的情緒活動。

神經造影技術在了解阿茲海默症上的應用[編輯]

阿茲海默症為一種常見的失智症,其中一種可能的成因與腦部神經元中的Tau 蛋白過度糾結有關。Tau 蛋白在正常情況下能夠穩定神經元中的微管系統。若罹患某些疾病,可能會導致 Tau 蛋白被磷酸化,阿茲海默症患者的 Tau 蛋白的磷酸化程度就高達正常人的三、四倍。這種過度磷酸化的情況會形成神經纖維糾結(neurofibrillary tangle),影響神經元的傳導情形並對其造成損害。另一種可能的成因被認為與β澱粉樣蛋白(amyloid beta)在大腦的堆積有關。β澱粉樣蛋白斑塊的形成是阿茲海默症的特徵,且出現的時機點早於症狀的發作。若神經元產生β澱粉樣蛋白的速度高過於清除的速度,即會導致β澱粉樣蛋白於腦中堆積,形成斑塊。

利用具有 Tau 蛋白專一性的正子放射造影(PET)追蹤劑,能以非侵入的方法了解 Tau 蛋白的腦內沈積的模式,以及與β澱粉樣蛋白、神經退化(Neurodegeneration)的關係。理想的追蹤劑應該要符合下列七種條件:

  1. 與 PHF-Tau 蛋白具有高度親和力
  2. 針對 PHF-Tau 蛋白具有高度的專一性
  3. 能夠穿過血腦障壁
  4. 在正常的腦中會快速消散
  5. 中等的親油性
  6. 與皮層下白質的非專一性結合低
  7. 低分解率

利用神經成影技術研究對立色彩神經[編輯]

簡介[編輯]

加州大學的 Stephan A. Engel 使用核磁共振造影(fMRI),在人類大腦皮質上發現了色彩對比神經 (Color-opponent neurons )的存在。色彩對比神經對於研究人類對色彩的理解分辨上,有非常重要的作用。此項研究不僅讓我們對色彩認知有更深層的認識,也賦予了神經成像技術新的功能與價值。

一般而言,視網膜上有三種視錐細胞,分別接收不同波長的刺激,而不同細胞接收訊息加總起來,才變成為我們所見到的各種顏色。這三種細胞分別為:長波視錐細胞、中波視錐細胞、短波視錐細胞,分別接收紅色系、綠色系、藍色系訊號。然而,除了上述較為大眾所知的系統之外,還存在另一顏色認知系統,即色彩對立理論,其中包括下列三種視覺神經細胞:

  1. 紅綠對立神經:受長波與中波視錐細胞輸出訊號的差異值所刺激,即紅色、綠色的量的差值,差值越高,刺激越大。
  2. 藍黃對立神經:受短波視錐細胞與長波、中波視錐細胞兩者訊號加總的差異值所刺激。
  3. 亮暗對立神經:受不同明暗程度的視覺桿狀細胞訊號加總的差異值所刺激。
實驗方法[編輯]

Stephan 的研究團隊初步認為,大腦皮質視覺區的初級視覺區(primary visual cortex, V1)含有許多色彩對立神經,他們利用一連串核磁共振造影相關的研究來證明此事。

首先,他們用核磁共振造影測量受試者看到不同顏色、不同對比度下,產生的神經訊號,發現人腦對高對比度的顏色反應比較強烈,對不同顏色的反應大小也不相同。核磁共振造影條目連結中的圖片為其中幾項測量結果,可以見到,人腦對於高對比的圖案都會產生較強的反應。

  • 核磁共振造影 :核磁共振造影測量人腦對不同顏色與對比所產生的腦波訊號,橫軸為時間,縱軸為腦部反應訊號強度。研究者依序展示給受試者對比度低到高、黑白到彩色的圖案。

接着,研究者計算出對所有顏色都可以產生相同反應的刺激,而此反應強度為上圖實驗的最大反應強度的一半。為了產生相同反應強度,實驗會針對人腦較不敏感的色彩,給予更強的刺激,對較敏感的顏色則給較弱的刺激。如此一來,相同刺激、相同反應強度,只要用核磁共振造影測量不同視錐細胞的訊號量,就可以計算不同波長之間的關係,了解是否有色彩對立神經參與作用。以下視錐細胞輸出訊號圖是此實驗結果,可以發現,刺激曲線會構成傾斜的長方形。

  • 視錐細胞輸出訊號圖:橫軸是長波視錐細胞的輸出訊號變化比例,縱軸是中波視錐細胞的輸出訊號變化比例。正值代表訊號增加,負值代表訊號減少。
結果[編輯]

研究者發現當長波、中波視錐細胞都受到強烈刺激,大腦皮質的反應不是很激烈。相對的,在長波視錐細胞受到較強刺激,中波視錐細胞受到較弱刺激時,大腦皮質卻表現出強烈的反應,因此當兩視錐細胞的差值較大時,大腦皮質才會有較顯著的反應。此結果間接證明了色彩對比神經在大腦皮質的存在,這正是藍綠對立神經的特徵。這項研究賦予了神經成像技術新的用途:不只是找出神經反應的位置,而是進一步確認神經反應的機制。

研究組間變異的新方法:增加結果正確性的策略[編輯]

前言[編輯]

目前經常用來檢測組間變異性的工具為 Anova(Analysis of variance) F test,當檢驗結果為不拒絕虛無假設時,Anova F test 效能很好,但若結果為拒絕虛無假設時,有時候會檢測力不佳。因此,我們將介紹一些最近陸續被發表的測試,不論在檢驗結果為不拒絕虛無假設或拒絕虛無假設時,都可以保持良好的檢測力。 使用 Anova F test 分析時必須滿足三項先決條件:數據具有常態性、獨立性、變異數同值性(即母體為常態分佈、樣本為簡單隨機抽樣、各樣本必須取自變異數相等的母群),而以下三種情況經常造成 Anova F test 無法分辨真正的差異性:

  • 數據存在異常值、離群值(Outliers)

樣本中的離群值(極大值或極小值)容易造成 Anova F test 無法檢測出真正的變異性,且根據現在的研究指出,離群值(Outliers)是很常見的。通常母體出現離群值時,會大大降低 Anova F test 的檢測力。

  • 不對稱性(Skewness)

比較組與組之間的數據時,若有一組數據為不對稱(如:右尾分佈(right-tail distribution)或是左尾分佈(left-tail distribution)),數據對稱時會呈現鐘形分佈(bell-shape distribution),極可能造成 Anova F test 檢測力低落。

  • 組內的變異數 (Variation among each group)

若樣本來自兩組變異量不相同的群體,便違反 Anova F test 的三項先決條件,同時也會影響檢測力與結果的正確性。

替代的檢測方法[編輯]

1. 檢測中位數(Medians)[編輯]

把所有數按照大小依序排列,若樣本數為單數,中位數為數列正中間的數值,若樣本數為偶數,則為最接近中間的兩數值之算術平均數。相較於 Anova F test 比較的是組間的平均數,中位數較不受離群值的影響,也減少了不對稱性對檢測結果的影響。

當檢測母體為常態分佈,且無離群值時,中位數檢測法的檢測力會比 Anova F test 低。此時可使用下述方法。

2. 20%修飾法(20% Trimming)[編輯]

20%修飾法是把數據依序排列,去除最大的 20%及最小的 20%數值,再根據剩下的數據比較組間的平均數。當我們去除越多邊界值時,不對稱性造成的不良影響就越小,當去除邊界值 0 到 20%時,檢測力有顯著的成長,在 20%之後其成長效果就趨緩,因此以 20%為最好的去除比例。同時,去除邊界值也可以避免離群值造成的影響。 Wu(2002)用了 24 篇論文的數據來比較許多檢測方法的效力,然而他發現並沒有任何一個檢測方法是最有效力的,但在所有使用的檢測方法中 Anova F test 的檢測力明顯是很薄弱的,而使用 20%修飾法的檢測力是最佳的。

雖然 20%修飾法是個相當好的檢測方式,但仍有許多學者為此爭論,認為有許多更好的替代的檢測方式。例如非參數(Nonparametric method)、排名(Rank-based method)都在這幾年陸續被發表。還有許多像是只剔除離群值、或是為了避免不對稱性而只剔除最大的 20%數據等。以上探討的方式都皆為組與組之間的比較,但若今天面臨的問題是 A 組高分群與 B 組高分群的比較、A 組低分群與 B 組低分群的比較,以上方法皆無法得到有效力的結果,這種問題可以被 Shift function 這種檢測方式解決,這個方法同時也是以上所述中,有潛力成為最具有檢測力的檢測方式。

女性主義對心理學研究方法的影響[編輯]

女性主義心理學批判以男性為標準的心理研究。後現代女性主義心理學認為,在心理學的研究中,傳統的實驗方法透過實驗條件的安排可以得到實驗者希望得到的結論。

傳統的心理學研究將受試者視為脫離社會和文化背景的抽象的存在,然而事實上實驗者無法脫離社會背景,其行為方式必然受到社會背景的影響。女性與男性在這樣的實驗情境中所產生的行為差異,被解釋為內在的心理特性所造成;研究的結果又被用來解釋女性在某些方面天生不如男性,為維持婦女在社會上的從屬地位提供了科學的根據,這是男性中心主義偏見的例證。因此,傳統實驗方法有其缺陷,應該用其他方法來加以彌補。女性心理學推崇用多元方法來增加研究結論的有效性,以便使心理研究結論更貼近女性生活的現實。

德國精神分析師卡倫·霍尼(Karen Horney,1885~1952)被視為女性心理學的先驅,她不同意弗洛伊德有關男性和女性心理固有差異的觀點(例如:陰莖嫉妒理論),並將這些差異歸因於社會和文化而不是生物學。霍尼因此提出了與弗洛伊德相反的「子宮嫉妒」(womb envy),認為這類情緒可能助長了對女性的社會地位的壓制,並推動男性在其他生活領域(如商業、法律和政治)取得成功。但她同時認為,子宮嫉妒不是男性天生的心理特徵,而是當男性認為他們並沒有像他們想像中那樣掌控和強大自己的生活時產生的。[3]當然,這樣的說法可能存在爭議,卻着實在過去以男性心理學家為主的心理學研究上做出了空前的突破。

本土研究[編輯]

本土心理學崛起:貼近自己的心理學[編輯]

此篇章中的「本土」意指華人社會。本土心理學研究者楊國樞先生(2005)曾以一段話精闢解釋本土心理學的定位:「本土心理學是一種以科學方法研究某一特定族群團體或社會文化之中人民的心理與行為所發展來的心理學知識體系,但研究歷程中所採用的理論、概念、方法及工具必須與所探討的本土心理或行為現象及其生態的、經濟的、社會的、文化的、及歷史的脈絡高度契合、符合。
自從科學革命、工業革命後,西方國家在國際上佔領優勢地位,而在心理學研究也是如此,率先發展了心理學的科學體系。1970 年代的臺灣學者開始發覺,由於過去的政治與歷史因素,臺灣在各個方面——研究亦然——皆嚴重地受西方影響,其中心理學研究受美國影響尤深。這使得當代心理學研究過度依賴西方理論,缺乏自身獨特性,且忽略了不同社會文化下人類行為的差異。即便研究對象是華人,但研究使用的方法、觀念、理論皆沿襲西方,研究成果可能因此偏頗而無法成為有效的資料,或是無法成功解釋華人文化現象,如同「失去靈魂」。在懷疑西方的心理學研究對當地的適切性之後,港、中、臺學者開啟了尋找「靈魂」的旅程,三地各自有不同的發展,又交互影響激盪,以脫離歐美或非本土的框架、並建立與本土契合的系統。

本土心理學研究條件:本土化契合[編輯]

身處於相同環境的人們,往往有相近的生活體驗與視野;但散落於世界各地的成員,便不見得擁有相似的經驗。當我們的研究方法是直接套用國外的東西而來,這些西化知識是不是能夠契合我們的社會文化因素,就成為一個爭議點。舉個簡單的例子,2015 年的電影「我的少女時代」勾起台灣民眾的青春集體記憶,橫掃票房、掀起風潮;然而小虎隊、溜冰場等元素在當今其他國家的電影裏,便可能無法引起共鳴。再舉個例子,本章節寫本土研究,即便翻譯成其他語言,一到非華人地區,讀者極有可能興致缺缺、直接跳過。而「本土化契合」正是讓當地人來研究當地人。經由這樣的機制能保證研究者之問題、方法理論,高度契合被研究者。

本土化研究之原則[編輯]

為了有效進行本土心理學研究,心理學者提了消極性的「七不」與積極性的「十要」準則。前者為消極避免妨礙心理學本土化發展,後者則為有利且積極捍衛心理學的本土化。

秉持這些原則的原因:

心理學畢竟是以人作為研究對像,在研究之前就應該理解個體之間或者文化之間的差異性。更何況是本土心理學研究以地域為主軸的研究,更應該以謹慎的態度選擇理論、方法、變因,避免先入為主。

「七不」[編輯]

一、不套用他國理論與方法

在進行本土的心理研究時,不要套用他國學者的理論及方法,尤其是針對他國人民行為的研究。

二、不忽略他國理論與方法

本土化並不是全然地排外,學習者依然可以引用外國建立的概念、參考外國文獻,再與本土研究互相對照援引,進而整合成適用於本土之理論。

三、不排斥他人所用之方法

做本土研究的心態應是對於所有方法都持包容態度,只要能有效地探討華人心理,任何研究方法都應予以尊重、悉心探討,避免錯失適用理論。

四、不採用跨文化研究策略

進行研究時,不要與他國文化做比較,否則可能再次陷進西方觀點。

五、不採抽象性過高的項目

不要研究太抽象的題目、或者範圍太大的議題。

六、不要採用外語進行思考

語文對於思考的面向、內涵有很大的影響,研究時應以本土之思維理解、詮釋,以期保有清楚的邏輯。

七、不將學術研究泛政治化

雖政治與生活息息相關、密不可分,但研究者應切記自己立場的中立性,不因個人的主觀意識、利益的影響,而使得研究的方向、理論,偏離了軌道。

「十要」[編輯]

一、要忍受懸疑未決的狀態

需要研究者耐心地思考當地社會文化因素與研究題目之關聯性。一旦心急,可能會使用西方的現成觀念,不僅失去了研究的本土性,更阻礙了自己本土化的學術思考。

二、要充分反映華人思想

在研究時,須將自己本土性思想、認知充分反映在問題界定、概念分析、方法設計、工具製作、結果解釋之中,以有利開創屬於本土的研究方法。

三、要批判地運用西方理論

在研究的過程中,若真的有採用西方概念的必要,則要以謹慎的態度,仔細地分析所探討之心理與行為,其根本的內涵以及特徵。

四、要強調社會文化的脈絡

考慮到行為發生的背景,才能合理地解釋其因果關係。

五、要研究特有的心理與行為

在選擇研究課題方面,儘量從華人特有的心理與行為來切入(如孝道、關係、緣分、面子、人情等),能避免習慣性套用西方概念,方能再更進一步創造新的本土理論。
而在解釋特有現象的同時,最好能採用其現象在當地的民俗性詞語,如此一來,才可保留概念之本土性及意義。

六、要詳盡描述研究之對象

進行研究的同時,我們需要詳細的資料,也要力求在正當的方法及程序下,紀錄、研究現象的本質。

七、要同樣重視內容與機制

前面有提到應該要詳盡研究之對象,指的是行為的內容;而我們也必須重視行為的原因,即背後社會結構的影響。內容與機制缺一不可,否則建構的理論會較為薄弱。

八、要與華人學術傳統銜接

在學術上,有關華人的心理學術研究,要儘量與華人以往的傳統銜接,而非勉強地和外國的心理學、思想哲學作連結。

九、要兼顧傳統面與現代面

隨着時間推移,傳統與現代的時局不同。以現在的華人作為研究對象,應注意其變遷的過程,兼顧傳統與現代的面向,並探討變遷的因素,確切了解事件的演變。

十、要兼研今人與古人的心理

建立本土理論時,除了要研究現代華人,還要研究古代人的心理,建立更宏觀的本土心理學。

本土研究之目的[編輯]

有鑑於華人社會的形塑過程與西方歐美國家大相逕庭,華人心理學界希望藉由設計適合東方社會的心理學研究方式,讓研究更貼近真實情況。考慮華人社會的文化、社會體系和心理間的交互作用,掌握華人行動背後的意義,進而找到適合研究華人心理概念的設計,發展一套適用的模型或理論,建立東方的心理學研究體系。因此研究者需要將文化、歷史脈絡放入研究的思考框架中,才能釐清影響個人行為的因素。在研究方法上,應採取「多元典範的觀點」,視問題性質的不同,採用不同的研究典範,盡力於對問題能夠獲得「由不同世界觀源與生俱來的全面性瞭解」,方能彰顯學術主體性及獨立性。

本土心理學與心理學的本土化的問題[編輯]

心理學的發展經歷了「整合—分裂—再整合」三階段。現今,國內心理學正處於第三階段——再整合。

而國外之研究亦有其不同階段,以及各學派的分立。在了解本土之前,我們亦必須觀察並了解西方心理學的分歧。 科學心理學創始人馮特(Wundt)提倡統一的心理學。自馮特以後,心理學逐漸往不同方向發展,大體而言分為實證主義立場的心理學和人本主義立場的心理學此二派。簡單來說,就是以科學或人性為中心的差別。兩種學派各自為陣,互不相讓,然雙方皆是為了把自己的理論成就推向巔峰。不可否認,兩種學派的積極研究為西方心理學的進程做出了巨大貢獻,但另一方面,因兩種學派的堅持己見,雙方始終無法進一步溝通、融合,導致心理學的學科性質越來越不統一,造成「小心理學觀」。 而當今學者若想建立起屬於東方、華人自己的心理學,首先必須使研究方法本土化。因研究方法是一套理論體系的標誌,是判斷一套體系是否成熟的關鍵,但若過分着重研究方法的本土化,必然使本土心理學研究形同虛設,無法真正與現實生活契合。此外,研究時也應當銘記西方心理學走向分化的教訓,更多以開放的心胸與其他研究者交流,並時時自省。如此一來我們必能創造更完整、更兼容也更精準之本土心理學知識。

本土心理學之困境[編輯]

西方心理學的強加使用[編輯]

將適用於西方人的心理學概念與測量工具加以翻譯,強用於非西方人民,就以爲測到相同的心理結果,是任何研究者都不應犯之研究大忌。因此,本土心理學正是強調不要直接套用美歐心理學的理論、概念、方法及工具。

本土心理學者後繼無人[編輯]

即便心理學本土化運動如火如荼地進行,黃光國先生不諱言本土心理學的發展遭受許多困難。各國研究本土心理學的學者寥寥無幾,因此當成果遭受許多主流心理學研究者的批判時,也無他人發聲、或繼續鑽研。後繼無人,便無人能繼續開拓研究的深度廣度。菲律賓就是一個佐證,在學術圈最早倡導本土心理學的學者為菲律賓的 Enriquez,當初曾是一位受人景仰的大師,可惜在最燦爛的年華就殞落了,連帶使得當地心理學發展面臨停滯不前的窘境。

不完整的心理輔導諮商系統[編輯]

楊國樞認為亞洲與華人地區的心理輔導與諮商專業長期引用來自西方的理論與技術。無論在學術研究、課程教學或實務工作上,都以西方的理論學派與研究結果為思考與工作的依據,忽略了東方文化因素,沒有建立起一個符合亞洲與華人地區文化的心理輔導與諮商專業的學術傳統與實務環境。

本土心理學的未來展望[編輯]

本土心理學將兵分兩路[編輯]

黃光國先生認為,依目前形勢,在可預見的未來裏,會發展成一派以西方科學實證為宗,重視自然科學研究的成果,異於西方理論的架構,較易為學術主流所接受;另一派以素樸哲學觀為基礎,雖可能較無法與國際心理學家互相交流,然仍有其大放異彩之處。黃光國也建議亞洲與華人地區的本土諮商心理學研究的策略,可以利用東方哲學中的傳統智慧為題材,並以西方科學研究的知識論為基礎,建構一套既能代表普世人類的心智,又能表現特定文化人群的特殊心態之本土心理學理論,最終進行能驗證本土心理學理論的實徵研究。

李瑞玲提出三點未來之展望[編輯]

  • 應該進行關於中國心理學歷史發展之研究
  • 提出可連結於其他學門,本土心理學的研究層次與方法
  • 建立一套本土心理學研究的方法論

對於最後一點,李瑞玲更強調:「即使在中國土壤孕育出來的方法論,並不應只適用於本土的社會與學術生態。因為學術本土化的目的,並非只是為邊陲社會的學術自主性做民族文化式的訴求,而是經過徹底自我反省後的自我解放」。亦即本土化(Indigenous)研究並非等同於在地化(Localized)研究,而是要建構既能代表普世人類心智,又能表現特定文化族群的特殊心態。此種心理學理論,才是本土心理學研究所要努力方向。

結合西方和本土的策略[編輯]

鄭伯壎在《華人組織行為研究的方向與策略:由西化到本土化》的論文中提到,華人的本土化研究,可結合西方和本土的策略,進而取長補短:其一為本土化研究策略,另一是跨文化策略,最後為整合性策略。採用本土化策略時,剛開始是以民族誌做參與和觀察,而後以個案研究等質化研究方式,來長期觀察某文化下的組織行為。應先為厚實的描述,再由此歸納出重要的研究構想與命題,進而形成理論,而後進入科學研究歷程的循環。

代表人物、組織、其他發展[編輯]

代表人物[編輯]

楊國樞教授
楊教授1959 年畢業於國立臺灣大學心理學系,爾後赴美進修並取得美國伊利諾大學文學碩士學位與哲學博士學位,是台灣第一位心理學博士。楊教授畢生致力於發展人格與社會心理學研究,尤其在本土心理學研究上,楊教授看出華人心理學研究的盲點——全盤套用西方心理學的理論與方法,於是他積極倡導與推動貼進華人社會文化特徵的本土心理學。辛苦耕耘四十多年後,其豐富、多面向的研究成果為臺灣本土心理學的研究奠定紮實、穩固的基礎,相關的理論建構與研究方法亦逐漸發展成熟。 楊教授在理論建構方面,建立了「華人社會取向與個人取向理論」與「人類基本需求的雙 Y 理論」等兩項人格與社會心理學理論。在研究方法與工具方面,則編製了家族主義量表、成就動機量表、自尊量表、自我概念量表...等等本土化測量工具。 至今,楊教授仍堅守學者崗位,致力於華人本土心理學的發展,包括參與相關研討會與發表著作,更主導多項大型研究計劃,盼能竭盡己力貢獻學界。 楊教授跟中研院民族學所的所長文崇一先生合編了一本書「社會及行為科學研究的中國化」,主要思考兩個議題:心理學理論建構的本土化;知識跟理論建構的自主性。

黃光國教授
黃教授從 1980 年代之初,開始參與心理學本土化運動,是「華人本土心理學研究追求卓越計劃」的主持人。他著有《儒家關係主義:哲學反思、理論建構與實徵研究》(黃光國,2009);《Foundations of Chinese Psychology: Confucian Social Relations》(Hwang, 2012)。在 Foundations of Chinese Psychology 一書中,黃教授所主張的「文化系統」(Culture System)研究取向,將儒家文化視為整體系統,可以避開「泛文化向度」(Pan Cultural Dimensions)研究取向上的缺失。「泛文化向度」研究取向雖然能累積許多瑣碎的實徵研究成果,卻傾向於使非西方文化面貌模糊,喪失其文化的可辨認性(Cultural Identity)。而「文化系統」研究取向則可使華人瞭解其文化傳統,並獲致清晰的文化認同感。此種研究取向以「多重哲學典範」作為基礎,其核心為「本體論的實在論」,有堅實的哲學基礎,可以推廣到其他非西方國家,協助他們建立自主的社會科學。

鄭發育教授
鄭教授畢業於日本京都大學哲學系,拜京都學派西田幾多郎門下,專攻京都學派及德國哲學,戰後專研實驗心理學,是台灣實驗心理學的奠基者,同時也是台灣大學心理系的創立元老。一生不斷培育心理學優秀人才,如吳英璋、余德慧等人。鄭發育早年接觸德國思想例如德國觀念論、完型心理學(Hullian psychology)等,使得從事知覺心理學研究時,大抵以知覺的統覺理論為基礎。曾赴美國耶魯大學心理學實驗室短研一年,接觸到霍爾學派(Hullian psychology)的行為學派,並且設計一系列實驗,為排灣、賽夏、阿美族的色彩好惡、智力、及人格測驗提供比較,也曾將心理設計測驗導入工商適性研究上。

蘇薌雨教授
蘇薌雨(1902 年 9 月 11 日-1986 年 6 月 25 日),名維霖,以字行。北京大學哲學系畢業、東京帝國大學大學院肄業。曾在校師承李大釗、蔡元培、李石曾、陳大齊等,戰後隨國府返臺,任行政長官公署參議,並受聘為國立臺灣大學哲學系正教授,主持哲學繫心理學研究室,後任臺灣大學心理學系創系主任兼圖書館館長,為臺灣心理學及哲學學者。 譽為心理學拓荒者的蘇薌雨,赴京就讀哲學時受五四運動影響,積極鼓吹白話文,主張中國白話文做為臺人書寫系統,並受胡適、陶行知、金岳霖等實用主義者影響,專研發展及教育心理學[5][6],著有《心理學原理》、《心理學新論》、《心理學新論增訂本》等。治學嚴謹、待人謙和,與楊國樞等後進有亦師傅亦友的關係,「但欲培植佳子弟,富貴於我如浮雲」為其一生最佳寫照 。

余德慧教授
余德慧(1951年1月10日—2012年9月7日,被譽為華人心理學大師。畢業於國立臺灣大學臨床心理學博士,1987年赴美國加州柏克萊大學進行博士後研究。1989年,返國任教於國立臺灣大學心理學研究所,他與恩師楊國樞教授在臺大心理學系開設了全臺灣第一門「生死學」課程,深受學生喜愛。 曾擔任台灣第一本人文心理雜誌《張老師月刊》總編輯,開創了新穎的本土心理學研究領域,多次獲得行政院新聞局頒發的雜誌類金鼎獎。其作品包括《生命夢屋》、《情話色語》、《觀山觀雲觀生死》、《生命宛若幽靜長河》、《生命史學》和《生死無盡》等。

組織[編輯]

華人本土心理學基金會:1997 年由一群從事華人心理與行為研究的工作者所發起成立。其性質為一非營利的學術公益團體。此會主旨在於促進華人心理學家以本土研究定向,進而發展能夠貼切描述及瞭解華人心理、行為及生活的學科,並憑以貢獻本地社會。此會提倡的「本土研究定向」是有鑑於有關華人心理之研究深受西方心理學的概念及方法之束縛,其成果常與當地社會的實際情況及需要脫節,因而易淪為點綴的學科,不能憑之造福自己的社會。採取本土研究定向,需要研究者攝取本土哲學、宗教、歷史等人文科學及社會學、心理學、人類學等社會科學的養份,以全面了解華人的心理、行為及生活。此基金會因此認為加強各人文暨社會科學的合作及交流,是推動本土研究必須走的道路。現今幾個華人社會具有其共同的文化傳統,但也各自生活在當地特殊的政治、經濟、社會體系之中。在這些地區進行合作或跨地區的比較研究,可以多方面了解傳統文化在現代社會所扮演的角色,使華人本土研究的內容更豐富、更完整。同時,各華人社會也可彼此借鏡,以提昇其研究水平。

華人本土心理學推動委員會:持續推廣有關華人本土心理學的相關理念知識和理論。

其他發展[編輯]

《本土心理學研究》期刊:華人本土心理研究基金會出版,1993 年創刊,半年一刊。為純學術性的中文期刊,主要發表採取本土化研究觀點與策略所完成的論文。目前仍持續出刊。

「華人本土心理學研究追求卓越計劃」:總計劃主持人黃光國教授,向教育部申請參加「追求卓越」的計劃,提出「華人關係主義」做為理論架構,並建立了一套自我規約的機制,希望能促進華人本土心理學研究水準的大幅提昇。

本土心理學學案[編輯]

本土心理學學案研究一: 楊中芳教授與她的中庸心理學研究[編輯]

楊中芳,台灣大學心理學學士,芝加哥大學心理學博士。先後任教於美國、台灣中正大學和陽明大學、以及香港大學。退休後在中國廣州中山大學和中國社會科學院推動西方心理學教學及本土化心理學研究。楊中芳的代表性著作有《如何研究中國人》、《如何理解中國人》以及《中國人的人際關係、情感及信任》等。

作為華人本土心理研究基金(香港)的主持人,楊中芳晚年最重要的本土心理學研究,乃探索中國傳統文化的核心部分,即所謂中庸的思想對中國人心理與行為的影響。

楊中芳和趙誌裕於1997年提出採用心理學構念化的方式,將傳統思想的中庸構想為類似於元認知的一套「實踐型」思維方式,稱之為中庸實踐思維。此後,楊中芳對這個「中庸實踐思維」不斷細化、更新,擴展為一套包含集體文化思維、個體心理思維(生活哲學、具體事件處理、事後反思/修正)和心理健康等三大層面的中庸實踐思維體系,並孕育影響了3種中庸思維量表的開發。

楊中芳強調中庸心理學的研究初心並不在復古,而是在於探研一個仍然在當今華人生活中發揮重要作用的思維方式、價值觀以及行動策略。故中庸心理學研究雖然採用西方實證研究方式及量表開發,但偏重的卻是本土化心理學的研究思路, 即楊國樞所說的,是用華人自身的思維方式及價值體系,來理解華人生活現象的心理意義。

生活應用[編輯]

心理學研究法最常被使用的研究法分成五種。分別是個案研究法、實驗法、觀察法、相關法、調查法, 以下一一介紹並舉出生活實際應用案例。

個案研究法[編輯]

研究案例──研究法的謬誤-藥越貴越有效?

通常在醫學和心理學實施的每種療法中都能獲得一些支持者,不論治療效果,人們通常都傾向回報療程有效,這就是著名的安慰劑效應(Placebo Effect)。實際上,近百年醫藥科學才發展出較多具療效證據的治療方式,因此也有「在這個世紀以前,醫學史不過是安慰劑效應的歷史」這種說法。此外,這裏也能夠套用反安慰劑效應,即人們對於越便宜或是體積越小的藥物,越不相信其效用。

美國辛辛那提大學(University of Cincinnati)的神經學家 Alberto Espay 針對安慰劑效應進行了實驗。他挑選了 12 位罹患巴金森氏症(Parkinson's disease, PD)的病人,先停用原本的藥物「左旋多巴」(Levodopa)後告知病人,有兩種新藥可幫他們製造多巴胺,實際上這兩種「藥物」都只是生理食鹽水。研究結果發現,在運動技能(motor skill)測試中,接受較高費用藥物治療的病人,其測試結果比接受低費用藥物治療的病人較佳,顯示病人主觀相信服用較貴藥物會得到較好的結果。但是不管是何種安慰劑,效果仍未比服用常規藥物左旋多巴好。

安慰劑效應在心理治療中也很常見。許多有輕度和中度心理問題的人,在接受心理治療後表示他們的情況好轉,然而控制研究證明:此康復比例中,有一部份的人是由於安慰劑效應與時間推移兩個因素共同作用的結果,這裏的時間推移通常稱為「自然康復現象」。大多數有療效的治療都是原有療效及安慰劑效應的結合。正如多德茲(J. E. Dodes)所說:「即便非常嚴重的疾病,也有惡化與康復交替出現的過程,關節炎和多發性硬化是最常見的例子。甚至有些人患有腫瘤,也會莫名其妙地消失。」不過他也提醒人們:「安慰劑效應往往會證實且強化人們懷疑自己有某一疾病的想法,從而又發出慢性疾病,使他們變成毫無科學根據、只靠安慰劑效應從事治療的江湖郎中之常客。」

實驗法[編輯]

赫爾曼.艾賓豪斯的「遺忘曲線」

赫爾曼.艾賓豪斯(Hermann Ebbinghaus,1850-1909)是德國的心理學家,也是第一個用實驗方法研究記憶衰退的心理學家。為了能夠客觀地研究記憶與遺忘,記憶的實驗必須採用標準化、一致性的測驗項目。因此艾賓豪斯發明了兩千多個無意義單字,把一個母音嵌入兩個子音之中,並隨機抽出若干字來做為記憶實驗的內容。他以自己為實驗對象,每次實驗取出若干單字,隨機排序後,測驗自己需要重複幾次才能完全記住這些字序,並間隔不同的時間測驗自己的記憶與遺忘狀況。同時也測驗複習之後,需要多久時間才能再重新完全記住這些字序。艾賓豪斯從實驗結果得到了一些遺忘規律,得出著名的「遺忘曲線」,是使用科學實驗方法,成功用量化呈現遺忘的特性的案例。
(請注意:雖然艾賓豪斯的遺忘曲線是一個被多次驗證和應用,且被視為可複製的心理學現象,但其也存在一些問題,包含:
1. 外部效度的問題:艾賓豪斯的原始實驗主要是針對他自己進行的,因此實驗結果若要推廣到其他人身上,在外部效度上會有一定的限制。
2. 實驗設計的問題:許多後續研究指出,遺忘曲線可能受到實驗設計的影響,例如學習材料的性質、學習方式等,這些因素可能會影響遺忘曲線的形狀和速度。
3. 個體差異的問題:每個人的記憶和遺忘模式皆存在差異,因此遺忘曲線在不同個體間的適用性可能會有所不同。
因此,遺忘曲線雖是一個被廣泛研究和討論的現象,但在應用和推廣時需要考慮到不同的情況和限制,以確保其可靠性和準確性。)

典型的遺忘曲線
典型的遺忘曲線


上圖為《艾賓豪斯的遺忘曲線》:用於表述記憶中的中長期記憶的遺忘率的一種曲線。

觀察法[編輯]

企業界的「神秘客」

《遠見》雜誌每年發佈的「服務品質調查」,共動員二十名具國際證照的「神秘客」實地調查十九類不同行業企業。主要觀察員工服務態度、熱誠表現,約佔總評分七成五,出狀況測試的魔鬼題佔總評分二成五。2021 年共評比兩百八十三家企業門市,規模歷年最大。以神祕客至 LEXUS 測試為例,保養過程中神祕客宣稱手機沒電,LEXUS 維修技師立刻大方出借他的手機,令神祕客感受到「把客人當朋友」的服務態度。除此,神祕客保養汽車離去後,還去電指稱於車內撿到螺絲,車廠接到通知後便立刻安排再次入廠檢修。

值得留意的是,神秘客觀察法亦有其侷限性,即實驗設計與樣本採取上可能有所不足,所得出之結果未必具有普遍性。例如:在神秘客觀察法中,研究者無法控制所有影響服務體驗的變數,比如店鋪繁忙程度、員工個人狀態、其他顧客行為干預等,這使得很難斷定測試結果是由於實際服務品質本身還是外部因素介入。此外,因為培訓神秘客並進行消費測試需要相當的時間與金錢成本,所以神秘客觀察法只能獲取少數樣本,進而可能導致測試結果的代表性受到質疑,蓋其無法覆蓋所有潛在的顧客消費體驗

餐飲界的「神秘客」

《米其林指南》是餐飲界中相當具有權威的一美食評鑑書刊。透過動員受過法國完善訓練的「神秘客」實地走訪各種不同的餐廳,依照五項標準選出餐廳名單,包含食材品質、食物準備技巧與口味融合、創新程度與廚師理念。且為了保持客觀、公正,「神秘客」之身份、行為皆與一般顧客相同,並不會有故意掉落叉子等引發餐廳(受試者)注意的刻意行為。

遊戲界的「作弊問題」

「懷維爾」(Whyville)是1999年創立的一款為8歲以上兒童而設的教育遊戲,它似乎不像是一個需要調查作弊的地方。但是據《作弊:在電玩中佔便宜》(Cheating: Gaining Advantage in Videogames)一書的作者、加拿大蒙特利爾市康考迪亞大學(Concordia University)的遊戲研究與設計和傳播研究教授米婭·康薩爾沃(Mia Consalvo)說,它卻成為了作弊無處不在的一個證據。「懷維爾」的開發者在開發過程中發現了一些不尋常的事——這是一款68%的受眾為8-13歲女性的遊戲,但是作弊在當中卻相當盛行。這或許是因為,玩家在遊戲所感受到的失去是真實的。你的遊戲資本被奪走,是一種傷害,哪怕你失去的只是「大富翁」裏的貨幣或者「懷維爾」裏的「蛤幣」。

相關法[編輯]

睡眠與學業成績的相關性

挪威一項針對學生睡眠情況與學業成績研究中指出,睡覺時間、睡眠時數以及睡眠缺損都與學業成績有關,睡眠缺損越嚴重,學業成績就會越低落。這項調查包含了近八千位青少年,在這項研究中學業表現最好的那群學生,是在晚上 10-11 點間睡覺、每天睡 7-9 小時、睡眠缺損少於一小時。
有人會指出,不一定是睡眠時間不足導致學業成績低落,也可能是因為學業成績較差,所以需要花上更多時間熬夜趕上,至於成績好會唸書的人當然早早唸完就睡了。因為本研究採用的方法是相關性研究法,結果只是代表相關性,其因果關係仍須透過更近一步的數據分析以及研究才能確定。

避孕與家用電器相關性

台灣過去曾經做過一個大規模的調查,研究哪些因素與人們是否進行避孕有關。一群社會學家和醫學工作者組成龐大的研究隊伍,為了得知什麼變數最能有效預測人們進行避孕,而廣泛蒐集了諸多行為和環境變數的資料。蒐集資料後,他們發現──家中家電的數量與人們是否使用任何方法避孕的相關性最高。雖然家電數量和是否使用任何避孕方法之間,似乎存在着密切的關係,這個研究結果卻不會讓人們認為用家用電器就能夠解決懷孕問題。這個例子表達了一個很重要的基本原則:有相關不表示一定有因果關係,也就是相關不蘊涵因果(Correlation does not imply causation)。除了要考慮兩個變數關係的本質與研究者想理解的問題是否相關之外,還必須再考慮到第三變數問題與方向性問題。

古德柏格與癩皮病

二十世紀初的美國南部,數以千計的人遭受一種稱為癩皮病(Pellagra)的皮膚病侵襲。當時研究資料顯示,此一病症與衛生條件有關。因為在南卡羅來納州的斯巴坦堡(Spartanburg)市內,未患有癩皮病的家戶似乎都裝設了自來水及污水管道系統,也就是衛生條件較好。此相關恰好呼應當時一個傳染病的病理理論:由於衛生條件較差,污水處理不當,使癩皮病容易透過感染者的糞便不斷傳播。 不過古德柏格(Joseph Goldberger)醫師對這種解釋不以為然,他反而認為癩皮病是營養不良引起的。因為美國南方地區普遍比較貧窮,人民多以當地盛產且便宜的玉米作為主食,較少吃肉、蛋、奶等高蛋白含量的食物。

古德柏格認為污濁的環境和癩皮病之間的相關不具因果關係,之所以會出現相關性,是因為有水管線設施的家戶通常經濟條件也比較好,而這種經濟差別也反映在日常的飲食中。

古德柏格假說不僅建立於觀察變數間相關系數所作出的判斷,還包括另一類證據:對關鍵變數進行操控之後所蒐集的資料。為了證實癩皮病不是透過患者的體液傳播,古德柏格也在自己身上注射患者的血液,還將患者喉中和鼻中的分泌物放入自己口中。此外,他選出兩位癩皮症病患,一個有皮癬症狀,一個有腹瀉症狀,他從病患身上撥下魚鱗狀角質皮,混入該病患的尿液,並加入他們的糞便,與一些麵粉揉在一起做成小藥丸。古德柏格醫師自己和幾個助手自願吞服下去,最終他們都沒有染上癩皮病。 古德柏格醫師在試驗癩皮病所有可能的傳染途徑後都並無大礙,有力的反駁了衛生條件差這一說法。古德柏格之後更為了證明自己的因果機制有效,從監獄農場找到兩批無癩皮病並志願參加實驗的犯人,其中一批配給多為玉米製品且低蛋白質的食物;另一批則配給相對營養均衡的食物。五個月內,癩皮病果然在食用大量玉米製品且低蛋白質食物的犯人間肆虐,另一批人則安然無恙,為古德柏格的理論提供強而有力的依據。

上網成癮與憂鬱症

英國里茲大學心理學家曾針對上網成癮與憂鬱症進行研究,且研究後發現上網成癮者憂鬱沮喪的現象,比起沒上癮者嚴重得多,其憂鬱指數足足高五倍。並將其研究成果刊於《心理病理學》期刊。然而此研究並不能代表上網成癮與憂鬱症有因果關係。首先,里茲大學的研究結論,是根據 1319 份線上填寫的問卷而得,內容詢問受測者上網時間多長、目的是什麼,因此受測者可能會由於抽樣謬誤及社會期許反應而導致誤差。其次,上網成癮與憂鬱現象,就像「雞先蛋先」問題,猶有爭議。網絡上癮者情緒可能本就悲觀消沉,而導致了此研究結果。因此此研究只代表了兩者可能有相關性,其因果關係需要其他研究證明。

調查法[編輯]

焦點訪談

使用焦點訪談法,研究者會挑選一群研究對象進行訪談。一般來說,會精心挑選 6~10 位對象進行訪談,並由一位熟知該研究主題的主持人帶領大家討論。 比起其他的研究方法,「焦點訪談」能更了解研究對象的行為動機,但因為樣本數少,且又帶入研究對象的主觀想法,因此不具有完全的代表性。此外需考量研究者的能力,是否能夠掌控一群訪問者,不讓場面失控又能問到欲了解的主題。

問卷抽獎

在許多地方都可以看到一些調查問卷,這便是生活中運用調查法的實例。在這類型的網絡問卷中,調查的範圍十分廣泛,例如:生活習慣造成哪方面的影響、對同志婚姻的看法、消費者購買物品的心理因素、自殺防治等相關議題都有。在此類的問卷調查方式中,都會配合「填寫後可參加抽獎」的方法,只要獎品足夠吸引人,就能增加填寫人數,一旦樣本數量足夠龐大,便具有統計學上的意義。但在此類的社群網站或社團發佈問卷調查,也有其缺點。例如接受調查的族群,幾乎都是同年齡層的大學生,較缺少社會大眾多數族群對議題的看法,缺乏普遍性。故若能在各類年齡群及不同職業的人群間使用此法,即可帶來較具普遍性的實驗結果。

服務滿意度調查

在餐廳用完餐或是使用電話客服後常常可以看到有關服務滿意度的調查問卷。調查的範圍涉及對服務的滿意度、服務人員的態度等。透過此類的問卷調查,業者可以分析調查數據來研究如何增加顧客的忠誠度以及滿意度,再根據不足之處進行改進以增加營收。而由於此種問卷調查方式可以直接地獲得使用者的反饋,並馬上進行處理或是改進,所以已經被眾多服務業所採用。但其也具有一些缺點,例如

  1. 填答意願低落造成樣本不足,而使其不具統計學上的意義。
  2. 填答時容易受服務員左右而導致不能忠實的呈現結果。

書籍影音[編輯]

書籍[編輯]

1.《這才是心理學(增訂版)》 作者:Keith E. Stanovich 譯者:楊中芳 出版社:遠流
史坦諾維奇教授為了讓心理學家的研究成果能受到應得的重視及合理的應用,以富有邏輯又不失風趣的方式,搭配簡潔具體的實例和最新的研究資料,說明研究者如何透過系統化的實徵研究、可公開重複驗證與評鑑的程序,逐步描繪出人類心智的真實面貌。
2.《心理與教育研究法》 作者: 董奇,申繼亮 出版社:東華

3.《這才是做研究的王道》 作者:Howard S.Becker 譯者:呂姿吟/郭錦媛 出版社:群學
作者援引超過數十年的教學與研究經驗,給予學生寶貴的建言。這些忠告簡單的如改變訪談提問,到困難的像是操作真假值表,誘導出許多新的想法。

4.《史上最偉大的心理學實驗最新完整版:原來人性心理是這樣!》 作者:田秋 出版社:達觀
書中收錄了八十餘則著名的心理學實驗,通過這些有趣的實驗讓讀者發現人們行為背後受到一些奇妙的心理規律所支配的;進而發現,生活中那麼多的道理都有據可依。
5.《趣味心理實驗》 作者:渋谷昌三 出版社:小倉書房
本書以心理學的實驗為例,來探討我們身邊的話題及社會問題,並希望能以科學方式剖析人心。由這些知識,能了解以往不怎麼清楚認識的自己,以及和朋友、同事之間的言行。相信對一些社會事件也將能更向下挖掘,深入了解其背後真正的理由。
6.《實驗心理學(第四版)》 作者:朱瀅 出版社:北京大學
實驗心理學是將實驗研究方法應用於心理學各個領域的一個心理學分支。本書在介紹實驗設計、心理物理學方法和反應時間等基礎知識後,對各個重要的心理學研究領域作較系統的講解,如視覺與聽覺、注意、記憶、思維、心理語言學、社會認知、意識等。
7.《生活中的趣味心理學》 作者:田秋 出版社:金城
本書通過心理學實驗,讓你清楚地看到人在特定情境脈絡中的好惡、恐懼、順從、怯懦等心理特質,從而幫助我們梳理在日常生活中經常忽略的行為背後複雜微妙的心理因素,使我們能更加清楚地檢視自我、了解他人。
8.《怎樣洞察別人》 作者:G.I. Nierenberg 譯者:蔡慶蘭 出版社:遠流出版
本書所探討的是洞察別人行為姿態的問題,幫助讀者探測人際關係的海洋,確實看清他人行為姿態所透露的訊息。
9.《研究方法:實徵性研究取向(第二版)》 作者: 周文欽 出版社:心理

影音[編輯]

1.科學方法的步驟

2.個案研究:Genie Wiley

3.自然觀察法

4.相關法

5.心理學實驗法

6.Correlation vs. Causation

7.Descriptive Methods

8.The Little Albert Experiment

9.Finding Little Albert - The Brain: A Secret History - BBC Four

10.Placebo Effect

11.Delphi Technique

12.the Nocebo Effect

13.Observer Bias

14.The Hawthorne Effect

15.Ecological Fallacy

16.The Monster Study

17.THE BYSTANDER EFFECT


參考資料[編輯]

核心觀念[編輯]

  1. Susan Nolen-Hoeksema, Barbara L. Fredrickson, Geoffrey R. Loftus, Christel Lutz(2015)。心理學導論(危芷芬譯,第二版)。雙葉書廊。(原著出版於1953年)
  2. Richard J. Gerrig(2014)。心理學(游恆山譯,第六版)。五南圖書出版。(原著出版於2013年)
  3. 溫世頌(2016)。心理學導論(5-14頁)。三民書局。
  4. 賴惠德(2016)。心理學:認知.情緒.行為(13-21頁)。雙葉書廊。ISBN 9789865668396
  5. Philip G. Zimbardo, Robert L. Johnson, Vivian McCann(2012)。Zimbardo’s 普通心理學:核心概念(張文哲、洪光遠、邱發忠、蘇文賢譯,第六版,11-22頁)。學富文化。(原著出版於2008年)ISBN 9789866624636
  6. 陳皎眉、張滿玲、徐富珍、林宜旻、孫旻暐(2015)。心理學(第二版,22-29頁)。雙葉書廊。ISBN: 9789865668259。
  7. John W. Santrock(2012)。心理學概論:心靈與生活探索(黎士鳴等譯,11-22頁)。東華書局。(原著出版於2002年)ISBN 9789863411499
  8. Beck, H. P., Levinson, S., & Irons, G.(2009). Finding Little Albert: A Journey to John B. Watson’s Infant Laboratory. American Psychologist, 64, 605-614.
  9. Watson, J. B., & Rayner, R. (1920). Conditioned emotional reactions. Journal of Experimental Psychology, 3, 1–14.
  10. 王克先(1989)。學習心理學。桂冠。ISBN 9789575512651
  11. 梁庚辰(2018)。心理學:身體、心靈與文化的整合(第二章,13.3.3)。臺大出版中心。ISBN 9789863502920
  12. 鄭雅淳、呂芷晴(2019)。實驗動物與他們的產地。窩窩,檢自https://wuo-wuo.com/topics/experiment-animals/experiment-animal-and-their-living
  13. Encyclopaedia Britannica(2019) Gustav Fechner - German psychologist and physicist. *https://www.britannica.com/biography/Gustav-Fechner

最新研究[編輯]

  1. Cole, M. W., Repovš, G., & Anticevic, A. (2014). The frontoparietal control system: a central role in mental health. The Neuroscientist : A Review Journal Bringing Neurobiology, Neurology and Psychiatry, 20(6), 652–64.
  2. Fox, K. C. R., Spreng, R. N., Ellamil, M., Andrews-Hanna, J. R., & Christoff, K. (2015). The wandering brain: Meta-analysis of functional neuroimaging studies of mind-wandering and related spontaneous thought processes. NeuroImage, 111, 611–621.
  3. Kristen A. Lindquist,Ajay B. Satpute,Tor D. Wager,Jochen Weber, & Lisa Feldman Barrett (2016). The Brain Basis of Positive and Negative Affect: Evidence from a Meta-Analysis of the Human Neuroimaging Literature, 26 (5), 1910-1922.
  4. Okamura, N., Harada, R., Kudo, Y., & Yanai, K. (2015). Amyloid and tau imaging, its present and future. Nihon Yakurigaku Zasshi, 146(3), 144–149.
  5. Saint-Aubert, L., Lemoine, L., Chiotis, K., Leuzy, A., Rodriguez-Vieitez, E., & Nordberg, A. (2017). Tau PET imaging: present and future directions. Molecular Neurodegeneration, 12(1), 19.
  6. Tharick A Pascoal, Joseph Therriault, Andrea L Benedet, Melissa Savard, Firoza Z Lussier, Mira Chamoun, Cécile Tissot, Muhammad Naveed Iqbal Qureshi, Min Su Kang, Sulantha Mathotaarachchi, Jenna Stevenson, Robert Hopewell, Gassan Massarweh, Jean-Paul Soucy, Serge Gauthier, Pedro Rosa-Neto (2020).18F-MK-6240 PET for early and late detection of neurofibrillary tangles, Brain, Volume 143, Issue 9, 2818–2830
  7. Jie, C., Treyer, V., Schibli, R., & Mu, L. (2021). Tauvid™: The First FDA-Approved PET Tracer for Imaging Tau Pathology in Alzheimer's Disease. Pharmaceuticals (Basel, Switzerland), 14(2), 110.

華人本土心理學學案書籍[編輯]

  1. 高尚仁(1991)。中國人、中國心:傳統篇。遠流。
  2. 高尚仁(1992)。書法藝術心理學。文化教育出版社。
  3. 高尚仁(2000)。書法心理治療。香港大學出版社。
  4. 楊中芳(2001)。如何理解中國人:文化與個人論文集。遠流。
  5. 楊中芳(2001)。中國人的人際關係, 情感與信任: 一個人際交往的觀點。遠流。
  6. 楊中芳(2001)。如何研究中國人:心理學研究本土化論文集。桂冠圖書。

跨文化研究[編輯]

  1. 黃光國,〈心理學本土化運動的過去、現在與未來〉,《人文與社會科學短訊》第 3 期(2004 年,台北),頁 29-42。
  2. 黃光國,〈「華人本土心理學研究追求卓越計劃」的總回顧〉,《本土心理學研究》第 22 期(2004 年,台北),頁 3-10。
  3. 葉啓政編,《從現代到本土》(台北:遠流,2002 年),黃囇莉著,〈孰可忍?孰不可忍?從現代化的「批判」到本土化的「堅忍」之間〉,頁 5-14。
  4. 楊中芳,〈試論如何深化本土心理學研究:兼評現階段之研究成果〉,《本土心理學研究》第 1 期(1993 年,台北),頁 122-183。
  5. 楊國樞,〈我們為什麼要建立中國人的本土心理學〉,《本土心理學研究》第 1 期(1993 年,台北),頁 6-88。
  6. 徐詩淳與黃詩婕盛(民 100 年 10 月 21 日)。人物專訪-楊國樞老師。台大心理系季報。
  7. 簡晉龍與黃囇莉(民 101)。華人權威取向之概念建構與實徵研究:本土心理學研究取徑(博士論文)。
  8. 華人本土心理研究基金會

生活應用[編輯]

  1. 智庫百科(民 103 年 11 月 11 日)。案例研究法。
  2. 蔡惠如(民 102 年 11 月 06 日)。服務品質首都客運首奪冠【線上論壇】。蘋果日報。
  3. 百科知識。個案研究。

相關名詞解釋[編輯]

  1. 個案研究法
  2. 實驗法
  3. 觀察法
  4. 相關研究法
  5. 調查法
  6. 安慰效應
  7. 畢馬龍效應。
  8. 反安慰劑
  1. Orne, Martin T. On the social psychology of the psychological experiment: With particular reference to demand characteristics and their implications. American Psychologist. 1962, 17 (11): 776–783. doi:10.1037/h0043424.  已忽略未知參數|s2cid= (幫助)
  2. Baron-Epel, Orna; Kaplan, Giora; Weinstein, Ruth; Green, Manfred S. Extreme and acquiescence bias in a bi-ethnic population. European Journal of Public Health. October 2010, 20 (5): 543–548. ISSN 1464-360X. PMID 20439322. doi:10.1093/eurpub/ckq052.  已忽略未知參數|doi-access= (幫助)
  3. Dr. Arpita Acharya,Feminine theory of Karen Horney,網址:https://www.mbbcollege.in/students/viewtxt.php?folder=notes&id=582