應用教學
應用教學
你應該使用多模式的組合來提升行為研究嗎? - Noldus
JUN 17 ,2025
以下節自 Noldus' Behavioral Research Blog - Should you use a combination of modes to optimize behavioral studies? by Andrew Spink
你應該使用多模式的組合來提升行為研究嗎?
如果你問一位科學家,當你提到「行為研究」時他們會想到什麼,根據他們的研究類型可能會給出截然不同的答案。而人類行為的研究大致可以分為四種類型:
- 觀察性研究是觀察和記錄人們的行為。
- 內隱性(Implicit)測量包括生理、臉部表情等的測量。
- 外顯性(Explicit)測量是指在參與者執行任務期間或之後對個別參與者進行測試或提問。
- 問卷調查類似於外顯性測量,但對象主要會是大規模的群體,且所提出的問題通常與任務無關。
每種類型都有其特定的優點與缺點。
觀察性研究(Observational studies)
這是心理學研究中的經典研究類型。它們是客觀的(因此一般來說是不帶偏見),在受到控制的條件下進行,可以被重複實驗,且通常是為了檢驗可證偽性假設(falsifiable hypothesis )而設計的(符合科學實驗上所謂常態之定義)。
然而,這些研究現象的解釋可能比乍看之下還要更為困難,而且很容易受到各種偏見的影響。許多經典的心理學實驗已被證明是難以複製的。
棉花糖實驗(Stanford marshmallow experiment)
例如,著名的史丹佛棉花糖實驗最早於 1960 年代首次進行,並於1970年發表,目的在測試意志力。研究人員給孩子們一些棉花糖,如果他們能忍住不吃眼前的棉花糖,過一段時間後就會得到兩顆棉花糖。那些在實驗中表現較好的孩子,十年後在學校考試的成績也較為優異,這一現象被稱為「延遲滿足」(delayed gratification)。
然而,在實驗過程中,研究者發現,那些成功延遲滿足的孩子並非是擁有最強意志力的孩子,而是那些能夠運用技巧分散注意力的孩子(有一位孩子甚至成功地睡著了)。此外,這些孩子的樣本並不具有代表性,因為他們都來自大學的日間照顧中心。
後來的研究顯示,不同國家之間的結果差異極大,證明這些結果至少有部分是由文化背景所決定的。而且,當調整家庭背景因素之後,這些孩子在學校測試中的表現與延遲滿足之間的相關性就消失了。
心理學的標準
儘管如此,如果足夠重視研究設計(自 1960 年代以來,科學家們在這方面已經累積了大量經驗),這類研究仍然能夠提供許多有價值的見解,而且這類研究在過去幾十年裡一直是心理學領域的標準。心理學家經常使用The Observer® XT 觀察家行為觀察軟體來進行這類型的研究,既可以作為獨立研究程序使用,也可以作為完整觀察實驗室的一部分。
外顯性測量(Explicit measures)
純粹觀察性研究的一個缺點是很難了解受試者的內心想法。而解決這個問題的其中一個方法就是直接詢問參與者,了解他們的主觀感受。這可以在實驗結束後進行,也可以在實驗過程中的特定時刻進行(例如:「你現在感覺如何?」)。
在較長期的研究中,與參與者行為或生理訊號相關的問題可以每天在固定的時間提出(例如:「你為什麼那樣做?」)。這種在參與者日常生活中所進行的調查評估,有時會被稱為「生態瞬時評估」(Ecological Momentary Assessment,簡稱 EMA)。
然而,這種方法也存在著比你最初想像的還有更多問題。如果在參與者執行任務時提問,可能會分散他們對任務本身的注意力。此外,研究顯示,如果在事後才提問,參與者的回答主要反映的是最後幾分鐘的經歷,而不是整個任務過程。參與者也可能會下意識地給出他們認為研究人員希望聽到的答案(出於取悅的心理),或者給出他們認為能給自己留下更好印象的答案(在不健康飲食的研究中特別常見)。
心理狀態
令人驚訝的是,人們通常對自己心理狀態的了解十分有限。我記得曾在 Measuring Behavior 研討會上聽過一場由 Jennifer Healey 主講的演講,她提到有位參與者在開車時聽到了槍聲,並表示自己完全沒有受到影響,但實際上他們的心率卻飆升到極高的程度。
問卷調查(Surveys)
上述兩種方法的一大缺點是,很難確定其研究結果是否適用於整體大眾,還是僅適用於研究對象本身(通常是心理學專業的學生)。解決這個問題的一個方法是透過問卷調查,向一個更大且具代表性的群體提問。這種方法可以涵蓋數百位來自不同地區與生活背景的人。
然而,這些問題通常與實驗的任務無關,而且仍然會面臨參與者回答不夠誠實或缺乏自我認知的問題。例如,當被問到某個產品價格時,許多人可能會說:「太貴了!」,即使他們內心並不是真的這麼認為,只是因為他們不希望製造商提高價格。
心理學家通常說他們在問卷調查或小型研究中所使用的問卷是「經過驗證的」(validated)。然而,通常情況下,這往往只是代表這些問卷的結果與其他問卷一致,而非經過獨立指標的驗證。當在進行跨國或跨文化的態度調查時,就更需要特別謹慎,因為對於問題的詮釋往往受到文化差異的影響,如果問卷經過翻譯,則更是如此。
儘管如此,問卷調查在追蹤趨勢或觀察時間變化方面仍然非常有用。由於這類偏誤在短時間內不太可能產生劇變,因此問卷中所觀察到的某些增加,很可能也確實反映了現實中的真正變化。
內隱性測量(Implicit measures)
過去,像是一些生理指標(心率、皮膚導電性等)、眼動追蹤、腦波圖(EEG)、功能性近紅外線光譜(fNIRS)和臉部表情分析等測量方法,大多局限於實驗室研究,研究對象通常需要靜止不動地坐著參與實驗。然而,近年來,這些技術已變得越來越有機動性。此外,像 NoldusHub 行為研究整合平台這樣的技術平台出現,也讓這些測量工具變得更容易使用,進而推動它們在日常生活情境中的應用更加廣泛。。
他們最大的優勢就是完全客觀,因此較不容易受到各種偏見及偏誤的影響。
另一個優點是,它們可以發現外顯問卷無法量測到的效果。例如,de Wijk 和 Noldus 進行了一項實驗,測量了參與者在實驗室和家中的飲食體驗,並確保其他所有條件(食物、餐具、測量設備等)完全相同。結果顯示,在外顯測量上幾乎沒有差異,但在心率與臉部表情等內隱測量指標上,卻出現了顯著的差異。
他們接著進行另一項實驗,想驗證這種效應是否可以複製,這次的實驗地點分別是實驗室、一間模擬咖啡廳,以及一間真正的咖啡廳。結果成功複製了前次實驗的發現:外顯測量並未顯示出地點有什麼影響,但內隱測量卻明確呈現出彼此之間有所差異。
然而,單獨依靠內隱測量仍然是不夠的,此外,這些測量技術的技術需求也可能會對實驗設計造成限制。
混和性設計:提升客觀性與洞察力
顯然,研究人員進行研究時,不應只使用單一種測量技術,而應該盡可能地使用多種方法來測量參與者對實驗條件的反應。這樣既能提供更深入的見解,又能獲得更客觀的結果。當然,如果實驗設計中存在根本性的問題,例如參與者群體不具代表性、重複次數不足,或是存在偽重複(pseudoreplication)等情況,即使使用多種測量方法,結果仍可能具有誤導性。然而,混合使用多種方法,在提升研究的客觀性與深度方面仍是非常有價值的。
References
1. Mischel, Walter; Ebbesen, Ebbe B. (1970). "Attention in delay of gratification". Journal of Personality and Social Psychology. 16 (2): 329–337. doi:10.1037/h0029815.
2. Yanaoka, Kaichi; Michaelson, Laura E.; Guild, Ryan Mori; Dostart, Grace; Yonehiro, Jade; Saito, Satoru; Munakata, Yuko (22 June 2022). "Cultures Crossing: The Power of Habit in Delaying Gratification". Psychological Science. 33 (7): 1172–1181. doi:10.1177/09567976221074650.
3. René A. de Wijk, Lucas P.J.J. Noldus (2021), Using implicit rather than explicit measures of emotions, Food Quality and Preference 92, 104125. doi: 10.1016/j.foodqual.2020.104125.
未來還會持續推出不同產品知識或應用方面的文章喔!還請多多關注我們!
歡迎加入我們的社群頁面,隨時獲得最新消息!