警惕心理學(xué)研究中的統(tǒng)計誤用論文范本
1從賭徒的謬誤談起
首先讓我們來看一個有趣的例子:一名賭徒在打賭硬幣是正面朝上或是背面朝上時的情景。如果硬幣正面朝上或朝下確實是隨機的話,那么該名打賭者在任何一次壓注時贏的概率都是0.5。假設(shè)這個人接連賭了5次,每次他都賭硬幣正面朝上,而每次結(jié)果卻都是背面朝上,F(xiàn)在他要賭第6次了,他該賭正面朝上還是背面朝上呢?或者說這時硬幣正面朝上的概率大還是背面朝上的概率大呢?顯然,投擲硬幣時連續(xù)5次背面朝上是很不尋常的,這樣的事件發(fā)生的概率非常低,賭徒注意到了這一點,所以,在下一次壓注時,他加大了籌碼,依然賭了正面向上,在硬幣連續(xù)5次背面朝上后,他愈發(fā)相信硬幣將正面向上了。結(jié)果很不幸,這位打賭者又一次輸了。打賭者的錯誤就在于對概率規(guī)律的應(yīng)用,一枚真的硬幣應(yīng)該有一半的時候正面朝上,這些規(guī)律只有在無數(shù)次大量的事件后才可能成立。對于很少的嘗試次數(shù)而言,這些規(guī)律不適用。那名賭徒所忽略的是,每次硬幣投擲都是一個獨立事件,前面拋擲中發(fā)生的情況對接下來將要發(fā)生的事件沒有任何影響。其實,賭徒對于第6次的嘗試不會比前面的5次更有把握。正面朝上的概率依然沒變。從某種程度上講,賭徒的錯誤是很自然的事,他們確實是依據(jù)正確的概率規(guī)律所作的結(jié)論,經(jīng)過大量的投擲,對一面真正的硬幣而言,的確有50%的結(jié)果是正面向上,錯就在把適用于大量事件發(fā)生時才有效的規(guī)律運用到了很少的事件上。在6次投擲中全部正面朝上或全部背面朝上并不是絕對不可能,因為概率還沒有小到可以忽略不計。賭徒的謬誤同樣可能發(fā)生在心理學(xué)研究中。
科學(xué)心理學(xué)的目的在于理解人們的所思所想。為了達成此目的,心理學(xué)工作者收集信息和提供理論解釋時使用的是大量的完備技術(shù)。正是對這些技術(shù)的恰當(dāng)運用和對所得數(shù)據(jù)的合理分析構(gòu)成了科學(xué)心理學(xué)的支柱?茖W(xué)方法在心理學(xué)研究中的作用是顯而易見的。因為科學(xué)心理學(xué)強調(diào)經(jīng)驗觀察,而只有科學(xué)方法所確立的信念才是建立在經(jīng)驗觀察之上,其他方法所確立的信念都不是建立在經(jīng)驗基礎(chǔ)上的。經(jīng)驗觀察的正確方法包括收集數(shù)據(jù)的科學(xué)程序和分析數(shù)據(jù)的科學(xué)程序,因而對數(shù)據(jù)加以分析的程序——統(tǒng)計的使用和理解在心理學(xué)研究中就變得非常關(guān)鍵和重要的。正如Wells所言:統(tǒng)計思維的能力有朝一日將如同閱讀與書寫的能力一樣,成為一名合格公民的必須[1]。但是在心理學(xué)研究中存在著大量統(tǒng)計誤用和亂用的現(xiàn)象,其原因是多方面的:有時僅僅是研究者出于某種目的和需要,有時是對統(tǒng)計學(xué)本身理解得不透徹、不深入,有時則是由于統(tǒng)計學(xué)本身的邏輯性造成的。統(tǒng)計在心理學(xué)研究中的重要性不能成為我們在任何時候任何場合可以誤用或亂用統(tǒng)計學(xué)的理由。如果不對這些現(xiàn)象作深入的剖析,如果容忍這樣的錯誤一犯再犯,那么統(tǒng)計學(xué)在心理學(xué)研究中的作用越大,造成的后果也就越嚴(yán)重。甚至可能為阻礙心理學(xué)的發(fā)展。因此要警惕心理學(xué)研究中的各種統(tǒng)計誤用和亂用的現(xiàn)象。應(yīng)該使自己在從事心理學(xué)研究時不會因為不小心而落入統(tǒng)計學(xué)的陷阱,也不人為地為別人設(shè)計統(tǒng)計學(xué)陷阱,同時在閱讀他人的研究報告時也要注意不落入別人設(shè)下的統(tǒng)計學(xué)陷阱。本人把該文定名為警惕心理學(xué)研究中的統(tǒng)計學(xué)誤用,其用意也正因為此。
2心理學(xué)研究中常見的統(tǒng)計誤用
統(tǒng)計的方法是如此地有用,以至于有時我們似乎可以借助統(tǒng)計的方法使任何的觀點站住腳。許多人都用統(tǒng)計來支持他們各自的觀點。難怪有人這樣說,世界上有3種謊言——謊言、該詛咒的謊言和統(tǒng)計。統(tǒng)計會說謊嗎?其實統(tǒng)計本身并不會說謊,但它們卻可以被人利用而給人以誤導(dǎo)。以下是本人認(rèn)為容易發(fā)生在心理學(xué)研究中的一些統(tǒng)計誤用和亂用現(xiàn)象。
2.1小或有偏樣本的使用
在心理學(xué)研究中,我們希望利用統(tǒng)計分析推論出普遍的結(jié)論,因此我們常常使用大樣本的研究范式。在大樣本研究范式里,有非常多的被試,因而任何一個不尋常的參與者都不會對結(jié)果形成多大影響,這樣我們就可以得到一個相對普遍的結(jié)論。大樣本研究設(shè)計已經(jīng)成為心理學(xué)研究的一個標(biāo)準(zhǔn)。因此取樣問題是心理學(xué)研究中一個非常重要的問題:我們在對數(shù)據(jù)作統(tǒng)計分析時就要想一想這些數(shù)據(jù)是怎么得來的,它的取樣合理嗎?所有的'統(tǒng)計分析都是建立在數(shù)據(jù)的取得是合理、正確的前提下,如果取樣不合理,無論多么高深和精美的統(tǒng)計方法都是無計于事的。合理的樣本、準(zhǔn)確的測量是使統(tǒng)計結(jié)論正確可靠的前提。但我們在進行研究時,有意無意地,在取樣的合理性問題上總會打折扣。下面兩種取樣的問題在研究中就經(jīng)常會發(fā)生:(1)樣本過;(2)有偏樣本的使用。許多廣告就會用小樣本或有偏樣本來誤導(dǎo)消費者,比如說在電視上有一位明星說他喜歡喝某一品牌的飲料。廣告商這樣做的目的就是要給大家一個印象,因為這位明星喜歡這種品牌的飲料,所以所有的人(總體)也會喜歡它。而回歸假象效應(yīng)這一現(xiàn)象也說明了有偏樣本的使用會導(dǎo)致我們得出錯誤的結(jié)論。所謂回歸假象是指向平均數(shù)的回歸,當(dāng)我們從總體中挑選出極端分?jǐn)?shù)組進行重測時,第二次測得的分?jǐn)?shù)更接近于整個總體的平均數(shù)。我們在研究中經(jīng)常會使用匹配技術(shù),這時就可能有回歸假象效應(yīng)存在。如果在第一次測驗的基礎(chǔ)上對兩組進行匹配,倘若研究者從通常做得很差的組中挑出高分者,從通常做得很好的組中挑出低分者,即使沒有給予兩組不同的實驗處理,研究者仍可以預(yù)期他們在第二次測驗中得分會很不同,其原因僅僅是因為向平均數(shù)回歸。這方面一個典型的例子就是20世紀(jì)60年代在美國的一個“領(lǐng)先計劃”研究。因此,無論何時你自己在進行研究和閱讀別人的研究報告時,你都要問兩個有關(guān)抽樣的問題:(1)樣本有多大?(2)樣本是如何被選中的?
2.2在統(tǒng)計學(xué)的基礎(chǔ):概率的理解上存在偏差
應(yīng)用于心理學(xué)研究中的定量研究方法大部分是基于概率理論之上的,概率是統(tǒng)計學(xué)的基礎(chǔ)。我們借助于概率達到對未來的預(yù)測。如氣象學(xué)家會說,明天有80%的幾率會下雨,或有20%的可能會下雪。如我們前面提到的賭徒的例子。但倘若我們對概率的理解不透徹,就有可能犯錯誤,賭徒的謬論就是典型的例子。即使給予事件將要發(fā)生的先決條件,我們也很難有絕對的把握認(rèn)為此事件必然發(fā)生,我們所能知道的僅僅是發(fā)生機會的比率或是一特定的概率。如根據(jù)我們的研究發(fā)現(xiàn)具有某一心理特點的人中有90%難以完成某一水準(zhǔn)的學(xué)業(yè),我們能否就可以據(jù)此來預(yù)測一個具有這樣心理特點的人就不能完成學(xué)業(yè)呢[2]?顯然我們并不能得出這樣的結(jié)論。基于概率和統(tǒng)計學(xué)基礎(chǔ)上得出的結(jié)論是從總體中得出的,我們在總結(jié)自己的某一研究時,總會這樣表述:從總體上說,什么是怎么怎么樣的……總體上得出的結(jié)論在具體用到某一個人身上不能過分絕對化。
鑒于此,人們對大樣本研究范式也提出了批評,認(rèn)為個體的心理活動是非常獨特的,這種獨特性并非都能作出普遍的概括。經(jīng)過充分混合個體分?jǐn)?shù)的“統(tǒng)計磨合機”的加工,這些獨特性就喪失殆盡了。單靠統(tǒng)計未必就能夠抓住事物的本質(zhì)特征[3]。斯金納就曾呼吁在操作性研究中使用小樣本設(shè)計,因為他想強調(diào)削弱統(tǒng)計分析的重要性。他認(rèn)為人們把統(tǒng)計的作用夸大了,統(tǒng)計分析通常被看成了目的而不是幫助實驗者推出實驗結(jié)論的工具。
2.3顯著性檢驗問題
眾所周知,統(tǒng)計顯著性檢驗在心理統(tǒng)計學(xué)教科書中是作為推斷統(tǒng)計的重要組成部分而引進的,它和參數(shù)估計組成了推斷統(tǒng)計的兩大基石[4]。心理學(xué)家有一個約定俗成的規(guī)定,即如果統(tǒng)計檢驗的計算表明虛無假設(shè)可能正確的概率小于0.05,那么我們就可以拒絕它而接受另一個假設(shè)。因為拒絕虛無假設(shè)可能犯錯誤的機會如此微小,我們有理由認(rèn)為這么做是安全的。簡單地就,推斷統(tǒng)計被用于確定兩種條件的結(jié)果差別是由自變量還是隨機因素造成的。如果不同實驗條件下所得的結(jié)果之間差異很大,而且這種差異由偶然因素導(dǎo)致的概率低于0.05時,那么研究者可以排除偶然因素導(dǎo)致該結(jié)果的可能性,而認(rèn)為結(jié)果是自變量造成的。心理學(xué)家一般都認(rèn)為推斷統(tǒng)計比描述統(tǒng)計更能反映事物的本質(zhì),因為它用了概率論的知識,從樣本數(shù)據(jù)到總體性質(zhì)作了科學(xué)的推斷。但是簡單的顯著性檢驗在應(yīng)用中卻會產(chǎn)生這樣或那樣的問題。盡管結(jié)論在統(tǒng)計上被認(rèn)為是可信的,但由偶然因素(統(tǒng)計信度仍保持5%的錯誤概率)、一些未被注意到的混淆因素、或者實驗者誤差所造成的可能性仍然存在。例如,大多數(shù)聰明或大多數(shù)低智商的被試碰巧被分在一種條件中。盡管這些可能性不太容易出現(xiàn),但有時它們確實發(fā)生了。
不少人對顯著性檢驗存在誤解,誤認(rèn)為經(jīng)過顯著性檢驗后其科學(xué)性就得到了保證,自己的觀點就萬無一失了。但事實上并非如此。近年來,人們對心理學(xué)研究中的顯著性檢驗有諸多爭議,Cohen在其著名的《地球是圓的(p<.05)》[5]一文中對此進行了列舉。有鑒于此,美國心理學(xué)會統(tǒng)計推斷特別工作小組發(fā)表了《心理學(xué)雜志中的統(tǒng)計方法——指導(dǎo)方針及其解釋》[6]一文,以期引起人們對于顯著性檢驗的思考。流行于研究者間的一句格言是“重復(fù)一次抵得上一千次t檢驗”,這句格言的要旨是許多研究者都相信實驗驗證要好于應(yīng)用于初次實驗結(jié)果的推斷統(tǒng)計,這是非常有道理的。
2.4夸大的統(tǒng)計圖
統(tǒng)計作為一種工具,往往為受到使用者本人主觀意愿的制約。有人曾感嘆統(tǒng)計學(xué)家會說話。確實,人們在統(tǒng)計指標(biāo)的選擇、統(tǒng)計圖表的制作、統(tǒng)計方法的選用上都可能會帶有自己的個人目的,具有一定的功利性。這一點可以從下面的例子中可見一斑。有一所高校近3年內(nèi)因心理問題而被迫中斷學(xué)業(yè)的人數(shù)從13增加到17、20人,學(xué)校的心理咨詢中心為了呼吁人們對大學(xué)生心理健康問題的重視,因而想讓人們知道該校學(xué)生的心理問題正變得越來越嚴(yán)重,單單因心理問題而中斷學(xué)業(yè)的人數(shù)就在不斷增加,所以他們以年份為橫坐標(biāo),以心理問題而中斷學(xué)業(yè)的人數(shù)為縱坐標(biāo)繪制了一張統(tǒng)計圖,通過把Y軸的標(biāo)尺拉得很短,使學(xué)校心理問題而中斷學(xué)業(yè)的人數(shù)的增加看上去很突出。而學(xué)校當(dāng)局則往往不愿意這樣來宣傳自己的學(xué)校,于是根據(jù)同樣的數(shù)據(jù)可以繪制了另外一張統(tǒng)計圖,他們通過把Y軸的標(biāo)尺拉得很長,給人以學(xué)校因心理問題而中斷學(xué)業(yè)的人數(shù)相當(dāng)穩(wěn)定的感覺。兩張圖顯示的結(jié)果都是正確的,但要說明的問題卻大相徑庭。
【警惕心理學(xué)研究中的統(tǒng)計誤用論文】相關(guān)文章:
統(tǒng)計心理學(xué)相關(guān)論文04-11
醫(yī)院管理中病案統(tǒng)計價值研究論文06-22
心理學(xué)的研究論文04-11
企業(yè)管理中的心理學(xué)方法的研究論文06-21
市場調(diào)查研究中的統(tǒng)計軟件發(fā)展論文02-11
積極心理學(xué)研究論文04-11
幼兒心理學(xué)研究論文04-11
生活中的心理學(xué)論文04-11