當前位置:首頁 > 芯聞號 > 充電吧
[導讀]我不是試圖用通俗的語言來解釋清楚什么是假設(shè)檢驗,如何去實踐。 做到能用理 論化的語言來描述和理解問題是科研工作者應該掌握的能力。其實這個不難,只要 把基本問題吃透了,就可以在基本問題上繼續(xù)問題。本文中

我不是試圖用通俗的語言來解釋清楚什么是假設(shè)檢驗,如何去實踐。 做到能用理 論化的語言來描述和理解問題是科研工作者應該掌握的能力。其實這個不難,只要 把基本問題吃透了,就可以在基本問題上繼續(xù)問題。本文中主要解釋的是什么是假設(shè)檢驗,一些相關(guān)的概念的理解,以及如何構(gòu)造檢驗規(guī)則,構(gòu)造拒絕域。
1、統(tǒng)計假設(shè)檢驗問題 ? ? “假設(shè)檢驗”,從字面上上理解就是先“假設(shè)”,后“檢驗”的過程,“檢驗”的對象當然 是之前的假設(shè)本身,有些情況下為了區(qū)分與其它學科的“假設(shè)”,研究統(tǒng) 計的人就 用“統(tǒng)計假設(shè)”來描述統(tǒng)計上的假設(shè)問題,既然我們研究統(tǒng)計,跟其它行業(yè)的人們打 交道就較少了,所以我們有時候就會簡稱“統(tǒng)計假設(shè)”為“假 設(shè)”了。
說了半天,那,到底什么是“假設(shè)”呢?其實,在統(tǒng)計學中,“假設(shè)”目前主要有兩 種,至少我沒有碰見其它“假設(shè)”類型。(這里突出“兩種”,也是一種研究問 題的 方法學,在研究某個問題的時候,能夠精確講問題分類,是一種必要的素質(zhì))。一 種是參數(shù)的假設(shè),另一種是非參數(shù)的假設(shè),后者好像概括了所有“不 是第一種假 設(shè)”的情況,其實不然,在實際研究中,人們把隨機變量分布的假設(shè)稱為非參數(shù)的 假設(shè)。為什么把分布的假設(shè)稱為非參數(shù)的假設(shè)呢?一方面是因 為它確實不是參數(shù) 的假設(shè),另一方面,其它類型的除了參數(shù)和分布的假設(shè)外,我們想不到其它東西的 假設(shè)了,至少我沒有想到,也許真的存在,只是我還沒 有遇到,沒有學習過而已。
? ? 什么是參數(shù)的假設(shè)呢?實際就是對隨機變量分布中未知參數(shù)的假設(shè)。參數(shù)如果已 知,我們沒有必要假設(shè)了呀!還有一個前提就是我們已知隨機變量的分布類型。所 謂 分布,就是知道分布函數(shù)的類型,已知分布函數(shù)的前提下,我們便知道了概率 分布列(離散的),密度函數(shù)(連續(xù)情況)。還有未知參數(shù)的問題,我們可以 舉 一個例子,比如某個隨機變量服從正太分布,大家都立馬想到正太分布的密度函 數(shù),這個函數(shù)中有兩個參數(shù)確定后,這個函數(shù)就可以來實際計算了,如果 我們不 知到其中一個,或者都不知道參數(shù)的值,那么我們就說它是未知參數(shù)了。其實未知 參數(shù)不是定義的,未知參數(shù)一般不會給出定義,是因為它很容易滿 足所有人的思 維邏輯。我們對某個參數(shù)作出假設(shè),這就是參數(shù)的假設(shè)了。
? ? 什么是非參數(shù)的假設(shè)呢?大家在看書的時候,會看到書里大部分寫的是“非參數(shù)假 設(shè)”,只是少個“的”而已,但是這種缺省就很容易導致不在一個思維邏輯上的人 們 產(chǎn)生迷惑,當然也正是很多學科中存在這樣或者那樣的迷惑才嚇退一些人來保證少 部分人掌握這些迷惑背后的東西,不信你想想什么EM啊,什么 SIFT,什么支撐向 量機(SVM)呀,多么讓人迷惑的東西啊。當然,你知道了缺省的存在,或者迷糊 背后美妙的結(jié)論,就沒什么可怕的了。前面也說 過了,就是隨機變量分布的假 設(shè),我們稱為非參數(shù)的假設(shè)。比如我們研究世界人民的身高的分布情況,我們現(xiàn)在 不知道身高這個數(shù)字特征定義的隨機變量服 從什么分布,我們就可以假設(shè)他是某 個分布,這個就是非參數(shù)的假設(shè)問題了。
檢驗呢?什么是檢驗?前面給出了假設(shè),對假設(shè)進行判斷的過程就叫檢驗了。我們 怎么檢驗呢?是要組織構(gòu)造一個檢驗規(guī)則的,然后根據(jù)這個規(guī)則來檢驗之前的假 設(shè),這樣在邏輯上大家都說的過去。
2、檢驗規(guī)則構(gòu)造的思考 ? ? 我們從犯錯誤的角度來構(gòu)造檢驗規(guī)則。如果你看書,也許或者很有可能,書里面并 沒有解釋,他在做什么,而是給出邏輯推理過程后,給出你他們的動機。不過現(xiàn)在 你不用擔心了,我已經(jīng)告訴你我的動機了。當然我這樣做也可能違背了提出“假設(shè) 檢驗”問題的人的原始意愿,但是這起碼是一種理解問題的方式,盡管他 可能有所 偏差。(一切皆有可能,基于這個原理,我會在講述過程中說明某些屬于小概率事 件的事情)。?
? ? 為了有理論依據(jù),數(shù)學上給出一些符號來標記,文字上給出一些定義用來說明問題。首先H_0 這個數(shù)學符號用來表示“原”假設(shè),H_1這個符號用來表示“備擇”假設(shè),可以理解為“準備選擇的”假設(shè),至于為什么這樣理解,其實等我們熟悉了這套理論之 后,我們就會明白往往拒絕H_0這個結(jié)論更具有說服力(這是基于小概率原理的),不過如果大家沒多少概念,也沒有關(guān)系,后面我會試圖一點點的 解釋清楚,力圖讓你豁然開朗,當然你沒有耐心看下去,我也沒有能力讓你理解這一且的。
? ? 我們可用的數(shù)據(jù)只有樣本,或許還有一些已知的參數(shù),那我們應該努力使用這些已知的東西來構(gòu)造檢驗準則。記住這一點!
? ? 為了弄出檢驗準則,我們先從結(jié)果考慮。不管作出什么選擇,我們的總會有出現(xiàn)錯誤的可能,幸運的是我們只會犯兩個錯誤,一個錯誤是H_0實際上是正確的,我 們根據(jù)我們的檢驗規(guī)則,判斷H_0是錯誤的了,這種錯誤我們稱他為第一類錯誤,統(tǒng)計中,我們稱“判斷H_0正確”為“接受H_0”,相反為 “拒絕H_0”, 第一類錯誤也就可以說成拒絕真值的錯誤了,為了高深一點,大家會說,這個叫“拒真”。另一種錯誤,就是第二類錯誤,就是“在H_0錯誤的情況下,根據(jù)判決 規(guī)則判斷H_0正確”,這種錯誤也可以叫“取偽”。
? ? 那我們是根據(jù)樣本觀測值給出判斷的吧,我們就必須把樣本觀測值搞成兩個集合,我們做實驗后,樣本觀測值屬于了某個集合,我們作出相應的判斷,即接受或拒絕 H_0,我們再起一個名字,就是包含可以用來拒絕H_0的那個樣本觀測值的所在的集合,我們稱之為“拒絕域”。既然有了拒絕域,相應的我們再 給另一個可以用來接受H_0的樣本觀測值的集合叫做“接受域”,這樣理解非常符合邏輯。其實我敘述接受域和拒絕域的過程,就是構(gòu)造檢驗規(guī)則的 一種邏輯想法,為什么說這種想法是邏輯的呢?因為我只有樣本觀測值可以使用的情況下(某些情況可能知道更多),我很自然的想到使用樣本觀測值 來檢驗假設(shè),我既然有兩個選擇(接受和拒絕H_0),那么我就把樣本觀測值的所有可能結(jié)果(有些書也稱他為樣本空間,當然樣本空間的理解是正 確的,我只是沒怎么用)分成兩個集合,一個稱之為拒絕域(我們記為W),一個稱之為接受域(記為!W),相應的,當樣本觀測值落在拒絕域中的 時候,我們拒絕H_0,相反接受H_0 。知道了這些,前面我們提到的“拒真”就可以表示出它的概率形式了。P((X_1,X_2,...,X_n) in W | H_0實際為真) = alpha,表示的是實際H_0為真的條件下,樣本觀測值落在了拒絕域中的概率,用alpha來表示它的結(jié)果,自然我們會想,如果我們的H_0是真 的,那么樣本觀測值就應該很難落在拒絕域中,也就是說在假設(shè)為真時,“我們的樣本觀測值落在拒絕域中”這個事件是一個小概率事件,一般我們認 為發(fā)生概率比較小的事件為小概率事件,這里“小”的度量根據(jù)實際問題來定,根據(jù)小概率事件原理,即小概率事件在一次事件中認為不會發(fā)生,如果 發(fā)生了,我們就認為這不是小概率事件了,往往這句話的前半句更容易接受一點,我們很難說一個發(fā)生的事件不是小概率事件,這也就是為什么我們更 愿意得到拒絕H_0的原因。這個原理看起來有太大人為思想了,我們還是承認他,就是在沒有完美解決方案的情況下,退而求其次的結(jié)果呀。
? ? 那到底如何給出我們談?wù)摰倪@個“拒絕域”呢?這個一般根據(jù)具體情況而定,不過套路還是差不多的,一般都會用統(tǒng)計量的某些規(guī)則來給出拒絕域。
? ? 需要說明一下的是,很多情況下,我們也希望取偽概率要盡可能小,但是我們很難都照顧到,所以我們又找了個簡單的做,就是只考慮拒真概率盡可能小,
? ?首先給出一個小概率值alpha(比如取0.05),來限定拒真概率以便給出拒絕域。這里數(shù)學家給了一個名字,叫顯著性水平,alpha值越小,顯 著性水平就越低,說明的是小概率發(fā)生的概率就越低。對于參數(shù)的建設(shè)檢驗問題,我們要構(gòu)造一個估計這個參數(shù)的統(tǒng)計量。然后我們在H_0為真的前 提下,找到這個統(tǒng)計量的分布。 找到分布就成功了一大步了。下一步也很關(guān)鍵,這一步是根據(jù)原假設(shè)H_0的形式進行的,這一步我們用例子說明,這一步完成了,任務(wù)基本上完成了。

? ?例子,有一堆鉛筆要出廠啊,根據(jù)經(jīng)驗,該廠的鉛筆長度滿足正態(tài)分布,方差已知為sigma^2,假設(shè)某個組織給了一個標準,說鉛筆的長度的期望為 u_0才能合格。


? ? ? ?那我們就設(shè)H_0: u = u_0, H_1:u!=u_0。 我們找一個估計u的統(tǒng)計量,就用樣本均值了,由于CSDN我編輯不了X的上面畫個橫線,我就用Y表示樣本均值了。樣本容量為n,那么(Y- u)sqrt(n)/(sigma)就服從標準正態(tài)分布N(0,1)了,在H_0為真的條件下,就是說u=u_0的條件下,T=(Y- u_0)sqrt(n)/(sigma)就是一個統(tǒng)計量了,這個統(tǒng)計量服從標準正態(tài)分布。我們就是要根據(jù)這個統(tǒng)計量來尋找拒絕域。觀察T這 個統(tǒng)計量,當樣本均值Y與u_0接近的越近,我們就更容易接受H_0,也就是說當樣本均值遠離u_0的時候,在總體數(shù)學期望為u_0的條件 下,發(fā)生這個的概率比較小,也是為了限定這個小的程度,我們給定一個數(shù)值,比如我們前面提到的alpha=0.05,這個可以在不同的場合 下給出不同的值,這里我只是隨便給出的一個值而已。拒真的概率為 P(|T|>u_x) = alpha, 根據(jù)標準正態(tài)分布的分位數(shù)性質(zhì),u_x = u_{alpha/2}。根據(jù)|T|>u_x這個不等式,我們就可以來限制拒絕域了。W = {(x_1,...x_n) | |T|>u_x}。后面做判斷就水到渠成了。

?3、總結(jié)一下
? ?本文中主要討論的是參數(shù)的假設(shè)檢驗問題。 ?在統(tǒng)計中,假設(shè)檢驗的關(guān)鍵問題是如何構(gòu)造統(tǒng)計量。 然后是如何思考選定拒絕域。 多多訓練之后,我們就自然明白這個過程了。所以還是要研究一些實際問題,來獲得理解。


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉