《高中數(shù)學(xué) 第三章 統(tǒng)計(jì)案例 3_2 獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用課件 新人教A版選修2-3》由會員分享,可在線閱讀,更多相關(guān)《高中數(shù)學(xué) 第三章 統(tǒng)計(jì)案例 3_2 獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用課件 新人教A版選修2-3(52頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、3.2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用 自主學(xué)習(xí) 新知突破 1通過對實(shí)際問題的分析探究,了解獨(dú)立性檢驗(yàn)(只要求22列聯(lián)表)的基本思想、方法及初步應(yīng)用;了解獨(dú)立性檢驗(yàn)的常用方法:等高條形圖及K2統(tǒng)計(jì)量法2通過典型案例的探究,了解實(shí)際推斷原理和假設(shè)檢驗(yàn)的基本思想、方法及初步應(yīng)用3理解獨(dú)立性檢驗(yàn)的基本思想及實(shí)施步驟,能運(yùn)用自己所學(xué)知識對具體案例進(jìn)行檢驗(yàn) 飲用水的質(zhì)量是人類普遍關(guān)心的問題據(jù)統(tǒng)計(jì),飲用優(yōu)質(zhì)水的518人中,身體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系嗎?提示人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系 1分類變量變量的不同“
2、值”表示個體所屬的_,像這樣的變量稱為分類變量2列聯(lián)表(1)定義:列出的兩個分類變量的_,稱為列聯(lián)表分類變量和列聯(lián)表不同類別頻數(shù)表 (2)22列聯(lián)表一般地,假設(shè)兩個分類變量X和Y,它們的取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱22列聯(lián)表)為:y1 y2總計(jì)x1 a b abx2 c d cd總計(jì)ac bd abcd 分類變量及其關(guān)系的分析的理解(1)這里的“變量”和“值”都應(yīng)作為廣義的變量和值來理解,只要不屬于同種類別都是變量和值,并不一定是取具體的數(shù)值,如:男、女;上、下;左、右等(2)頻數(shù)分析是指用不同類別的事件發(fā)生的頻率的大小比較來分析分類變量是否有關(guān)聯(lián)關(guān)系(3)等高條形圖
3、更加形象直觀地反映兩個分類變量之間的差異,進(jìn)而推斷它們之間是否具有關(guān)聯(lián)關(guān)系 1等高條形圖與表格相比,更能直觀地反映出兩個分類變量間是否_,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的_2觀察等高條形圖發(fā)現(xiàn)_和_相差很大,就判斷兩個分類變量之間有關(guān)系等高條形圖相互影響頻率特征 繪制等高條形圖時(shí),列聯(lián)表的行對應(yīng)的是高度,兩行的數(shù)據(jù)不相等,但對應(yīng)的條形圖的高度是相同的;兩列的數(shù)據(jù)對應(yīng)不同的顏色 獨(dú)立性檢驗(yàn) 獨(dú)立性檢驗(yàn)思想的理解及常用的幾個數(shù)值(1)獨(dú)立性檢驗(yàn)的基本思想類似于數(shù)學(xué)中的反證法,要確認(rèn)兩個分類變量有關(guān)系這一結(jié)論成立的可信程度,首先假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個分類變量沒有關(guān)系”成立,在該假設(shè)下我們構(gòu)
4、造的隨機(jī)變量K2應(yīng)該很小,如果由觀測數(shù)據(jù)計(jì)算得到的K2的觀測值很大,則在一定程度上說明假設(shè)不合理,根據(jù)隨機(jī)變量K2的含義,可以通過P(K26.635)0.01來評價(jià)假設(shè)不合理的程度,由實(shí)際計(jì)算得K2的觀測值k6.635,說明假設(shè)不合理的程度約為99%,即兩個分類變量有關(guān)系這一結(jié)論成立的可信程度為99%. (2)在實(shí)際問題中要記住以下幾個常用值:若k6.635,則在犯錯誤的概率不超過0.01的前提下認(rèn)為“X與Y有關(guān)系”;若k3.841,則在犯錯誤的概率不超過0.05的前提下認(rèn)為“X與Y有關(guān)系”;若k2.706,則在犯錯誤的概率不超過0.1的前提下認(rèn)為“X與Y有關(guān)系”;若k2.706,則認(rèn)為沒有充
5、分證據(jù)顯示“X與Y有關(guān)系” 1觀察下列各圖,其中兩個分類變量x,y之間關(guān)系最強(qiáng)的是() 解析:在四幅圖中,D圖中兩個深色條的高相差最明顯,說明兩個分類變量之間關(guān)系最強(qiáng)答案:D 2下面是一個22列聯(lián)表:則表中a,b處的值分別為()A94,96B52,50C52,54 D54,52y1 y2總計(jì)x1 a 21 73x2 2 25 27總計(jì)b 46 3在吸煙與患肺病是否相關(guān)的判斷中,有下面的說法:若K2的觀測值k6.635,則在犯錯誤的概率不超過0.01的前提下,認(rèn)為吸煙與患肺病有關(guān)系,那么在100個吸煙的人中必有99人患有肺??;從獨(dú)立性檢驗(yàn)可知在犯錯誤的概率不超過0.01的前提下,認(rèn)為吸煙與患肺病
6、有關(guān)系時(shí),若某人吸煙,則他有99%的可能患有肺?。粡莫?dú)立性檢驗(yàn)可知在犯錯誤的概率不超過0.05的前提下,認(rèn)為吸煙與患肺病有關(guān)系時(shí),是指有5%的可能性使得推斷錯誤其中說法正確的是_ 解析:K2是檢驗(yàn)吸煙與患肺病相關(guān)程度的量,是相關(guān)關(guān)系,而不是確定關(guān)系,是反映有關(guān)和無關(guān)的概率,故說法不正確;說法中對“確定容許推斷犯錯誤概率的上界”理解錯誤;說法正確答案: 4為了解決高二年級統(tǒng)計(jì)案例入門難的問題,某校在高一年級的數(shù)學(xué)教學(xué)中設(shè)有試驗(yàn)班,著重加強(qiáng)統(tǒng)計(jì)思想的滲透,下面是高二年級統(tǒng)計(jì)案例的測驗(yàn)成績統(tǒng)計(jì)表(單位:分)的一部分,試分析實(shí)驗(yàn)效果.70及70分以下70分以上總計(jì)對照班32 18 50試驗(yàn)班12 38
7、 50總計(jì) 44 56 100 附:P(K2k0) 0.025 0.010 0.005k0 5.024 6.635 7.879 合作探究 課堂互動 利用等高條形圖判斷分類變量間的關(guān)系2012年5月1日起我國對醉駕列入法律,交通事故明顯降低,現(xiàn)從發(fā)生交通事故的司機(jī)中抽取2 000名司機(jī)的隨機(jī)樣本,根據(jù)他們血液中是否含有酒精以及他們是否對事故負(fù)有責(zé)任將數(shù)據(jù)整理如下:有責(zé)任無責(zé)任總計(jì)有酒精650 150 800無酒精700 500 1 200總計(jì)1 350 650 2 000 (1)試作出相應(yīng)的等高條形圖;(2)結(jié)合等高條形圖分析血液中含有酒精與對事故負(fù)有責(zé)任是否有關(guān)系 思路點(diǎn)撥 (1)相應(yīng)的等高條
8、形圖如圖: (2)圖中兩個深色條的高分別表示司機(jī)血液中有酒精和無酒精樣本中對事故負(fù)有責(zé)任的頻率,從圖中可以看出,司機(jī)血液中有酒精樣本中對事故負(fù)有責(zé)任的頻率明顯高于司機(jī)血液中無酒精樣本中對事故負(fù)有責(zé)任的頻率由此可以認(rèn)為司機(jī)血液中含有酒精與對事故負(fù)有責(zé)任有關(guān)系 2分析分類變量關(guān)系的步驟:(1)作大量的調(diào)查、研究,統(tǒng)計(jì)出結(jié)果;(2)列出列聯(lián)表利用頻率粗略估計(jì);(3)作出等高條形圖,從直觀上進(jìn)一步判斷分類變量之間的關(guān)聯(lián)關(guān)系特別提醒:通過等高條形圖可以粗略地判斷兩個分類變量是否有關(guān)系,但無法精確地給出所得結(jié)論的可靠程度 1某校對學(xué)生課外活動進(jìn)行調(diào)查,結(jié)果整理成下表:請根據(jù)數(shù)據(jù),利用圖形判斷:喜歡體育或喜
9、歡文娛是否與性別有關(guān)系體育文娛合計(jì)男生21 23 44女生6 29 35合計(jì)27 52 79 解析:其等高條形圖如圖所示由圖可以直觀地看出喜歡體育還是喜歡文娛與性別在某種程度上有關(guān)系 利用隨機(jī)變量K2判斷分類變量間的關(guān)系下表是某地區(qū)的一種傳染病與飲用水的調(diào)查表:得病不得病合計(jì)干凈水52 466 518不干凈水94 218 312合計(jì)146 684 830 (1)這種傳染病是否與飲用水的衛(wèi)生程度有關(guān),請說明理由;(2)若飲用干凈水得病5人,不得病50人,飲用不干凈水得病9人,不得病22人按此樣本數(shù)據(jù)分析這種疾病是否與飲用水有關(guān),并比較兩種樣本在反映總體時(shí)的差異思路點(diǎn)撥(1)根據(jù)表中的信息計(jì)算K2
10、的觀測值,并根據(jù)臨界值表來分析相關(guān)性的大小,對于(2)要列出22列聯(lián)表,方法同(1) 兩個樣本都能統(tǒng)計(jì)得到傳染病與飲用不干凈水有關(guān)這一相同結(jié)論,但(1)中我們在犯錯誤的概率不超過0.001的前提下肯定結(jié)論的正確性,(2)中我們在犯錯誤的概率不超過0.025的前提下肯定結(jié)論的正確性. 12分 規(guī)律方法利用K2公式判斷兩分類變量是否有關(guān)系的方法 2某電視臺聯(lián)合相關(guān)報(bào)社對“男女同齡退休”這一公眾關(guān)注的問題進(jìn)行了民意調(diào)查,數(shù)據(jù)如下表所示:根據(jù)表中數(shù)據(jù),能否在犯錯誤的概率不超過0.001的前提下認(rèn)為這一問題的看法與性別有關(guān)系?(P(K 210.828)0.001)贊同反對總計(jì)男198 217 415女4
11、76 109 585總計(jì)674 326 1 000 獨(dú)立性檢驗(yàn)的綜合應(yīng)用為了調(diào)查某生產(chǎn)線上質(zhì)量監(jiān)督員甲對產(chǎn)品質(zhì)量的好壞有無影響,現(xiàn)統(tǒng)計(jì)數(shù)據(jù)如下:甲在生產(chǎn)現(xiàn)場時(shí),990件產(chǎn)品中有合格品982件,次品8件;甲不在生產(chǎn)現(xiàn)場時(shí),510件產(chǎn)品中有合格品493件,次品17件試分別用列聯(lián)表、等高條形圖、獨(dú)立性檢驗(yàn)的方法分析監(jiān)督員甲對產(chǎn)品質(zhì)量的好壞有無影響能否在犯錯誤的概率不超過0.001的前提下,認(rèn)為質(zhì)量監(jiān)督員甲在不在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量的好壞有關(guān)系? 思路點(diǎn)撥 解析:(1)22列聯(lián)表如下:由列聯(lián)表可得|acbd|982174938|12 750,相差較大,可在某種程度上認(rèn)為“質(zhì)量監(jiān)督員甲是否在生產(chǎn)現(xiàn)場與產(chǎn)品
12、質(zhì)量有關(guān)”合格品數(shù)次品數(shù)總計(jì)甲在生產(chǎn)現(xiàn)場982 8 990甲不在生產(chǎn)現(xiàn)場493 17 510總計(jì)1 475 25 1 500 (2)由等高條形圖可知:在某種程度上認(rèn)為“質(zhì)量監(jiān)督員甲是否在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量有關(guān)系” 規(guī)律方法判斷兩個分類變量之間有無關(guān)系,可以用22列聯(lián)表、等高條形圖、獨(dú)立性檢驗(yàn)等方法作出判斷,其中從列聯(lián)表和等高條形圖中只能粗略地進(jìn)行估計(jì),要進(jìn)行精確的判斷,必須利用獨(dú)立性檢驗(yàn)進(jìn)行計(jì)算并與臨界值對比 3在調(diào)查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,做出列聯(lián)表,試用獨(dú)立性檢驗(yàn)的方法來判斷色盲與性別是否有關(guān)?你所得到的結(jié)論在什么范圍內(nèi)有效? 解析:根據(jù)題目所給的數(shù)據(jù)作出如下的列聯(lián)表:色盲不色盲總計(jì)男38 442 480女6 514 520總計(jì)44 956 1 000 為了研究男子的年齡與吸煙的關(guān)系,抽查了100個男子,按年齡超過和不超過40歲,吸煙量每天多于和不多于20支進(jìn)行分組,數(shù)據(jù)如表,試問吸煙量與年齡是否有關(guān)?年齡合計(jì)不超過40歲超過40歲吸煙量不多于20支/天50 15 65吸煙量多于20支/天10 25 35合計(jì)60 40 100 提示由于對22列聯(lián)表中a,b,c,d的位置不確定,在代入公式時(shí)取錯了數(shù)值,導(dǎo)致計(jì)算結(jié)果的錯誤