《2020版高考數(shù)學大一輪復習 第九章 統(tǒng)計 第3節(jié) 變量間的相關關系與統(tǒng)計案例課件 理 新人教A版.ppt》由會員分享,可在線閱讀,更多相關《2020版高考數(shù)學大一輪復習 第九章 統(tǒng)計 第3節(jié) 變量間的相關關系與統(tǒng)計案例課件 理 新人教A版.ppt(39頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第3節(jié)變量間的相關關系與統(tǒng)計案例,考試要求1.了解樣本相關系數(shù)的統(tǒng)計含義,了解樣本相關系數(shù)與標準化數(shù)據(jù)向量夾角的關系,會通過相關系數(shù)比較多組成對數(shù)據(jù)的相關性;2.了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法,會使用相關的統(tǒng)計軟件,會用一元線性回歸模型進行預測;3.理解22列聯(lián)表的統(tǒng)計意義,了解22列聯(lián)表獨立性檢驗及其應用.,知 識 梳 理,1.相關關系與回歸分析,回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法;判斷相關性的常用統(tǒng)計圖是:________;統(tǒng)計量有相關系數(shù)與相關指數(shù). (1)在散點圖中,點散布在從_
2、_______到________的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關. (2)在散點圖中,點散布在從________到________的區(qū)域,兩個變量的這種相關關系稱為負相關. (3)如果散點圖中點的分布從整體上看大致在_____________附近,稱兩個變量具有線性相關關系.,散點圖,左下角,右上角,左上角,右下角,一條直線,2.線性回歸方程 (1)最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的______________最小的方法叫做最小二乘法.,距離的平方和,斜率,3.回歸分析 (1)定義:對具有____________的兩個變量進行統(tǒng)計分析的一種常用方法.,相關關系,正相
3、關,負相關,越強,r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于______時,認為兩個變量有很強的線性相關性.,0.75,4.獨立性檢驗 (1)利用隨機變量K2來判斷“兩個分類變量____________”的方法稱為獨立性檢驗. (2)列聯(lián)表:列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(22列聯(lián)表)為,有關系,ab,bd,abcd,微點提醒,基 礎 自 測,1.判斷下列結論正誤(在括號內(nèi)打“”或“”),(1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關關系.(),(
4、3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關性檢驗.() (4)事件X,Y關系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越大.() 答案(1)(2)(3)(4),2.(選修23P91探究改編)為調(diào)查中學生近視情況,測得某校男生150名中有80名近視,在140名女生中有70名近視.在檢驗這些學生眼睛近視是否與性別有關時,用下列哪種方法最有說服力() A.回歸分析 B.均值與方差 C.獨立性檢驗 D.概率 解析“近視”與“性別”是兩類變量,其是否有關,應用獨立性檢驗判斷. 答案C,3.(選修23P85講解改編)兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相
5、關指數(shù)R2如下,其中擬合效果最好的模型是() A.模型1的相關指數(shù)R2為0.98 B.模型2的相關指數(shù)R2為0.80 C.模型3的相關指數(shù)R2為0.50 D.模型4的相關指數(shù)R2為0.25 解析在兩個變量y與x的回歸模型中,它們的相關指數(shù)R2越近于1,模擬效果越好,在四個選項中A的相關指數(shù)最大,所以擬合效果最好的是模型1. 答案A,4.(2019臨沂模擬)已知變量x和y的統(tǒng)計數(shù)據(jù)如下表:,答案C,5.(2015全國卷)根據(jù)下面給出的2004年至2013年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結論不正確的是(),A.逐年比較,2008年減少二氧化硫排放量的效果最顯著 B.2007年我國治
6、理二氧化硫排放顯現(xiàn)成效 C.2006年以來我國二氧化硫年排放量呈減少趨勢 D.2006年以來我國二氧化硫年排放量與年份正相關 解析對于A選項,由圖知從2007年到2008年二氧化硫排放量下降得最多,故A正確.對于B選項,由圖知,由2006年到2007年矩形高度明顯下降,因此B正確.對于C選項,由圖知從2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正確.由圖知2006年以來我國二氧化硫年排放量與年份負相關,D不正確. 答案D,6.(2019天津和平區(qū)檢測)某校為了研究學生的性別和對待某一活動的態(tài)度(支持與不支持)的關系,運用22列聯(lián)表進行獨立性檢驗,經(jīng)計算K26.705,則
7、所得到的統(tǒng)計學結論是:有________的把握認為“學生性別與支持該活動沒有關系”.(),A.99.9% B.99% C.1% D.0.1% 解析因為6.635<6.705<10.828,因此有1%的把握認為“學生性別與支持該活動沒有關系”,故選C. 答案C,考點一相關關系的判斷,【例1】 (1)觀察下列各圖形,,其中兩個變量x,y具有相關關系的圖是() A. B. C. D.,(2)甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性做試驗,并用回歸分析方法分別求得相關系數(shù)r與殘差平方和m如下表:,則哪位同學的試驗結果體現(xiàn)A,B兩變量有更強的線性相關性() A.甲 B.乙 C.丙 D.丁,解
8、析(1)由散點圖知中的點都分布在一條直線附近.中的點都分布在一條曲線附近,所以中的兩個變量具有相關關系. (2)在驗證兩個變量之間的線性相關關系時,相關系數(shù)的絕對值越接近于1,相關性越強,在四個選項中只有丁的相關系數(shù)最大;殘差平方和越小,相關性越強,只有丁的殘差平方和最小,綜上可知丁的試驗結果體現(xiàn)了A,B兩變量有更強的線性相關性. 答案(1)C(2)D,【訓練1】 (1)已知變量x和y滿足關系y0.1x1,變量y與z正相關.下列結論中正確的是() A.x與y正相關,x與z負相關 B.x與y正相關,x與z正相關 C.x與y負相關,x與z負相關 D.x與y負相關,x與z正相關,(2)x和y的散點圖
9、如圖所示,則下列說法中所有正確命題的序號為________.,解析(1)由y0.1x1,知x與y負相關,即y隨x的增大而減小,又y與z正相關,所以z隨y的增大而增大,減小而減小,所以z隨x的增大而減小,x與z負相關.,答案(1)C(2),考點二線性回歸方程及應用 【例2】 (2019日照調(diào)研)某地隨著經(jīng)濟的發(fā)展,居民收入逐年增長,下表是該地一建設銀行連續(xù)五年的儲蓄存款(年底余額),如下表1:,表1,為了研究計算的方便,工作人員將上表的數(shù)據(jù)進行了處理,tx2 012,zy5得到下表2:,表2 (1)求z關于t的線性回歸方程; (2)通過(1)中的方程,求出y關于x的回歸方程; (3)用所求回歸方
10、程預測到2022年年底,該地儲蓄存款額可達多少?,【訓練2】 (2018全國卷)如圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額y(單位:億元)的折線圖.,(2)利用模型得到的預測值更可靠.理由如下:,()從計算結果看,相對于2016年的環(huán)境基礎設施投資額220億元,由模型得到的預測值226.1億元的增幅明顯偏低,而利用模型得到的預測值的增幅比較合理,說明利用模型得到的預測值更可靠. 以上給出了2種理由,考生答出其中任意一種或其他合理理由均可得分.,考點三獨立性檢驗 【例3】 (2019湖南長沙雅禮中學、河南省實驗中學聯(lián)考)環(huán)境問題是當今世界共同關注的問題,我國環(huán)保總局根據(jù)空氣污染指數(shù)PM
11、2.5濃度,制定了空氣質(zhì)量標準:,某市政府為了打造美麗城市,節(jié)能減排,從2010年開始考察了連續(xù)六年11月份的空氣污染指數(shù),繪制了頻率分布直方圖,經(jīng)過分析研究,決定從2016年11月1日起在空氣質(zhì)量重度污染和嚴重污染的日子對機動車輛限號出行,即車牌尾號為單號的車輛單號出行,車牌尾號為雙號的車輛雙號出行(尾號是字母的,前13個視為單號,后13個視為雙號).王先生有一輛車,若11月份被限行的概率為0.05.,(1)求頻率分布直方圖中m的值; (2)若按分層抽樣的方法,從空氣質(zhì)量良好與中度污染的天氣中抽取6天,再從這6天中隨機抽取2天,求至少有一天空氣質(zhì)量是中度污染的概率;,(3)該市環(huán)保局為了調(diào)查
12、汽車尾氣排放對空氣質(zhì)量的影響,對限行兩年來的11月份共60天的空氣質(zhì)量進行統(tǒng)計,其結果如下表:,根據(jù)限行前6年180天與限行后60天的數(shù)據(jù),計算并填寫22列聯(lián)表,并回答是否有90%的把握認為空氣質(zhì)量的優(yōu)良與汽車尾氣的排放有關.,參考數(shù)據(jù):,解(1)因為限行分單雙號,王先生的車被限行的概率為0.05, 所以空氣重度污染和嚴重污染的概率應為0.0520.1, 由頻率分布直方圖可知(0.0040.0060.005m)500.11,解得m0.003.,(2)因為空氣質(zhì)量良好與中度污染的天氣的概率之比為0.30.1521, 按分層抽樣的方法從中抽取6天,則空氣質(zhì)量良好的天氣被抽取的有4天,記作A1,A2
13、,A3,A4,空氣中度污染的天氣被抽取的有2天,記作B1,B2, 從這6天中隨機抽取2天,所包含的基本事件有(A1,A2),(A1,A3),(A1,A4),(A1,B1),(A1,B2),(A2,A3),(A2,A4),(A2,B1),(A2,B2),(A3,A4),(A3,B1),(A3,B2),(A4,B1),(A4,B2),(B1,B2),共15個, 記事件A為“至少有一天空氣質(zhì)量是中度污染”,則事件A所包含的事件有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2),(B1,B2),共9個,,(3)22列聯(lián)表如下
14、:,【訓練3】 為了判斷高中三年級學生是否選修文科與性別的關系,現(xiàn)隨機抽取50名學生,得到如下22列聯(lián)表:,解析K2的觀測值k4.844,這表明小概率事件發(fā)生.根據(jù)假設檢驗的基本原理,應該斷定“是否選修文科與性別之間有關系”成立,并且這種判斷出錯的可能性約為5%. 答案5%,思維升華,2.回歸分析是處理變量相關關系的一種數(shù)學方法.主要解決:(1)確定特定量之間是否有相關關系,如果有就找出它們之間貼近的數(shù)學表達式;(2)根據(jù)一組觀察值,預測變量的取值及判斷變量取值的變化趨勢;(3)求出線性回歸方程.,易錯防范 1.回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的線性回歸方程才有實際意義,否則,求出的線性回歸方程毫無意義. 2.獨立性檢驗中統(tǒng)計量K2的觀測值k0的計算公式很復雜,在解題中易混淆一些數(shù)據(jù)的意義,代入公式時出錯,而導致整個計算結果出錯.,