《高考數學 一輪復習學案訓練課件北師大版理科: 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關關系與統(tǒng)計案例學案 理 北師大版》由會員分享,可在線閱讀,更多相關《高考數學 一輪復習學案訓練課件北師大版理科: 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關關系與統(tǒng)計案例學案 理 北師大版(9頁珍藏版)》請在裝配圖網上搜索。
1、
第四節(jié) 變量間的相關關系與統(tǒng)計案例
[考綱傳真] (教師用書獨具)1.會做兩個有關聯變量的數據的散點圖,并利用散點圖認識變量間的相關關系.2.了解最小二乘法的思想,能根據給出的線性回歸方程系數公式建立線性回歸方程(線性回歸系數公式不要求記憶).3.了解回歸分析的基本思想、方法及其簡單應用.4.了解獨立性檢驗(只要求2×2列聯表)的思想、方法及其初步應用.
(對應學生用書第165頁)
[基礎知識填充]
1.兩個變量的線性相關
(1)正相關
在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關.
(2)負相關
在散點圖中
2、,點散布在從左上角到右下角的區(qū)域,兩個變量的這種相關關系稱為負相關.
(3)線性相關關系、回歸直線
如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫作回歸直線.
2.回歸方程
(1)最小二乘法
求回歸直線,使得樣本數據的點到它的距離的平方和最小的方法叫作最小二乘法.
(2)回歸方程
方程y=bx+a是兩個具有線性相關關系的變量的一組數據(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中a,b是待定參數.
3.回歸分析
(1)定義:對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.
(2)樣本點的中心
對
3、于一組具有線性相關關系的數據(x1,y1),(x2,y2),…,(xn,yn),其中(,)稱為樣本點的中心.
(3)相關系數
當r>0時,表明兩個變量正相關;
當r<0時,表明兩個變量負相關.
r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性.
4.獨立性檢驗
(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這類變量稱為分類變量.
(2)列聯表:列出兩個分類變量的頻數表,稱為列聯表.假設有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1
4、,y2},其樣本頻數列聯表(稱為2×2列聯表)為
2×2列聯表
y1
y2
總計
x1
a
b
a+b
x2
c
d
c+d
總計
a+c
b+d
a+b+c+d
構造一個隨機變量χ2=,其中n=a+b+c+d為樣本容量.
(3)獨立性檢驗
利用隨機變量χ2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗.
[知識拓展] 1.b的幾何意義:體現平均增加或平均減少.
2.由回歸直線求出的數據是估算值,不是精確值.
[基本能力自測]
1.(思考辨析)判斷下列結論的正誤.(正確的打“√”,錯誤的打“×”)
(1)“名師
5、出高徒”可以解釋為教師的教學水平與學生的水平成正相關關系.( )
(2)通過回歸直線方程y=bx+a可以估計預報變量的取值和變化趨勢.( )
(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關性檢驗.( )
(4)事件X,Y關系越密切,則由觀測數據計算得到的χ2的觀測值越大.( )
[答案] (1)√ (2)√ (3)× (4)√
2.(教材改編)已知變量x與y正相關,且由觀測數據算得樣本平均數=3,=3.5,則由該觀測數據算得的線性回歸方程可能是( )
A.y=0.4x+2.3 B.y=2x-2.4
C.y=-2x+9.5 D.y
6、=-0.3x+4.4
A [因為變量x和y正相關,排除選項C,D.又樣本中心(3,3.5)在回歸直線上,排除B,選項A滿足.]
3.下面是一個2×2列聯表
y1
y2
總計
x1
a
21
73
x2
2
25
27
總計
b
46
則表中a,b處的值分別為________.
52,54 [因為a+21=73,所以a=52.又因為a+2=b,所以b=54.]
4.調查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調查顯示年收入x與年飲食支出y具有線性相關關系,并由調查數據得到回歸直線方程:y=0.254x+0.32
7、1,由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均約增加________萬元.
0.254 [由題意知回歸直線的斜率為0.254,
故家庭年收入每增加1萬元,年飲食支出平均約增加0.254萬元.]
5.為了判斷高中三年級學生是否選修文科與性別的關系,現隨機抽取50名學生,得到如下2×2列聯表:
理科
文科
男
13
10
女
7
20
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.
根據表中數據,得到χ2的觀測值k=≈4.844.則認為選修文科與性別有關系出錯的可能性為________.
5% [χ2的觀測值k≈
8、4.844,這表明小概率事件發(fā)生.根據假設檢驗的基本原理,應該斷定“是否選修文科與性別之間有關系”成立,并且這種判斷出錯的可能性約為5%.]
(對應學生用書第166頁)
相關關系的判斷
(1)已知變量x和y滿足關系y=-0.1x+1,變量y與z正相關.下列結論中正確的是( )
A.x與y正相關,x與z負相關
B.x與y正相關,x與z正相關
C.x與y負相關,x與z負相關
D.x與y負相關,x與z正相關
(2)x和y的散點圖如圖941所示,則下列說法中所有正確命題的序號為________.
【導學號:79140333】
圖9&
9、#173;41
①x,y是負相關關系;
②在該相關關系中,若用y=c1ec2x擬合時的相關指數為R,用y=bx+a擬合時的相關指數為R,則R>R;
③x,y之間不能建立線性回歸方程.
(1)C (2)①② [(1)因為y=-0.1x+1的斜率小于0,故x與y負相關.因為y與z正相關,可設z=by+a,b>0,則z=by+a=-0.1bx+b+a,故x與z負相關.
(2)在散點圖中,點散布在從左上角到右下角的區(qū)域,因此x,y是負相關關系,故①正確;由散點圖知用y=c1ec2x擬合比用y=bx+a擬合效果要好,則R>R,故②正確;x,y之間可以建立線性回歸方程,但擬合效
10、果不好,故③錯誤.]
[規(guī)律方法] 判定兩個變量正、負相關性的方法
(1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關;點的分布從左上角到右下角,兩個變量負相關.
(2)相關系數:r>0時,正相關;r<0時,負相關.
(3)線性回歸直線方程中:b>0時,正相關;b<0時,負相關.
[跟蹤訓練] 某公司在上半年的月收入x(單位:萬元)與月支出y(單位:萬元)的統(tǒng)計資料如表所示:
月份
1月份
2月份
3月份
4月份
5月份
6月份
收入x
12.3
14.5
15.0
17.0
19.8
20.6
支出y
5.63
5.75
5.8
11、2
5.89
6.11
6.18
根據統(tǒng)計資料,則( )
A.月收入的中位數是15,x與y有正線性相關關系
B.月收入的中位數是17,x與y有負線性相關關系
C.月收入的中位數是16,x與y有正線性相關關系
D.月收入的中位數是16,x與y有負線性相關關系
C [月收入的中位數是=16,收入增加,支出增加,故x與y有正線性相關關系.]
回歸分析
(20xx·全國卷Ⅰ)為了監(jiān)控某種零件的一條生產線的生產過程,檢驗員每隔30 min從該生產線上隨機抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內依次抽取的16個零件的尺寸:
抽取次
12、序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
經計算得=xi=9.97,s==≈0.212,≈18.439,(xi-)(i-8.5)=-2.78,其中xi為抽取的第i個零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)
13、的相關系數r,并回答是否可以認為這一天生產的零件尺寸不隨生產過程的進行而系統(tǒng)地變大或變小(若|r|<0.25,則可以認為零件的尺寸不隨生產過程的進行而系統(tǒng)地變大或變小);
(2)一天內抽檢零件中,如果出現了尺寸在(-3s,+3s)之外的零件,就認為這條生產線在這一天的生產過程可能出現了異常情況,需對當天的生產過程進行檢查.
(ⅰ)從這一天抽檢的結果看,是否需對當天的生產過程進行檢查?
(ⅱ)在(-3s,+3s)之外的數據稱為離群值,試剔除離群值,估計這條生產線當天生產的零件尺寸的均值與標準差.(精確到0.01)
附:樣本(xi,yi)(i=1,2,…,n)的相關系數r=,≈0.0
14、9.
[解] (1)由樣本數據得(xi,i)(i=1,2,…,16)的相關系數
r=
≈≈-0.18.
由于|r|<0.25,因此可以認為這一天生產的零件尺寸不隨生產過程的進行而系統(tǒng)地變大或變?。?
(2)(ⅰ)由于=9.97,s≈0.212,因此由樣本數據可以看出抽取的第13個零件的尺寸在(-3s,+3s)以外,因此需對當天的生產過程進行檢查.
(ⅱ)剔除離群值,即第13個數據,剩下數據的平均數為
(16×9.97-9.22)=10.02,
這條生產線當天生產的零件尺寸的均值的估計值為10.02.
x≈16×0.2122+16×9.972≈
15、1 591.134,
剔除第13個數據,剩下數據的樣本方差為
(1 591.134-9.222-15×10.022)≈0.008,
這條生產線當天生產的零件尺寸的標準差的估計值為≈0.09.
[規(guī)律方法] 1.回歸直線方程中系數的兩種求法
(1)利用公式,求出回歸系數b,a.
(2)待定系數法:利用回歸直線過樣本點中心求系數.
2.回歸分析的兩種策略
(1)利用回歸方程進行預測:把回歸直線方程看作一次函數,求函數值.
(2)利用回歸直線判斷正、負相關:決定正相關還是負相關的是回歸系數B.
3.選擇填空中選一組數據的線性回歸直線方程的方法
(1)過定點(),驗證.
16、
(2)正、負相關看b的符號.
(3)代入數據看誤差大小.
[跟蹤訓練] 為了解某地區(qū)某種農產品的年產量x(單位:噸)對價格y(單位:千元/噸)和年利潤z的影響,對近五年該農產品的年產量和價格統(tǒng)計如下表:
x
1
2
3
4
5
y
7.0
6.5
5.5
3.8
2.2
(1)求y關于x的線性回歸方程y=bx+a;
(2)若每噸該農產品的成本為2千元,假設該農產品可全部賣出,預測當年產量為多少時,年利潤z取到最大值?(保留兩位小數)
參考公式:b==,a=-b.
[解] (1)由題知=3,=5,xiyi=62.7,x=55,
b===-1.23,
a
17、=-b=5-(-1.23)×3=8.69,
所以y關于x的線性回歸方程為y=-1.23x+8.69.
(2)年利潤z=x(-1.23x+8.69)-2x=-1.23x2+6.69=-1.232+1.23×,
即當x=≈2.72時,年利潤z最大.
獨立性檢驗
(20xx·皖北名校聯考)某醫(yī)院對治療支氣管肺炎的兩種方案A,B進行比較研究,將志愿者分為兩組,分別采用方案A和方案B進行治療,統(tǒng)計結果如下:
有效
無效
總計
使用方案A組
96
120
使用方案B組
72
總計
32
(1)完成上述列聯表
18、,并比較兩種治療方案有效的頻率;
(2)能否在犯錯誤的概率不超過0.05的前提下認為治療是否有效與方案選擇有關?
附:χ2=,其中n=a+b+c+D.
P(χ2≥k0)
0.05
0.010
0.001
k0
3.841
6.635
10.828
[解] (1)列聯表如下:
有效
無效
總計
使用方案A組
96
24
120
使用方案B組
72
8
80
總計
168
32
200
使用方案A組有效的頻率為=0.8;
使用方案B組有效的頻率為=0.9.
(2)χ2=≈3.517<3.841,
所以不能在犯錯誤的概率不超過0.05的
19、前提下認為治療是否有郊與方案選擇有關.
[規(guī)律方法] 解決獨立性檢驗問題的一般步驟
(1)根據樣本數據制成2×2列聯表.
(2)根據公式χ2=,計算χ2的值.
(3)查表比較χ2與臨界值的大小關系,作統(tǒng)計判斷.
易錯警示:應用獨立性檢驗方法解決問題,易出現不能準確計算χ2值的錯誤.
[跟蹤訓練] (20xx·江西九校聯考)隨著國家二孩政策的全面放開,為了調查一線城市和非一線城市的二孩生育意愿,某機構用簡單隨機抽樣方法從不同地區(qū)調查了100位育齡婦女,結果如圖.
非一線
一線
總計
愿生
45
20
65
不愿生
13
22
35
總計
58
42
100
算得χ2=≈9.616.
附表:
P(χ2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
參照附表,得到的正確結論是( )
A.在犯錯誤的概率不超過0.1%的前提下,認為“生育意愿與城市級別有關”
B.在犯錯誤的概率不超過0.1%的前提下,認為“生育意愿與城市級別無關”
C.有99%以上的把握認為“生育意愿與城市級別有關”
D.有99%以上的把握認為“生育意愿與城市級別無關”
C [因為χ2≈9.616>6.635,所以有99%以上的把握認為“生育意愿與城市級別有關”,故選C.]