2019-2020年高中數(shù)學(xué)回歸分析的基本思想及其初步應(yīng)用知識(shí)梳理教案新人教A版選修2-3.doc
《2019-2020年高中數(shù)學(xué)回歸分析的基本思想及其初步應(yīng)用知識(shí)梳理教案新人教A版選修2-3.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《2019-2020年高中數(shù)學(xué)回歸分析的基本思想及其初步應(yīng)用知識(shí)梳理教案新人教A版選修2-3.doc(3頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
2019-2020年高中數(shù)學(xué)回歸分析的基本思想及其初步應(yīng)用知識(shí)梳理教案新人教A版選修2-3 一.線性回歸方程的確定 如果一組具有相關(guān)關(guān)系的數(shù)據(jù) 作出散點(diǎn)圖大致分布在一條直線附近,那么我們稱這樣的變量之間的關(guān)系為線性相關(guān)關(guān)系(也稱一元線性相關(guān)),這條直線就是回歸直線,記為. 那么如何求得參數(shù)使得各點(diǎn)與此直線的距離的平方和為最小,即如何求得線性回歸方程呢? 在所求回歸直線方程中,當(dāng)取時(shí),與實(shí)際收集到的數(shù)據(jù)之間的偏差為,偏差的平方為(如圖1). 即 來(lái)刻畫(huà)出個(gè)點(diǎn)與回歸直線在整體上的偏差的平方和,顯然Q取最小值時(shí)的的值就是我們所求的: 其中為樣本數(shù)據(jù),為樣本平均數(shù),稱為樣本點(diǎn)中心,且所求線性回歸直線經(jīng)過(guò)樣本點(diǎn)中心(如圖2所示). 當(dāng)回歸直線斜率時(shí),為線性正相關(guān), 時(shí)為線性負(fù)相關(guān). y 圖1 應(yīng)注意,這個(gè)最小距離不是通常所指的各數(shù)據(jù)的點(diǎn)到直線的距離,而是各數(shù)據(jù)點(diǎn)沿平行y軸方向到直線的距離(如圖1所示). y 圖2 對(duì)于上面參數(shù)的求法原理及方法是簡(jiǎn)單的,但是運(yùn)算量較大,需要將展開(kāi),再合并,然后配方整理,從而求得. 例如,當(dāng)取怎樣實(shí)數(shù)時(shí), 的值為最小,顯然當(dāng)時(shí)最小值為,像這樣配方求最值的方法是經(jīng)常用到的, 線性回歸方程中的參數(shù)就是這樣求出的. 教材中用了添項(xiàng)法較為簡(jiǎn)捷的求出了截距和斜率分別是使取最小值時(shí)的值. 求得,的值,請(qǐng)同學(xué)們體會(huì)其解法. 線性回歸方程的確定是進(jìn)行回歸分析的基礎(chǔ). 二.回歸分析:是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種常用方法. 1.線性相關(guān)關(guān)系的強(qiáng)弱 兩個(gè)變量之間線性相關(guān)關(guān)系的樣本相關(guān)系數(shù)衡量線性相性關(guān)系的強(qiáng)弱,由于分子與斜率的分子一樣,因此,當(dāng)時(shí),兩個(gè)變量正相關(guān);當(dāng)時(shí)兩個(gè)變量負(fù)相關(guān).當(dāng)?shù)慕^對(duì)值接近1,表明兩個(gè)變量的線性相關(guān)性很強(qiáng);當(dāng)?shù)慕^對(duì)值接近0,表明兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系.規(guī)定當(dāng)時(shí),我們認(rèn)為兩個(gè)變量有很強(qiáng)的線性相關(guān)關(guān)系. 2.解釋變量與隨機(jī)誤差對(duì)預(yù)報(bào)精度的影響以及殘差分析 (1)有關(guān)概念 圖3 y 線性回歸模型 其中和為模型的未知參數(shù); 稱為解釋變量,稱為預(yù)報(bào)變量; 是與之間的誤差, 叫隨機(jī)誤差。 隨機(jī)誤差的估計(jì)值為 稱為相應(yīng)于樣本點(diǎn)的殘差(如圖3). (2)隨機(jī)誤差的方差估計(jì)值衡量回歸方程的預(yù)報(bào)精度 由于隨機(jī)誤差的均值=0, 因此,可以用隨機(jī)誤差的方差估計(jì)值= (其中,殘差平方和為)衡量回歸方程的預(yù)報(bào)精度,顯然越小,預(yù)報(bào)精度越高。 (3)通過(guò)殘差分析判斷模型擬合效果 由計(jì)算出殘差,,…,,然后選取橫坐標(biāo)為編號(hào)、或解釋變量或預(yù)報(bào)變量,縱坐標(biāo)為殘差作出殘差圖.通過(guò)圖形分析,如果樣本點(diǎn)的殘差較大,就要分析樣本數(shù)據(jù)的采集是否有錯(cuò)誤;另一方面,可以通過(guò)殘差點(diǎn)分布的水平帶狀區(qū)域的寬窄,說(shuō)明模型擬合效果,反映回歸方程的預(yù)報(bào)精度. 3.相關(guān)指數(shù)反應(yīng)模型的擬合效果 ?。? ?。?)變量理解: 為總偏差平方和,表示解釋變量和隨機(jī)誤差產(chǎn)生的總的效應(yīng); 為殘差平方和,表示了隨機(jī)誤差效應(yīng); ,表示了解釋變量效應(yīng). (2)模型擬合效果 ,反映了隨機(jī)誤差對(duì)預(yù)報(bào)變量(總效應(yīng))的貢獻(xiàn)率; 反映了解釋變量對(duì)預(yù)報(bào)變量(總效應(yīng))的貢獻(xiàn)率; 因此,越接近1(即越接近0),表示回歸的效果越好, 即解釋變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng). 三.非線性回歸的問(wèn)題轉(zhuǎn)化為線性回歸問(wèn)題 圖4 ?。?)作散點(diǎn)圖確定曲線模型 根據(jù)收集的數(shù)據(jù)作散點(diǎn)圖(如圖4), 可見(jiàn)兩個(gè)變量不呈線性相關(guān)關(guān)系.而是 分布在某一條指數(shù)函數(shù)曲線的 周?chē)?,也可以認(rèn)為樣本點(diǎn)集中在某二次 曲線的附近. (2)非線性轉(zhuǎn)化為線性 這時(shí)通過(guò)對(duì)數(shù)變換把指數(shù)關(guān)系 變?yōu)榫€性關(guān)系;通過(guò)換元把二次函數(shù)關(guān)系變換為 線性關(guān)系. 在這兩種情況下就可以利用線性回歸模型,建立和之間的非線性回歸方程了. (3)比較兩種模型的擬合效果 對(duì)于給定的樣本點(diǎn) ⅰ可以通過(guò)轉(zhuǎn)換后的對(duì)應(yīng)數(shù)表作散點(diǎn)圖來(lái)確定線性回歸的擬合情況,判斷選用哪一種曲線模型較為合適; ⅱ可以通過(guò)原始數(shù)據(jù)及和之間的非線性回歸方程列出殘差對(duì)比分析表,一 般通過(guò)殘差平方和比較兩種模型的擬合效果,顯然殘差平方和較小的擬合效果較好; ⅲ還可以用來(lái)比較兩個(gè)模型的擬合效果,越大(越接近1),擬合效果越好。- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 2019 2020 年高 數(shù)學(xué) 回歸 分析 基本 思想 及其 初步 應(yīng)用 知識(shí) 梳理 教案 新人 選修
鏈接地址:http://www.820124.com/p-2386482.html