武漢大學(xué)醫(yī)學(xué)統(tǒng)計學(xué)串講講義演示文檔
《武漢大學(xué)醫(yī)學(xué)統(tǒng)計學(xué)串講講義演示文檔》由會員分享,可在線閱讀,更多相關(guān)《武漢大學(xué)醫(yī)學(xué)統(tǒng)計學(xué)串講講義演示文檔(540頁珍藏版)》請在裝配圖網(wǎng)上搜索。
.,醫(yī)學(xué)統(tǒng)計學(xué)武漢大學(xué),.,第一部分 緒 論,.,,,,,,一、什么是統(tǒng)計學(xué)? What’s statistics?,是一門關(guān)于收集、整理和分析(統(tǒng)計)數(shù)據(jù)的科學(xué)。 醫(yī)學(xué)統(tǒng)計學(xué)是統(tǒng)計學(xué)方法在醫(yī)學(xué)中的運用。 醫(yī)學(xué)研究中觀測結(jié)果多為隨機事件,通過統(tǒng)計學(xué)方法可以揭示其內(nèi)在規(guī)律。,.,(1)設(shè)計: design (2)收集資料 collection of data (3)整理資料 sorting data (4)分析資料 analysis of data,二、統(tǒng)計工作的基本步驟,1)專業(yè)設(shè)計 2)統(tǒng)計設(shè)計,1)統(tǒng)計報表 2)醫(yī)療衛(wèi)生工作記錄 3)專題調(diào)查和實驗,1)對數(shù)據(jù)檢查、核對 2)按分析要求分組、匯總,1)統(tǒng)計描述 2)統(tǒng)計推斷,.,用定量方法測定得到,有大小之分,有度量衡單位。,三、 統(tǒng)計資料類型,(一)計量資料 measurement data,.,將觀察單位按屬性或類型分組計數(shù)所得的資料。 分為:1、二項分類資料; 2、多項分類資料。,(二)計數(shù)資料 enumeration count data,.,.,(三)等級資料 ranked ordinal data,將觀察單位按某屬性不同程度分組計數(shù)所得的資料。,.,例:測得一群人Hb值(g/dL),此資料為 計量資料 ; 按正常和異常分為兩組,此時資料為 計數(shù)資料 ; 按量的多少分為: 16 (Hb增高)。此時資料為 等級資料 。,資料間的相互轉(zhuǎn)化,.,四、統(tǒng)計學(xué)的基本概念,(一)同質(zhì)與變異,同質(zhì)(homogeneity) 指各觀察指標(biāo)受相同因素影響的部分。,變異(variation) 在同質(zhì)的基礎(chǔ)上個體間的差異。,.,例某地某年用隨機抽樣方法檢查了140名健康成年男子的紅細(xì)胞數(shù)(1012/L),檢測結(jié)果如下表:,觀察指標(biāo)的同質(zhì)部分:“某地某年健康成年男子” 觀察指標(biāo)的變異部分:各個體間紅細(xì)胞數(shù)間的差異,.,醫(yī)學(xué)統(tǒng)計學(xué)的基本概念,(二)總體與樣本(population & sample),總體:是根據(jù)研究目的所確定的同質(zhì)觀察單位(某種變量值)的全體。 1)有限總體(有時間、空間限制) 例研究2008年溫州市肝癌死亡率。 2)無限總體 例研究某藥對高血壓病的療效。 樣本:從總體中隨機抽取一部分個體所組成的集合。,.,醫(yī)學(xué)統(tǒng)計學(xué)的基本概念,(三)隨機抽樣,1.單純隨機抽樣 2.系統(tǒng)(機械)隨機抽樣 3.整群隨機抽樣 4.分層隨機抽樣,從總體中隨機抽取部分個體的過程。(總體中每一個觀察單位均有同等的機會被抽取到) 隨機抽樣是樣本客觀反映總體情況的前提。 隨機抽樣方法:,.,單純隨機抽樣,即先將調(diào)查總體的全部觀察單位編號,再隨機抽取部分觀察單位組成樣本。,例:欲了解某單位職工HBsAg陽性率,該單位有職工1000人,試按單純隨機抽樣法,抽取一例數(shù)為100的樣本。,.,系統(tǒng)隨機抽樣,又稱等距抽樣或機械抽樣,即先將總體的觀察單位按某一順序號等分成n個部分,再從第一部分隨機抽第k號觀察單位,依次用相等間隔,機械地從每一部分各抽一個觀察單位組成樣本。,例:欲了解某單位職工HBsAg陽性率,該單位有職工1000人,試按系統(tǒng)抽樣法,抽取一例數(shù)為100的樣本。,.,整群隨機抽樣,先將總體劃分為n個群,每個群包括若干觀察單位,再隨機抽取k個群,并將被抽取的各個群的全部觀察單位組成樣本。,例:某校有80個班級,各班學(xué)生50人,現(xiàn)用錫克氏試驗調(diào)查該校學(xué)生白喉易感率,隨機抽查了8個班的全部學(xué)生。,.,分層隨機抽樣,按有關(guān)影響因素把觀察對象分成若干層次,然后將同一層次的觀察對象進行隨機抽取。,例:欲了解某地人群HBsAg陽性率情況,按年齡段、職業(yè)、性別等因素分層后進行抽樣。,.,醫(yī)學(xué)統(tǒng)計學(xué)的基本概念,(四)誤差 主要有:粗差、系統(tǒng)誤差、隨機誤差(如測量誤差、 抽樣誤差等),問題:某中醫(yī)師對某方劑進行改良,改良后的方劑治療某病患者30例,有效率為80%,原方劑治療30例,有效率為60%,問兩者有效率有無差別?,抽樣誤差:抽樣引起的總體參數(shù)與樣本統(tǒng)計量之間sampling error 的差別。,.,醫(yī)學(xué)統(tǒng)計學(xué)的基本概念,(五)參數(shù)與統(tǒng)計量 (parameter & statistic) 參數(shù): 統(tǒng)計量: 檢驗統(tǒng)計量:,總體的特征量,如總體均數(shù)、總體標(biāo)準(zhǔn)差等。 樣本的統(tǒng)計指標(biāo)如樣本均數(shù)、標(biāo)準(zhǔn)差等。 用于統(tǒng)計檢驗的樣本指標(biāo)。 如 t、u、x2、F 等,.,均表示某事件發(fā)生可能性大小的量。,(六)頻率和概率,但:頻率為變量,fn(A) =m/n 概率P(A)為常數(shù)。 若n足夠大, fn(A) ≈P(A),?小概率事件 P(A) ? 0.05 “小概率事件一次是不太可能發(fā)生的”,醫(yī)學(xué)統(tǒng)計學(xué)的基本概念,第二部分 計量資料的統(tǒng)計描述,.,第一節(jié) 計量資料的統(tǒng)計描述,一、計量資料的頻數(shù)表 二、集中趨勢的描述 三、離散程度的描述,.,,1、頻數(shù)表的編制 2、頻數(shù)分布的特征 3、頻數(shù)分布的類型 4、頻數(shù)表的用途,,一、計量資料的頻數(shù)表,.,例某地用隨機抽樣方法檢查了140名成年男子的紅細(xì)胞數(shù),檢測結(jié)果如下表:,,.,(1)求全距或極差(R),(2)定組段和組距(i),1. 頻數(shù)表的編制,.,(3)列出頻數(shù)表,某地140名正常男子紅細(xì)胞數(shù)的頻數(shù)表,.,2. 頻數(shù)分布的特征,(1)集中趨勢 (2)離散趨勢,.,(1)對稱分布 其中一種常見的類型為正態(tài)分布. (2)偏態(tài)分布 有正偏態(tài)、負(fù)偏態(tài)之分.,3. 頻數(shù)分布的類型,.,4. 頻數(shù)表的用途 (1)了解資料的分布類型. (2)發(fā)現(xiàn)異常值. (3)在頻數(shù)表的基礎(chǔ)上計算有關(guān)指標(biāo)。,.,1、算術(shù)均數(shù) μ ,X 2、幾何均數(shù) G 3、中位數(shù) M,,二、集中趨勢的描述,.,概念: 數(shù)值的平均. 計算: 1)直接法:,例2.1 求某地140名正常成年男子紅細(xì)胞數(shù)均值為,,,1. 均數(shù)(mean) μ ,X,2)加權(quán)法:,,應(yīng)用: 對稱分布,尤其是正態(tài)分布.,.,概念:指一組數(shù)據(jù)的倍數(shù)平均。 計算:(1)直接法:,2. 幾何均數(shù) ( geometric mean, G ),,.,例:5份血清的抗體效價為1:10,1:100,1:1000,1:10000,1:100000,求其平均效價。,或者: 1:10,1:100,1:1000,1:10000,1:100000的指數(shù)部分為:-1,-2,-3,-4,-5,其平均值為-3,故G =10-3=1:1000,.,(2)加權(quán)法:,.,何謂對數(shù)正態(tài)分布? 某資料由變量值 X1,X2,…… Xn組成,已知其分布呈偏態(tài)。若每個變量值取對數(shù),如Y1=lgX1,Y2=lgX2,…… Yn=lgXn,且Y1,Y2,…… Yn呈正態(tài)分布。 此時,,將對數(shù)值還原為原始數(shù)值,則:,?應(yīng)用: (1)變量值呈倍數(shù)關(guān)系 (2)對數(shù)正態(tài)分布,.,3. 中位數(shù) M,概念:是一組由小到大按順序排列的觀察 值中位次居中的數(shù)值。 計算:(1)直接法: n為奇數(shù)時,,n為偶數(shù)時,,某病患者9人發(fā)病潛伏期為2,3,3,3,4,5,6,9,16天, 求中位數(shù)。 若在第20天又發(fā)現(xiàn)1例患者,則其中位數(shù)為:,3. 中位數(shù) (median M),.,利用百分位數(shù)計算公式進行計算. 百分位數(shù)(PX)是一種位置指標(biāo), 。中位數(shù)是一個特定的百分位數(shù),即M= P50 。,(2)頻數(shù)表法:,.,百分位數(shù)計算公式:,.,百分位數(shù)計算公式:,M,.,M,.,.,.,.,應(yīng)用: (1)偏態(tài)分布資料; (2)資料分布一端或兩端有未確定值。,.,.,三、離散程度的描述,例: 三組同性別、同年齡兒童的體重(Kg)如下,分析其集中趨勢與離散趨勢。 甲組:26 28 30 32 34 均數(shù):X=30 Kg 乙組:24 27 30 33 36 均數(shù):X=30 Kg 丙組:26 29 30 31 34 均數(shù):X=30 Kg,,,,,三、離散趨勢的描述,.,描述離散程度的常用指標(biāo),1、全距(極差) (R) 2、四分位數(shù)間距(QR) 3、方差(?2 S2)和 標(biāo)準(zhǔn)差(?、S) 4、變異系數(shù) (CV),.,反映一組同質(zhì)觀察值個體差異的范圍。 R甲=8; R乙=12; R丙=8。 缺點(1)不能反映組內(nèi)其它觀察值的變異度。 (2)樣本含量越大,則全距可能也越大。,1. 全距(極差),.,即P75-P25 四分位數(shù)可看作是一組同質(zhì)觀察值居中的50%變量值的變異范圍。,2. 四分位數(shù)間距(quartile range, QR),.,不受極值影響,較穩(wěn)定。,與全距比較有何優(yōu)點?,應(yīng)用: (1)偏態(tài)分布; (2)資料一端或兩端有未確定值。,.,.,變量值的離散程度可看作是各個變量值距離中心點(均數(shù))的遠(yuǎn)近問題。 用算式表示: ??x??? 但: ??x???=0 則求: ??x???2 (離均差平方和) ??x???2 大小與變異度有關(guān)外,還與變量值個數(shù)(N)有關(guān)。 故:,3. 方差(?2 S2)和 標(biāo)準(zhǔn)差(?、S) (variance & standard deviation),.,為了用原單位表示,開方即:,標(biāo)準(zhǔn)差或方差越大,說明個體差異越大,則均數(shù)的代表性越差。,.,實際工作中經(jīng)常得到的是樣本資料,總體均數(shù)?是不知道的,只能用樣本均數(shù)來估計總體均數(shù),這樣: 用 ??x?x?2 代替 ??x???2 n 代替 N 但這樣算得結(jié)果常比真實?低。,因此,統(tǒng)計學(xué)家提出用 n - 1 來校正。,,.,即:樣本標(biāo)準(zhǔn)差(S),S2 稱為 —— 樣本方差,.,,式中n-1稱為自由度,用希臘字母 ? (ju:psilen)表示。 自由度的概念: 是指隨機變量能自由取值的個數(shù)。 例:X+Y+Z=10 ? = 2 又例:,當(dāng)樣本均數(shù)一定時,隨機變量可以自由取值的變量值個數(shù)只能是n - 1 個。,.,計算: 1)不分組資料:,例: 三組同性別、同年齡兒童的體重(Kg)如下,分析其集中趨勢與離散趨勢。 甲組:26 28 30 32 34 均數(shù):X=30 Kg 乙組:24 27 30 33 36 均數(shù):X=30 Kg 丙組:26 29 30 31 34 均數(shù):X=30 Kg,計算得:S甲=3.16,S乙=4.74,S丙=2.92,,,,.,2)分組資料:,計算得:S = 0.38(×1012/ L),.,?應(yīng)用: 對稱分布,尤其是正態(tài)分布,.,,?應(yīng)用:(1)比較單位不同的幾組資料的變異程度 ?。?)比較均數(shù)相差懸殊的幾組資料的變異程度,4. 變異系數(shù)(CV),.,例2.9 某地調(diào)查110名18歲男大學(xué)生,其身高均數(shù)為172.73cm,標(biāo)準(zhǔn)差為4.09cm;其體重均數(shù)為55.04kg,標(biāo)準(zhǔn)差為4.10kg,試比較兩者變異度。,,某衛(wèi)生防疫站對30名麻疹易感兒童經(jīng)氣溶膠免疫一個月后,測得其血凝抑制抗體滴度資料如下,試計算其平均滴度 抗體滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 例 數(shù) 2 6 5 10 4 2 1,.,某市1974年為了解該地居民發(fā)汞的基礎(chǔ)水平, 為汞污染的環(huán)境監(jiān)測積累資料, 調(diào)查了留住該市一年以上, 無明顯肝、腎疾病,無汞作業(yè)接觸史的居民238 人的發(fā)汞含量如下:,用何種指標(biāo)說明本資料的集中位置和變異程度較好?并計算之;,.,某檢驗師測定了10名正常成年鋼鐵工人的血紅蛋白值(g/dl)和紅細(xì)胞數(shù)(萬/mm3)如下,試比較這兩個檢測項目的結(jié)果哪個變異性大?,血紅蛋白(g/dL) 13.0 13.6 14.0 14.5 14.6 14.7 15.2 15.5 15.8 16.0 血細(xì)胞數(shù)(萬/mm3) 510 515 517 518 520 522 524 525 528 530,.,第二部分 數(shù)值變量的描述性統(tǒng)計,統(tǒng)計圖表; 統(tǒng)計指標(biāo)。,.,第一節(jié) 頻數(shù)分布一. 編制頻數(shù)表的步驟,求極差 R=84-57cm=27(次/分) 劃分組段 確定組數(shù):較大樣本時,一般取10組左右。 確定組距:極差/組數(shù)=27/10=2.7≈3(次/分) 確定各組段的上下限:上限=下限+組距 統(tǒng)計各組段內(nèi)的數(shù)據(jù)頻數(shù),編制頻數(shù)表,.,表2.1 130名健康成年男子脈搏(次/分)的頻數(shù)分布表,,脈搏組段 (1),頻數(shù) (2),頻率(%) (3),累計頻數(shù) (4),累計頻率(%) (5),,56~ 59~ 62~ 65~ 68~ 71~ 74~ 77~ 80~ 83~85 合計,,2 5 12 15 25 26 19 15 10 1 130,1.54 3.85 9.23 11.54 19.23 20.00 14.62 11.54 7.69 0.77,2 7 19 34 59 85 104 119 129 130,1.54 5.38 14.62 26.15 45.38 65.38 80.00 91.54 99.23 100.00,.,二. 頻數(shù)表的用途,可以揭示資料的分布類型和分布特征,以便于選用相應(yīng)的統(tǒng)計分析方法。 便于進一步計算指標(biāo)和統(tǒng)計處理。 便于發(fā)現(xiàn)某些特大或特小的可疑值。,.,第二節(jié) 集中趨勢的描述,三種平均數(shù) 算術(shù)均數(shù) 幾何均數(shù) 中位數(shù)。,.,(一)算術(shù)均數(shù)(x),簡稱均數(shù),適合于表達呈正態(tài)分布資料的平均水平。 直接法: X=,,,X1+···+Xn,,n,=,?X,,n,例2-2:X,,=,81+70+66+···+69,,13,=71.69(次/分),.,,加權(quán)法 X=,,?fX,,?f,例: X=,,57?2+60?5+63?12+···+84 ?1,,130,=71.12(次/分),.,(二)幾何均數(shù)(G),適用于原始數(shù)據(jù)分布不對稱,但經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。 G= n X1X2···Xn G=lg-1( ),,,,,?lgX,,n,G=lg-1( ),?f lgX,,?f,.,例:40名麻疹易感兒童接種麻疹疫苗后一個月,測其血凝抑制抗體滴度,結(jié)果如表所示,求幾何均數(shù)。,,抗體滴度,人數(shù) f,滴度倒數(shù) X,lgX,,1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512,1 4 5 8 11 6 4 1,4 8 16 32 64 128 256 512,0.6021 0.9031 1.2041 1.5051 1.8061 2.1072 2.4082 2.7093,,G′=lg-1(,,?f lgX,,n,)=lg-1(1 ?0.6021+4 ?0.9031+ ··· +1 ?2.7093),,40,.,=lg-1(,,40,67.1282,),=48,G=1:48,.,(三)中位數(shù)(M),適合于表達偏態(tài)資料、或分布不明的資料的平均水平,尤其適合于表達只知數(shù)據(jù)的個數(shù)、但部分較大或較小數(shù)據(jù)的具體數(shù)值未準(zhǔn)確知道的資料的平均水平。,.,對于原始數(shù)據(jù)和頻數(shù)分布表資料,分別用下列兩式計算中位數(shù)。,M=,,(X n/2+X(n/2+1) )/2,(n為偶數(shù)),X(n+1)/2,(n為奇數(shù)),M = LM +,iM,,fM,(,n,,2,?fL ),,其中, LM :中位數(shù)所在組下限; iM :中位數(shù)所在組的組距; fM :中位數(shù)所在組的頻數(shù); ?fL :中位數(shù)所在組前一組的累計頻數(shù)。,.,例2-4 表2.3 107正常人的尿鉛含量(?g/L)的中位數(shù)計算表,,含量( ?g/L ) (1),頻數(shù)f (2),累計頻數(shù) ?f (3),累計頻率 % (4),,0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 合計,14 22 29 18 15 6 1 2 107,14 36 65 83 98 104 105 107,13.08 33.64 60.75 77.57 91.59 97.20 98.13 100.00,,,M=8+ (107/2 - 36) = 10.41(?g/L),4,,29,.,第三節(jié) 離散程度的描述,例:設(shè)有三組同年齡、同性別兒童體重(kg)數(shù)據(jù)如下: 甲組 26 28 30 32 34 乙組 24 27 30 33 36 丙組 26 29 30 31 34,.,描述離散程度的指標(biāo): 極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。,.,一. 極差(全距,R),為一組同質(zhì)觀察值中最大值與最小值之差。 甲組 R=34-26=8 乙組 R=36-24=12 甲組數(shù)據(jù)分布較乙組集中。,.,優(yōu)點:計算簡單 缺點: 1.沒有充分利用樣本信息,只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度。 2.樣本含量越大,抽到較大或較小觀察值的可能性越大,則極差可能越大,因此,樣本含量懸殊時不宜用極差比較分布的離散度。 所以,一般不用極差來反映離散程度。,.,二. 四分位數(shù)間距(Q) 1.分位數(shù)的概念 分位數(shù)是一種位置指標(biāo),一個特定的分位數(shù)將任何一個頻數(shù)曲線下的面積分為兩部分。 第1四分位數(shù)記作Q1,第2、第3四分位數(shù),分別記作Q2、Q3;第1百分位數(shù),記作P1。同理,還有第2、第3、 ···、第99百分位數(shù),分別記作P2、P3、 ···、P99。 顯然,Q1=P25、Q2=P50=M、Q3=P75,.,2.百分位數(shù)的計算公式 對連續(xù)型變量頻數(shù)表資料,按下式計算第X百分位數(shù)PX: PX=LX+,iX,,fX,(nX%,,?fL ),,其中, LX :第X百分位數(shù)所在組下限; iX :第X百分位數(shù)所在組的組距; fX :第X百分位數(shù)所在組的頻數(shù); ?fL :第X百分位數(shù)所在組前一組的累計頻數(shù)。,.,例 某地200例正常成人血鉛含量的頻數(shù)分布如表所示,請計算出血鉛含量的95%正常值范圍。 200例正常成人血鉛含量的頻數(shù)分布表,,血鉛含量 頻數(shù) 累計頻數(shù) (?mol/L) (1) (2),,0~ 0.24~ 0.48~ 0.72~ 0.97~ 1.21~ 1.45~ 1.69~ 1.93~ 2.17~ 2.42~ 2.66~ 2.90~3.14,6 48 43 36 28 13 14 4 4 1 2 0 1,6 54 97 133 161 174 188 192 196 197 199 199 200,,解:即求P95。 nX%=200×95%=190 P95 =1.69+ (190-188),0.24,,4,=1.81 (?mol/L),故某地正常人血鉛含量95%的單側(cè)正常值范圍的上限為 1.81 (?mol/L)。,.,,3.四分位數(shù)間距(Q) Q=P75-P25 Q=QU-QL 優(yōu)缺點:用四分位數(shù)間距作為描述數(shù)據(jù)分布離散程度的指標(biāo),比極差穩(wěn)定,但仍未考慮到每個數(shù)據(jù)的大小,常用于描述偏態(tài)頻數(shù)分布以及分布的一端或兩端無確切數(shù)值資料的離散程度。,.,?2=,?(X-?)2,,N,S2=,?(X-X)2,,,n - 1,n - 1稱為自由度,三.方差,.,? =,?(X-?)2,,N,,,,S=,?(X-X)2,,,n - 1,,,,直接法; s=,?X2-( ?X)2/n,由于?(X-X)2 =?X2-( ?X)2/n,所以,,n - 1,,,,加權(quán)法: s= ?fX2-( ?fX)2/?f,,?f - 1,,,,,,四.標(biāo)準(zhǔn)差,.,五. 變異系數(shù)(CV),CV=,S,,X,,?100%,1.用于比較度量衡單位不同的多組資料的變異度。 2.比較均數(shù)相差懸殊的多組資料的變異度。,.,一. 正態(tài)分布的概念和特征,正態(tài)分布的圖形:正態(tài)分布的密度函數(shù): f(X)=,1,,,? 2?,,,,e,-(X-?)2,,2 ?2,-?- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
10 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 武漢大學(xué) 醫(yī)學(xué) 統(tǒng)計學(xué) 串講 講義 演示 文檔
鏈接地址:http://www.820124.com/p-359924.html