《《數(shù)據(jù)的整理與展》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《數(shù)據(jù)的整理與展》PPT課件.ppt(49頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、第3章 統(tǒng)計(jì)數(shù)據(jù)的整理與展示,主要內(nèi)容,統(tǒng)計(jì)數(shù)據(jù)的預(yù)處理 非數(shù)值型數(shù)據(jù)的整理與顯示 數(shù)值型數(shù)據(jù)的展示與顯示 Excel的應(yīng)用,3.1 統(tǒng)計(jì)數(shù)據(jù)的預(yù)處理,,數(shù)據(jù)的篩選 數(shù)據(jù)的審核 數(shù)據(jù)排序,3.1.1 統(tǒng)計(jì)數(shù)據(jù)的審核,審核數(shù)據(jù)的完整性和準(zhǔn)確性。 完整性:調(diào)查單位是否有遺漏 調(diào)查項(xiàng)目是否填寫齊全 準(zhǔn)確性: 數(shù)據(jù)是否有錯(cuò)誤 是否存在異常值 (方法:邏輯檢查、計(jì)算檢查),3.1.2 數(shù)據(jù)的篩選,篩選內(nèi)容: 1.將某些不符合要求的或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除; 2.將符合某種特殊條件的數(shù)據(jù)篩選出來。 篩選方法: 計(jì)算機(jī):“數(shù)據(jù)”“篩選”,3.1.3 數(shù)據(jù)排序,作用: 1.便于通
2、過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征或趨勢,為分類(組)提供方便 2.檢查糾錯(cuò); 排序標(biāo)志: 字母、漢字、數(shù)值;升序或降序 Excel的應(yīng)用:,3.2 非數(shù)值型數(shù)據(jù)的整理與顯示,,3.2.1 分類數(shù)據(jù)整理(基本過程),1.列出各類別 2.計(jì)算各類別數(shù)據(jù)的頻數(shù)(個(gè)數(shù)) 3.制作頻數(shù)分布表 4.用圖形顯示數(shù)據(jù),1) 頻數(shù)分布,將統(tǒng)計(jì)數(shù)據(jù)分成幾類(組),匯總計(jì)算各類(組)的數(shù)據(jù)個(gè)數(shù),并用表格的形式表現(xiàn)出來,這種形式稱為頻數(shù)分布或次數(shù)分布。 各類(組)數(shù)據(jù)的個(gè)數(shù)稱為頻數(shù)或次數(shù),它與全部數(shù)據(jù)個(gè)數(shù)之比稱為頻率。 頻數(shù)分布的特點(diǎn):各類(組)的頻率大于或等于0;各類(組)的頻率之和為1或100%。,,頻數(shù)分布的作用:
3、 揭示現(xiàn)象的類型 反映現(xiàn)象的內(nèi)部構(gòu)成,2)例題分析,一家市場調(diào)查公司為研究 不同品牌飲料的市場占有率,對隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購買某一品牌的飲料,就將這一飲料的名稱記錄一次。以下是記錄的原始數(shù)據(jù)。.,旭日升冰茶可口可樂 旭日升冰茶 匯源果汁 露露 露露旭日升冰茶 可口可樂 露露 可口可樂 旭日升冰茶可口可樂 可口可樂 百事可樂 旭日升冰茶 可口可樂百事可樂 旭日升冰茶 可口可樂 百事可樂 百事可樂露露 露露 百事可樂 露露 可口可樂旭日升冰茶 旭日升冰茶 匯源果汁 匯源果汁 匯源果汁旭日升冰茶 可口可樂 可口可樂 可口
4、可樂 可口可樂百事可樂 露露 匯源果汁 百事可樂 露露可口可樂 百事可樂 可口可樂 露露 可口可樂旭日升冰茶 百事可樂 匯源果汁 旭日升冰茶,不同飲料銷售分布表,,頻數(shù)分布由兩部分組成: 分組形成的組別; 與各組對應(yīng)的總體單位數(shù)(頻數(shù)或次數(shù))。 當(dāng)以頻率表示各組在整體中的相對地位時(shí),即為頻率分布。,3) 分類數(shù)據(jù)頻數(shù)分布 的圖示,條形圖(直方圖) 餅圖(圓形圖),,分類數(shù)據(jù)的圖示柱形圖,柱形圖,用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)個(gè)數(shù)多少的圖形 有單式條形圖、復(fù)式條形圖等形式 各類別可以放在縱軸,稱為柱形圖,也可以放在橫軸,稱為條形圖,分類數(shù)據(jù)的圖示餅圖,,,餅圖,也稱圓形圖,是用圓
5、形及圓內(nèi)扇形面積來表示數(shù)值大小的圖形 主要用于表示總體的內(nèi)部結(jié)構(gòu) 繪制圓形圖時(shí),總體中各部分所占的百分比用圓內(nèi)的各個(gè)扇形角度表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定的,4) 用Excel編制頻數(shù)分布的步驟,在同一列輸入分類數(shù)據(jù)資料; 給每類分別賦值,并輸入在第二列; 點(diǎn)擊“工具”“數(shù)據(jù)分析”“直方圖”填寫對話框“圖表輸出”“確定”; 將輸出結(jié)果轉(zhuǎn)化為易于閱讀的表格形式。,5)用Excel制作統(tǒng)計(jì)圖的步驟,輸入分類數(shù)據(jù)頻數(shù)分布; 點(diǎn)擊“圖表向?qū)А钡膱D標(biāo),選擇需要的圖形; 填寫對話框; 對輸出結(jié)果進(jìn)行個(gè)性化的修飾。,3.2.2 順序數(shù)據(jù)的分類整理與圖示,,,與分類數(shù)據(jù)
6、不同的是: 1.給每一類別賦值時(shí)必須考慮順序 2.可以計(jì)算頻數(shù)或頻率的累計(jì)數(shù) 向上累計(jì):由較低水平的次數(shù)開始累計(jì); 向上累計(jì):由較高水平的次數(shù)開始累計(jì)。,例題分析,在一項(xiàng)城市住房問題的研究中,研究人員在某城市抽樣調(diào)查50戶,其中的一個(gè)問題是:“您對您家庭目前的住房狀況是否滿意?” 1非常不滿意;2不滿意;3一般; 4滿意; 5非常滿意。 將調(diào)查的資料分類整理。,順序數(shù)據(jù)的頻數(shù)分布,,想一想:向上累計(jì)、向上累計(jì)次數(shù)的意義是什么?,3.3 數(shù)值型數(shù)據(jù)的整理與顯示,,3.3.1 數(shù)值型數(shù)據(jù)頻數(shù)分布的種類,,頻數(shù)分布(分布數(shù)列),品 質(zhì) 數(shù) 列,單 項(xiàng) 式 數(shù) 列,組 距 式 數(shù) 列,等距式頻
7、數(shù)分布,異距式頻數(shù)分布,,,,,,,,某印染廠職工家庭人口分組統(tǒng)計(jì)(單項(xiàng)式),某印染廠職工工資分組統(tǒng)計(jì)(等距式),各類頻數(shù)分布的適用情況,若數(shù)據(jù)是離散型變量且變化范圍不大單項(xiàng)式; 連續(xù)型變量、離散型變量且變化范圍較大組距式; 若變動(dòng)比較均勻等距式; 若變動(dòng)不均勻異距式。,3.3.2 關(guān)于組距式頻數(shù)分布,1)概念 組限:上限、下限 組距=上限-下限 組中值=(上限+下限)/2 全距=總體最大值-最小值 開口組:無上限或無下限的組 開口組的組中值如何計(jì)算?,,2)常見的組限表現(xiàn)形式: 重疊組限 非重疊組限 (適合連續(xù)型變量) (適合離散型變量) 3040 3039 4050
8、 4049 5060 5059 ,,3)編制的原則 下閉上開原則,即上組限不在內(nèi)。 不重不漏的原則。 組限取整的原則。,4)編制步驟:,1.確定組數(shù)。參考公式: 2.確定組距:組距=全距/組數(shù); 3.根據(jù)分組,匯總各組的數(shù)據(jù)個(gè)數(shù)(頻數(shù)),必要時(shí)計(jì)算各組的頻率; 4.將以上結(jié)果繪制成統(tǒng)計(jì)表。,,,2,lg,n,lg,1,k,+,=,5)用Excel編制數(shù)值型數(shù)據(jù)頻數(shù)分布的 操作步驟:,1.在同一列輸入數(shù)據(jù)資料; 2. 在另一列輸入各組的上限減1的數(shù); 3.點(diǎn)擊“工具”“數(shù)據(jù)分析”“直方圖”填寫對話框“圖表輸出”“確定”; 4.將輸出結(jié)果轉(zhuǎn)化為易于閱讀的表格形式。,各類數(shù)
9、據(jù)整理的基本問題,弄清數(shù)據(jù)的類型,因?yàn)椴煌愋偷臄?shù)據(jù)處理方法有差異; 順序型數(shù)據(jù)可在整理的基礎(chǔ)上計(jì)算累計(jì)頻數(shù)和累計(jì)頻率; 對數(shù)值型數(shù)據(jù)可以編制單項(xiàng)式或組距式頻數(shù)分布; 適合低層次數(shù)據(jù)的整理方法同樣適合高層次數(shù)據(jù),但適合高層次數(shù)據(jù)的方法不適合低層次數(shù)據(jù)處理。,3.3.3 關(guān)于統(tǒng)計(jì)圖,,常用的圖形及主要作用,直方圖 :總體的分布、內(nèi)部結(jié)構(gòu)、數(shù)量多少的比較; 餅圖:總體的分布、內(nèi)部結(jié)構(gòu); 環(huán)行圖:多個(gè)總體內(nèi)部結(jié)構(gòu)的比較; 線形圖(折線圖):現(xiàn)象的發(fā)展變化趨勢、現(xiàn) 象的依存關(guān)系; 雷達(dá)圖:多個(gè)總體內(nèi)部結(jié)構(gòu)的比較;,關(guān)于線形圖,反映現(xiàn)象的發(fā)展變化趨勢時(shí)應(yīng)注意: 時(shí)間一般繪在橫軸,指標(biāo)數(shù)值繪在縱軸; 圖形
10、的長寬比例要適當(dāng); 一般情況下,縱橫軸的起點(diǎn)值視情況而定;指標(biāo)數(shù)值太大時(shí)可以采取“斷條”的方式。,例題分析,已知19912000年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表。試?yán)L制線形圖,時(shí)間序列的線形圖,繪制統(tǒng)計(jì)圖應(yīng)注意的問題,1.應(yīng)根據(jù)具體情況選擇最合適的圖形;2.圖形布局合理,統(tǒng)計(jì)圖的要素齊備,即應(yīng)該有:標(biāo)題、圖例、計(jì)量單位、主要的統(tǒng)計(jì)數(shù)字。,用Excel制作統(tǒng)計(jì)圖的步驟,1.輸入資料; 2.“圖表向?qū)А保?3.填寫對話框; 4.對圖形進(jìn)行一定的修飾。,3.3.4 關(guān)于統(tǒng)計(jì)表,,統(tǒng)計(jì)表的構(gòu)成,統(tǒng)計(jì)表的名稱 統(tǒng)計(jì)表的行標(biāo)題、列標(biāo)題 數(shù)據(jù)資料 表格線 附注,某印染廠職工工資分組統(tǒng)計(jì)(等距式),設(shè)計(jì)統(tǒng)計(jì)表應(yīng)注意的問題,統(tǒng)計(jì)表的要素齊備 指標(biāo)排列有序:邏輯順序、合計(jì)與分項(xiàng); 開口表:左右不封口;或三線表; 計(jì)量單位列在恰當(dāng)?shù)奈恢茫?統(tǒng)計(jì)數(shù)字的數(shù)位保持一致,且數(shù)位對齊; 統(tǒng)計(jì)表的規(guī)模不宜太大,必要時(shí)可以編號。,主要內(nèi)容,1.數(shù)據(jù)的預(yù)處理:審核、篩選、排序 2.分類數(shù)據(jù)和順序數(shù)據(jù)的頻數(shù)分布及顯示 3. 數(shù)值型數(shù)據(jù)的頻數(shù)分布及顯示 4.統(tǒng)計(jì)表和統(tǒng)計(jì)圖的制作 5.用Excel編制頻數(shù)分布 6.用Excel繪制統(tǒng)計(jì)圖和統(tǒng)計(jì)表,結(jié) 束,