《數(shù)據(jù)的整理與顯示》PPT課件.ppt
《《數(shù)據(jù)的整理與顯示》PPT課件.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《《數(shù)據(jù)的整理與顯示》PPT課件.ppt(60頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
第3章數(shù)據(jù)的整理與顯示,3.1數(shù)據(jù)的預(yù)處理3.2品質(zhì)數(shù)據(jù)的整理與顯示3.3數(shù)值型數(shù)據(jù)的整理與顯示3.4統(tǒng)計(jì)表,3.1數(shù)據(jù)的預(yù)處理,一.數(shù)據(jù)審核二.數(shù)據(jù)篩選三.數(shù)據(jù)排序,數(shù)據(jù)的預(yù)處理,數(shù)據(jù)的審核檢查數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征,數(shù)據(jù)的審核—原始數(shù)據(jù)(rawdata),完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全準(zhǔn)確性審核檢查數(shù)據(jù)是否真實(shí)反映客觀實(shí)際情況,內(nèi)容是否符合實(shí)際檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等,數(shù)據(jù)的審核—二手?jǐn)?shù)據(jù)(secondhanddata),適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料;確定數(shù)據(jù)是否符合自己分析研究的需要;時(shí)效性審核盡可能使用最新的數(shù)據(jù);確認(rèn)是否必要做進(jìn)一步的加工處理,數(shù)據(jù)篩選(datafilter),當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時(shí),需要對數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選的內(nèi)容包括將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來通常借助統(tǒng)計(jì)軟件實(shí)現(xiàn)Excel、SPSS,數(shù)據(jù)排序(datarank),按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計(jì)算機(jī)完成,數(shù)據(jù)排序(方法),分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序數(shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,…,xn,遞增排序后可表示為:x(1)x(2)>…>x(n),3.2品質(zhì)數(shù)據(jù)的整理與顯示,一.分類數(shù)據(jù)的整理與顯示二.順序數(shù)據(jù)的整理與顯示,數(shù)據(jù)的整理與顯示(基本問題),要弄清所面對的數(shù)據(jù)類型,因?yàn)椴煌愋偷臄?shù)據(jù),所采取的處理方式和方法是不同的對分類數(shù)據(jù)和順序數(shù)據(jù)主要是做分類整理對數(shù)值型數(shù)據(jù)則主要是做分組整理要注意的是:適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù),分類數(shù)據(jù)的整理(基本過程),1、列出各類別2、計(jì)算各類別的頻數(shù)3、制作頻數(shù)分布表4、用圖形展示數(shù)據(jù),分類數(shù)據(jù)的整理,頻數(shù)(frequency):落在各類別中的數(shù)據(jù)個(gè)數(shù)頻率或比例(proportion):某一類數(shù)據(jù)占全部數(shù)據(jù)的比值(或百分比)比率(ratio):不同類別數(shù)值之間的比值,頻數(shù)分布表(例題分析),,,,,,,【例】一家市場調(diào)查公司為研究不同品牌飲料的市場占有率,對隨機(jī)抽取的一家超市進(jìn)行了調(diào)查。調(diào)查員在某天對50名顧客購買飲料的品牌進(jìn)行了記錄,如果一個(gè)顧客購買某一品牌的飲料,就將這一飲料的品牌名字記錄一次。下表就是記錄的原始數(shù)據(jù):,用Excel制作頻數(shù)分布表,分類數(shù)據(jù)的圖示—條形圖(BarChart),用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖,分類數(shù)據(jù)的圖示—條形圖(例題分析),分類數(shù)據(jù)的圖示—帕累托圖(ParetoChart),又叫排列圖一種用來分析分類數(shù)據(jù)問題的圖形工具;按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序的條形圖;具有雙縱坐標(biāo),一側(cè)是頻數(shù),另一側(cè)是累積頻率;條形圖上方有一條平滑曲線與累積頻率相對應(yīng);是一般條形圖與曲線圖的疊加。,雙直角坐標(biāo)系表示的paretochart有什么功用呢?,帕累托圖,分類數(shù)據(jù)的圖示—餅圖(PieChart),也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形主要用于表示總體或樣本中各組成部分所占的比例,對于研究結(jié)構(gòu)性問題十分有用繪制圓形圖時(shí),總體中各部分所占的百分比用園內(nèi)的各個(gè)扇形角度表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占360的相應(yīng)比例確定的,分類數(shù)據(jù)的圖示—環(huán)形圖(doughnutchart),環(huán)形圖中間有一個(gè)“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個(gè)總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)總體的數(shù)據(jù)系列,每一個(gè)總體的數(shù)據(jù)系列為一個(gè)環(huán)環(huán)形圖可用于結(jié)構(gòu)比較研究,有強(qiáng)烈的對比效果,環(huán)形圖(例題分析),順序數(shù)據(jù)的整理與展示,分類數(shù)據(jù)的整理與圖示方法同樣適用于順序數(shù)據(jù),而且順序數(shù)據(jù)還可以計(jì)算累積頻數(shù)和累積頻率累積頻數(shù)(cumulativefrequencies):各類別頻數(shù)的逐級(jí)累加累積頻率(cumulativepercentages):各類別頻率(百分比)的逐級(jí)累加累積的方法有兩種,可以方便地看出某一類別以下(或以上)的頻數(shù)(或頻率)之和向上累積,即從類別順序開始的一方向后面累加向下累積,即從類別順序的最后向前面累加,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),【例】在一項(xiàng)城市住房問題的研究中,研究人員在甲、乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問題是:“您對您家庭目前的住房狀況是否滿意?1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。,順序數(shù)據(jù)的頻數(shù)分布表(例題分析),順序數(shù)據(jù)的圖示—累積頻數(shù)分布圖(例題分析),甲城市家庭對住房狀況評價(jià)的累積頻數(shù)分布,3.3數(shù)值型數(shù)據(jù)的整理與顯示,一.數(shù)據(jù)分組二.數(shù)值型數(shù)據(jù)的圖示,組距分組(要點(diǎn)),將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組,組距分組(步驟),確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),組數(shù)K一般在5~15之間,確定組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即組距=(最大值-最小值)組數(shù),統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表,組距分組(幾個(gè)概念),下限(lowlimit):一個(gè)組的最小值上限(upperlimit):一個(gè)組的最大值組距(classwidth):上限與下限之差組中值(classmidpoint):下限與上限之間的中點(diǎn)值,等距分組表(上下組限重疊),等距分組表(上下組限間斷),等距分組表(使用開口組),等距分組與不等距分組(在表現(xiàn)頻數(shù)分布上的差異),等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實(shí)際狀況,數(shù)值型數(shù)據(jù)的圖示,分組數(shù)據(jù)未分組數(shù)據(jù)時(shí)間序列數(shù)據(jù)多變量數(shù)據(jù),分組數(shù)據(jù)—直方圖(histogram),用矩形的寬度和高度來表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖,分組數(shù)據(jù)的圖示(直方圖的繪制),某電腦公司銷售量分布的直方圖,,分組數(shù)據(jù)—直方圖(直方圖與條形圖的區(qū)別),條形圖是用條形的長度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù),未分組數(shù)據(jù)—莖葉圖(stem-and-leafdisplay),用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字5.莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息,未分組數(shù)據(jù)—莖葉圖(例題分析),未分組數(shù)據(jù)—箱線圖(boxplot),用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線段組成其繪制方法是:首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)然后,連接兩個(gè)四分位數(shù)畫出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接,未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成),未分組數(shù)據(jù)—單批數(shù)據(jù)箱線圖(例題分析),分布的形狀與箱線圖,,不同分布的箱線圖,頻數(shù)分布的類型,幾種常見的頻數(shù)分布,,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖(例題分析),【例】從某大學(xué)經(jīng)濟(jì)管理專業(yè)二年級(jí)學(xué)生中隨機(jī)抽取11人,對8門主要課程的考試成績進(jìn)行調(diào)查,所得結(jié)果如表。試?yán)L制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖(例題分析),8門課程考試成績的箱線圖,11名學(xué)生8門課程考試成績的箱線圖,,,,,Min-Max,,25%-75%,,Medianvalue,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,45,55,65,75,85,95,105,,,,,,,,,,,,,,,學(xué)生1,學(xué)生2,學(xué)生3,學(xué)生4,學(xué)生5,學(xué)生6,學(xué)生7,學(xué)生8,學(xué)生9,學(xué)生10,學(xué)生11,未分組數(shù)據(jù)—多批數(shù)據(jù)箱線圖(例題分析),時(shí)間序列數(shù)據(jù)—線圖(lineplot),?繪制線圖時(shí)應(yīng)注意以下幾點(diǎn)時(shí)間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸圖形的長寬比例要適當(dāng),其長寬比例大致為10:7一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時(shí),可以采取折斷的符號(hào)將縱軸折斷,時(shí)間序列數(shù)據(jù)—線圖(例題分析),【例】已知1991~2003年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表,試?yán)L制線圖。,時(shí)間序列數(shù)據(jù)—線圖(例題分析),多變量數(shù)據(jù)—散點(diǎn)圖,用于展示兩個(gè)變量之間的相關(guān)關(guān)系;由n組數(shù)據(jù)在坐標(biāo)系中形成n個(gè)散點(diǎn);【例】小麥的單位面積產(chǎn)量與降雨量和溫度有一定關(guān)系。為了解其關(guān)系形態(tài),收集如下數(shù)據(jù)。試?yán)L制小麥產(chǎn)量與降雨量的散點(diǎn)圖。,散點(diǎn)圖,(scatterplot),多變量數(shù)據(jù)—?dú)馀輬D,用于展示三個(gè)變量之間的關(guān)系;繪制時(shí)一個(gè)變量在橫軸,一個(gè)變量在縱軸,第三個(gè)變量用氣泡的大小來表示;,(bubblechart),顯示多個(gè)變量的圖示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時(shí)十分有用假定各變量的取值具有相同的正負(fù)號(hào),總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個(gè)樣本之間的相似程度,多變量數(shù)據(jù)—雷達(dá)圖(radarchart),?設(shè)有n個(gè)樣本S1,S2,…Sn,每個(gè)樣本測得P個(gè)變量X1,X2,Xp,要繪制這P個(gè)變量的雷達(dá)圖,其具體做法是:,多變量數(shù)據(jù)—雷達(dá)圖(雷達(dá)圖的制作),先做一個(gè)圓,然后將圓P等分,得到P個(gè)點(diǎn),令這P個(gè)點(diǎn)分別對應(yīng)P個(gè)變量,在將這P個(gè)點(diǎn)與圓心連線,得到P個(gè)幅射狀的半徑,這P個(gè)半徑分別作為P個(gè)變量的坐標(biāo)軸,每個(gè)變量值的大小由半徑上的點(diǎn)到圓心的距離表示再將同一樣本的值在P個(gè)坐標(biāo)上的點(diǎn)連線。這樣,n個(gè)樣本形成的n個(gè)多邊形就是一個(gè)雷達(dá)圖,,,,,,,,多變量數(shù)據(jù)—雷達(dá)圖(例題分析),【例】2000年我國城鄉(xiāng)居民家庭平均每人各項(xiàng)生活消費(fèi)支出構(gòu)成數(shù)據(jù)如表。試?yán)L制雷達(dá)圖。,多變量數(shù)據(jù)—雷達(dá)圖(例題分析),3.4統(tǒng)計(jì)表,一.統(tǒng)計(jì)表的構(gòu)成二.統(tǒng)計(jì)表的設(shè)計(jì),統(tǒng)計(jì)表的結(jié)構(gòu),行標(biāo)題,列標(biāo)題,數(shù)字資料,,,,,表頭,附加,,合理安排統(tǒng)計(jì)表的結(jié)構(gòu)總標(biāo)題內(nèi)容應(yīng)滿足3W要求數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計(jì)表的左右兩邊不封口表中的數(shù)據(jù)一般是右對齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一對于沒有數(shù)字的表格單元,一般用“—”表示必要時(shí)可在表的下方加上注釋,統(tǒng)計(jì)表的設(shè)計(jì),本章小結(jié),數(shù)據(jù)預(yù)處理的內(nèi)容和目的分類和順序數(shù)據(jù)的整理與顯示方法數(shù)值型數(shù)據(jù)的整理與顯示方法合理使用統(tǒng)計(jì)表用統(tǒng)計(jì)軟件作頻數(shù)分布表和圖形,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)據(jù)的整理與顯示 數(shù)據(jù) 整理 顯示 PPT 課件
鏈接地址:http://www.820124.com/p-13095723.html