衛(wèi)生統(tǒng)計學(xué)第八版李曉松第一章 數(shù)據(jù)分布的描述

上傳人:燈火****19 文檔編號:64549306 上傳時間:2022-03-21 格式:PPT 頁數(shù):59 大小:17.82MB
收藏 版權(quán)申訴 舉報 下載
衛(wèi)生統(tǒng)計學(xué)第八版李曉松第一章 數(shù)據(jù)分布的描述_第1頁
第1頁 / 共59頁
衛(wèi)生統(tǒng)計學(xué)第八版李曉松第一章 數(shù)據(jù)分布的描述_第2頁
第2頁 / 共59頁
衛(wèi)生統(tǒng)計學(xué)第八版李曉松第一章 數(shù)據(jù)分布的描述_第3頁
第3頁 / 共59頁

下載文檔到電腦,查找使用更方便

12 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《衛(wèi)生統(tǒng)計學(xué)第八版李曉松第一章 數(shù)據(jù)分布的描述》由會員分享,可在線閱讀,更多相關(guān)《衛(wèi)生統(tǒng)計學(xué)第八版李曉松第一章 數(shù)據(jù)分布的描述(59頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、 歐春泉 南方醫(yī)科大學(xué)第一章 數(shù)據(jù)分布的描述目錄第一節(jié):數(shù)據(jù)分布表與直方圖第二節(jié):集中位置第三節(jié):變異程度第四節(jié):箱式圖第五節(jié):數(shù)據(jù)核查與離群值01020304050506第六節(jié):分類變量的常用統(tǒng)計圖重點(diǎn)難點(diǎn) 頻數(shù)分布表與直方圖的編制原則和方法 集中位置和變異程度的常用指標(biāo)及其適用條件 基本箱式圖和箱式百分位數(shù)圖的繪制和作用 常用的邏輯核查方法 離群值的探索和處理方法 各種圖形的適用條件第一節(jié) 數(shù)據(jù)分布表與直方圖 采用SF-36自測健康量表測得118名慢性鼻竇炎患者的生命質(zhì)量評估總分如下:(一)頻數(shù)分布表第一節(jié) 數(shù)據(jù)分布表與直方圖72308057727272306525105275825260

2、6572356245353066816555656780626245524745575267525740665562454552725757574555507755724550357260475752604045456760404535507225604062405555926561353515658792408565577272724030524553505257454530256540254565451. 頻數(shù)表的編制方法(1)找出最小值和最大值,本例為10與92。(2)計算全距 (range,R) :最大值與最小值之差,本例 R=9210=82。(3)確定組距:相鄰兩組之間的距離,組距=

3、全距/組段數(shù),通常組段數(shù)取812組。本例共設(shè)9個組段,組距取10。(4)確定組段的上、下限:每個組段的起點(diǎn)為下限(lower limit),終點(diǎn)為上限(upper limit)。每個組段均包含組段的下限值,最后一組的組段寫出上限值。(5)列表整理:計算頻數(shù)、頻率、累計頻數(shù)及累計頻率。(一)頻數(shù)分布表第一節(jié) 數(shù)據(jù)分布表與直方圖 廣州市118名慢性鼻竇炎患者生命質(zhì)量評估總分的頻數(shù)分布表(一)頻數(shù)分布表第一節(jié) 數(shù)據(jù)分布表與直方圖組段(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)10 2 1.69 2 1.6920 4 3.39 6 5.083011 9.33 17 14.4140

4、2521.19 42 35.59502924.58 71 60.17602521.19 96 81.36701411.86110 93.2280 6 5.08116 98.3190100 2 1.69118100.00合計118100.00(二)直方圖第一節(jié) 數(shù)據(jù)分布表與直方圖 慢性鼻竇炎患者生命質(zhì)量評估總分的直方圖慢性鼻竇炎患者生命質(zhì)量評估總分的直方圖(非等距分組造成錯覺)1. 分布形態(tài)分類(1)對稱分布:集中位置在正中,左右兩側(cè)頻數(shù)分布對稱。(2)偏態(tài)分布:集中位置偏向一側(cè),左右兩側(cè)頻數(shù)分布不對稱。正偏態(tài)(positive skewness):有小部分?jǐn)?shù)據(jù)偏大、直方圖呈現(xiàn)右側(cè)拖尾,又稱右偏

5、態(tài)(right skewness);負(fù)偏態(tài)(negative skewness):有小部分?jǐn)?shù)據(jù)偏小、直方圖呈現(xiàn)左側(cè)拖尾,又稱左偏態(tài)(left skewness)。(三)數(shù)據(jù)分布特征第一節(jié) 數(shù)據(jù)分布表與直方圖(三)數(shù)據(jù)分布特征第一節(jié) 數(shù)據(jù)分布表與直方圖分布形態(tài)圖示:成都市238名正常居民發(fā)汞值分布直方圖(三)數(shù)據(jù)分布特征第一節(jié) 數(shù)據(jù)分布表與直方圖分布形態(tài)圖示:冠心病患者的年齡分布直方圖(三)數(shù)據(jù)分布特征第一節(jié) 數(shù)據(jù)分布表與直方圖2. 集中趨勢和離散趨勢的描述(1)集中趨勢(central tendency):指一組數(shù)據(jù)向某一中心值靠攏的趨勢,反映了一組數(shù)據(jù)中心點(diǎn)的位置,是頻數(shù)分布表和直方圖中高峰

6、所在位置,即頻數(shù)最大的組段。(2)離散趨勢(dispersion tendency):部分?jǐn)?shù)據(jù)偏離中心位置的變異特征。第二節(jié) 集中位置第二節(jié) 集中位置1. 集中位置(center) 反映一組觀察值的平均水平或中心位置。描述集中位置的常見指標(biāo)有以下三種:(1)算術(shù)均數(shù)(arithmetic mean)(2)幾何均數(shù)(geometric mean,G)(3)中位數(shù)(median,M)(一)算術(shù)均數(shù)第二節(jié) 集中位置(一)算術(shù)均數(shù)第二節(jié) 集中位置 基于頻數(shù)分布表數(shù)據(jù)計算慢性鼻竇炎患者生命質(zhì)量評估總分的均數(shù)組段(1)頻數(shù)( fi )(2)組中值(xMi)(3)fixMi(4)=(2)(3)10 215

7、3020 425 100301135 385402545112550295515956025651625701475105080 685 51090100 295 190合計11866102 15425 11 351475=56.6 8529011852x ()(二)幾何均數(shù)第二節(jié) 集中位置1. 計算方法(1)原始資料(直接法):(2)頻數(shù)表資料(加權(quán)法):2. 應(yīng)用 幾何均數(shù)常用于數(shù)據(jù)呈倍數(shù)變化或?qū)?shù)正態(tài)分布資料的平均水平,計算幾何均數(shù)時,觀察值中不能有零且不能同時有正數(shù)和負(fù)數(shù)。11121ln=ln (ln)=. .ln.ninxxx xGnx11lnlnlnlniMiiMiiffGxfnx

8、(二)幾何均數(shù)第二節(jié) 集中位置 廣州市6名3歲以上兒童接種麻疹疫苗后,麻疹I(lǐng)gG抗體滴度水平如下:1:200,1:800,1:800,1:800,1:3200,1:12800。計算6名兒童麻疹I(lǐng)gG抗體滴度的幾何均數(shù)。 求G的倒數(shù),得到6名兒童接種麻疹疫苗后麻疹I(lǐng)gG抗體滴度的幾何均數(shù)為1:1270。(二)幾何均數(shù)第二節(jié) 集中位置 下表是262名患兒體內(nèi)肺炎支原體抗體滴度水平,計算其平均抗體滴度。 262名患兒體內(nèi)肺炎支原體抗體滴度水平抗體滴度(1)頻數(shù)(2)抗體滴度倒數(shù)(3)抗體滴度倒數(shù)的對數(shù)(4)抗體滴度倒數(shù)的對數(shù)和(5)=(2)(4)1:8097 804.38 424.86 1:1605

9、6 1605.08 284.48 1:32042 3205.77 242.34 1:64021 6406.46 135.66 1:12804612807.15 328.90 合計2621416.2411ln1416.24ln=ln=223262iMixfGn即262名患兒體內(nèi)肺炎支原體抗體平均滴度水平為1:223。(三)中位數(shù)第二節(jié) 集中位置(三)中位數(shù)第二節(jié) 集中位置下表是成都市238名正常居民發(fā)汞含量測量結(jié)果,求發(fā)汞含量的中位數(shù)。組段(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)0.319 7.98 19 7.980.76226.05 8134.031.16326.47

10、14460.501.55121.4319581.931.922 9.2421791.182.313 5.4623096.642.7 4 1.6923498.323.1 1 0.4223598.743.5 2 0.8423799.58 3.94.3 1 0.42238100.00合計238100.00238 從第(5)列可知,累計有34.03%的觀測值小于1.1,有60.50%的觀測值小于1.5,故可判斷P50在1.11.5這個組段,代入公式得:500.41.1238 50%=1.346381P 238名居民發(fā)汞含量(g/g)的頻數(shù)分布表(三)中位數(shù)第二節(jié) 集中位置2. 中位數(shù)的應(yīng)用(1)對任何

11、資料(對稱分布、偏態(tài)分布、分布未知或分布末端有極端值、不確定值) 都適用。日常應(yīng)用中,對稱分布資料更常用均數(shù)。(2)與均數(shù)相比,中位數(shù)存在一些不足:中位數(shù)未考慮大部分觀測值的實(shí)際大小,而均數(shù)充分利用了全部數(shù)據(jù)的信息;兩組數(shù)據(jù)合并時,合并后的中位數(shù)不能用原來兩組的中位數(shù)表達(dá),而均數(shù)可基于兩組的均數(shù)和例數(shù)用求得; 均數(shù)可通過如估計截尾均數(shù)等方法進(jìn)行修正,而中位數(shù)無法進(jìn)行此修正。第二節(jié) 集中位置不同分布中三種指標(biāo)的大小比較第三節(jié) 變異程度第三節(jié) 變異程度三組兒童身高特征的比較示意圖僅描述數(shù)據(jù)的集中位置還不足以反映數(shù)據(jù)完整的分布特征第三節(jié) 變異程度1. 變異(variation) 一組數(shù)據(jù)中個體值之間

12、的差異。描述變異程度的常見指標(biāo)有:(1)極差(2)四分位數(shù)間距(inter-quartile range,IQR)(3)方差(variance)(4)標(biāo)準(zhǔn)差(standard deviation,SD)(5)變異系數(shù)(coefficient of variation,CV)(一)極差第三節(jié) 變異程度1. 極差(range,R)也稱全距,為所有觀測值中最大值與最小值之差。極差越大說明數(shù)據(jù)變異程度越大。可用來反映傳染病、食物中毒的最短和最長潛伏期等。2. 極差的不足之處(1)僅用到最大值和最小值的信息,不能反映組內(nèi)其他數(shù)據(jù)的變異情況。(2)極差與樣本例數(shù)有關(guān)。一般地,樣本量越大,得到較大或較小變量

13、值的可能性越大,極差就可能越大,故樣本量相差較大時,不宜采用極差進(jìn)行比較。(二)四分位數(shù)間距第三節(jié) 變異程度四分位數(shù)間距四分位數(shù)間距(inter-quartile range,IQR)IQR可看做中間一半觀測值的極差R,適于偏態(tài)分布或分布未知資料,由于不受兩端極大或極小數(shù)據(jù)的影響,四分位數(shù)間距比極差更為穩(wěn)定,但仍未考慮每個觀測值的變異。常與中位數(shù)一起使用,綜合反映數(shù)據(jù)的平均水平和變異程度,寫成M(P25, P75)。適于P0 P25 P50 P75 P100Min 下四分位數(shù)(QL) 中位數(shù) 上四分位數(shù)(QU) MaxIQR=P75P25(三)方差與標(biāo)準(zhǔn)差第三節(jié) 變異程度方差(variance

14、)是指所有觀測值的離均差平方和的平均值,描述所有觀測值與均數(shù)的平均偏離程度;標(biāo)準(zhǔn)差(standard deviation,SD)是方差的平方根。方 差: 標(biāo)準(zhǔn)差:22() / (1)isxxn22() / (1)isxxns(三)方差與標(biāo)準(zhǔn)差第三節(jié) 變異程度(四)變異系數(shù)第三節(jié) 變異程度100%sCVx(四)變異系數(shù)第三節(jié) 變異程度第三節(jié) 變異程度特征指 標(biāo)應(yīng) 用集中位置均數(shù)對稱分布幾何均數(shù)對數(shù)正態(tài)、等比資料中位數(shù)偏態(tài)分布、分布不明、末端有不確定值變異程度極差偏態(tài)分布四分位間距偏態(tài)分布、分布不明、末端有不確定值方差/標(biāo)準(zhǔn)差對稱分布變異系數(shù)單位不同、均數(shù)相差懸殊、評價測量精度集中位置和變異程度指

15、標(biāo)小結(jié):第四節(jié) 箱式圖(一)箱式圖第四節(jié) 箱式圖15例大骨節(jié)病患者白細(xì)胞數(shù)箱式圖1. 表示中位數(shù)的橫線在箱體中間位置則表明數(shù)據(jù)呈對稱分布。2. 中間橫線靠下端則提示右偏態(tài)分布。3. 中間橫線靠上端則提示左偏態(tài)分布。(一)箱式圖第四節(jié) 箱式圖 廣州市一項(xiàng)關(guān)于慢性鼻竇炎患病率的橫斷面調(diào)查中,用SF-36量表測得所有調(diào)查對象的生活質(zhì)量,所調(diào)查的1411名成年居民中有118名患有慢性鼻竇炎。以慢性鼻竇炎患者和正常人的精力評分為例,繪制箱式圖。正常人與慢性鼻竇炎患者精力評分箱式圖“”表示均數(shù)“”表示離群值(二)箱式百分位數(shù)圖第四節(jié) 箱式圖1. 箱式百分位數(shù)圖(box-percentile plot)結(jié)合

16、了箱式圖和直方圖的功能,不僅給出了幾個關(guān)鍵的百分位數(shù),還描述了整個數(shù)據(jù)的分布形態(tài)。箱體中間部分最寬,越往兩端越窄。2. 制作方法 首先將n個觀測值從小到大排列,假設(shè)箱體最中間(中位數(shù)位置) 寬度為w,則將數(shù)據(jù)從小到大排列后第k個觀測值xk所在位置的箱體寬度為:()1kwkxMn時(1)()1kwnkxMn 時(二)箱式百分位數(shù)圖第四節(jié) 箱式圖 以下為慢性鼻竇炎患者健康評估總分同時繪制了箱式圖與箱式百分位數(shù)圖,箱式百分位數(shù)圖呈梭型左右對稱。若關(guān)于中位數(shù)上下對稱則提示資料呈對稱分布。 慢性鼻竇炎患者健康評估總分的箱式圖(A)和箱式百分位數(shù)圖(B)(二)箱式百分位數(shù)圖第四節(jié) 箱式圖慢性鼻竇炎患者精力

17、評分的箱式圖(A)和箱式百分位數(shù)圖(B)慢性鼻竇炎患者精力評分呈左偏態(tài)分布。箱式圖顯示該組數(shù)據(jù)有兩個數(shù)值特別小的離群點(diǎn)。箱式百分位數(shù)圖從箱體往下延伸出一條又長又細(xì)的線離群點(diǎn)。第五節(jié) 數(shù)據(jù)核查與離群值(一)邏輯核查第五節(jié) 數(shù)據(jù)核查與離群值1. 邏輯核查的幾種常用策略(1)檢查變量類型和性質(zhì):變量可分為數(shù)值型變量與字符型變量。數(shù)值型變量只能包括數(shù)字、小數(shù)點(diǎn)和負(fù)號,個別情況也包括作為千位分隔符的逗號,不能含有字母或文字。(2)核查變量值范圍:檢查每個變量的取值范圍。例如:一個人的體重不能為負(fù)數(shù);出生月份應(yīng) 在112之間;某成年男性的身高值低于140cm或者高于210cm也值得懷疑。(3)有效值檢查:

18、 檢查觀測值是否為事先定義的數(shù)值之一。例如:錄入性別時,事先規(guī)定用1表示男性,2表示女性,如果數(shù)據(jù)中出現(xiàn)其他觀測值則說明有誤。(一)邏輯核查第五節(jié) 數(shù)據(jù)核查與離群值1. 邏輯核查的幾種常用策略(4)一致性檢查:檢查有無前后矛盾,相關(guān)問題的邏輯是否一致。出院日期早于入院日期、收縮壓小于舒張壓等都不符合邏輯。(5)唯一性檢查:每個觀察單位通常都設(shè)有一個唯一的標(biāo)識號,如調(diào)查對象編號、住院號、門診號等。根據(jù)標(biāo)識號檢查是否存在同一個觀察單位的數(shù)據(jù)兩次重復(fù)錄入。(6)完整性檢查:檢查每一個觀察單位的完整性和整個數(shù)據(jù)庫的完整性。(7)交叉檢查:不同來源的兩個數(shù)據(jù)庫中同一內(nèi)容的信息應(yīng)該一致。(二)離群值的初步

19、探索第五節(jié) 數(shù)據(jù)核查與離群值(二)離群值的初步探索第五節(jié) 數(shù)據(jù)核查與離群值2. 核查離群值的統(tǒng)計手段(4)通過統(tǒng)計檢驗(yàn)判斷:檢驗(yàn)偏離程度是否超出隨機(jī)誤差所能解釋的上限。已知標(biāo)準(zhǔn)差時可用Nair檢驗(yàn)法,未知標(biāo)準(zhǔn)差時可用Grubbs檢驗(yàn)法、Dixon檢驗(yàn)法和峰度-偏度檢驗(yàn)法。(5)結(jié)合其他變量信息判斷:根據(jù)兒童的身高,可初步判斷其體重是否過高或者過低。根據(jù)身高所建立的體重核查規(guī)則比單純只考慮體重的核查更為有效。(三)離群值的處理第五節(jié) 數(shù)據(jù)核查與離群值1. 測量或者記錄過程中出現(xiàn)錯誤而導(dǎo)致離群值,或者存在明顯的邏輯錯誤,應(yīng)予以剔除。例如:細(xì)胞培養(yǎng)時出現(xiàn)了污染或者操作失誤,這時的離群值應(yīng)剔除。2.

20、無明確理由剔除離群值(1)對離群值刪除前后各做一次統(tǒng)計分析,若前后分析結(jié)果矛盾則下結(jié)論需謹(jǐn)慎。(2)采取一些穩(wěn)健分析(robust analysis)的方法:中位數(shù);對數(shù)變換:觀測值大于0,夸大極小值的影響;截尾均數(shù):是將數(shù)據(jù)按從小到大順序排列后,兩端截掉一定比例的數(shù)據(jù)后計算余下數(shù)據(jù)的均數(shù)。第六節(jié) 分類變量的常用統(tǒng)計圖(一)餅圖第六節(jié) 分類變量的常用統(tǒng)計圖餅圖(pie chart)又稱圓圖,是將圓形分割成若干個扇形,扇形面積的大小表示同一個事物內(nèi)部中各部分的構(gòu)成比。因此,餅圖主要用來描述分類變量的構(gòu)成比,用于說明事物內(nèi)部各組成部分所占比重。繪制餅圖時應(yīng)注意:各扇形通常從時鐘12時處開始,按大小

21、或自然順序順時針方向排列;簡要注明各扇形所代表的類別和百分比。(一)餅圖第六節(jié) 分類變量的常用統(tǒng)計圖 有研究表明大骨節(jié)病的發(fā)生可能與糧食作物真菌污染有關(guān),為了解西藏糧食作物中的帶菌情況,從尼木縣隨機(jī)抽取600粒青稞籽粒,培養(yǎng)分離出真菌3894株,各種菌屬的分布見下表。 西藏尼木縣青稞籽粒真菌菌屬構(gòu)成真菌菌屬例數(shù) 構(gòu)成(%)支孢霉菌屬2068 53.11鏈格孢菌屬 705 18.10莖點(diǎn)霉菌屬 391 10.04其他菌屬 730 18.75合計3894100.00西藏尼木縣青稞籽粒真菌菌屬構(gòu)成餅圖(二)條圖和百分位圖第六節(jié) 分類變量的常用統(tǒng)計圖條圖(bar chart)可用直條的高度反映分類數(shù)據(jù)

22、中每一類的頻數(shù)或者頻率。條圖又分為單式條圖和復(fù)式條圖。 從我國公共衛(wèi)生數(shù)據(jù)共享中心獲得我國大陸2010年和2013年四種主要蟲媒傳染病的發(fā)病率數(shù)據(jù),見下表。試?yán)L制發(fā)病率的條圖。我國大陸2010年和2013年四種蟲媒傳染病發(fā)病率(/千萬人)傳染病2010年2013年出血熱71.3794.61登革熱 1.6734.44瘧疾55.3628.77流行性乙型腦炎19.0416.09(二)條圖和百分位圖第六節(jié) 分類變量的常用統(tǒng)計圖2013年我國大陸四種蟲媒傳染病發(fā)病率(/千萬人)2010年和2013年我國大陸四種蟲媒傳染病發(fā)病率(/千萬人)(二)條圖和百分位圖第六節(jié) 分類變量的常用統(tǒng)計圖百分條圖(perc

23、ent bar graph)的功能與餅圖相同,可以將多組數(shù)據(jù)放在一起比較其構(gòu)成比。對于等級數(shù)據(jù)需按照等級順序排列,如果沒有明顯的邏輯關(guān)系,也可按照百分比由大到小排列。(二)條圖和百分位圖第六節(jié) 分類變量的常用統(tǒng)計圖2001年西藏桑日縣和林周縣412歲兒童大骨節(jié)病監(jiān)測結(jié)果監(jiān)測縣陰性例數(shù)(%)大骨節(jié)病例數(shù)(%)度度度桑日縣274 (65.08)96 (22.80)35 (08.32)16 (3.80)林周縣255 (74.78)35 (10.26)36 (10.56)15 (4.40)西藏林周縣和桑日縣412歲兒童大骨節(jié)病監(jiān)測結(jié)果百分條圖(三)熱圖第六節(jié) 分類變量的常用統(tǒng)計圖熱圖(heat map

24、):用不同的顏色(或者深淺)表示觀測值的大小,常用來表示疾病的時間與空間分布,生物信息學(xué)中也常用熱圖描述基因表達(dá)譜。 從公共衛(wèi)生科學(xué)數(shù)據(jù)中心獲得2013年我國大陸31個省/自治區(qū)/直轄市手足口病發(fā)病率數(shù)據(jù),試?yán)L制熱圖反映手足口病時空分布特點(diǎn)。2013年我國大陸31個省/自治區(qū)/直轄市手足口病發(fā)病率的空間分布(三)熱圖第六節(jié) 分類變量的常用統(tǒng)計圖 從公共衛(wèi)生科學(xué)數(shù)據(jù)中心獲得 2013年我國大陸31個省/自治區(qū)/直轄市手足口病發(fā)病率數(shù)據(jù),試?yán)L制熱圖反映手足口病時空分布特點(diǎn)。2013年我國大陸31個省/自治區(qū)/直轄市手足口病疫情的時間分布本章小結(jié)1. 對于定量數(shù)據(jù),可編制頻數(shù)分布表并繪制直方圖,初步

25、了解變量的分布特征(集中趨勢、離散趨勢、是否對稱分布等)。2. 反映定量數(shù)據(jù)集中位置的主要指標(biāo)包括均數(shù)、幾何均數(shù)、中位數(shù)等。(1)均數(shù)主要用于描述不含離群值的對稱分布數(shù)據(jù)的平均水平。(2)中位數(shù)用于描述對稱分布和偏態(tài)分布數(shù)據(jù)的平均水平,尤其是當(dāng)數(shù)據(jù)中有離群值、含不確定值的數(shù)據(jù)、數(shù)據(jù)呈偏態(tài)分布或分布類型未知。(3)幾何均數(shù)用于描述存在少數(shù)偏大的極端值的正偏態(tài)分布或近似倍數(shù)關(guān)系數(shù)據(jù)。本章小結(jié)3. 描述定量數(shù)據(jù)變異程度的指標(biāo)主要包括全距、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)等。(1)全距只能粗略表示數(shù)據(jù)的變異程度。(2)標(biāo)準(zhǔn)差常與均數(shù)結(jié)合起來使用。(3)四分位數(shù)間距常與中位數(shù)結(jié)合使用。(4)變異系數(shù)主要用于度量衡單位不同的兩個變量變異程度的比較,或者度量衡單位相同但均數(shù)相差懸殊的幾組數(shù)據(jù)變異程度的比較。本章小結(jié)4. 基本箱式圖主要報告中位數(shù)、上四分位數(shù)、下四分位數(shù)、最大值、最小值等五個重要統(tǒng)計量,同時也可對離群值予以標(biāo)注。箱式百分位數(shù)圖同時描述了整個數(shù)據(jù)的分布概貌。5. 數(shù)據(jù)分析之前應(yīng)常規(guī)地進(jìn)行邏輯核查,盡可能減少數(shù)據(jù)錯誤。6. 對離群值的處理應(yīng)慎重。7. 描述分類數(shù)據(jù)的常用統(tǒng)計圖有餅圖、百分條圖和熱圖等。

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!