欧美极品第一页,一区二区三区四区高清视频,久草成色在线,在线观看网站免费入口在线观看国内

推廣 熱搜: ISO9001  音樂版權  知識產(chǎn)權貫標  科技服務  ISO20000  CMMI  知識產(chǎn)權  質量管理體系  測試標準  電池 

質量數(shù)據(jù)相關性分析的6種方法

   日期:2024-08-19 13:28:11     來源:企業(yè)管理     作者:中企檢測認證網(wǎng)     瀏覽:71    評論:0
核心提示:從事質量行業(yè)的朋友一定經(jīng)常需要對數(shù)據(jù)進行分析,這也是一項最基礎的技能。那么你知道幾種數(shù)據(jù)相關性分析的方法呢?做數(shù)據(jù)分析時,為了提煉

從事質量行業(yè)的朋友一定經(jīng)常需要對數(shù)據(jù)進行分析,這也是一項最基礎的技能。那么你知道幾種數(shù)據(jù)相關性分析的方法呢?

做數(shù)據(jù)分析時,為了提煉觀點,相關性分析是必不可少,而且尤為重要的一個環(huán)節(jié)。但是,對于不同類型的數(shù)據(jù),相關性分析的方法都各不相同。本文,主要按照不同的數(shù)據(jù)類型,來對各種相關性分析方法進行梳理總結。

相關性分析是指對兩個或多個具備相關性的變量元素進行分析,相關性不等于因果性。

一、離散與離散變量之間的相關性

1、卡方檢驗

卡方檢驗是一種用途很廣的計數(shù)資料的假設檢驗方法。它屬于非參數(shù)檢驗的范疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯(lián)性分析。其根本思想就是在于比較理論頻數(shù)和實際頻數(shù)的吻合程度或擬合優(yōu)度問題。

它在分類資料統(tǒng)計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。

(1)假設,多個變量之間不相關

(2)根據(jù)假設計算得出每種情況的理論值,根據(jù)理論值與實際值的差別,計算得到卡方值 及 自由度

df=(C-1)(R-1)

(3)查卡方表,求p值

卡方值越大,P值越小,變量相關的可能性越大,當P<=0.05.否定原假設,認為變量相關。

2、信息增益和信息增益率

在介紹信息增益之前,先來介紹兩個基礎概念,信息熵和條件熵。

信息熵,就是一個隨機變量的不確定性程度。

條件熵,就是在一個條件下,隨機變量的不確定性。

(1)信息增益:熵 - 條件熵

在一個條件下,信息不確定性減少的程度。

Gain(Y,X)=H(Y)-H(Y|X)

信息增益越大,表示引入條件X之后,不純度減少得越多。信息增益越大,則兩個變量之間的相關性越大。

(2)信息增益率

假設,某個變量存在大量的不同值,例如ID,引入ID后,每個子節(jié)點的不純度都為0.則信息增益減少程度達到最大。所以,當不同變量的取值數(shù)量差別很大時,引入取值多的變量,信息增益更大。因此,使用信息增益率,考慮到分支個數(shù)的影響。

Gain_ratio=(H(Y)-H(Y|X))/H(Y|X)

二、連續(xù)與連續(xù)變量之間的相關性

1、協(xié)方差

協(xié)方差,表達了兩個隨機變量的協(xié)同變化關系。如果兩個變量不相關,則協(xié)方差為0.

Cov(X,Y)=E{[X-E(X)],[Y-E(Y)]}

當 cov(X, Y)>0時,表明 X與Y 正相關;

當 cov(X, Y)<0時,表明X與Y負相關;

當 cov(X, Y)=0時,表明X與Y不相關。

協(xié)方差只能對兩組數(shù)據(jù)進行相關性分析,當有兩組以上數(shù)據(jù)時就需要使用協(xié)方差矩陣。

協(xié)方差通過數(shù)字衡量變量間的相關性,正值表示正相關,負值表示負相關。但無法對相關的密切程度進行度量。當我們面對多個變量時,無法通過協(xié)方差來說明那兩組數(shù)據(jù)的相關性最高。要衡量和對比相關性的密切程度,就需要使用下一個方法:相關系數(shù)。

2、線性相關系數(shù)

也叫Pearson相關系數(shù), 主要衡量兩個變量線性相關的程度。

r=cov(X,Y)/(D(X)D(Y))

相關系數(shù)是用協(xié)方差除以兩個隨機變量的標準差。相關系數(shù)的大小在-1和1之間變化。再也不會出現(xiàn)因為計量單位變化,而數(shù)值暴漲的情況了。

線性相關系數(shù)必須建立在因變量與自變量是線性的關系基礎上,否則線性相關系數(shù)是無意義的。

三、連續(xù)與離散變量之間的相關性

1、連續(xù)變量離散化

將連續(xù)變量離散化,然后,使用離散與離散變量相關性分析的方法來分析相關性。

2、箱形圖

使用畫箱形圖的方法,看離散變量取不同值,連續(xù)變量的均值與方差及取值分布情況。

如果,離散變量取不同值,對應的連續(xù)變量的箱形圖差別不大,則說明,離散變量取不同值對連續(xù)變量的影響不大,相關性不高;反之,相關性高。

中企檢測認證網(wǎng)提供iso體系認證機構查詢,檢驗檢測、認證認可、資質資格、計量校準、知識產(chǎn)權貫標一站式行業(yè)企業(yè)服務平臺。中企檢測認證網(wǎng)為檢測行業(yè)相關檢驗、檢測、認證、計量、校準機構,儀器設備、耗材、配件、試劑、標準品供應商,法規(guī)咨詢、標準服務、實驗室軟件提供商提供包括品牌宣傳、產(chǎn)品展示、技術交流、新品推薦等全方位推廣服務。這個問題就給大家解答到這里了,如還需要了解更多專業(yè)性問題可以撥打中企檢測認證網(wǎng)在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產(chǎn)權、版權法律法規(guī)知識資訊,包括商標注冊、食品檢測第三方檢測機構網(wǎng)絡信息技術檢測環(huán)境檢測管理體系認證、服務體系認證產(chǎn)品認證、版權登記、專利申請知識產(chǎn)權、檢測法、認證標準等信息,中企檢測認證網(wǎng)為檢測認證商標專利從業(yè)者提供多種檢測、認證、知識產(chǎn)權、版權、商標、專利的轉讓代理查詢法律法規(guī),咨詢輔導等知識。

本文內容整合網(wǎng)站:百度百科搜狗百科360百科、知乎、市場監(jiān)督總局

免責聲明:本文部分內容根據(jù)網(wǎng)絡信息整理,文章版權歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內容、版權和其它問題,請跟我們聯(lián)系刪除并致歉!

本文來源: http://m.rumin8raps.com/zs/202208/ccaa_40670.html

 
打賞
 
更多>同類企業(yè)管理知識
0相關評論

企業(yè)管理推薦圖文
企業(yè)管理推薦知識
企業(yè)管理點擊排行
ISO體系認證  |  關于我們  |  聯(lián)系方式  |  使用協(xié)議  |  版權隱私  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  蜀ICP備07504973號
 
主站蜘蛛池模板: 商南县| 九江市| 上饶市| 德钦县| 水富县| 白银市| 攀枝花市| 上栗县| 任丘市| 吉安市| 泗洪县| 巴南区| 湖南省| 夏河县| 汉中市| 湖州市| 彰化市| 水城县| 晋中市| 龙山县| 格尔木市| 华蓥市| 宁安市| 东山县| 平原县| 从江县| 苗栗县| 宽城| 邢台县| 呼和浩特市| 民和| 普定县| 广州市| 兴国县| 禹城市| 孟村| 全椒县| 广河县| 临泉县| 五家渠市| 株洲县|