發(fā)布日期:2022-05-06 10:04閱讀:次
主成分分析法
主成分分析法即PCA(Principal Component Analysis),由名字就可以看出來,這是一個挑重點分析的方法。主成分分析,是將多個變量通過線性變換以選出較少個數(shù)重要變量的一種多元統(tǒng)計分析方法,又稱主分量分
在實際生活中,為了全面分析問題,往往提出很多與此有關(guān)的變量(或因素),因為每個變量都在不同程度上反映所關(guān)心問題的某些信息。
為了加深了解,下面舉個例子
假如你是一家公司的HR,你需要從很多申請者中挑選出最佳的候選人。不妨假設(shè)1000個人中,挑選出一個人。這個是一項十分具有挑戰(zhàn)性的工作,雖然你可能已經(jīng)把范圍縮小到十個人,但是這十個人各有千秋,難分伯仲,你很難決定。這時候你想起了數(shù)學(xué),既然我選不出來,就讓數(shù)學(xué)去選吧。于是,你拿起筆開始給每一個人打分,分了七八個指標(biāo),比如學(xué)歷,實習(xí)經(jīng)歷,領(lǐng)導(dǎo)力,溝通能力等等。
但是你卡在了最后一步,每個人都有七八個分?jǐn)?shù),把這七八個分整合成一個分?jǐn)?shù)難住了你。你本來想的是給每一個指標(biāo)一個權(quán)重,加起來求和就可以了,但是你又想到如果主觀地給權(quán)重,我還要用數(shù)學(xué)搞這一套干嘛。怎么才能客觀地給一個權(quán)重呢?這時候主成分分析就出場了。因為這十個人實力十分接近,所以給的權(quán)重要盡量得把這十個人區(qū)分開來。這和高考一樣,高考命題的其中一個目的就是把學(xué)生區(qū)分開來。而恰恰主成分分析就是構(gòu)建一個新變量(第一主成分),并且使得這個新變量的方差達(dá)到最大。于是你利用主成分分析,很快搞了一套權(quán)重,然后得到每個人的分?jǐn)?shù),一目了然。
需要指出的是,主成分分析可不知道什么是學(xué)歷,什么是領(lǐng)導(dǎo)力,所以這個結(jié)果一定是客觀的,而且使得每個人的分?jǐn)?shù)盡量區(qū)分開來,但是這個新指標(biāo)的表現(xiàn)究竟怎么樣呢?舉一個極端的情況,這七八個指標(biāo)是獨立的,在這種情況下使用主成分分析,結(jié)果會告訴你,哪個指標(biāo)變化最大用哪個作為新指標(biāo)(第一主成分)。也就是說其他六七個指標(biāo)完全沒用到(當(dāng)然如果其他指標(biāo)都保持不變的話,確實沒有任何作用),這樣做好像讓人不太能接受,你不能因為這個指標(biāo)變化大就讓這個指標(biāo)權(quán)重就大甚至為1。
所以我們需要衡量這個(第一)主成分的表現(xiàn)情況。主成分的方差與總的方差的比值可以作為評價指數(shù),這個比值總是介于0和1之間,越接近于1說明(第一)主成分包含總的變化就越多,直觀地說,等同于包含的有用信息就越多。比值等于1時,(第一)主成分已經(jīng)包含所有的有用信息,是一個“最理想”的(第一)主成分。
當(dāng)然現(xiàn)實往往與理想不同,對于實際問題,很難構(gòu)造一個“最理想的”主成分。而且評價(第一)主成分的標(biāo)準(zhǔn)也因具體而異,比如對于某些問題90%以上才可能接受,但是對于另外一些問題,10%以上就十分理想了。需要注意,雖然評價無統(tǒng)一標(biāo)準(zhǔn),但大多數(shù)情況,變量越多,評價標(biāo)準(zhǔn)就越低。
沒有找到您需要的服務(wù)與信息?
請留下您的具體需求,我們將立刻安排相關(guān)領(lǐng)域的專業(yè)人士與您聯(lián)系; 或者您也可以致電我們: 025-5275 8185 [工作日09:00-18:30]