在社會(huì)科學(xué)研究中,主要的多變量分析方法包括多變量方差分析(Multivariate analysis of variance,MANOVA)、主成分分析(Principal component analysis)、因子分析(Factor analysis)、典型相關(guān)(Canonical correlation analysis)、聚類分析(Cluster analysis)、判別分析(Discriminant analysis)、多維量表分析(Multidimensional scaling),以及近來頗受矚目的驗(yàn)證性因子分析(Confirmatory factor analysis )或線性結(jié)構(gòu)模型(LISREL)與邏輯斯蒂回歸分析等,以下簡(jiǎn)單說明這些方法的觀念和適用時(shí)機(jī)。
一、多變量方差分析
MANOVA適用于同時(shí)探討一個(gè)或多個(gè)自變量與兩個(gè)以上因變量間因果關(guān)系的統(tǒng)計(jì)方法,依照研究者所操作自變量的個(gè)數(shù),可以分為單因素(一個(gè)自變量)或多因素(兩個(gè)以上自變量)MANOVA。進(jìn)行多變量方差分析時(shí),自變量必須是離散的定類或定序變量,而因變量則必須是定距以上層次的變量。
二、主成分分析
主成分分析的主要功能在分析多個(gè)變量間的相關(guān),以建構(gòu)變量間的總體性指標(biāo)(overall indicators)。當(dāng)研究者測(cè)量一群彼此間具有高度相關(guān)的變量,則在進(jìn)行顯著性檢驗(yàn)錢,為避免變量數(shù)過多,造成解釋上的復(fù)雜與困擾,常會(huì)先進(jìn)行主成分分析,在盡量不喪失原有信息的前提下,抽取少數(shù)幾個(gè)主成分,作為代表原來變量的總體性指標(biāo),達(dá)到資料縮減(data reduction)的功能。進(jìn)行主成分分析時(shí),并無(wú)自變量和因變量的區(qū)別,但是所有的變量都必須是定距以上層次變量。
三、因子分析
因子分析與主成分分析常被研究者混用,因?yàn)槎叩墓δ芏际峭ㄟ^對(duì)變量間的相關(guān)分析,以達(dá)到簡(jiǎn)化數(shù)據(jù)功能。但不同的是,主成分分析是在找出變量間最佳線性組合(linear combination)的主成分,以說明變量間最多的變異量;至于因子分析,則在于找出變量間共同的潛在結(jié)構(gòu)(latent structure)或因子,以估計(jì)每一個(gè)變量在各因子上的負(fù)荷量(loading)。進(jìn)行因子分析時(shí),并無(wú)自變量和因變量的區(qū)分,但是所有變量都必須是定距以上層次變量。
四、典型相關(guān)
典型相關(guān)可視為積差相關(guān)或多元回歸分析的擴(kuò)展,主要功能在分析兩個(gè)變量間的相關(guān)。進(jìn)行多元回歸分析的目的,是在分析一個(gè)或多個(gè)自變量與一個(gè)因變量間的關(guān)系,而典型相關(guān)中因變量也可以是多個(gè);也就是說,典型相關(guān)的目的在于通過計(jì)算得到兩個(gè)變量線性組合的加權(quán)系數(shù)。以使(maximum)兩個(gè)變量間的相關(guān)達(dá)到最大化。進(jìn)行典型相關(guān)時(shí),并無(wú)自變量和因變量的區(qū)分,但是所有變量都必須是定距以上層次變量。
五、聚類分析
聚類分析的主要功能在進(jìn)行分類(classification),當(dāng)研究者有觀測(cè)值時(shí),常會(huì)根據(jù)觀測(cè)值的相似性或差異性進(jìn)行分類,以形成幾個(gè)性質(zhì)不同的類別,簡(jiǎn)化解釋的工作。也就是說,聚類分析根據(jù)對(duì)變量進(jìn)行測(cè)量的觀察值進(jìn)行分類,以達(dá)到組內(nèi)同質(zhì)、組間異值的目的。其次,聚類分析完成后,通常可以進(jìn)行判別分析,以識(shí)別分類的效度。當(dāng)然,在某些時(shí)候也可以對(duì)變量進(jìn)行分類(此功能類似因子分析,因此多采用因子分析解決問題)。進(jìn)行聚類分析時(shí),并無(wú)自變量和因變量的區(qū)分,但是所有變量都必須是定距以上層次變量。
六、判別分析
判別分析是多變量分析中應(yīng)用相當(dāng)廣泛的統(tǒng)計(jì)方法,它可以用來對(duì)樣本進(jìn)行分類的工作;也可以用來了解不同類別樣本在某些變量上的差異情形;同時(shí)也可以根據(jù)不同類別的樣本在某些變量的實(shí)際表現(xiàn),用來預(yù)測(cè)新的樣本屬于某一類別的概率。因此,在行為科學(xué)中,常見的研究者單獨(dú)使用判別分析,建立判別函數(shù)(discriminant function),以對(duì)新樣本進(jìn)行預(yù)測(cè);或是多變量方差分析的檢驗(yàn)值達(dá)到顯著性水平后,比較不同組別樣本在因變量平均數(shù)的差異情形;或是聚類分析后,檢驗(yàn)聚類分析的正確性。進(jìn)行判別分析時(shí),自變量是定距以上層次變量,至于因變量通常是離散變量。
七、多維量表分析
多維量表分析基本上也是一種分類的統(tǒng)計(jì)方法,他在市場(chǎng)上普遍被應(yīng)用。當(dāng)研究者想要解釋一群受試者(例如消費(fèi)者)對(duì)一組客體(例如商品)在某些變量上相似性的測(cè)量中所包含的信息,此時(shí)多維量表分析就是一個(gè)相當(dāng)適用的方法。研究者只要將這一組客體在變量上的測(cè)量值轉(zhuǎn)化成多維度的幾何表征,就能夠?qū)⑦@些客體有效地顯示在這個(gè)幾何空間中,達(dá)到分類的目的,同時(shí)也可以進(jìn)一步解釋這些幾何表征所代表的潛在結(jié)構(gòu)或意義。進(jìn)行多維量表分析時(shí),并無(wú)自變量和因變量的區(qū)分,同時(shí)變量可以是等距以上變量,也可以是定類或定序變量。
八、線性結(jié)構(gòu)方程
線性結(jié)構(gòu)方程是一個(gè)相當(dāng)具有變通與彈性的統(tǒng)計(jì)方法,隨著研究者對(duì)變量間關(guān)系界定的差異,LISREL的常見名稱包括協(xié)方差結(jié)構(gòu)分析,潛變量分析、線性結(jié)構(gòu)模型或驗(yàn)證性因子分析。LISREL可視為多元回歸分析與因子分析兩個(gè)方法論的整合模型,讓研究者可以探討變量間的線性關(guān)系(回歸分析),并對(duì)可測(cè)量顯變量與不可測(cè)量的潛變量見(因子分析)的因果模型作假設(shè)檢驗(yàn)。
九、邏輯斯蒂回歸分析
邏輯斯蒂回歸可視為傳統(tǒng)多元回歸分析的一個(gè)特列。它和多元回歸分析一樣,都具有解釋自變量與因變量之間的關(guān)系,并可進(jìn)行預(yù)測(cè)。所不同的是在進(jìn)行多元回歸分析時(shí),包括自變量與因變量都必須是定距以上層次變量;但在進(jìn)行邏輯斯蒂回歸分析時(shí),自變量仍是定距以上層次變量,因變量則是二分的定類變量或多分定類變量或定序變量。
十、對(duì)數(shù)線性方程
在基本統(tǒng)計(jì)學(xué)中,當(dāng)研究者面對(duì)探討兩個(gè)定類或定序變量間關(guān)系的研究問題時(shí),都是以卡方檢驗(yàn)來進(jìn)行假設(shè)檢驗(yàn)。當(dāng)問題的性質(zhì)是探討兩個(gè)定類變量間是否獨(dú)立或是關(guān)聯(lián)強(qiáng)度時(shí),是以卡方獨(dú)立性檢驗(yàn)來進(jìn)行假設(shè)檢驗(yàn)。進(jìn)行卡方獨(dú)立性檢驗(yàn)時(shí),研究者必須將樣本在兩個(gè)定類變量上的反應(yīng),建立二維列聯(lián)表(contingency table),以進(jìn)一步根據(jù)列聯(lián)表中各單元格(cell)的次數(shù)反應(yīng),進(jìn)行顯著性檢驗(yàn)。但當(dāng)研究者面對(duì)三個(gè)或三個(gè)以上的定類變量時(shí),所建立的多元列聯(lián)表間變量關(guān)聯(lián)的分析,卡方獨(dú)立性檢驗(yàn)將無(wú)法解決這樣的問題,此時(shí)適合的方法就是對(duì)數(shù)線性模型。利用對(duì)數(shù)線性模型來解決多元列聯(lián)表的問題的目的,主要就在于探討構(gòu)成列聯(lián)表的多個(gè)定類變量間的關(guān)系,進(jìn)而在精簡(jiǎn)原則下構(gòu)建擬合的解釋模型,并根據(jù)所建立的模型估計(jì)單元格參數(shù)值,以了解各變量效果對(duì)單元格次數(shù)的影響。
十一、Logit對(duì)數(shù)線性模型
在對(duì)數(shù)線性模型中,多個(gè)定類變量間是互為因果的關(guān)系(即相關(guān)關(guān)系),并無(wú)自變量與因變量的區(qū)分,研究目的在于探討變量間的關(guān)聯(lián)強(qiáng)度和性質(zhì)。但有時(shí)研究者會(huì)面臨變量間有自變量和因變量的區(qū)分的情境。在基本統(tǒng)計(jì)學(xué)中,當(dāng)研究者面對(duì)的問題性質(zhì)是兩個(gè)定類變量間有自變量和因變量的區(qū)別,目的在于探討兩個(gè)變量間的因果關(guān)系時(shí),多是以卡方齊性檢驗(yàn)來進(jìn)行假設(shè)檢驗(yàn)。但自變量個(gè)數(shù)在兩個(gè)以上時(shí),卡方齊性檢驗(yàn)就不再適用,而必須改用logit對(duì)數(shù)線性模型方法來對(duì)數(shù)據(jù)進(jìn)行分析。Logit對(duì)數(shù)線性模型的功能與多元回歸分析相當(dāng)類似,都可以用來探討與解釋因變量與自變量間的關(guān)系,但不同的是,多元回歸分析的變量都是定距以上層次變量,通常以最小二乘法進(jìn)行模型估計(jì)與檢驗(yàn);logit對(duì)數(shù)線性模型的變量都是定類變量,通常以最大似然估計(jì)法進(jìn)行模型估計(jì)與檢驗(yàn)。