在社會科學研究中,主要的多變量分析方法包括多變量方差分析(Multivariate analysis of variance,MANOVA)、主成分分析(Principal component analysis)、因子分析(Factor analysis)、典型相關(Canonical correlation analysis)、聚類分析(Cluster analysis)、判別分析(Discriminant analysis)、多維量表分析(Multidimensional scaling),以及近來頗受矚目的驗證性因子分析(Confirmatory factor analysis )或線性結構模型(LISREL)與邏輯斯蒂回歸分析等,以下簡單說明這些方法的觀念和適用時機。
一、多變量方差分析
MANOVA適用于同時探討一個或多個自變量與兩個以上因變量間因果關系的統計方法,依照研究者所操作自變量的個數,可以分為單因素(一個自變量)或多因素(兩個以上自變量)MANOVA。進行多變量方差分析時,自變量必須是離散的定類或定序變量,而因變量則必須是定距以上層次的變量。
二、主成分分析
主成分分析的主要功能在分析多個變量間的相關,以建構變量間的總體性指標(overall indicators)。當研究者測量一群彼此間具有高度相關的變量,則在進行顯著性檢驗錢,為避免變量數過多,造成解釋上的復雜與困擾,常會先進行主成分分析,在盡量不喪失原有信息的前提下,抽取少數幾個主成分,作為代表原來變量的總體性指標,達到資料縮減(data reduction)的功能。進行主成分分析時,并無自變量和因變量的區別,但是所有的變量都必須是定距以上層次變量。
三、因子分析
因子分析與主成分分析常被研究者混用,因為二者的功能都是通過對變量間的相關分析,以達到簡化數據功能。但不同的是,主成分分析是在找出變量間最佳線性組合(linear combination)的主成分,以說明變量間最多的變異量;至于因子分析,則在于找出變量間共同的潛在結構(latent structure)或因子,以估計每一個變量在各因子上的負荷量(loading)。進行因子分析時,并無自變量和因變量的區分,但是所有變量都必須是定距以上層次變量。
四、典型相關
典型相關可視為積差相關或多元回歸分析的擴展,主要功能在分析兩個變量間的相關。進行多元回歸分析的目的,是在分析一個或多個自變量與一個因變量間的關系,而典型相關中因變量也可以是多個;也就是說,典型相關的目的在于通過計算得到兩個變量線性組合的加權系數。以使(maximum)兩個變量間的相關達到最大化。進行典型相關時,并無自變量和因變量的區分,但是所有變量都必須是定距以上層次變量。
五、聚類分析
聚類分析的主要功能在進行分類(classification),當研究者有觀測值時,常會根據觀測值的相似性或差異性進行分類,以形成幾個性質不同的類別,簡化解釋的工作。也就是說,聚類分析根據對變量進行測量的觀察值進行分類,以達到組內同質、組間異值的目的。其次,聚類分析完成后,通??梢赃M行判別分析,以識別分類的效度。當然,在某些時候也可以對變量進行分類(此功能類似因子分析,因此多采用因子分析解決問題)。進行聚類分析時,并無自變量和因變量的區分,但是所有變量都必須是定距以上層次變量。
六、判別分析
判別分析是多變量分析中應用相當廣泛的統計方法,它可以用來對樣本進行分類的工作;也可以用來了解不同類別樣本在某些變量上的差異情形;同時也可以根據不同類別的樣本在某些變量的實際表現,用來預測新的樣本屬于某一類別的概率。因此,在行為科學中,常見的研究者單獨使用判別分析,建立判別函數(discriminant function),以對新樣本進行預測;或是多變量方差分析的檢驗值達到顯著性水平后,比較不同組別樣本在因變量平均數的差異情形;或是聚類分析后,檢驗聚類分析的正確性。進行判別分析時,自變量是定距以上層次變量,至于因變量通常是離散變量。
七、多維量表分析
多維量表分析基本上也是一種分類的統計方法,他在市場上普遍被應用。當研究者想要解釋一群受試者(例如消費者)對一組客體(例如商品)在某些變量上相似性的測量中所包含的信息,此時多維量表分析就是一個相當適用的方法。研究者只要將這一組客體在變量上的測量值轉化成多維度的幾何表征,就能夠將這些客體有效地顯示在這個幾何空間中,達到分類的目的,同時也可以進一步解釋這些幾何表征所代表的潛在結構或意義。進行多維量表分析時,并無自變量和因變量的區分,同時變量可以是等距以上變量,也可以是定類或定序變量。
八、線性結構方程
線性結構方程是一個相當具有變通與彈性的統計方法,隨著研究者對變量間關系界定的差異,LISREL的常見名稱包括協方差結構分析,潛變量分析、線性結構模型或驗證性因子分析。LISREL可視為多元回歸分析與因子分析兩個方法論的整合模型,讓研究者可以探討變量間的線性關系(回歸分析),并對可測量顯變量與不可測量的潛變量見(因子分析)的因果模型作假設檢驗。
九、邏輯斯蒂回歸分析
邏輯斯蒂回歸可視為傳統多元回歸分析的一個特列。它和多元回歸分析一樣,都具有解釋自變量與因變量之間的關系,并可進行預測。所不同的是在進行多元回歸分析時,包括自變量與因變量都必須是定距以上層次變量;但在進行邏輯斯蒂回歸分析時,自變量仍是定距以上層次變量,因變量則是二分的定類變量或多分定類變量或定序變量。
十、對數線性方程
在基本統計學中,當研究者面對探討兩個定類或定序變量間關系的研究問題時,都是以卡方檢驗來進行假設檢驗。當問題的性質是探討兩個定類變量間是否獨立或是關聯強度時,是以卡方獨立性檢驗來進行假設檢驗。進行卡方獨立性檢驗時,研究者必須將樣本在兩個定類變量上的反應,建立二維列聯表(contingency table),以進一步根據列聯表中各單元格(cell)的次數反應,進行顯著性檢驗。但當研究者面對三個或三個以上的定類變量時,所建立的多元列聯表間變量關聯的分析,卡方獨立性檢驗將無法解決這樣的問題,此時適合的方法就是對數線性模型。利用對數線性模型來解決多元列聯表的問題的目的,主要就在于探討構成列聯表的多個定類變量間的關系,進而在精簡原則下構建擬合的解釋模型,并根據所建立的模型估計單元格參數值,以了解各變量效果對單元格次數的影響。
十一、Logit對數線性模型
在對數線性模型中,多個定類變量間是互為因果的關系(即相關關系),并無自變量與因變量的區分,研究目的在于探討變量間的關聯強度和性質。但有時研究者會面臨變量間有自變量和因變量的區分的情境。在基本統計學中,當研究者面對的問題性質是兩個定類變量間有自變量和因變量的區別,目的在于探討兩個變量間的因果關系時,多是以卡方齊性檢驗來進行假設檢驗。但自變量個數在兩個以上時,卡方齊性檢驗就不再適用,而必須改用logit對數線性模型方法來對數據進行分析。Logit對數線性模型的功能與多元回歸分析相當類似,都可以用來探討與解釋因變量與自變量間的關系,但不同的是,多元回歸分析的變量都是定距以上層次變量,通常以最小二乘法進行模型估計與檢驗;logit對數線性模型的變量都是定類變量,通常以最大似然估計法進行模型估計與檢驗。