Question: 在 Minitab 中,我該如何解釋回歸分析報表中的 R-square 和 R-Sq(pred)?
Answer:
在迴歸分析中的預測 R 平方值 (Predicted R-squared) 是用來解釋模型預測新觀測值的好壞能力,而 R 平方值則是用來解釋模型針對目前資料的配適好壞。而預測 R 平方值能避免過度配適 (over fitting) 的情況並且在比較模型上會比修正 R 平方值 (Adjust R-squared) 還要有用,因為它使用了估計模型未包含的觀測值來計算。過度配適指的是模型在模型估計上解釋現了有資料中反應變數 (y) 和獨立變數 (x) 之間的關係,但是卻無法提供對新的觀測值的有效預測值。
預測 R 平方值是有系統地將資料中的移除單一觀測值移除並估計迴歸模型之後所得之一種修飾 R 平方值,並且決定了模型預測移除觀測值能力的好壞。預測 R 平方值的範圍介於 0 到 100% 之間,並且它是透過 PRESS 統計量計算得到。當模型的預測 R 平方值越大,則模型預測能力越好。
例如,假設您在一家財務顧問公司上班並且正在研發一個預測未來市場情況的模型。您選定一個模型,它的 R 平方值達到 87%,可是此模型的預測 R 平方值只有 52%。這可能是一個模型過度配適的現象,並且此模型可能無法對現有資料以外的新觀測值作一個好的預測。