Simple Linear Regression
เป้าหมายคือการเดาค่า B เมื่อมีการให้ค่า A มา โดยที่มั่นใจว่า 2 ตัวแปรนี้มีความสัมพันธ์แบบเป็นเส้นตรง
Assumptions
- ตัวแปร → Continuous
- ตัวแปรมีความสัมพันธ์แบบเป็นเส้นตรง (จะขึ้น จะลงก็ได้ แต่ต้องเส้นตรง)
- อย่าลืมลบ Significant Outlier
- Independent of observations
Requirement test factor
- ต้องเป็น Homoscedasticity (หากเส้นไปต่อ ต้องล้อไปตามเส้นด้วย ไม่ใช่ค่อยๆ หนีห่างออกจากเส้น)
- Independent of Error (Error ของ Residual กระจายแบบปกติ) (วัดด้วย Durbin-Watson)
Tests
Analyze → Regression → Linear
ใส่ตัวแปรเข้ากล่อง
ตัวแปร Dependent + Independent
เช็คค่าของตัวแปร
เข้า Statistics
ติ้ก Estimates + Confidence Intervals
ติ้ก Model Fit
ติ้ก Durbin-Watson + Casewise Diagnostics
เช็คความกระจายตัว
เข้า Plots
ใส่ ZPRED ที่ X
ใส่ ZRED ที่ Y
ติ้ก Histogram + Normality Probability Plot
Reporting the result
ตาราง Model Summary
ค่า R
- ความสัมพันธ์ไปในทิศทางไหน ( เป็นบวก = เพื่ม | เป็นลบ = ลด )
ค่า R^2
- เส้นที่เดาออกมา อธิบายค่าตัวแปรได้แม่นยำแค่ไหน ( range คะแนน 0 - 1 )
- ออกมาน้อย = คาดเดาผลลัพท์ได้ไม่ดี
- ออกมามาก = คาดเดาได้ดีมาก
ค่า Adjusted R^2
- เป็นเหมือน R^2 แต่เป็นของประชากร ว่าจะเดาความสัมพันธ์ในระดับประชากรได้มากขนาดไหน
ค่า Durbin-Watson
- อธิบายไว้แล้วใน +SPSS x Data Analysis: Durbin-Watson-Statistics
ตาราง ANOVA
- ค่าความ Sig ของการทดสอบ F-statistics
ตาราง Coefficient
สมการ Regression
- y = <b ของ constant> + <b ของ income> x income
- เพื่อนำไปทำนายตัวแปรตามอันต่อไป หากให้ตัวแปรต้นมา
ความ significant ของตัวแปรต้น
- p < 0.05 → significant
- ถ้า significant ก็จะเป็นตัวแปรที่ช่วยอธิบายตัวแปรตามได้
- หากไม่ significant แปลว่าจะใส่หรือไม่ใส่ตัวแปร ก็ไม่ได้ทำให้อธิบายตัวแปรตามได้ดีเท่าไหร่ เอาออกไปก็ได้
ตาราง Correlations