Simple Linear Regression

เป้าหมายคือการเดาค่า B เมื่อมีการให้ค่า A มา โดยที่มั่นใจว่า 2 ตัวแปรนี้มีความสัมพันธ์แบบเป็นเส้นตรง

Assumptions

  1. ตัวแปร → Continuous
  2. ตัวแปรมีความสัมพันธ์แบบเป็นเส้นตรง (จะขึ้น จะลงก็ได้ แต่ต้องเส้นตรง)
  3. อย่าลืมลบ Significant Outlier
  4. Independent of observations

Requirement test factor

  1. ต้องเป็น Homoscedasticity (หากเส้นไปต่อ ต้องล้อไปตามเส้นด้วย ไม่ใช่ค่อยๆ หนีห่างออกจากเส้น)
  2. Independent of Error (Error ของ Residual กระจายแบบปกติ) (วัดด้วย Durbin-Watson)

Tests

Analyze → Regression → Linear

  1. ใส่ตัวแปรเข้ากล่อง

  2. ตัวแปร Dependent + Independent

  3. เช็คค่าของตัวแปร

  4. เข้า Statistics

  5. ติ้ก Estimates + Confidence Intervals

  6. ติ้ก Model Fit

  7. ติ้ก Durbin-Watson + Casewise Diagnostics

  8. เช็คความกระจายตัว

  9. เข้า Plots

  10. ใส่ ZPRED ที่ X

  11. ใส่ ZRED ที่ Y

  12. ติ้ก Histogram + Normality Probability Plot

Reporting the result

ตาราง Model Summary

Model Summary Table for Linear Regression Procedure in SPSS Statistics

ค่า R

  • ความสัมพันธ์ไปในทิศทางไหน ( เป็นบวก = เพื่ม | เป็นลบ = ลด )

ค่า R^2

  • เส้นที่เดาออกมา อธิบายค่าตัวแปรได้แม่นยำแค่ไหน ( range คะแนน 0 - 1 )
  • ออกมาน้อย = คาดเดาผลลัพท์ได้ไม่ดี
  • ออกมามาก = คาดเดาได้ดีมาก

ค่า Adjusted R^2

  • เป็นเหมือน R^2 แต่เป็นของประชากร ว่าจะเดาความสัมพันธ์ในระดับประชากรได้มากขนาดไหน

ค่า Durbin-Watson

ตาราง ANOVA

ANOVA Table for Linear Regression Procedure in SPSS Statistics

  • ค่าความ Sig ของการทดสอบ F-statistics

ตาราง Coefficient

Coefficients Table for Linear Regression in SPSS Statistics

สมการ Regression

  • y = <b ของ constant> + <b ของ income> x income
  • เพื่อนำไปทำนายตัวแปรตามอันต่อไป หากให้ตัวแปรต้นมา

ความ significant ของตัวแปรต้น

  • p < 0.05 → significant
  • ถ้า significant ก็จะเป็นตัวแปรที่ช่วยอธิบายตัวแปรตามได้
  • หากไม่ significant แปลว่าจะใส่หรือไม่ใส่ตัวแปร ก็ไม่ได้ทำให้อธิบายตัวแปรตามได้ดีเท่าไหร่ เอาออกไปก็ได้

ตาราง Correlations