สหสัมพันธ์ การวิเคราะห์ถดถอย และผังการกระจาย
Correlation, Regression and Scatter Diagrams

เนื้อหาการวิเคราะห์ถดถอย

การวิเคราะห์ผังการกระจาย และสหสัมพันธ์ ทำให้เราทราบ แนวโน้มของความสัมพันธ์ xy อย่างกว้าง ๆ ว่าเป็นไปในทิศทางใด เช่น แปรตามกัน หรือแปรผกผันกัน
ถ้าเราต้องการทราบ รายละเอียดของความสัมพันธ์เป็นตัวเลข ที่อ่านได้ หรือวัดได้เลย เช่นในตัวอย่างถังพลาสติก ถ้าอยากทราบว่า ความดันเท่าไร ทำให้ผนังถัง มีความหนาเป็นเท่าไร เราจะต้องศึกษาลึกลงไปอีก

ในตัวอย่างเรื่องถังพลาสติก การศึกษานี้ ทำได้โดย ปรับค่าแรงดันลม แล้ววัดความหนาของถัง 4 ใบ ที่แรงดันลม 5 ระดับ จะได้ข้อมูลจำนวน 20 ข้อมูล (ตาราง 6.3)

ให้ค่า x เป็นแรงดันลมที่ใช้ และ y เป็นความหนาของถัง ซึ่งเป็นผลมาจากแรงดันลม
ดังนั้น

x คือ "ตัวแปรต้น*" (Independent Variable)
y คือ "ตัวแปรตาม*" (Dependent Variable)
* คำแปลจากพจนานุกรมศัพท์คณิตศาสตร์ ฉบับราชบัณฑิตยสถาน พ.ศ.2532

เขียนเป็นสมการ แสดงความสัมพันธ์ x กับ y ได้ดังนี้

Alpha คือ ค่าคงที่ (ค่า y เมื่อ x = 0 หรือจุดตัดแกน y, y-intercept)
Beta คือ ค่าความชัน (Slope) ของเส้นกราฟ หรือเรียกว่า สัมประสิทธิ์การถดถอย (Regression Coefficient)

เส้นตรงที่มีสมการเป็น เรียกว่า "เส้นการถดถอย" (Rgression Line)

ส่วนวิธีการเปลี่ยนผังการกระจาย ให้เป็นสมการที่ชัดเจน เรียกว่า "การวิเคราะห์ถดถอย" (Regression Analysis)

ตาราง 6.3 นำมาลงจุดเป็นกราฟ xy ได้ดังนี้ (รูป 6.8)

สมมติให้ข้อมูล (xi,yi) เป็นข้อมูลที่ทดลองมาได้ โดย
i มีค่าจาก 1 ถึง n และ
n คือจำนวนคู่ของข้อมูล
และ
Alpha^ และ Beta^ คือค่าประมาณของ Alpha กับ Beta โดยมี
ei เป็นผลต่าง ของค่า yi กับค่า ( Alpha^ + Beta^ xi ) นั่นคือ...

นำข้อมูลจากตาราง 6.3 มาเป็น ตัวอย่าง การคำนวณหา เส้นการถดถอย ได้ดังนี้

จากสมการถดถอยที่ได้ หมายความว่า ทุกค่าแรงดันลม (x) ที่เพิ่มขึ้น 1 กก./ตร.ซม. มีผลให้ความหนาของถัง (y) บางลง 1.28 มม. เพราะเป็นลบ

เราสามารถคำนวณเส้นการถดถอย จากสมการได้ดังนี้

x = 8.0 , y = 14.80 - 1.28 (8.0) = 4.6
x = 8.5 , y = 14.80 - 1.28 (8.5) = 3.9
x = 9.0 , y = 14.80 - 1.28 (8.0) = 3.3
x = 9.5 , y = 14.80 - 1.28 (8.0) = 2.6
x = 10.0 , y = 14.80 - 1.28 (8.0) = 2.0

นำเส้นการถดถอยมาเขียนลงในกราฟรูป 6.8 โดยเส้นตรงจะผ่านกึ่งกลางของชุดข้อมูล แต่ละชุด (รูป 6.9)

1) อย่าวิเคราะห์การถดถอย หรือคำนวณเส้นการถดถอย โดยมีได้เขียน ผังการกระจาย เพราะ จะทำให้เกิด ความผิดพลาดได้

ตัวอย่างข้อมูล 4 ชุดแสดงในรูป 6.10.1 - 6.10.4 และตาราง 6.4

พิจารณารูป 6.10.1 ถึงรูป 6.10.4 ข้อมูลทั้ง 4 รูป แตกต่างกันอย่างชัดเจน แต่ให้สมการถดถอย ที่เหมือนกัน

หมายเหตุ
รูป 6.10.1 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นตรง
รูป 6.10.2 จากผังการกระจาย จะเห็นว่า ควรเป็นเส้นโค้ง
รูป 6.10.3 มีจุดแตกกลุ่มจุดหนึ่ง ควรตัดออกไม่คิด ข้อมูลที่เหลือ จึงเป็นเส้นตรง
รูป 6.10.4 ข้อมูลบนแกน x มีน้อยไป มีเพียง 2 ค่า คือที่ x = 8 และ x = 19 เท่านั้น

ตัวอย่างในตาราง 6.4 ข้อมูล 4 ชุดที่แตกต่างกัน แต่ได้ผลการคำนวณ เส้นสมการถดถอย ที่เหมือนกัน

ผังการกระจาย

สหสัมพันธ์