วันศุกร์ที่ 18 กันยายน พ.ศ. 2552

ค่า Adjusted R square

Adjusted R square คือ ค่า R ยกกำลังสองที่ปรับเนื่องจากจำนวนตัวอย่างของประชากรกับจำนวนตัวแปรให้เหมาะสมยิ่งขึ้น โดยปกติถ้ามีจำนวนตัวแปรมาก จำนวนข้อมูลก็ต้องมีมากขึ้นเป็นเงาตามตัว
เป็นการหดตัว(Shrinkage) ของค่า R square ระหว่างค่า R square ที่ได้จากการคำนวณค่าประชากร ที่ใช้ในการพยากรณ์ จะมีค่ามากกว่าค่า R square ที่ได้จากกลุ่มตัวอย่างที่จะใช้ประมาณค่าประชากร ที่มีสาเหตุมาจากจำนวนตัวอย่าง (n) ว่ามีขนาดเท่าไร ถ้าจำนวนกลุ่มตัวอย่างน้อย ค่า adjusted R square จะน้อย ถ้าจำนวนตัวอย่างมากค่า adjusted R square จะมาก เพื่อแสดงถึงการประมาณค่าประชากรที่ทำได้ดีที่สุด เนื่องจากค่า
ค่า R-Square จะอ่อนไหวต่อขนาดของกลุ่มตัวอย่างและจำนวนของตัวแปรพยากรณ์ ในเทอมของ R จะประมาณค่าความสัมพันธ์พหุคูณของประชากรได้ลำเอียงเนื่องจากความคลาดเคลื่อนในการสุ่มตัวอย่างในความสัมพันธ์ระหว่างสองตัวแปรและในส่วนเบี่ยงเบนมาตรฐานของ X และ Y เพราะว่า R จะประมาณค่าสหสัมพันธ์พหุคูณของประชากรได้สูงเกินความเป็นจริงและสัมประสิทธิ์การอธิบายปรับแก้ (Adjusted coefficient of multiple determinations) ก็จะถูกนำมาใช้ในการอภิปรายผล ค่า R-Square ปรับแก้สามารถคำนวณได้ด้วยสูตร
สูตรการหาค่า Adjusted R2 = 1 - (1 - R2) [(n - 1)/(n - m - 1)] ดังนั้นค่า Adjusted R2 จะใช้เมื่อขนาดกลุ่มตัวอย่างมีจำนวนน้อยแต่จำนวนของตัวแปรพยากรณ์มีจำนวนมาก และเปรียบเทียบความเหมาะสมของสมการถดถอยที่ได้ในชุดข้อมูลเดียวกันนี้กับจำนวนตัวแปรพยากรณ์ที่แตกต่างกันและมีข้อมูลของกลุ่มตัวอย่างที่แตกต่างออกไปความแตกต่างระหว่าง R2 และ ค่า Adjusted R2 จะเรียกว่า Shrinkage เมื่อ n มีจำนวนน้อย จะมีความลำเอียงให้ค่า R2 มีค่ามาก
ในกรณีนี้การปรับแก้จะเข้ามีประโยชน์ โดยใช้ Adjusted R2 นอกจากนี้กรณีมีกลุ่มตัวอย่างขนาดเล็ก สัมประสิทธิ์การถดถอย อาจจะประมาณค่าอ้างอิงไปยังประชากรได้ไม่ดี แต่อย่างไรก็ตาม ควรมี n จำนวนมากกว่า m หลายเท่า จะช่วยให้เกิดความลำเอียงน้อยและจะช่วยสรุปอ้างอิงไปยังประชากรได้ดีขึ้น
เนื่องจากเมื่อจำนวนตัวแปรพยากรณ์มีมากในการวิเคราะห์การถดถอยพหุคูณ อำนาจการทดสอบจะลดลงและจะไปเพิ่มความคลาดเคลื่อนแบบที่ 1 ในการทดสอบนัยสำคัญคือแม้ตัวแปรต้นและตามจะไม่มีความสัมพันธ์เชิงเส้นตรงแต่มีค่า R2 บ่งบอกระดับความเชื่อมั่นไปพอๆ กับกลุ่มตัวอย่างที่มีการกระจายเป็นเชิงเส้นไปตลอดทั่วๆ สมการพยากรณ์
Adjusted R-Square = 1 - (1 - R-SQUARE)[(n - 1)/(n - m - 1)]
หมายเหตุ m คือ จำนวนตัวแปรอิสระ
ดังนั้นค่า R-SQUARE adjusted จะใช้เมื่อขนาดกลุ่มตัวอย่างมีจำนวนน้อยและจำนวนของตัวแปรพยากรณ์มีจำนวนมาก และเปรียบเทียบความเหมาะสมของสมการถดถอยที่ได้ในชุดข้อมูลเดียวกันนี้กับจำนวนตัวแปรพยากรณ์ที่แตกต่างกันและมีข้อมูลของกลุ่มตัวอย่างที่แตกต่างออกไปความแตกต่างระหว่าง R-Square และ R-Square adjusted จะเรียกว่า shrinkage
เมื่อ n หรือกลุ่มตัวอย่างมีจำนวนน้อย จะมีความลำเอียงให้ค่า R-Square มีค่ามาก ในกรณีนี้การปรับแก้จะเข้ามามีประโยชน์ โดยใช้ R-Square adjusted เป็นตัวบ่งบอก
นอกจากนี้กรณีมีกลุ่มตัวอย่างขนาดเล็ก สัมประสิทธิ์การถดถอยอาจจะประมาณค่าอ้างอิงไปยังประชากรได้ไม่ดี แต่อย่างไรก็ตาม ควรมี n จำนวนมากกว่า m หลายเท่า จะช่วยให้เกิดความลำเอียงน้อยและจะช่วยสรุปอ้างอิงไปยังประชากรได้ดีขึ้น
เมื่อจำนวนตัวแปรพยากรณ์มีมากในการวิเคราะห์การถดถอยพหุคูณ อำนาจการทดสอบจะลดลง และจะไปเพิ่มความคลาดเคลื่อนแบบที่ 1 ในการทดสอบนัยสำคัญ
ในกรณีการวิเคราะห์การถดถอยพหุคูณ อำนาจการทดสอบจะเกี่ยวข้องกับขนาดของกลุ่มตัวอย่าง จำนวนของตัวแปรพยากรณ์ ระดับนัยสำคัญและขนาดของอิทธิพลประชากร ไม่มีกฎว่าจะต้องใช้กลุ่มตัวอย่างจำนวนเท่าใดที่จะสัมพันธ์กับจำนวนของตัวแปรพยากรณ์ แต่โดยปกตินักวิจัยจะใช้อัตราส่วนของจำนวน n ต่อ m มาก ๆ

ไม่มีความคิดเห็น:

แสดงความคิดเห็น