เมื่อใดและอย่างไรที่จะใช้ตัวแปรอธิบายที่เป็นมาตรฐานในการถดถอยเชิงเส้น


37

ฉันมีคำถามง่ายๆ 2 ข้อเกี่ยวกับการถดถอยเชิงเส้น:

  1. เมื่อใดควรที่จะสร้างมาตรฐานของตัวแปรอธิบาย?
  2. เมื่อการประมาณค่าดำเนินการด้วยค่ามาตรฐานแล้วหนึ่งคนจะคาดการณ์ด้วยค่าใหม่ได้อย่างไร (ควรประเมินค่ามาตรฐานใหม่อย่างไร)

การอ้างอิงบางอย่างจะเป็นประโยชน์


3
หากซอฟต์แวร์ของคุณเขียนได้เป็นอย่างดีซอฟต์แวร์จะทำการจัดมาตรฐานภายในโดยอัตโนมัติเพื่อหลีกเลี่ยงปัญหาความแม่นยำเชิงตัวเลข คุณไม่ควรทำอะไรเป็นพิเศษ
whuber

1
โปรดทราบว่าหัวข้อต่อไปนี้เกี่ยวข้องและจะเป็นที่สนใจ: เมื่อใดที่คุณควรจัดศูนย์กลางข้อมูลของคุณ & เมื่อใดที่คุณควรจัดทำมาตรฐาน .
gung - Reinstate Monica

คำตอบ:


26

แม้ว่าคำศัพท์จะเป็นหัวข้อที่ถกเถียงกัน แต่ฉันชอบเรียกตัวแปร "อธิบาย", "ตัวแปรทำนาย"

เมื่อใดที่จะสร้างมาตรฐานของการทำนาย:

  • ซอฟต์แวร์จำนวนมากสำหรับการดำเนินการถดถอยเชิงเส้นหลายครั้งจะให้ค่าสัมประสิทธิ์มาตรฐานซึ่งเทียบเท่ากับค่าสัมประสิทธิ์ที่ไม่ได้มาตรฐานซึ่งคุณตั้งค่ามาตรฐานของตัวทำนายและตัวแปรตอบสนองด้วยตนเอง (แน่นอนว่าดูเหมือนว่าคุณกำลังพูดถึง
  • ความคิดเห็นของฉันคือมาตรฐานเป็นเครื่องมือที่มีประโยชน์สำหรับการสร้างสมการการถดถอยที่มีความหมายมากขึ้น นี่เป็นเรื่องจริงโดยเฉพาะอย่างยิ่งในกรณีที่ตัวชี้วัดของตัวแปรขาดความหมายต่อบุคคลที่ตีความสมการถดถอย (เช่นมาตรวัดทางจิตวิทยาของมาตรวัดโดยพลการ) นอกจากนี้ยังสามารถใช้เพื่ออำนวยความสะดวกในการเปรียบเทียบความสำคัญสัมพัทธ์ของตัวแปรทำนาย (แม้ว่าจะมีวิธีการที่ซับซ้อนกว่าสำหรับการประเมินความสำคัญสัมพัทธ์; ดูโพสต์ของฉันสำหรับการอภิปราย ) ในกรณีที่ตัวชี้วัดมีความหมายต่อบุคคลที่ตีความสมการการถดถอยสัมประสิทธิ์ที่ไม่ได้มาตรฐานมักจะให้ข้อมูลมากกว่า
  • ฉันยังคิดว่าการใช้ตัวแปรมาตรฐานอาจให้ความสนใจกับความจริงที่ว่าเราไม่ได้คิดเกี่ยวกับวิธีทำให้ตัวชี้วัดของตัวแปรมีความหมายกับผู้อ่านมากขึ้น

  • Andrew Gelman มีเหตุผลพอสมควรที่จะพูดในหัวข้อนี้ ดูหน้าของเขาเกี่ยวกับมาตรฐานเช่นGelman (2008, Stats Med, PDF ฟรี)โดยเฉพาะ

การทำนายขึ้นอยู่กับ standarisation:

  • ฉันจะไม่ใช้สัมประสิทธิ์การถดถอยมาตรฐานเพื่อการคาดการณ์
  • คุณสามารถแปลงค่าสัมประสิทธิ์มาตรฐานให้เป็นค่าสัมประสิทธิ์ที่ไม่ได้มาตรฐานได้หากคุณทราบค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของตัวแปรตัวทำนายในตัวอย่างดั้งเดิม

3
+1 แต่ทำไมคุณไม่ใช้ค่าสัมประสิทธิ์การถดถอยที่ไม่ได้มาตรฐานสำหรับการทำนาย
onestop

1
(+1) เกี่ยวกับการประเมินความสำคัญของตัวแปรฉันคิดว่าแพคเกจrelaimpo R ทำงานได้ดี (แต่ดูที่การเริ่มต้นใช้วิธีการแบบใหม่เพื่อการถดถอย ) นอกจากนี้ยังมีบทความดีๆจากDavid V. Budescuเกี่ยวกับการวิเคราะห์การปกครอง (สามารถขอได้ฟรี)
chl

@onestep อุ๊ปส์ พิมพ์ผิด มันเปลี่ยนไปแล้ว
Jeromy Anglim

1
@ Jeromy, คุณช่วยอธิบายได้ไหมว่าทำไมคุณถึงไม่ใช้สัมประสิทธิ์การถดถอยแบบมาตรฐานสำหรับการทำนาย?
Michael Bishop

3
@MichaelBishop ฉันกำลังคิดถึงบริบทที่คุณใช้แบบจำลองการถดถอยของคุณและนำไปใช้ในการทำนายจากข้อมูลตัวอย่าง โดยทั่วไปคุณต้องการการคาดการณ์ที่ไม่ได้มาตรฐาน นอกจากนี้ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานสามารถเปลี่ยนแปลงได้ในกลุ่มตัวอย่าง การใช้เครื่องทำนายที่ไม่ได้มาตรฐานควรให้ผลลัพธ์ที่มีความหมายมากกว่า
Jeromy Anglim

-4

ให้ฉันตอบด้วยแป้งคำตอบสั้น ๆ มันอาจทับซ้อนกับคำตอบที่เขียนก่อนหน้านี้

  1. ให้คะแนนที่สม่ำเสมอซึ่งช่วยให้คุณสามารถตีความการถดถอยได้โดยเฉพาะสัมประสิทธิ์การถดถอยที่ดีกว่า

  2. สำหรับข้อมูลใหม่ที่ไม่ได้มาตรฐานฉันขอแนะนำให้คุณเก็บค่าที่คุณใช้สำหรับแต่ละตัวแปรให้อยู่ในสถานะสแตนด์อะโลนเช่นค่าสูงสุดและค่าต่ำสุดจากนั้นทำการแปลงแบบเดียวกันกับที่คุณทำในชุดข้อมูลรูมาก่อน อินสแตนซ์เดียว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.