การถดถอยของประชากรทั้งหมด


10

อะไรคือความหมายของข้อผิดพลาดมาตรฐานของสัมประสิทธิ์ในการถดถอยเมื่อรวมประชากรทั้งหมด?

ฉันงงงวยกับคำถามนี้มาก เพราะสำหรับฉันแล้วข้อผิดพลาดมาตรฐานไม่สมเหตุสมผลเมื่อรวมประชากรทั้งหมด - ไม่จำเป็นต้องอนุมานเชิงสถิติเนื่องจากคุณมีประชากรทั้งหมดอยู่แล้ว

แต่มันถูกใช้อย่างกว้างขวางถึงแม้จะมีบทความมากมายตีพิมพ์ในวารสารชั้นนำ ตัวอย่างเช่นถ้าฉันกำลังตรวจสอบความสัมพันธ์ระหว่างอัตราการเติบโตของ GDP ของประเทศและความหนาแน่นของประชากรฉันจะทำการถดถอย:

GDPi=α+βPopi+γXi+ϵi

กับ 195 ประเทศทั่วโลก ในกรณีนี้จะรวมทุกประเทศ (ประชากร) แต่วรรณคดีทั้งหมดยังคงพูดถึงความสำคัญทางสถิติของค่าสัมประสิทธิ์

มีใครอธิบายได้ไหมว่ามันเป็นการใช้สถิติอย่างผิด ๆ เมื่อทำการถดถอยประชากรทั้งหมด?


คำถามนี้ได้รับการตอบในเครือข่ายสถิติ ดูที่นี่ โดยทั่วไปสถิติไม่มีความเกี่ยวข้อง "การถดถอย" เป็นอุปกรณ์ทางคณิตศาสตร์อย่างแท้จริง
luchonacho

@luchonacho ความคิดเห็นของฉันคือคำถามนี้อยู่ในหัวข้อที่เกี่ยวกับเนื้อหาที่เรามีโดยธรรมชาติแล้ว \ som ทับซ้อนกับ stats.SE) ฉันยอมรับว่ามันเป็นเรื่องซ้ำซ้อน ฉันพบการสนทนาเกี่ยวกับสิ่งที่ซ้ำซ้อนข้ามไซต์ได้ที่นี่: meta.stackexchange.com/questions/172307/…
jmbejara

@ jmbejara ขอบคุณสำหรับการอ้างอิง ดีแล้วที่รู้.
luchonacho

ดูเหมือนว่าจะมีการอ้างอิงอื่นที่เกี่ยวข้อง มันกล่าวถึงเทคนิคที่เกี่ยวข้องที่เรียกว่าการอนุมานแบบสุ่มตามที่กล่าวไว้ใน Athey Imbens (2017) jasonkerwin.com/nonparibus/2017/09/25/…
jmbejara

คำตอบ:


4

ตอนแรกฉันตั้งค่าสถานะคำถามนี้สำหรับผู้ดูแลเพื่อตรวจสอบว่าควรโยกย้ายไปยังเว็บไซต์ SE ทางสถิติที่ผ่านการตรวจสอบความถูกต้องหรือไม่ แต่เนื่องจาก OP ได้นำเสนอตัวอย่างทางเศรษฐมิติที่เฉพาะเจาะจงมากฉันเชื่อว่าแนวคิด "ประชากร / ตัวอย่าง" (ลึกมาก) ของเรื่องนี้สามารถนำมาพูดคุยอย่างมีประโยชน์สำหรับวัตถุประสงค์ของตัวอย่างนี้

ประเด็นแรกคือที่กล่าวถึงใน @AdamBailey คำตอบ: หากพิจารณา "ทุกประเทศในโลก" สำหรับปีหรือปีที่กำหนดและติดป้ายกำกับข้อมูลเป็น "ประชากร" ดังนั้นปีถัดไปควรเป็นของประชากรที่แตกต่างกัน หากเป็นของประชากรอื่นเราจะใช้ผลลัพธ์จากประชากรหนึ่งเพื่ออนุมานสำหรับประชากรอื่นได้อย่างไร ดังนั้นที่นี่ "ประชากร" ของเราคือสองมิติประเทศและเวลา - และในแง่นั้นเมื่อเวลาเปิดกว้างเรามีตัวอย่างในมือของเราเท่านั้น

ปัญหาที่สอง (โดยนัยเป็นส่วนหนึ่งใน @luchonacho คำตอบ) มีดังต่อไปนี้: ประชากรของเราไม่ใช่การรับรู้ตัวแปรสุ่มแบบสุ่ม " . นี่คือข้อมูลประชากรของเราคือชุดของการสุ่ม ตัวแปรตัวเองซึ่งเป็นฟังก์ชั่นไม่ใช่ค่าGDPi,i=1,..n

ดังนั้นข้อมูลของเราเป็นเพียงหนึ่งในการรวมการสุ่มตัวแปรที่เป็นไปได้ การรับรู้เหล่านี้ไม่เพียง แต่เป็นผลมาจากความสัมพันธ์ที่กำหนดขึ้น / วิศวกรรม / สาเหตุ (สะท้อนในสัมประสิทธิ์) แต่ยังอยู่ภายใต้ผลของปัจจัยสุ่มโดยกำเนิด ในความหมายนั้นข้อมูลไม่ใช่ภาพ "บริสุทธิ์ / ทั่วไป" ของ "ประชากร" - ประกอบด้วยเสียงรบกวนการรบกวนที่ไม่มีโครงสร้างการกระแทกแบบครั้งเดียวเป็นต้น

จากนั้นความไม่แน่นอนนี้จะนำไปสู่การประมาณค่าสัมประสิทธิ์ที่เราพยายามประมาณเพราะเราสันนิษฐานว่าสัมประสิทธิ์เหล่านี้อธิบายถึงสาเหตุหรือการเคลื่อนไหวร่วมก่อนที่องค์ประกอบสุ่มที่มีผลต่อค่าสุดท้ายของตัวแปรตาม

เนื่องจากทั้งสองด้านข้างบนการพูดคุยเกี่ยวกับ "ข้อผิดพลาดมาตรฐานของการประมาณการ" นั้นถูกต้องโดยสิ้นเชิงในกรณีนี้เช่นกันจากนั้นจึงใช้การทดสอบทางสถิติตามปกติ


5

เป็นสิ่งสำคัญที่จะต้องพิจารณาว่าประชากรมีความเกี่ยวข้องกับการอนุมาน มันง่ายที่จะมองข้ามแง่มุมเวลาในบริบทนี้

สมมติว่าจุดมุ่งหมายคือการคาดการณ์ GDP สองปีถัดไปสำหรับแต่ละประเทศในโลก จากนั้นจำนวนประชากรที่น่าสนใจคือชุดของคู่ของรูปแบบ "ประเทศปี" มันไม่ได้เป็นเพียง "ทุกประเทศ" และแม้ว่ารูปแบบการคาดการณ์ได้รับการประเมินโดยการถดถอยของข้อมูลปีปัจจุบันและที่ผ่านมาสำหรับแต่ละประเทศนั่นไม่ได้หมายความว่าจะมีการรวมจำนวนประชากรที่น่าสนใจทั้งหมด

หากหนึ่งเริ่มต้นจากชุดข้อมูลที่สมบูรณ์สำหรับประชากรที่น่าสนใจทั้งหมดแล้วสิ่งหนึ่งที่สามารถทำได้คือการคำนวณสถิติสรุป นั่นอาจรวมถึงการเบี่ยงเบนมาตรฐาน แต่มันจะไม่เหมาะสมที่จะเรียกข้อผิดพลาดมาตรฐานเหล่านี้เนื่องจากคำนั้นเกี่ยวข้องกับการกระจายตัวตัวอย่างในขณะที่ "ตัวอย่าง" เพียงอย่างเดียวในกรณีนี้คือประชากรทั้งหมด


ขอบคุณมาก. เพียงเพื่อให้ชัดเจนยิ่งขึ้นฉันได้อัปเดตคำถามคือ 'ทุกประเทศ' ในกรณีนี้ถือว่าเป็นประชากรทั้งหมดหรือไม่ หากไม่มีนั่นหมายความว่าพวกเขาเป็น 'ตัวอย่าง' จาก 'ประชากรสุดยอด' - สมมติว่ามีหลายล้านประเทศใน 'จักรวาลคู่ขนาน' และ 195 ประเทศบนโลกนั้นมีการกระจายอย่างอิสระและเหมือนกันในหมู่พวกเขาและ สุ่มตัวอย่าง มันเป็นสมมติฐานที่ไกลเกินไปใช่ไหม
Akira Osawa
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.