การกระจายตัวตัวอย่างของสัมประสิทธิ์การถดถอย


11

ก่อนหน้านี้ฉันได้เรียนรู้เกี่ยวกับการสุ่มตัวอย่างการแจกแจงที่ให้ผลลัพธ์ซึ่งมีไว้สำหรับตัวประมาณในแง่ของพารามิเตอร์ที่ไม่รู้จัก ตัวอย่างเช่นสำหรับการแจกแจงตัวอย่างของและในโมเดลการถดถอยเชิงเส้น β 1Yฉัน=βo+β1Xฉัน+εฉันβ^0β^1Yผม=βโอ+β1Xผม+εผม

β^0~ยังไม่มีข้อความ(β0, σ2(1n+x¯2Sxx))
และ
β^1~ยังไม่มีข้อความ(β1, σ2Sxx)

โดยที่Sxx=i=1n(xi2)-nx¯2

แต่ตอนนี้ฉันได้เห็นสิ่งต่อไปนี้ในหนังสือ :

สมมติว่าเราพอดีกับโมเดลโดยกำลังสองน้อยที่สุดในวิธีปกติ พิจารณาการแจกแจงแบบเบย์หลังและเลือกนักบวชเพื่อให้นี่เท่ากับการแจกแจงตัวอย่างแบบปกติทั่วไปนั่นคือ ......

(β0β1)~ยังไม่มีข้อความ2[(β^1β^2), σ^2(nΣผม=1nxผมΣผม=1nxผมΣผม=1nxผม2)-1]

นี่ทำให้ฉันสับสนเพราะ:

  1. ทำไมค่าประมาณปรากฏที่ด้านซ้ายมือ (lhs) ของ 2 นิพจน์แรกและด้านขวามือ (rhs) ของนิพจน์สุดท้าย
  2. ทำไมเบต้าแคปในนิพจน์สุดท้ายจึงมีตัวห้อย 1 และ 2 แทนที่จะเป็น 0 และ 1
  3. สิ่งเหล่านี้เป็นตัวแทนของสิ่งเดียวกันหรือไม่? หากเป็นเช่นนั้นมีใครแสดงให้ฉันเห็นว่าพวกเขามีความเท่าเทียมกันได้อย่างไร ถ้าไม่มีใครช่วยอธิบายความแตกต่างได้ไหม
  4. เป็นกรณีที่การแสดงออกครั้งสุดท้ายคือ "การผกผัน" ของสองคนแรก? ทำไมเมทริกซ์ 2x2 ในนิพจน์สุดท้ายจึงกลับด้านและการประมาณ / พารามิเตอร์ถูกเปลี่ยนจาก rhs lhs? ถ้ามีคนสามารถแสดงให้ฉันเห็นว่าจะได้จากที่หนึ่งไปยังอีกที่หนึ่งได้อย่างไร

คำตอบ:


7

ส่วนนี้เกี่ยวข้องกับคำถามแรกคำถามที่สามและคำถามที่สี่ของคุณ:

มีความแตกต่างพื้นฐานระหว่างสถิติแบบเบย์และสถิติผู้ใช้บ่อย

θ

P(θ|x_)

สิ่งนี้ส่งผลในสิ่งต่าง ๆ ซึ่งมักจะดูคล้าย ๆ กัน แต่ในที่ที่ตัวแปรหนึ่งมอง "ผิดทาง" มองผ่านเลนส์ของอีกทางหนึ่งที่คิดเกี่ยวกับมัน

ดังนั้นโดยพื้นฐานแล้วมันค่อนข้างแตกต่างกันและความจริงที่ว่าสิ่งที่อยู่บน LHS ของอันหนึ่งอยู่บน RHS ของอีกอันหนึ่งนั้นไม่มีอุบัติเหตุ

หากคุณทำงานกับทั้งสองอย่างในไม่ช้ามันก็จะชัดเจนพอสมควร

คำถามที่สองดูเหมือนว่าฉันจะเกี่ยวข้องกับการพิมพ์ผิด

---

คำแถลง "เทียบเท่ากับการแจกตัวอย่างที่พบบ่อยเป็นประจำนั่นคือ": ฉันเอานี่ไปหมายความว่าผู้เขียนระบุการกระจายการสุ่มตัวอย่างเป็นประจำ ฉันอ่านผิดหรือเปล่า

มีสองสิ่งที่เกิดขึ้นที่นั่น - พวกเขาแสดงบางสิ่งบางอย่างอย่างหลวม ๆ (ผู้คนทำสิ่งที่แสดงออกเกินปกติแบบนี้ตลอดเวลา) และฉันคิดว่าคุณก็ตีความมันแตกต่างจากจุดประสงค์เช่นกัน

แล้วนิพจน์ที่พวกเขาให้นั้นหมายถึงอะไรกันแน่?

หวังว่าการอภิปรายด้านล่างจะช่วยให้เข้าใจชัดเจนขึ้น

หากคุณสามารถให้การอ้างอิง (pref. ออนไลน์ขณะที่ฉันไม่มีการเข้าถึงห้องสมุดที่ดี) ที่ได้รับการแสดงออกนี้ฉันจะขอบคุณ

มันตามมาจากที่นี่:

http://en.wikipedia.org/wiki/Bayesian_linear_regression

βσ2

เหตุผลก็คือหลังผู้เข้าร่วมจึงเป็นสัดส่วนกับโอกาสและช่วงเวลาที่สร้างขึ้นจากผู้โพสต์ในพารามิเตอร์ที่ตรงกับช่วงความมั่นใจบ่อยสำหรับพารามิเตอร์

คุณอาจพบว่าหน้าแรก ๆที่นี่มีประโยชน์เช่นกัน


ขอบคุณสิ่งนี้มีประโยชน์ ฉันทำสถิติแบบเบย์เล็กน้อยแล้ว ฉันยังคงสับสนอยู่บ้างเนื่องจากคำว่า "เทียบเท่ากับการแจกแจงตัวอย่างการแจกแจงปกติทั่วไปนั่นคือ" : ฉันใช้นี่เพื่อหมายความว่าผู้เขียนระบุการกระจายการสุ่มตัวอย่างเป็นประจำ ฉันอ่านผิดหรือเปล่า แล้วนิพจน์ที่พวกเขาให้นั้นหมายถึงอะไรกันแน่? หากคุณสามารถให้การอ้างอิง (pref. ออนไลน์ขณะที่ฉันไม่มีการเข้าถึงห้องสมุดที่ดี) ที่ได้รับการแสดงออกนี้ฉันจะขอบคุณ
Joe King

Joe - ดูการแก้ไขของฉันด้านบน
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.