ทีต้าในการถดถอยแบบทวินามลบด้วย R คืออะไร?


26

ฉันมีคำถามเกี่ยวกับการถดถอยแบบทวินามลบ: สมมติว่าคุณมีคำสั่งต่อไปนี้:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(โปรดทราบว่ารถยนต์เป็นชุดข้อมูลที่มีอยู่ใน R และฉันไม่สนใจว่ารุ่นนี้เหมาะสมหรือไม่)

สิ่งที่ฉันอยากรู้คือฉันจะตีความตัวแปรได้อย่างไรtheta(ส่งคืนที่ด้านล่างของการเรียกไปยังsummary) นี่คือพารามิเตอร์รูปร่างของการแจกแจงแบบเนกกิ้นและเป็นไปได้หรือไม่ที่จะตีความว่าเป็นการวัดความเบ้


บทสรุปของสิ่งMASSบอกว่าเป็นที่นี่
Scortchi - Reinstate Monica

คำตอบ:


17

ใช่thetaเป็นพารามิเตอร์รูปร่างของการแจกแจงแบบทวินามลบและไม่คุณไม่สามารถตีความได้ว่าเป็นการวัดความเบ้ อย่างแม่นยำมากขึ้น:

  • ความเบ้จะขึ้นอยู่กับมูลค่าของthetaแต่ก็ขึ้นอยู่กับค่าเฉลี่ยด้วย
  • ไม่มีคุณค่าthetaที่จะรับประกันว่าคุณขาดความเบ้

ถ้าฉันไม่ทำให้มันยุ่งเหยิงในmu/ thetaparametrization ที่ใช้ในการลบทวินามลบความเบ้

SkอีW(ยังไม่มีข้อความB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

ในบริบทนี้มักถูกตีความว่าเป็นการวัดการกระจายตัวมากเกินไปเกี่ยวกับการแจกแจงปัวซอง ความแปรปรวนของทวินามลบคือดังนั้นควบคุมความแปรปรวนส่วนเกินจริง ๆ เมื่อเปรียบเทียบกับปัวซอง (ซึ่งจะเป็น ) ไม่ใช่ความเบ้μ + μ 2 / θ θ μθμ+μ2/θθμ


ขอบคุณมาก! นี่เป็นความช่วยเหลือที่ดี ... แต่: ฉันจะตีความค่าของ theta ที่สูงหรือต่ำได้อย่างไร ในหนังสือ McCaullaughs โมเดลเชิงเส้นทั่วไปมีลิงก์ไปยังบทความนี้จาก anscombe เพื่อทำการตีความ k แต่น่าเสียดายที่ฉันไม่ได้รับมันจริงๆ กระดาษเป็นclaremontmckenna.edu/facultysites/math/FacMember/MOneill/...
MarkDollar

คุณต้องอ่านหน้าแรก ดังนั้น theta (หรือ k ใน anscombe) จึงเป็นพารามิเตอร์รูปร่างของการแจกแจงเนกบินและมันจะจัดการถ้าการแจกแจงนั้นใกล้กับแกมม่า (k -> 0) หรือปัวซอง (k -> อินฟินิตี้) แต่มันหมายถึงอะไรที่เหมาะสม? ฉันจะตีความทีต้าสำหรับการประมาณค่ารถยนต์ได้อย่างไร
MarkDollar

33

ฉันถูกอ้างอิงถึงไซต์นี้โดยหนึ่งในนักเรียนของฉันในหลักสูตรการนับแบบจำลองข้อมูลของฉัน ดูเหมือนจะมีข้อมูลที่ผิดมากมายเกี่ยวกับตัวแบบทวินามลบและโดยเฉพาะอย่างยิ่งเกี่ยวกับสถิติการกระจายตัวและพารามิเตอร์การกระจายตัว

μglmglm.nb θ

glm.nbglmμ+μ2θμ+αμ2glm.nbglmglm.nbเห็นได้ชัดว่าความสัมพันธ์ทางอ้อมจาก McCullagh & Nelder แต่ Nelder (ซึ่งเป็นผู้ร่วมก่อตั้ง GLM ในปี 1972) ได้เขียนระบบ kk ของเขาเสริมไปยัง Genstat ในปี 1993 ซึ่งเขาแย้งว่าความสัมพันธ์โดยตรงเป็นที่ต้องการ เขาและภรรยาของเขาเคยเยี่ยมฉันและครอบครัวของฉันเกี่ยวกับทุก ๆ ปีในแอริโซนาเริ่มต้นในต้นปี 1993 จนถึงปีก่อนที่เขาจะตาย เราพูดถึงเรื่องนี้อย่างละเอียดถี่ถ้วนเนื่องจากฉันได้ใส่ความสัมพันธ์โดยตรงลงในโปรแกรม glm ที่ฉันเขียนในปลายปี 1992 สำหรับซอฟต์แวร์ Stata และ Xplore และสำหรับแมโคร SAS ในปี 1994

nbinomialαθnbinomial


2
φโอโวลต์(β^)=φ(XTŴ^X)-1θμθ"รูปร่าง" - หลังที่ฉันไม่พบว่าไม่มีเหตุผลเพราะมันมีผลต่อรูปร่างอย่างแน่นอน
Momo

ช่วงของทีต้าคืออะไร? ทีต้าจะต้องมีค่ามากกว่าหนึ่งหรือไม่?
News_is_Selection_Bias

2

glm การอ้างอิงทวินามเชิงลบ: ป้อนคำอธิบายรูปภาพที่นี่

วิกิพีเดียลบทวินาม 'r' คือ 'ทีต้า' ของ glm ซึ่งแปลว่า glm 'ทีต้า' คือพารามิเตอร์รูปร่าง ในเงื่อนไขอย่างง่าย glm's 'theta' คือจำนวนความล้มเหลว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.