การถดถอยของผลลัพธ์ (อัตราส่วนหรือเศษส่วน) ระหว่าง 0 และ 1


41

ผมคิดว่าการสร้างแบบจำลองการคาดการณ์อัตราส่วน/ที่และ> 0และB > 0 ดังนั้นอัตราส่วนจะอยู่ระหว่าง0และ1a/baba>0b>001

ฉันสามารถใช้การถดถอยเชิงเส้นแม้ว่ามันจะไม่ได้ จำกัด อยู่ที่ 0..1 ฉันไม่มีเหตุผลที่จะเชื่อว่าความสัมพันธ์นั้นเป็นเส้นตรง แต่แน่นอนว่ามันมักจะถูกนำมาใช้เป็นโมเดลแรกง่ายๆ

ฉันสามารถใช้การถดถอยโลจิสติกได้แม้ว่าโดยปกติจะใช้ในการทำนายความน่าจะเป็นของผลลัพธ์แบบสองสถานะไม่ใช่เพื่อทำนายค่าต่อเนื่องจากช่วง 0..1

หากไม่รู้อะไรเพิ่มเติมคุณจะใช้การถดถอยเชิงเส้นการถดถอยโลจิสติกหรือตัวเลือกที่ซ่อนอยู่cหรือไม่?


4
คุณถือว่าการถดถอยเบต้าหรือไม่
Peter Flom - Reinstate Monica

ขอบคุณมากสำหรับทุกคนที่ตอบ ฉันจะต้องศึกษาและเลือก เสียงเหมือนเบต้าเป็นสถานที่ที่เหมาะสมในการเริ่มต้นโดยเฉพาะอย่างยิ่งถ้าฉันสามารถสังเกตแบบที่ดี (อาจจะด้วยตา)
dfrankow

ฉันเคยเห็นสิ่งนี้ทำโดยใช้ GLM (ฟังก์ชั่นการเชื่อมโยงปัวซอง) ตัวเศษaจะเป็นข้อมูลการนับ (ผลลัพธ์) และตัวส่วนbจะเป็นตัวแปรออฟเซ็ต จากนั้นคุณจะต้องแยกและค่าสำหรับแต่ละเรื่อง / สังเกต ฉันไม่แน่ใจว่านี่เป็นตัวเลือกที่ถูกต้องที่สุดหรือไม่ ฉันพบตัวเลือกการกระจายเบต้าที่น่าสนใจซึ่งเป็นสิ่งที่ฉันไม่เคยได้ยินมาก่อน อย่างไรก็ตามฉันพบว่ามันยากที่จะเข้าใจว่าเป็นนักสถิติ
MegPophealth

ขอขอบคุณทุกท่านสำหรับการวิเคราะห์เชิงลึกและมีประโยชน์ของฉันฉันกำลังเผชิญกับความท้าทายที่เหมือนกัน แต่แทนที่จะทำนายช่วงอัตราส่วนต่อเนื่องระหว่าง 0-1 ฉันต้องการสร้างแบบจำลองการถดถอยเพื่อทำนายช่วงอรรถประโยชน์ของผู้ป่วยระหว่าง -1 และ 1. มันค่อนข้างยุ่งยากฉันไม่สามารถหาฟังก์ชั่นการเชื่อมโยงใด ๆ ที่เหมาะสมในการสร้างแบบจำลองการถดถอยที่มีช่วงการพึ่งพาอย่างต่อเนื่องระหว่าง -1 ถึง 1 ดังนั้นพวกคุณแค่อยากรู้ว่าจะทำอะไรได้บ้าง ขอขอบคุณ

1
y(y+1)/2[0,1]

คำตอบ:


34

คุณควรเลือก "hidden options c" โดยที่ c คือการถดถอยเบต้า นี่คือประเภทของรูปแบบการถดถอยที่เหมาะสมเมื่อตัวแปรตอบสนองกระจายเป็นเบต้า คุณสามารถคิดว่ามันเป็นคล้ายกับโมเดลเชิงเส้นตรงทั่วไป มันคือสิ่งที่คุณกำลังมองหา มีแพ็คเกจที่Rเรียกว่าbetaregซึ่งเกี่ยวข้องกับสิ่งนี้ ฉันไม่รู้ว่าคุณใช้Rหรือไม่แม้ว่าคุณจะไม่สามารถอ่าน 'vignettes' ได้พวกเขาจะให้ข้อมูลทั่วไปเกี่ยวกับหัวข้อเพิ่มเติมนอกเหนือจากวิธีการนำไปใช้R(ซึ่งคุณไม่ต้องการ กรณีนั้น)


aba/b

ความเป็นไปได้อีกอย่างคือการใช้การถดถอยเชิงเส้นหากอัตราส่วนสามารถแปลงเพื่อให้ตรงกับสมมติฐานของตัวแบบเชิงเส้นมาตรฐานแม้ว่าฉันจะไม่ได้มองโลกในแง่ดีเกี่ยวกับการใช้งานจริง


1
คุณจะอธิบายเพิ่มเติมหรือไม่ว่าเหตุใดการถดถอยแบบเบต้าจึงเป็นที่นิยมในกรณีนี้ นั่นเป็นข้อเสนอแนะที่ฉันเห็นบ่อยครั้งที่นี่ แต่ฉันไม่เห็นว่ามีใครอธิบายเกี่ยวกับเหตุผลอย่างแท้จริง - นั่นน่าจะดีนะ!
แมตต์ปาร์กเกอร์

4
p

3
ฉันจะระมัดระวังในการบอกว่าเบต้าคือ "การกระจาย" ที่เหมาะสมในการใช้ มีความยืดหยุ่นพอสมควรและอาจเหมาะสม แต่ไม่ครอบคลุมทุกกรณี ดังนั้นในขณะที่มันเป็นข้อเสนอแนะที่ดีและอาจเป็นสิ่งที่พวกเขาต้องการ - คุณไม่สามารถพูดได้จริง ๆ ว่ามันเป็นการกระจายที่เหมาะสมเพียงอย่างเดียวเนื่องจากความจริงที่ว่ามันเป็นการตอบสนองอย่างต่อเนื่องระหว่าง 0 ถึง 1
Dason

1
การแจกแจงสามเหลี่ยมบน [0,1] หมายถึงการกระจายอย่างต่อเนื่องตามสัดส่วนที่ไม่ใช่เบต้า อาจมีคนอื่นอีกมากมาย เบต้าเป็นครอบครัวที่ยืดหยุ่น แต่ก็ไม่มีอะไรวิเศษเกี่ยวกับมัน คุณสร้างจุดที่ดีเกี่ยวกับการถดถอยโลจิสติกเพราะมันถูกนำไปใช้กับข้อมูลไบนารี
Michael Chernick

2
บางทีฉันควรพยายามที่จะดื้อดึงน้อยลง สิ่งที่ฉันหมายถึงคือคุณตรวจสอบ DV ของคุณและใช้การกระจายดังต่อไปนี้ จริงมีการแจกแจงอื่น ๆ ของสัดส่วนอย่างต่อเนื่อง ในทางเทคนิค Beta คืออัตราส่วนของแกมม่ามากกว่าผลรวมของมัน + แกมม่าอื่น ในสถานการณ์ที่กำหนดการกระจายที่แตกต่างอาจเหนือกว่า เช่นเบต้าไม่สามารถรับค่า 0 หรือ 1 เท่านั้น (0, 1) อย่างไรก็ตามเบต้านั้นเป็นที่เข้าใจกันดีและมีความยืดหยุ่นสูงโดยมีเพียง 2 พารามิเตอร์เพื่อให้เหมาะสม ฉันยืนยันว่าเมื่อจัดการกับ DV ที่มีสัดส่วนต่อเนื่องโดยปกติแล้วเป็นจุดเริ่มต้นที่ดีที่สุด
gung - Reinstate Monica

2

เป็นตัวอย่างที่จับคู่หรือสองประชากรอิสระหรือไม่

XiXiMiXiMi

การสกัดกั้นของคุณของการถดถอยนี้จะเป็น log (B) และความชันของคุณจะเป็น log (อัตราส่วน)

ดูเพิ่มเติมได้ที่นี่:

Beyene J, Moineddin R. วิธีการสำหรับการประมาณช่วงความมั่นใจของพารามิเตอร์อัตราส่วนกับแอปพลิเคชันเพื่อระบุตำแหน่ง วิธีการวิจัยทางการแพทย์ของ BMC 2005 5 (1): 32

แก้ไข: ฉันได้เขียนส่วนเสริม SPSS เพื่อทำสิ่งนี้ ฉันสามารถแบ่งปันได้ถ้าคุณสนใจ


1
คุณใช้วิธีใดบ้าง (delta, Fieller หรือ GLM) มันฆ่าฉันเล็กน้อยที่บทความ BMC ไม่ได้ทำการจำลองบางอย่างเกี่ยวกับความครอบคลุมของตัวประมาณที่แตกต่างกัน (แม้ว่าจะฝันถึงการจำลองที่เหมือนจริงจะน่ารำคาญ) ฉันได้รับการเตือนเพราะเมื่อเร็ว ๆ นี้ฉันพบเอกสารที่ใช้วิธีเดลต้า (โดยไม่มีเหตุผลจริง) แม้ว่าจะอ้างถึงบทความ BMC
Andy W

1
ย้อนกลับไปเมื่อฉันเขียนความคิดเห็นนี้ฉันใช้REGRESSIONหลังจากบันทึกการแปลงข้อมูล GLMตั้งแต่นั้นมาผมได้เขียนเป็นรุ่นที่มีความซับซ้อนมากขึ้นว่าการใช้งาน ฉันจัดการกับการวัดการปล่อยแสงและการทดสอบของฉันชี้ให้เห็นว่าการถดถอยของแกมม่าด้วยล็อกลิงค์นั้นมีความเสี่ยงน้อยที่สุดต่อความไม่แน่นอนของพารามิเตอร์ สำหรับข้อมูลจริงของฉันส่วนใหญ่คำตอบจากการใช้งานปกติลบทวินามและแกมม่าที่มีล็อกลิงค์นั้นคล้ายกันมาก (อย่างน้อยก็แม่นยำฉันต้องการ)
DocBuckets

0

Xii=1,2,..,kkp1pp=exp(x)[1+exp(x)]x


p

2
-1 ฉันเห็นด้วยกับ @amoeba ฉันงงงวยว่าทำไมสิ่งนี้ถึงถูกล้มเลิก มันไม่ได้มีผลกับคำถามซึ่งไม่ได้สมมติว่าข้อมูลไบนารี่เป็น 0 หรือ 1 แต่จะเน้นไปที่สัดส่วนที่วัดได้ซึ่งอยู่ระหว่าง 0 ถึง 1
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.