ทำไมการถดถอยเบต้าไม่สามารถจัดการกับ 0 และ 1 ในตัวแปรตอบกลับได้

การถดถอยแบบเบต้า (เช่น GLM ที่มีการแจกแจงแบบเบต้าและมักจะมีฟังก์ชั่นการเชื่อมโยงแบบ logit) มักจะแนะนำให้จัดการกับการตอบสนองหรือที่เรียกว่าตัวแปรตามค่าระหว่าง 0 และ 1 เช่นเศษส่วนอัตราส่วนหรือความน่าจะเป็น: การถดถอยสำหรับผลลัพธ์ ระหว่าง 0 และ 1

อย่างไรก็ตามมีการอ้างเสมอว่าการถดถอยเบต้าไม่สามารถใช้ได้ทันทีที่ตัวแปรตอบสนองเท่ากับ 0 หรือ 1 อย่างน้อยหนึ่งครั้ง ถ้าไม่จำเป็นต้องใช้ทั้งศูนย์ / รุ่นหนึ่งที่สูงเกินจริงเบต้าหรือทำให้การเปลี่ยนแปลงของการตอบสนองบาง ฯลฯ .: ถดถอยเบต้าของข้อมูลสัดส่วนรวมทั้งที่ 1 และ 0

คำถามของฉันคือคุณสมบัติของการกระจายเบต้าป้องกันการถดถอยเบต้าจากการจัดการกับ 0s และ 1s ที่แน่นอนและเพราะเหตุใด

ฉันเดาว่ามันคือและไม่ได้อยู่ในการสนับสนุนของการกระจายเบต้า แต่สำหรับพารามิเตอร์รูปร่างทั้งหมดและทั้งศูนย์และอีกอันหนึ่งอยู่ในการสนับสนุนการแจกแจงแบบเบต้ามันเป็นเพียงพารามิเตอร์รูปร่างขนาดเล็กที่การกระจายไปที่อนันต์ที่หนึ่งหรือทั้งสองด้าน และบางทีข้อมูลตัวอย่างเป็นเช่นที่และให้เหมาะสมที่สุดทั้งคู่ก็จะเปิดออกเพื่อจะเหนือ1 $0$ $1$ $\alpha>1$ $\beta>1$ $\alpha$ $\beta$ $1$

มันหมายความว่าในบางกรณีเราสามารถใช้การถดถอยแบบเบต้าแม้ว่าจะเป็นศูนย์ / คนก็ตาม

แน่นอนว่าแม้ว่า 0 และ 1 จะอยู่ในการสนับสนุนการแจกแจงเบต้าความน่าจะเป็นที่สังเกต 0 หรือ 1 เป็นศูนย์ แต่ความน่าจะเป็นที่จะสังเกตชุดของค่าที่นับได้อื่น ๆ จึงไม่น่าเป็นปัญหาใช่ไหม (เปรียบเทียบความคิดเห็นนี้โดย @Glen_b)

$\hskip{8em}$

ในบริบทของการถดถอยเบต้าการแจกแจงแบบเบต้าจะแปรตามพารามิเตอร์ที่แตกต่างกัน แต่ด้วยมันควรจะยังคงมีการกำหนดชัดเจนในสำหรับทั้งหมด $\phi=\alpha+\beta>2$ $[0,1]$ $\mu$

— อะมีบาพูดว่า Reinstate Monica
แหล่งที่มา

คำถามที่น่าสนใจ! ฉันไม่มีคำตอบใด ๆ นอกเหนือจากคะแนนที่ทำโดย Kevin Wright ฉันเดาว่าเลขศูนย์และคนที่มีความน่าจะเป็นกรณีทางพยาธิวิทยา (เช่นในการถดถอยโลจิสติก) ดังนั้นจึงไม่น่าสนใจเพราะพวกเขาไม่ควรเกิดขึ้น

— ทิม

@Tim ดีฉันไม่ทราบว่าพวกเขาควรหรือไม่ควรเกิดขึ้น แต่พวกเขาจะเกิดขึ้นบ่อยครั้งมิฉะนั้นคนจะไม่ถามคำถามเกี่ยวกับวิธีการจัดการกับ 0 และ 1 ในการถดถอยเบต้าจะไม่เขียนบทความเกี่ยวกับ 0- และ -1 รุ่นเบต้าที่สูงเกินจริง ฯลฯ อย่างไรก็ตามฉันยังคงหวังคำตอบที่ละเอียดกว่าของเควิน อย่างน้อยก็ควรอธิบายว่าข้อกำหนดเหล่านี้ในบันทึกความเป็นไปได้เกิดขึ้นได้อย่างไร

— อะมีบาพูดว่า Reinstate Monica

อัปเดต: อาจเป็นเพราะถ้า 0 และ 1 อยู่ในการสนับสนุน PDF ที่จุดเหล่านี้เท่ากับศูนย์หมายความว่าโอกาสในการสังเกตค่าเหล่านี้เป็นศูนย์ ฉันยังต้องการดูคำตอบอธิบายอย่างละเอียด

— อะมีบาพูดว่า Reinstate Monica

ดังนั้นการแจกแจงแบบใดที่ควรใช้เมื่อตัวแปรตอบกลับถือว่าค่าเป็น, พูดว่า,

[0, \infty)

$[0, \infty)$

— สับสนใน

คำตอบ:

เพราะ loglikelihood มีทั้งและซึ่งมีมากมายเมื่อหรือ 1ดูสมการ (4) ของ Smithson & Verkuilen, " Squeezer มะนาวที่ดีกว่า - การถดถอยความน่าจะเป็นสูงสุดด้วยตัวแปรพึ่งพาเบต้าแบบกระจาย " (ลิงก์โดยตรงไปยังPDF ) $\log(x)$ $\log(1-x)$ $x=0$ $x=1$

— เควินไรท์
แหล่งที่มา

ขอบคุณ นี่คือการเชื่อมโยงรูปแบบไฟล์ PDF โดยตรงไปยังกระดาษ ฉันเห็นได้ว่าสมการ (4) จะพังทันทีที่

หรือ

แต่ฉันยังไม่เข้าใจว่าทำไมสิ่งนี้เกิดขึ้นในรูปแบบทั่วไปของสิ่งต่าง ๆ

y_{i} = 0

$y_i=0$

y_{i} = 1

$y_i=1$

— อะมีบาพูดว่า Reinstate Monica

(+1) อะมีบาเพียงแค่มองไปที่รูปแบบไฟล์ PDF สำหรับทุกการกระจายเบต้าความหนาแน่นที่

และ

มีทั้ง

หรือ

∞

ไม่ว่าในกรณีใดโอกาสในการบันทึกจะไม่ถูกกำหนด ทันทีที่มีการตอบสนอง

หรือ

เพียงครั้งเดียวค่าทั้งหมดของความน่าจะเป็นเพียงศูนย์อนันต์หรือไม่แน่นอนและจะมีชุดพารามิเตอร์พารามิเตอร์ที่ไม่น่าสนใจซึ่งค่าต่ำสุดของความน่าจะเป็นจะถูกรับรู้ ดังนั้นการคำนวณเชิงปฏิบัติจึงถูก จำกัด และไม่สามารถระบุตัวแบบได้ (ในแง่ที่รุนแรง)

0

$0$

1

$1$

0

$0$

+ \infty

$+\infty$

0

$0$

1

$1$

— whuber

ร่วมกับความคิดเห็นของ @ whuber (ที่ฉันไม่ได้สังเกตจนกระทั่งตอนนี้) นี่เป็นการตอบคำถาม ประเด็นหลักคือสำหรับค่าพารามิเตอร์ที่ฉันถามเกี่ยวกับ

และ

มีโอกาสเป็นศูนย์

0

$0$

1

$1$

— อะมีบาพูดว่า Reinstate Monica

@ เหตุผลที่ฉันสับสนนั่นคือมีความน่าจะเป็นเป็นศูนย์ที่จะสังเกต

แต่ก็มีความน่าจะเป็นศูนย์ที่จะสังเกตว่า

(ลองใช้เบต้ากับ

เพื่อความเป็นรูปธรรม) อย่างไรก็ตาม

สอดคล้องกับโมเดล แต่ไม่ใช่

และเป็นเพราะโอกาสในการสังเกต

ไม่เป็นศูนย์ แต่โอกาสในการสังเกต

คือ ...

0

$0$

0.5

$0.5$

α = β = 2

$\alpha=\beta=2$

0.5

$0.5$

0

$0$

0.5

$0.5$

0

$0$

— อะมีบาพูดว่า Reinstate Monica

@amoeba โอกาสขึ้นอยู่กับความหนาแน่นของความน่าจะเป็นไม่ใช่ความน่าจะเป็นของตัวเอง บางครั้งเราสามารถหลีกเลี่ยงปัญหานี้ได้โดยพิจารณาจากการสังเกตแต่ละครั้งเพื่อรวมความน่าจะเป็นของช่วงเวลาเล็ก ๆ แต่ไม่ จำกัด (ไม่แน่นอน) (กำหนดเช่นโดยความแม่นยำของการวัด) หรือโดยการกระจายเบต้าด้วย Gaussian ที่แคบมาก ซึ่งกำจัดความหนาแน่นเป็นศูนย์และไม่มีที่สิ้นสุด)

— whuber

$log(x)$ $log(1-x)$

$p$ $N$

ด้วยเหตุนี้ในความเข้าใจของฉันเกี่ยวกับการถดถอยเบต้า 0s และ 1s จะสอดคล้องกับผลลัพธ์ที่แน่นอน (ไม่มีที่สิ้นสุด) อย่างแน่นอน

— meduz
แหล่งที่มา