จะประเมินความดีของแบบที่ไม่เชิงเส้นได้อย่างไร [ปิด]


10

ฉันมีรูปแบบไม่เชิงเส้นโดยที่Φคือ cdf ของการแจกแจงแบบปกติมาตรฐานและ f เป็นแบบไม่เชิงเส้น (ดูด้านล่าง) ฉันต้องการทดสอบความดีพอดีของโมเดลนี้ด้วยพารามิเตอร์aต่อข้อมูลของฉัน( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x n , y n )y=Φ(f(x,a))+εΦa(x1,y1),(x2,y2),,(xn,yn)หลังจากที่มีการใช้ในการประมาณค่าความน่าจะเป็นสูงสุดที่จะหา การทดสอบที่เหมาะสมจะเป็นอย่างไร ฉันต้องการใช้การทดสอบนี้เพื่อติดป้ายกำกับข้อมูลไม่ดีพอและระบุว่าควรรวบรวมข้อมูลเพิ่มเติมหรือไม่a

ผมมองในการใช้อันซ์ซึ่งเปรียบเทียบรุ่นนี้กับรุ่นอิ่มตัวที่มีของการทดสอบของความดีของพอดีสอดคล้องกันโดยใช้กระจาย สิ่งนี้จะเหมาะสมหรือไม่ สิ่งที่ฉันได้อ่านเกี่ยวกับความเบี่ยงเบนส่วนใหญ่นั้นนำไปใช้กับ GLMs ซึ่งไม่ใช่สิ่งที่ฉันมี หากการทดสอบแบบเบี่ยงเบนมีความเหมาะสมสมมติฐานใดที่จำเป็นต้องมีเพื่อให้การทดสอบมีผลχn12

อัปเดต: สำหรับx>1,a>0ในกรณีนี้ช่วยได้f=x1ax2+1x>1,a>0


1
y=Φ(f(x,a)+ε)y=Φ(f(x,a))+εε

ขอบคุณ ฉันได้ชี้แจงคำถามของฉัน ฉันรู้ว่าไม่มีคำตอบที่ดีที่สุดอย่างไรก็ตามฉันยังต้องการทราบว่าการเบี่ยงเบนเหมาะสมสำหรับการทดสอบความดีพอดีที่นี่หรือไม่ถ้าไม่ใช่การทดสอบอื่นที่เหมาะสมสำหรับการทำเครื่องหมายว่าเหมาะสมหรือไม่ แย่มากและบอกว่าต้องมีการรวบรวมข้อมูลเพิ่มเติม (สมมติว่าแบบจำลองนั้นถูกต้อง) หรือบอกว่าแบบจำลองไม่ได้อธิบายข้อมูล
spadequack

1
y0,1p(y=1)=Φ(f(x,a))y=0y=1p(y=1)=y¯หรือความเบี่ยงเบนหรือทางเลือกอื่น ๆ ถ้าอย่างหลัง, การกระจายแบบไหนที่คุณสมมุติว่าเป็นส่วนที่เหลือ?
jbowman

1
การลงคะแนนเป็นปิดเนื่องจากคำขอให้ชี้แจงไม่ได้รับคำตอบ
whuber

คำตอบ:


1

ใช้แพ็คเกจ "npcmstest" ในไลบรารี "NP" หากคุณใช้แพลตฟอร์ม R คำเตือน: ฟังก์ชั่นอาจใช้เวลาหลายนาทีในการประเมินโมเดลของคุณ

นอกจากนี้คุณยังสามารถพิจารณาการเปรียบเทียบข้อมูลการกระจายการตอบสนองและการทำนายเชิงพยากรณ์ (เช่น KL divergence, cross-entropy เป็นต้น)


lmglmf

@ คุณใช้gamหรือไม่ชอบ ( mgcvแพ็คเกจ)? ถ้าไม่คุณควรตรวจสอบ
suncoolsu

1

นี่คือวิธีที่ฉันจะทำมันโดยทั่วไปแล้วการทดสอบอัตราส่วนความน่าจะเป็น แต่จำไว้ว่าพวกเขา "สำคัญ" ในการทำความเข้าใจความดีของการทดสอบแบบพอดีคือการทำความเข้าใจกับชั้นของทางเลือกที่คุณกำลังทดสอบกับ ตอนนี้เรามีโอกาสสำหรับจุดข้อมูลแต่ละจุดดังนี้:

p(yi|xi,a,I)=g(ϵi)=g(yifi)

g(ϵ)fi=xi1axi2+1xia(xi,yi)afi=yiχ2g(ϵ)xj,yjyia


1
O(n)

0

ในบริบทการถดถอยเชิงเส้นความดีของการทดสอบแบบพอดีมักจะดำเนินการกับทางเลือกที่ซับซ้อนกว่า คุณมีการถดถอยเชิงเส้น - ใช้คำพหุนามเพื่อทดสอบว่ารูปแบบเชิงเส้นเพียงพอหรือไม่ ตั้งแต่คุณมีรูปแบบการทำงานเชิงทางเลือกที่มีความซับซ้อนที่คุณจะต้องพิจารณาจะต้องเป็นที่ของการถดถอยไม่ใช่ตัวแปร ฉันจะไม่พยายามให้คำแนะนำในหัวข้อนี้เนื่องจากต้องใช้ความคิดของตัวเองและมันก็คุ้มค่ากับการแนะนำที่เหมาะสมแยกต่างหาก สำหรับการทดสอบการถดถอยเชิงพารามิเตอร์เทียบกับการถดถอยแบบไม่มีพารามิเตอร์Wooldridge (1992)หรือHardle and Mammen (1993)พวกเขาทำสิ่งที่คล้ายกันมาก Hardle ยังเขียนหนังสือยอดเยี่ยมในหัวข้อ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.