รูปร่างของความมั่นใจและการทำนายระยะเวลาสำหรับการถดถอยแบบไม่เชิงเส้น


13

ความเชื่อมั่นและการคาดคะเนรอบ ๆ การถดถอยแบบไม่เชิงเส้นควรจะสมมาตรรอบ ๆ เส้นการถดถอยหรือไม่? ความหมายพวกเขาไม่ได้ใช้รูปทรงแก้วชั่วโมงเหมือนในกรณีของแถบสำหรับการถดถอยเชิงเส้น ทำไมถึงเป็นอย่างนั้น?

นี่คือตัวอย่างของคำถาม:
นี่คือรูป:

F(x)=(AD1+(xC)B)+D

http://i57.tinypic.com/2q099ok.jpg

และนี่คือสมการ:

ป้อนคำอธิบายรูปภาพที่นี่


คำถามของคุณไม่ชัดเจนเพราะคุณเปลี่ยนจากการถามว่าพวกเขา "ควรจะสมมาตร" ในประโยคที่ 1 เพื่อแสดงว่าพวกเขาไม่ได้อยู่ในประโยคที่ 2 และถาม (สมมุติ) ว่าทำไมพวกเขาถึงไม่อยู่ในประโยคที่ 3 นี้สอดคล้องกัน / ชัดเจนมากขึ้น?
gung - Reinstate Monica

ตกลงให้ฉันถามด้วยวิธีนี้ - ทำไมความมั่นใจและการคาดคะเนของแถบสมมาตรรอบเส้นถดถอยเมื่อการถดถอยไม่เชิงเส้น แต่ใช้รูปร่างชั่วโมงแก้วเมื่อมันเป็นเส้นตรง?
Serge

00

คุณพูดถูก วงดนตรีจะข้ามเข้าไปในดินแดนเชิงลบ อย่างไรก็ตามฉันไม่สนใจค่าของแบนด์เอง แต่ค่อนข้างจะอยู่ในค่า EC50 ที่สอดคล้องกับขีด จำกัด แบนด์ มีทางเลือกอื่นในการสร้างวงดนตรีด้วยวิธีนี้หรือไม่?
Serge

ใช่ แต่เมื่อฉันสนิทสนมพวกเขาจะซับซ้อน วิธีกำลังสองน้อยที่สุดทั่วไปและอนุกรมเวลาสามารถรับมือกับความสัมพันธ์แบบอนุกรม การแปลงแบบไม่เชิงเส้นของตัวแปรตามเป็นเครื่องมือหนึ่งในการจัดการข้อผิดพลาดที่ไม่ใช่แบบบวก เครื่องมือที่ซับซ้อนยิ่งขึ้นคือโมเดลเชิงเส้นทั่วไป ตัวเลือกขึ้นอยู่กับลักษณะของตัวแปรตาม BTW แม้ว่าฉันจะไม่แน่ใจว่าคุณหมายถึงอะไรด้วย "ค่า EC50" (ดูเหมือนว่าคุณกำลังสร้างแบบจำลองความสัมพันธ์การตอบสนองต่อปริมาณรังสี) แต่สิ่งที่คำนวณได้จากแถบภาพจะเป็นที่น่าสงสัย
whuber

คำตอบ:


8

โดยทั่วไปแล้วแถบความเชื่อมั่นและการคาดการณ์ควรจะกว้างขึ้นใกล้กับจุดสิ้นสุดและด้วยเหตุผลเดียวกับที่พวกเขาทำเช่นนั้นในการถดถอยปกติ โดยทั่วไปความไม่แน่นอนของพารามิเตอร์นำไปสู่ช่วงเวลาที่กว้างขึ้นใกล้กับจุดสิ้นสุดมากกว่าตรงกลาง

คุณสามารถเห็นสิ่งนี้ได้โดยการจำลองอย่างง่ายดายเพียงพอโดยการจำลองข้อมูลจากแบบจำลองที่กำหนดหรือโดยการจำลองจากการแจกแจงการสุ่มตัวอย่างของเวกเตอร์พารามิเตอร์

การคำนวณตามปกติ (ประมาณถูกต้อง) ที่ทำเพื่อการถดถอยแบบไม่เชิงเส้นนั้นเกี่ยวข้องกับการประมาณค่าเชิงเส้นในท้องถิ่น

อย่างไรก็ตามการคำนวณตามจริงนั้นเป็นเรื่องไม่สำคัญและอาจเป็นไปได้ว่าโปรแกรมอาจใช้ทางลัดในการคำนวณซึ่งจะไม่สนใจผลกระทบนั้น อาจเป็นไปได้ว่าสำหรับข้อมูลบางตัวและบางรุ่นเอฟเฟกต์มีขนาดค่อนข้างเล็กและมองเห็นยาก แน่นอนด้วยช่วงการทำนายโดยเฉพาะอย่างยิ่งกับความแปรปรวนขนาดใหญ่ แต่ข้อมูลจำนวนมากบางครั้งก็ยากที่จะเห็นเส้นโค้งในการถดถอยเชิงเส้นปกติ - พวกเขาสามารถดูเกือบจะตรงและมันค่อนข้างง่ายที่จะแยกแยะความแตกต่างจากความตรง

นี่คือตัวอย่างของวิธีที่ยากที่จะเห็นเพียงแค่ช่วงความมั่นใจสำหรับค่าเฉลี่ย (ช่วงการคาดการณ์อาจยากกว่าที่จะมองเห็นเพราะความแปรปรวนแบบสัมพัทธ์ของพวกมันน้อยกว่ามาก) นี่คือข้อมูลบางส่วนและกำลังสองน้อยที่สุดแบบไม่เชิงเส้นพร้อมช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยประชากร (ในกรณีนี้เกิดจากการกระจายตัวตัวอย่างเนื่องจากฉันรู้ว่าแบบจำลองที่แท้จริง แต่สิ่งที่คล้ายกันมากสามารถทำได้โดยการประมาณ asymptotic

ป้อนคำอธิบายรูปภาพที่นี่

ขอบเขตสีม่วงดูเกือบจะขนานกับการทำนายสีน้ำเงิน ... แต่ไม่ใช่ นี่คือข้อผิดพลาดมาตรฐานของการกระจายตัวตัวอย่างของการทำนายค่าเฉลี่ยเหล่านั้น:

ป้อนคำอธิบายรูปภาพที่นี่

ซึ่งเห็นได้ชัดว่าไม่คงที่


แก้ไข:

นิพจน์ "sp" ที่คุณเพิ่งโพสต์นั้นมาจากช่วงการคาดคะเนสำหรับการถดถอยเชิงเส้น !


คุณยังบอกด้วยว่าการเพิ่มขึ้นของความไม่แน่นอนของพารามิเตอร์เมื่อเคลื่อนห่างจากศูนย์กลางควรทำให้วงขยายในตอนท้ายแม้ในกรณีของการถดถอยแบบไม่เชิงเส้น แต่มันไม่ชัดเจนหรือไม่? หรือมีเหตุผลทางทฤษฎีว่าทำไมการขยับขยายนี้ไม่ได้เกิดขึ้นในกรณีของการถดถอยแบบไม่เชิงเส้น? วงของฉันดูสมมาตรมากอย่างแน่นอน
Serge

1
ขยับขยายที่จะเกิดขึ้นควรจะปกติ แต่มันจะไม่เกิดขึ้นในลักษณะเดียวกันกับรูปแบบไม่เชิงเส้นทุกคนและจะไม่เป็นที่ชัดเจนกับทุกรูปแบบและเพราะมันไม่ได้เป็นเรื่องง่ายที่จะทำอาจจะไม่ได้คำนวณว่าวิธีโดยโปรแกรมที่กำหนด ฉันไม่ทราบวิธีคำนวณวงที่คุณดู - ฉันไม่ใช่ผู้อ่านใจและฉันไม่เห็นรหัสของโปรแกรมที่คุณไม่ได้พูดถึงชื่อ
Glen_b -Reinstate Monica

@ user1505202 ยังคงเป็นคำถามที่ตอบยาก คุณสามารถระบุว่าโมเดลของคุณคืออะไร (รูปแบบการทำงาน) คุณสามารถแนบรูปภาพของรูปที่น่างงงวยกับคุณได้ไหม?
gung - Reinstate Monica

1
ขอบคุณ ฉันมีตัวเลขและพวกมันคงที่ - ความแตกต่างระหว่างเส้นการถดถอยและขีด จำกัด การทำนายแต่ละช่วงมีค่าตั้งแต่ 18.21074 ตรงกลางถึง 18.24877 ที่ปลาย ดังนั้นการขยับเล็กน้อยเล็กน้อย แต่เล็กน้อยมาก @gung ฉันได้สมการที่คำนวณช่วงการทำนาย มันคือ:Y-hat +/- sp(Y-hat)
Serge

1
นั่นคือเกี่ยวกับการเรียงลำดับของการเปลี่ยนแปลงที่คุณอาจเห็นด้วยช่วงเวลาการทำนายด้วยตัวอย่างมากมาย sp คืออะไร
Glen_b -Reinstate Monica

5

คณิตศาสตร์ของความเชื่อมั่นในการคำนวณและแถบการทำนายของเส้นโค้งที่เหมาะสมโดยการถดถอยแบบไม่เชิงเส้นได้อธิบายไว้ในหน้า Cross-Validated นี้ มันแสดงให้เห็นว่าวงดนตรีไม่ได้เสมอ / มักจะสมมาตร

และนี่คือคำอธิบายที่มีคำมากขึ้นและคณิตศาสตร์น้อยลง:

ก่อนอื่นเรามากำหนด G | x ซึ่งเป็นการไล่ระดับของพารามิเตอร์ที่ค่าเฉพาะของ X และใช้ค่าที่เหมาะสมที่สุดของพารามิเตอร์ ผลลัพธ์คือเวกเตอร์โดยมีหนึ่งองค์ประกอบต่อพารามิเตอร์ สำหรับแต่ละพารามิเตอร์จะถูกกำหนดเป็น dY / dP โดยที่ Y คือค่า Y ของเส้นโค้งที่ให้ค่าเฉพาะของ X และค่าพารามิเตอร์ที่ดีที่สุดและ P เป็นหนึ่งในพารามิเตอร์)

G '| x เป็นเวกเตอร์ไล่ระดับสีที่ถูกย้ายดังนั้นจึงเป็นคอลัมน์แทนที่จะเป็นแถวของค่า Cov เป็นเมทริกซ์ความแปรปรวนร่วม (inversed Hessian จากการทำซ้ำครั้งล่าสุด) มันเป็นเมทริกซ์จตุรัสที่มีจำนวนแถวและคอลัมน์เท่ากับจำนวนพารามิเตอร์ แต่ละรายการในเมทริกซ์คือความแปรปรวนร่วมระหว่างสองพารามิเตอร์ เราใช้ Cov เพื่ออ้างถึงเมทริกซ์ความแปรปรวนร่วมแบบปกติซึ่งค่าแต่ละค่าอยู่ระหว่าง -1 ถึง 1

ตอนนี้คำนวณ

c = G '| x * Cov * G | x

ผลลัพธ์จะเป็นตัวเลขเดี่ยวสำหรับค่าใด ๆ ของ X

แถบความมั่นใจและการคาดคะเนจะอยู่กึ่งกลางของเส้นโค้งที่พอดีที่สุดและขยายส่วนบนและด้านล่างของเส้นโค้งในปริมาณที่เท่ากัน

แถบความมั่นใจขยายออกไปด้านบนและด้านล่างของเส้นโค้งโดย:

= sqrt (c) * sqrt (SS / DF) * CriticalT (Confidence%, DF)

แถบคาดคะเนจะขยายระยะห่างออกไปอีกด้านบนและด้านล่างของโค้งเท่ากับ:

= sqrt (c + 1) * sqrt (SS / DF) * CriticalT (Confidence%, DF)

ในสมการทั้งสองนี้ค่าของ c (กำหนดไว้ด้านบน) ขึ้นอยู่กับค่าของ X ดังนั้นความเชื่อมั่นและแถบการทำนายจึงไม่ได้อยู่ห่างจากเส้นโค้งคงที่ ค่าของ SS คือผลรวมของกำลังสองสำหรับความพอดีและ DF คือจำนวนองศาอิสระ (จำนวนจุดข้อมูลลบด้วยจำนวนพารามิเตอร์) CriticalT เป็นค่าคงที่จากการแจกแจงค่า t ตามระดับความเชื่อมั่นที่คุณต้องการ (ตามธรรมเนียม 95%) และจำนวนองศาอิสระ สำหรับขีด จำกัด 95% และ df ที่ค่อนข้างใหญ่ค่านี้จะใกล้เคียงกับ 1.96 หาก DF มีขนาดเล็กค่านี้จะสูงกว่า


ขอบคุณฮาร์วีย์ ฉันกำลังหาค่าความชันของพารามิเตอร์สำหรับฟังก์ชั่นของฉัน คุณมีโอกาสที่จะรู้ตัวอย่างการทำงานหรือไม่เพราะฉันไม่ชัดเจนว่าเมทริกซ์ความแปรปรวนร่วมนั้นเป็นอย่างไร
Serge

หากคุณใช้การสาธิต GraphPad Prism คุณสามารถใส่ข้อมูลให้ตรงกับโมเดลที่คุณต้องการและดูเมทริกซ์ความแปรปรวนร่วม (ผลลัพธ์ที่เลือกได้ซึ่งเลือกในแท็บการวินิจฉัย) และแถบความเชื่อมั่นหรือการทำนาย (ทั้งตัวเลขและกราฟ; แท็บการวินิจฉัย) นั่นคือไม่ได้ค่อนข้างดีเป็นตัวอย่างที่ทำงาน แต่อย่างน้อยคุณสามารถเปรียบเทียบเมทริกซ์ความแปรปรวนและดูว่าปัญหาคือก่อนหรือหลัง ...
ฮาร์วีย์ Motulsky

แม้ว่าสองสิ่ง 1. ปริซึมให้เมทริกซ์ Cov แก่ฉัน อย่างไรก็ตามมันเป็นเพียงหมายเลขเดียวสำหรับชุดข้อมูลทั้งหมด ฉันไม่ควรได้รับหนึ่งค่าต่อค่า X หรือไม่? 2. ฉันได้รับแถบการทำนายในกราฟ แต่ฉันต้องการให้เอาท์พุทมีค่า ปริซึมดูเหมือนจะไม่ทำเช่นนั้น ฉันใหม่สำหรับ Prism และฉันอาจไม่ได้ดูทุกที่ แต่ฉันได้ลอง!
Serge

1. เมทริกซ์ความแปรปรวนร่วมแสดงระดับที่พารามิเตอร์ถูกพันกัน ดังนั้นจึงมีค่าหนึ่งค่าสำหรับพารามิเตอร์ทุกคู่ที่คุณขอให้การถดถอยแบบไม่เชิงเส้นให้พอดี 2. ดูที่แท็บ Range เพื่อขอให้ Prism สร้างตารางพิกัด XY ของเส้นโค้งโดยมีค่าบวก / ลบสำหรับความเชื่อมั่นหรือแถบคาดคะเน 3. สำหรับการสนับสนุนด้านเทคนิคกับ Prism ให้ส่งอีเมลไปที่ support@graphpad.com ใช้ฟอรัมนี้สำหรับคำถามเชิงสถิติไม่ใช่การสนับสนุนทางเทคนิค
Harvey Motulsky
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.