การถดถอยประเภทใดที่จะใช้โดยพิจารณาหนึ่งตัวแปรที่มีขอบเขตสูงสุด?


9

ฉันไม่แน่ใจว่าวิธีการใดที่ใช้ในการสร้างแบบจำลองความสัมพันธ์ระหว่างตัวแปรสองตัว (และ ) ในการทดลองที่อธิบายไว้ดังต่อไปนี้:xy

  • มี 3 ตัวแปร ได้แก่ : ,และy ที่xaimxy
  • ค่าของถูกตั้งค่าเมื่อใช้งานการทดสอบ อย่างไรก็ตามและอาจไม่เท่ากันเสมอไปxaimxxaim
  • สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันระหว่างถึงประมาณ 0.9xaimx
  • สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันระหว่างและน้อยกว่ามาก: ประมาณ 0.5xy
  • yมีค่าสูงสุดที่เป็นไปได้ ( ) ซึ่งไม่สามารถเกินได้ymax
  • แต่ละจุดข้อมูลที่จะได้รับหลังจากการตั้งค่าและการอ่านและy ที่xaimxy

แม้ว่าค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันระหว่างและไม่ดีดูเหมือนว่ามีแนวโน้มที่จะเพิ่มขึ้นด้วยxxyyx

หลังจากทำการวิเคราะห์เชิงเส้นอย่างง่ายของและ (และแปลงหลังเป็นเพื่อที่จะแสดงบนกราฟเดียวกันเช่นเช่น) ทั้งความชัน เป็นบวก แต่ความลาดชันของเป็นมากกว่าที่ฉy=f(x)x=g(y)g1fg1f

มันสมเหตุสมผลไหมที่จะพูดว่าหรือ ? (จะถึงก่อนหน้าในกรณีที่สอง)xmax=f1(ymax)xmax=g(ymax)xmax

เมื่อพิจารณาว่าถูกผูกไว้ด้วยสิ่งใดที่สามารถพูดได้เกี่ยวกับค่าสูงสุดที่เป็นไปได้ของที่สามารถเข้าถึงได้yymaxx

เท่าที่ฉันเข้าใจมันทำให้รู้สึกถึงการถดถอยเชิงเส้นของรูปแบบเมื่อเป็นตัวแปรอิสระและเป็นตัวแปรตาม อย่างไรก็ตามในบริบทนี้ฉันไม่แน่ใจว่ามันสมเหตุสมผลหรือไม่ที่จะพิจารณาว่าเป็นอิสระและขึ้นอยู่กับy=f(x)xyxy

การถดถอยกำลังสองน้อยที่สุดจะเหมาะสมกว่าหรือไม่ มีวิธีอื่นในการพิจารณาว่าค่าใดของสามารถเข้าถึงได้ (และโอกาสใดที่)xmax

(หากเป็นกรณีนี้และดูเหมือนจะไม่เป็นไปตามการแจกแจงแบบปกติเนื่องจากมีความพยายามมากขึ้นในการพยายามเข้าถึงค่าที่สูงกว่าของ )xyx


คุณจะทำอะไรกับความสัมพันธ์นี้ถ้าคุณจะพบมัน? คุณจะทดสอบสมมติฐานหรือสนใจว่ามันมีลักษณะอย่างไร? หากมีจุดข้อมูลจำนวนมากคุณควรพิจารณาตัวแบบที่ไม่ใช่เชิงเส้น
mpiktas

@mpiktas ในที่สุดฉันต้องการทราบว่า x_max เป็นเป้าหมายที่สมเหตุสมผลที่ฉันสามารถพยายามเข้าถึงเป็นประจำ (ไม่ใช่แค่ครั้งเดียว) โดยพิจารณาว่าการเข้าถึงหรือไปด้านบน y_max ทำให้การทดลองเป็นโมฆะ (หมายถึง x = x_min อย่างมีประสิทธิภาพ สำหรับความพยายามนั้น)
บรูโน่

รวมสองน้อยที่สุด (หรือข้อผิดพลาดในตัวแปร) ถดถอยจะแสดงเมื่อความแปรปรวนของจะกลายเป็นขนาดใหญ่เมื่อเทียบกับปีความสัมพันธ์ 90% กับชี้ให้เห็นว่าความแปรปรวนของอาจน้อยพอที่คุณจะสามารถปฏิบัติกับมันได้อย่างปลอดภัยในฐานะตัวแปรอิสระ นี่คือสิ่งที่คุณสามารถตรวจสอบการโพสต์การถดถอยโดยการเปรียบเทียบค่า RMSE เหลือของเทียบกับเพื่อ RMSEs ของเหลือของเมื่อเทียบกับ{} ไม่ว่าจะเป็นเป็นปัญหาหรือไม่ หากคุณเห็นการตัดยอดใน scatterplot ด้วยมันเป็นการพิจารณาที่สำคัญxyxaimxxaimxyxaimymaxxaim
whuber

คำตอบ:


4

ฉันต้องการคะแนนที่สองของ King มันง่ายมากที่จะสงสัยว่าการถดถอยลงบน ('direct regression') และการถดถอยเข้าสู่ ('reverse regression') ควรจะเหมือนกัน อย่างไรก็ตามนี่ไม่ใช่ความจริงทางคณิตศาสตร์หรือเกี่ยวกับการถดถอยที่เกี่ยวข้องกับสถานการณ์ที่คุณกำลังวิเคราะห์ หากคุณพล็อตบนแกนตั้งของกราฟและบนแกนนอนคุณจะเห็นว่าเกิดอะไรขึ้น การถดถอยโดยตรงพบว่าเส้นที่ลดระยะทางแนวตั้งระหว่างจุดข้อมูลและเส้นให้เล็กที่สุดในขณะที่การถดถอยแบบย้อนกลับจะลดระยะทางแนวนอนลง บรรทัดที่ย่อเล็กสุดจะย่อเล็กสุดอีกเส้นถ้าyxxyyxrxy=1.0r_คุณต้องตัดสินใจว่าคุณต้องการอธิบายอะไรและคุณต้องการใช้อะไรเพื่ออธิบาย คำตอบสำหรับคำถามนั้นให้คุณว่าตัวแปรคือและและระบุรูปแบบของคุณ นอกจากนี้ (ตาม @King อีกครั้ง) ฉันไม่เห็นด้วยกับการพยายามพูดด้วยเหตุผลเดียวกัน yxxmax=f1(ymax)

เกี่ยวกับปัญหาของตัวแปรที่ล้อมรอบโดยปกติแล้วเป็นไปได้ว่าจำนวน 'ของจริง' อาจสูงกว่านี้ได้ แต่คุณไม่สามารถวัดได้ ตัวอย่างเช่นเทอร์โมมิเตอร์ด้านนอกออกไปนอกหน้าต่างของฉันสูงถึง 120 แต่อาจเป็น 140 ภายนอกในบางสถานที่และคุณจะมีเพียง 120 เท่าสำหรับการวัดของคุณ ดังนั้นตัวแปรจะมีขอบเขตด้านบน แต่สิ่งที่คุณต้องการคิดจริงๆไม่ได้ หากเป็นกรณีนี้จะมีโมเดลtobitสำหรับสถานการณ์เช่นนี้

อีกวิธีหนึ่งคือการใช้สิ่งที่แข็งแกร่งกว่าเช่นเหลืองซึ่งอาจเพียงพอสำหรับความต้องการของคุณ


ขออภัยในความล่าช้าฉันไม่ได้สังเกตคำตอบของคุณ ฉันจะต้องอ่านเกี่ยวกับโมเดล Tobit
Bruno

ไม่มีปัญหา. สำหรับข้อมูลเพิ่มเติมเกี่ยวกับลักษณะของการถดถอย (เมื่อเทียบกับการถดถอยกลับ) ดูที่นี่ สำหรับความช่วยเหลือบาง w / การประยุกต์ใช้การถดถอยบิทใช้ลองซอฟต์แวร์ต่างๆที่นี่
gung - Reinstate Monica

3

ประการแรกฉันไม่คิดว่ามันสมเหตุสมผลที่จะพูดที่นี่ซึ่งหมายความว่ามันเป็นฟังก์ชั่นแบบหนึ่งต่อหนึ่งแม้ว่าจะอธิบายโดยตัวแปรที่ไม่ได้รับการตรวจสอบอื่น ๆxmax=f1(ymax)xmax

ประการที่สองมันขึ้นอยู่กับบริบทที่หนึ่งที่จะถือว่าเป็นตัวแปรอิสระหรือขึ้นอยู่กับ จากประสบการณ์ของฉันเว้นแต่ทฤษฎีแนะนำอย่างยิ่งทางเดียว; ทั้งสองวิธีก็โอเค จากความคิดเห็นของคุณในวันที่ 7 ตุลาคมดูเหมือนว่าจะขึ้นอยู่กับในขณะที่เป็นอิสระxy

ถ้าเป็นไปได้ดูที่เศษเหลือและดูว่าคุณสามารถบีบอะไรออกมาได้ไหม อาจมีตัวแปรอื่นที่คุณลืม หรืออาจช่วยในการแปลงตัวแปรของคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.