ฉันใช้แพ็คเกจquantregเพื่อสร้างแบบจำลองการถดถอยโดยใช้เปอร์เซ็นไทล์ที่ 99 ของค่าของฉันในชุดข้อมูล ตามคำแนะนำจากคำถาม stackoverflow ก่อนหน้านี้ที่ฉันถามฉันใช้โครงสร้างรหัสต่อไปนี้
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
ซึ่งฉันแสดงพล็อตที่ด้านบนของข้อมูลของฉัน ฉันวางแผนเรื่องนี้โดยใช้ ggplot2 โดยมีค่าอัลฟาสำหรับจุด ฉันคิดว่าหางของการแจกแจงของฉันไม่ได้รับการพิจารณาอย่างเพียงพอในการวิเคราะห์ของฉัน บางทีนี่อาจเป็นเพราะความจริงที่ว่ามีแต่ละจุดที่ถูกละเว้นโดยการวัดประเภทเปอร์เซ็นไทล์
หนึ่งในความคิดเห็นที่แนะนำว่า
บทความสั้นรวมถึงส่วนที่เกี่ยวกับการถดถอยเชิงเส้นไม่เชิงเส้นและรุ่นที่มีเส้นโค้งเรียบ
จากคำถามก่อนหน้านี้ฉันถือว่าความสัมพันธ์ลอการิทึม แต่ฉันไม่แน่ใจว่าถูกต้องหรือไม่ ฉันคิดว่าฉันสามารถแยกคะแนนทั้งหมดในช่วงเวลาเปอร์เซ็นไทล์ที่ 99 แล้วตรวจสอบแยกกัน แต่ฉันไม่แน่ใจว่าจะทำอย่างไรหรือว่าเป็นวิธีที่ดี ฉันขอขอบคุณคำแนะนำเกี่ยวกับวิธีปรับปรุงการระบุความสัมพันธ์นี้