R-squared ในการถดถอยแบบควอไทล์


21

ฉันใช้การถดถอยเชิงปริมาณเพื่อหาตัวทำนาย 90 เปอร์เซ็นต์ของข้อมูลของฉัน ฉันกำลังทำสิ่งนี้ใน R โดยใช้quantregแพ็คเกจ ฉันจะกำหนดr2สำหรับการถดถอยแบบควอไทล์ซึ่งจะบ่งบอกความแปรปรวนของตัวแปรทำนายได้เท่าใด

สิ่งที่ฉันอยากรู้: "วิธีใดที่ฉันสามารถใช้เพื่อค้นหาว่ามีการอธิบายความแปรปรวนมากแค่ไหน" ระดับนัยสำคัญโดยค่า P summary(rq(formula,tau,data))มีให้บริการในผลลัพธ์ของคำสั่ง: ฉันจะได้รับความดีของความพอดีได้อย่างไร


7
R2ไม่เกี่ยวข้องกับการถดถอยเชิงปริมาณ
whuber

@whuber: วิธีอื่นใดที่ฉันสามารถใช้เพื่อค้นหาว่ามีการอธิบายความแปรปรวนเท่าไร
rnso

2
นั่นจะเป็นสิ่งที่ดีที่จะถามในเนื้อความของคำถามของคุณแทนที่จะฝังไว้ในความคิดเห็น! "อธิบายความแปรปรวน" (ตามที่วัดได้ในแง่ของความแปรปรวนต่อไป) เป็นหลักแนวคิดกำลังสองน้อยที่สุด บางทีสิ่งที่คุณต้องการคือการวัดความสำคัญทางสถิติที่เหมาะสมหรือความดีที่เหมาะสม
whuber

สำหรับรูปของบุญใด ๆ ที่คุณต้องพิจารณาสิ่งที่จะเป็นผลงานที่ดีสิ่งที่จะมีประสิทธิภาพไม่ดีและสิ่งที่จะไม่เกี่ยวข้อง ยกตัวอย่างเช่นไม่มีการวิพากษ์วิจารณ์ของเปอร์เซ็นไทล์ที่ 90 ถ้านั่นเป็นตัวพยากรณ์หมัดของเปอร์เซ็นไทล์ที่ 10 เกณฑ์มาตรฐานของคุณอาจเป็นสิ่งที่คุณอาจใช้หากคุณไม่ได้ใช้การถดถอยเชิงปริมาณ หากตัวทำนายของคุณต่อเนื่องนั่นอาจยากที่จะนิยาม
Nick Cox

1
@whuber: ฉันได้เพิ่มว่าในส่วนของคำถาม ระดับความสำคัญโดยค่า P มีอยู่ในเอาต์พุตสรุป (rq (สูตร tau ข้อมูล)) ฉันจะได้รับความดีของความพอดีได้อย่างไร
rnso

คำตอบ:


23

Koenker และ Machado [ 1 ]อธิบายR 1ซึ่งเป็นมาตรวัดความดีของร่างกายในระดับที่เหมาะสม ( τ ) quantile[1]R1τ

Let V(τ)=minbρτ(yixib)

ให้β ( τ )และ~ β ( τ )เป็นประมาณการค่าสัมประสิทธิ์สำหรับรูปแบบเต็มรูปแบบและรูปแบบที่ จำกัด และให้Vและ~ Vเป็นที่สอดคล้องVเงื่อนไขβ^(τ)β~(τ)V^V~V

พวกเขากำหนดความดีของพอดีเกณฑ์ VR1(τ)=1V^V~

Koenker ให้สำหรับนี่ ,V

rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))

ดังนั้นหากเราคำนวณสำหรับรูปแบบที่มีการสกัดกั้นเท่านั้น ( ~ V - หรือในข้อมูลโค้ดด้านล่าง) แล้วรูปแบบไม่ จำกัด ( V )เราสามารถคำนวณที่ - อย่างน้อย notionally - เหมือนปกติR 2 .VV~V0V^R1 <- 1-Vhat/V0R2

แก้ไข: ในกรณีของคุณแน่นอนอาร์กิวเมนต์ที่สองซึ่งจะใส่ในตำแหน่งที่f$tauอยู่ในการเรียกในบรรทัดที่สองของรหัสจะเป็นค่าใด ๆ ที่tauคุณใช้ ค่าในบรรทัดแรกเป็นเพียงการตั้งค่าเริ่มต้น

'การอธิบายความแปรปรวนเกี่ยวกับค่าเฉลี่ย' ไม่ใช่สิ่งที่คุณกำลังทำกับการถดถอยเชิงปริมาณดังนั้นคุณไม่ควรคาดหวังว่าจะมีมาตรการที่เทียบเท่าจริง ๆ

ฉันไม่คิดว่าแนวคิดของแปลได้ดีกับการถดถอยเชิงปริมาณ คุณสามารถกำหนดปริมาณแบบอะนาล็อกที่หลากหลายมากขึ้นหรือน้อยลงได้ที่นี่ แต่ไม่ว่าคุณจะเลือกแบบใดคุณจะไม่มีคุณสมบัติส่วนใหญ่ที่R 2มีอยู่ในการถดถอยแบบ OLS คุณต้องมีความชัดเจนเกี่ยวกับคุณสมบัติที่คุณต้องการและสิ่งที่คุณไม่ต้องการ - ในบางกรณีอาจเป็นไปได้ที่จะมีมาตรการที่ทำในสิ่งที่คุณต้องการR2R2

-

Koenker, R และ Machado, J (1999), ความดีของกระบวนการพอดีและการอนุมานที่เกี่ยวข้องสำหรับการถดถอยเชิงปริมาณ, วารสารสมาคมสถิติอเมริกัน,94: 448, 1296-1310[1]


tau = 0.9 ควรมากกว่า 0.5 หรือไม่?
Dimitriy V. Masterov

ใช่มันควร แต่ถ้าคุณระบุอาร์กิวเมนต์ที่สองที่ถูกต้อง (เช่นเดียวกับในบรรทัดที่สองที่ฉันยกมาข้างต้น) นั่นคือวิธีการทำงาน ค่า 0.5 ในบรรทัดแรกเป็นเพียงอาร์กิวเมนต์เริ่มต้นหากคุณไม่ได้ระบุtauเมื่อคุณเรียกใช้ฟังก์ชัน ฉันจะชี้แจงในโพสต์
Glen_b

@Glen_b ขอบคุณสำหรับคำอธิบาย ยกเว้นกรณีที่ฉันกำลังทำอะไรโง่ V ดูเหมือนจะเป็นผลรวมของการเบี่ยงเบนถ่วงน้ำหนักเกี่ยวกับ quantile ประมาณมากกว่าหลอก 2 R2
Dimitriy V. Masterov

@Dimitriy เอ่อคุณพูดถูกฉันออกอะไรบางอย่าง ฉันจะแก้ไขปัญหานี้ในไม่ช้า
Glen_b -Reinstate Monica

@Dimitriy ฉันคิดว่าฉันได้แก้ไขแล้ว
Glen_b

19

การวัดแบบหลอก - แนะนำโดยKoenker และ Machado (1999)ใน JASA วัดความดีของความพอดีโดยการเปรียบเทียบผลรวมของส่วนเบี่ยงเบนน้ำหนักสำหรับแบบจำลองที่น่าสนใจกับผลรวมเดียวกันจากแบบจำลองที่มีจุดตัดเท่านั้น มันถูกคำนวณเป็นR2

R1(τ)=1yiy^iτ|yiy^i|+yi<y^i(1τ)|yiy^i|yiy¯τ|yiy¯|+yi<y¯i(1τ)|yiy¯|,

y^i=ατ+βτxτiY¯=βτ เป็นค่าติดตั้งจากโมเดลดักจับเท่านั้น

R1(τ) ควรโกหก [0,1]โดยที่ 1 จะสอดคล้องกับขนาดพอดีเนื่องจากตัวเศษซึ่งประกอบด้วยผลรวมถ่วงน้ำหนักของการเบี่ยงเบนจะเป็นศูนย์ มันเป็นตัวชี้วัดของท้องถิ่นสำหรับ QRM เนื่องจากมันขึ้นอยู่กับτซึ่งแตกต่างจากทั่วโลก R2จาก OLS นั่นคือแหล่งที่มาของคำเตือนเกี่ยวกับการใช้งาน: หากคุณทำตัวแบบพอดีกับหางไม่มีการรับประกันว่ามันจะเข้ากันได้ดีกับที่อื่น วิธีการนี้สามารถใช้เปรียบเทียบแบบจำลองที่ซ้อนกันได้

นี่คือตัวอย่างใน R:

library(quantreg)
data(engel)

fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)

rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho

นี่อาจจะทำให้สำเร็จได้อย่างงดงามยิ่งขึ้น


สูตรของคุณแสดงผลไม่ดี หลังจากเครื่องหมายลบเข้าสู่ระบบ: R_1(\tau) = 1 - 􀀀อักขระตัวสุดท้ายเป็นระเบียบบางอย่าง คุณตรวจสอบได้ไหม บางทีคุณอาจวางตัวละครที่ไม่ได้มาตรฐานแทนการใช้เท็กซ์
ทิม

@ เวลาฉันไม่เห็นอะไรแปลก ๆ ไม่ว่าจะใน tex หรือบนหน้าจอ
Dimitriy V. Masterov

ดูเหมือนว่าทั้ง linux และ windows: snag.gy/ZAp5T.jpg
Tim

@Tim กล่องนั้นไม่ตรงกับสิ่งใดดังนั้นจึงสามารถละเว้นได้ ฉันจะพยายามแก้ไขในภายหลังจากเครื่องอื่น
Dimitriy V. Masterov
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.