คำถามติดแท็ก quantile-regression

การถดถอยเชิงควอนไทล์ช่วยให้เราสามารถประมาณผลของชุดของตัวแปรทำนายในการแจกแจงทั้งหมดของตัวแปรผลลัพธ์หรือควอนไทล์ใด ๆ

2
การถดถอยเชิงปริมาณแบบมีเงื่อนไขและไม่มีเงื่อนไขแตกต่างกันอย่างไร
ตัวประมาณการถดถอยเชิงควอนไทลตามเงื่อนไขโดย Koenker และ Basset (1978) สำหรับ quantile ถูกกำหนดเป็น โดยที่\ rho_ \ tau = u_i \ cdot (\ tau - 1 (u_i <0))เป็นฟังก์ชันการถ่วงน้ำหนักอีกครั้ง (เรียกว่า "ตรวจสอบ" - หน้าที่) ของเหลือu_iτt hτth\tau^{th} ρτ=Uฉัน⋅(τ-1(Uฉัน<0))Uฉันβˆคิวอาร์= นาทีขΣi = 1nρτ( yผม- X'ผมขτ)β^QR=minb∑i=1nρτ(yi−Xi′bτ) \widehat{\beta}_{QR} = \min_{b} \sum^{n}_{i=1} \rho_\tau (y_i - X'_i b_\tau) ρτ= uผม⋅ ( τ- 1 ( คุณผม< …

1
Quantile regression: ข้อผิดพลาดมาตรฐานใด
summary.rqฟังก์ชั่นจากบทความ quantregให้ความหลากหลายของตัวเลือกสำหรับการประมาณการข้อผิดพลาดมาตรฐานของสัมประสิทธิ์การถดถอย quantile สถานการณ์พิเศษอะไรบ้างที่แต่ละสถานการณ์มีความเหมาะสมที่สุด "อันดับ" ซึ่งสร้างช่วงความเชื่อมั่นสำหรับพารามิเตอร์ที่ประเมินโดยการคว่ำการทดสอบยศตามที่อธิบายไว้ใน Koenker (1994) ตัวเลือกเริ่มต้นจะถือว่าความผิดพลาดคือ iid ในขณะที่ตัวเลือก iid = FALSE ใช้ข้อเสนอของ Koenker Machado (1999) ดูเอกสารประกอบสำหรับ rq.fit.br สำหรับข้อโต้แย้งเพิ่มเติม "iid" ซึ่งสันนิษฐานว่าข้อผิดพลาดคือ iid และคำนวณการประมาณค่าเมทริกซ์ความแปรปรวนร่วมแบบ asymptotic เช่นเดียวกับใน KB (1978) "nid" ซึ่งทึกทักท้องถิ่น (เป็นเอกภาพ) เป็นเชิงเส้น (ใน x) ของฟังก์ชั่นที่เป็นเงื่อนไขและคำนวณคำนวณแซนวิชฮิวเบอร์โดยใช้ประมาณการท้องถิ่นของกระจัดกระจาย "เคอร์" ซึ่งใช้การประเมินเคอร์เนลของแซนด์วิชตามที่เสนอโดย Powell (1990) "boot" ซึ่งใช้หนึ่งในหลาย ๆ ทางเลือกในการบู๊ตที่เป็นไปได้เพื่อประเมินข้อผิดพลาดมาตรฐาน ฉันได้อ่านเอกสารเชิงประจักษ์อย่างน้อย 20 เรื่องซึ่งมีการนำไปใช้ในชุดเวลาหรือมิติตัดขวางและไม่เคยเห็นการกล่าวถึงตัวเลือกข้อผิดพลาดมาตรฐาน

1
มีแผนการวินิจฉัยอะไรบ้างสำหรับการถดถอยแบบควอไทล์
ตามคำถามของฉันสำหรับ OLSฉันสงสัยว่ามีแผนการวินิจฉัยอะไรบ้างสำหรับการถดถอยแบบควอไทล์ (และมีการนำไปปฏิบัติของพวกเขาหรือไม่?) การค้นหา google อย่างรวดเร็วได้เกิดขึ้นกับตัวหนอน (ซึ่งฉันไม่เคยได้ยินมาก่อน) และฉันยินดีที่จะรู้วิธีการเพิ่มเติมที่คุณอาจรู้ (เป็นหนึ่งในนั้นจาก OLS พอร์ตสำหรับ quantile-regression?)

2
การถดถอยแบบควอไทล์อย่างไร“ ทำงาน”?
ฉันหวังว่าจะได้คำอธิบายที่เข้าใจง่ายและเข้าถึงได้ของการถดถอยเชิงปริมาณ สมมติว่าฉันมีชุดข้อมูลผลลัพธ์และตัวทำนายอย่างง่ายYYYX1,X2X1,X2X_1, X_2 ตัวอย่างเช่นถ้าฉันใช้การถดถอยแบบควอไทล์ที่. 25, .5, .75 และกลับมา .β0,.25,β1,.25...β2,.75β0,.25,β1,.25...β2,.75\beta_{0,.25},\beta_{1,.25}...\beta_{2,.75} เป็นค่าพบโดยเพียงแค่สั่งค่านิยมและการดำเนินการถดถอยเชิงเส้นขึ้นอยู่กับตัวอย่างซึ่งอยู่ที่ใกล้ / quantile ที่กำหนดหรือไม่ββ\betayyy หรือตัวอย่างทั้งหมดมีส่วนร่วมในการประมาณโดยมีน้ำหนักจากมากไปหาน้อยเมื่อระยะห่างจากควอนไทล์เพิ่มขึ้น?ββ\beta หรือมันเป็นสิ่งที่แตกต่างอย่างสิ้นเชิง? ฉันยังไม่พบคำอธิบายที่สามารถเข้าถึงได้

2
Quantile regression: Function loss
ฉันกำลังพยายามทำความเข้าใจกับการถดถอยเชิงปริมาณ แต่สิ่งหนึ่งที่ทำให้ฉันต้องทนทุกข์คือทางเลือกของฟังก์ชั่นการสูญเสีย ρτ(u)=u(τ−1{u&lt;0})ρτ(u)=u(τ−1{u&lt;0})\rho_\tau(u) = u(\tau-1_{\{u<0\}}) ฉันรู้ว่าความคาดหวังขั้นต่ำของเท่ากับ -quantile แต่อะไรคือเหตุผลเชิงสัญชาตญาณที่จะเริ่มต้นด้วยฟังก์ชั่นนี้? ฉันไม่เห็นความสัมพันธ์ระหว่างการลดฟังก์ชั่นนี้และควอนไทล์ ใครสามารถอธิบายให้ฉันได้ไหมτρτ(y−u)ρτ(y−u)\rho_\tau(y-u)τ%τ%\tau\%

2
มีสิ่งใดบ้างที่เป็นการปรับ
เมื่อรวมโมเดลการถดถอยเชิงปริมาณในกระดาษผู้วิจารณ์ต้องการให้ฉันรวมปรับปรุงแล้วลงในกระดาษ ฉันได้คำนวณหลอก - s (จากKoenker และกระดาษ JASA ของปี 1999 ของ Machado ) สำหรับสามปริมาณที่น่าสนใจสำหรับการศึกษาของฉันR2R2R^2R2R2R^2 อย่างไรก็ตามฉันไม่เคยได้ยินการปรับสำหรับการถดถอยแบบควอไทล์และไม่รู้จะคำนวณได้อย่างไร ฉันขอให้คุณทำอย่างใดอย่างหนึ่งต่อไปนี้:R2R2R^2 เด่นกว่า: สูตรหรือวิธีการเกี่ยวกับวิธีการคำนวณปรับปรุงแล้วสำหรับการถดถอยเชิงปริมาณR2R2R^2 อีกทางเลือกหนึ่ง: ข้อโต้แย้งที่น่าเชื่อเพื่อให้ผู้ตรวจสอบทราบว่าทำไมไม่มีสิ่งนั้นในฐานะปรับแล้วในการถดถอยเชิงปริมาณR2R2R^2

5
การถดถอยเชิงปริมาณเมื่อใดที่แย่กว่า OLS
นอกเหนือจากสถานการณ์เฉพาะบางอย่างที่เราต้องเข้าใจความสัมพันธ์ที่มีเงื่อนไขอย่างมีเงื่อนไขแล้วสถานการณ์ใดที่นักวิจัยควรเลือก OLS เหนือ Quantile Regression ฉันไม่ต้องการคำตอบว่า "ถ้าไม่มีประโยชน์ในการทำความเข้าใจความสัมพันธ์ท้าย" เพราะเราสามารถใช้การถดถอยแบบมัธยฐานแทน OLS

2
R-squared ในการถดถอยแบบควอไทล์
ฉันใช้การถดถอยเชิงปริมาณเพื่อหาตัวทำนาย 90 เปอร์เซ็นต์ของข้อมูลของฉัน ฉันกำลังทำสิ่งนี้ใน R โดยใช้quantregแพ็คเกจ ฉันจะกำหนดr2r2r^2สำหรับการถดถอยแบบควอไทล์ซึ่งจะบ่งบอกความแปรปรวนของตัวแปรทำนายได้เท่าใด สิ่งที่ฉันอยากรู้: "วิธีใดที่ฉันสามารถใช้เพื่อค้นหาว่ามีการอธิบายความแปรปรวนมากแค่ไหน" ระดับนัยสำคัญโดยค่า P summary(rq(formula,tau,data))มีให้บริการในผลลัพธ์ของคำสั่ง: ฉันจะได้รับความดีของความพอดีได้อย่างไร

3
วรรณกรรมเกี่ยวกับการถดถอยแบบควอนไทล์ IV
ในช่วงหลายเดือนที่ผ่านมาฉันได้อ่านอย่างละเอียดเกี่ยวกับการถดถอยเชิงปริมาณเพื่อเตรียมสำหรับวิทยานิพนธ์ปริญญาโทของฉันในฤดูร้อนนี้ โดยเฉพาะฉันได้อ่านหนังสือของ Roger Koenker 2005 ส่วนใหญ่ในหัวข้อ ตอนนี้ฉันต้องการที่จะขยายความรู้ที่มีอยู่นี้เพื่อเทคนิคการถดถอยเชิงปริมาณที่อนุญาตให้ตัวแปรเครื่องมือ (IV) นี่ดูเหมือนจะเป็นงานวิจัยที่กำลังเติบโตอย่างรวดเร็ว อาจมีคนแนะนำให้ฉัน: เอกสารหรือวรรณกรรมอื่น ๆ เกี่ยวกับการถดถอยเชิงปริมาณ IV ภาพรวมสั้น ๆ ของเทคนิคทางสถิติที่แตกต่างกันเหล่านี้ ข้อดีข้อเสียของเทคนิคต่าง ๆ ฉันกำลังมองหาวรรณกรรมเพื่อให้ฉันเริ่มต้นและมีภาพรวมที่ดีของสิ่งที่มีอยู่ ดังนั้นประเด็นแรกคือสิ่งที่สำคัญ ที่สองและสามจะดีที่มี! ความสนใจของฉันยังอยู่ที่วิธีการแบบตัดขวางเป็นหลัก แต่ก็ยินดีต้อนรับวิธีการแบบแผง ขอบคุณล่วงหน้า.

3
อะไรคือข้อดีของการถดถอยเชิงเส้นมากกว่าการถดถอยเชิงปริมาณ
ตัวแบบการถดถอยเชิงเส้นทำให้เกิดข้อสันนิษฐานว่าการถดถอยเชิงปริมาณไม่ได้และถ้าพบว่าการถดถอยเชิงเส้นเป็นไปตามสัญชาตญาณของฉัน (และประสบการณ์บางอย่างที่ จำกัด มาก) ก็คือการถดถอยแบบมัธยฐานจะให้ผลลัพธ์เกือบเหมือนการถดถอยเชิงเส้น การถดถอยเชิงเส้นมีข้อดีอย่างไร มันเป็นที่คุ้นเคยมากขึ้น แต่นอกเหนือจากนั้น?

2
ประสิทธิภาพของตัวแบบในการสร้างแบบจำลองควอไทล์
ฉันใช้การถดถอยแบบควอไทล์ (เช่นผ่านgbmหรือquantregใน R) - ไม่ได้มุ่งเน้นไปที่ค่ามัธยฐาน แต่แทนที่จะเป็นควอไทล์บน (เช่น 75) มาจากพื้นหลังการสร้างแบบจำลองการคาดการณ์ฉันต้องการวัดความเหมาะสมของแบบจำลองในชุดทดสอบและสามารถอธิบายสิ่งนี้กับผู้ใช้ทางธุรกิจ คำถามของฉันเป็นอย่างไร ในการตั้งค่าทั่วไปที่มีเป้าหมายต่อเนื่องฉันสามารถทำสิ่งต่อไปนี้: คำนวณ RMSE โดยรวม จัดทำชุดข้อมูลตามค่าที่ทำนายและเปรียบเทียบค่าเฉลี่ยจริงกับค่าเฉลี่ยที่คาดการณ์ในแต่ละช่วง เป็นต้น สิ่งที่สามารถทำได้ในกรณีนี้ที่ไม่มีมูลค่าจริง (ฉันไม่คิดว่าอย่างน้อย) เพื่อเปรียบเทียบการทำนายกับ? นี่คือตัวอย่างรหัส: install.packages("quantreg") library(quantreg) install.packages("gbm") library(gbm) data("barro") trainIndx&lt;-sample(1:nrow(barro),size=round(nrow(barro)*0.7),replace=FALSE) train&lt;-barro[trainIndx,] valid&lt;-barro[-trainIndx,] modGBM&lt;-gbm(y.net~., # formula data=train, # dataset distribution=list(name="quantile",alpha=0.75), # see the help for other choices n.trees=5000, # number of trees shrinkage=0.005, # shrinkage …

2
อธิบายการถดถอยเชิงควอนตัมให้กับผู้ที่ไม่ใช่นักสถิติ
ฉันเพิ่งส่งบทความซึ่งฉันใช้การถดถอยเชิงปริมาณเพื่อวารสารจิตวิทยา แม้ว่าฉันคิดว่าฉันได้ใส่ความคิดที่เพียงพอในการอธิบายการถดถอยเชิงปริมาณอย่างชัดเจนแล้วผู้ตรวจสอบขอคำอธิบายที่ดีขึ้นเกี่ยวกับเทคนิคการถดถอยเชิงปริมาณที่คุ้นเคยกับการถดถอย OLS มาตรฐานเท่านั้น ดังนั้นวิธีที่ดีที่สุดในการอธิบายการถดถอยเชิงปริมาณในบทความเชิงประจักษ์สำหรับนักสถิติที่ไม่ใช่คืออะไร?

2
การทำนายการถดถอยแบบเชิงปริมาณ
ฉันสนใจที่จะใช้การถดถอยเชิงปริมาณสำหรับแบบจำลองบางส่วนของฉัน แต่ต้องการที่จะชี้แจงให้ชัดเจนเกี่ยวกับสิ่งที่ฉันสามารถทำได้โดยใช้วิธีการนี้ ฉันเข้าใจว่าฉันสามารถได้รับการวิเคราะห์ที่แข็งแกร่งยิ่งขึ้นของความสัมพันธ์ IV / DV โดยเฉพาะอย่างยิ่งเมื่อต้องเผชิญกับค่าผิดปกติและ heteroscedasticity แต่ในกรณีของฉันการมุ่งเน้นไปที่การทำนาย โดยเฉพาะอย่างยิ่งฉันสนใจที่จะปรับปรุงแบบจำลองของฉันโดยไม่ต้องหันไปใช้แบบจำลองที่ไม่ใช่เชิงเส้นที่ซับซ้อนมากขึ้นหรือแม้แต่การถดถอยเชิงเส้นแบบชิ้นเล็ก ๆ ที่การทำนายมันเป็นไปได้หรือไม่ที่จะเลือกผลลัพธ์ความน่าจะเป็นที่มากที่สุดโดยใช้ค่าของตัวทำนาย? กล่าวอีกนัยหนึ่งเป็นไปได้หรือไม่ที่จะกำหนดความน่าจะเป็นแบบควอนไทล์ของผลลัพธ์ที่คาดการณ์ไว้แต่ละตัวตามค่าของตัวทำนาย

2
วิธีแก้ค่าเบี่ยงเบนสัมบูรณ์อย่างน้อยที่สุดด้วยวิธีซิมเพล็กซ์?
argminwL(w)=∑ni=1|yi−wTx|arg⁡minwL(w)=∑i=1n|yi−wTx| \underset{\textbf{w}}{\arg\min} L(w)=\sum_{i=1}^{n}|y_{i}-\textbf{w}^T\textbf{x}| min∑ni=1uimin∑i=1nui\min \sum_{i=1}^{n}u_{i} ui≥xTw−yii=1,…,nui≥xTw−yii=1,…,nu_i \geq \textbf{x}^T\textbf{w}- y_{i} \; i = 1,\ldots,n ui≥−(xTw−yi)i=1,…,nui≥−(xTw−yi)i=1,…,nu_i \geq -\left(\textbf{x}^T\textbf{w}-y_{i}\right) \; i = 1,\ldots,n แต่ฉันไม่มีความคิดที่จะแก้มันทีละขั้นตอนเพราะฉันเป็นมือใหม่ที่ LP คุณมีความคิดใด ๆ ขอบคุณล่วงหน้า! แก้ไข: นี่คือขั้นตอนล่าสุดที่ฉันได้มาถึงปัญหานี้ ฉันพยายามที่จะแก้ปัญหาตามหมายเหตุนี้: ขั้นตอนที่ 1: กำหนดเป็นรูปแบบมาตรฐาน minZ=∑ni=1uiminZ=∑i=1nui\min Z=\sum_{i=1}^{n}u_{i} xTw−ui+s1=yii=1,…,nxTw−ui+s1=yii=1,…,n \textbf{x}^T\textbf{w} -u_i+s_1=y_{i} \; i = 1,\ldots,n xTw+ui+s2=−yii=1,…,nxTw+ui+s2=−yii=1,…,n \textbf{x}^T\textbf{w} +u_i+s_2=-y_{i} \; i = 1,\ldots,n ภายใต้s1≥0;s2≥0;ui≥0 i=1,...,ns1≥0;s2≥0;ui≥0 i=1,...,ns_1 …

1
Logistic quantile regression - วิธีการถ่ายทอดผลลัพธ์
ในโพสต์ก่อนหน้านี้ฉันสงสัยว่าจะจัดการกับคะแนน EQ-5D ได้อย่างไร เมื่อเร็ว ๆ นี้ฉันได้พบกับการถดถอยเชิงปริมาณของโลจิสติกส์ที่Bottai และ McKeownแนะนำซึ่งนำเสนอวิธีการที่ยอดเยี่ยมในการจัดการกับผลลัพธ์ที่ถูกผูกไว้ สูตรง่าย: l o gฉันt ( y) = l o g( y- ym ฉันnYm a x- y)logit(y)=log(y−yminymax−y)logit(y)=log(\frac{y-y_{min}}{y_{max}-y}) เพื่อหลีกเลี่ยงการเข้าสู่ระบบ (0) และการหารด้วย 0 คุณขยายช่วงโดยมีค่าขนาดเล็กεสิ่งนี้ทำให้สภาพแวดล้อมที่เคารพขอบเขตของคะแนนεϵ\epsilon ปัญหาคือว่าใด ๆจะอยู่ในขนาด logit และที่ไม่ได้ทำให้รู้สึกใด ๆ เว้นแต่เปลี่ยนกลับเข้าสู่ระดับปกติ แต่นั่นหมายความว่าβจะไม่เชิงเส้น สำหรับจุดประสงค์ในการสร้างกราฟสิ่งนี้ไม่สำคัญ แต่ไม่ได้มีมากกว่าβ : s สิ่งนี้จะไม่สะดวกมากββ\betaββ\betaββ\beta คำถามของฉัน: คุณแนะนำให้รายงาน logit โดยไม่รายงานการขยายเต็มได้อย่างไรββ\beta ตัวอย่างการนำไปปฏิบัติ สำหรับการทดสอบการใช้งานฉันได้เขียนแบบจำลองโดยใช้ฟังก์ชั่นพื้นฐานนี้: outcome=β0+β1∗xtest3+β2∗sexoutcome=β0+β1∗xtest3+β2∗sexoutcome=\beta_0+\beta_1* xtest^3+\beta_2*sex β0=0β0=0\beta_0 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.