จะเข้าใจเอาต์พุตจากฟังก์ชัน polr ของ R ได้อย่างไร (สั่งการถดถอยโลจิสติก)


26

ฉันกำลังใหม่เพื่อ R polrสั่งการถดถอยโลจิสติกและ

ส่วน "ตัวอย่าง" ที่ด้านล่างของหน้าความช่วยเหลือสำหรับpolr (ที่เหมาะกับรูปแบบการถดถอยโลจิสติกหรือ probit กับการตอบสนองต่อปัจจัยที่สั่งซื้อ) แสดง

options(contrasts = c("contr.treatment", "contr.poly"))
house.plr <- polr(Sat ~ Infl + Type + Cont, weights = Freq, data = housing)
pr <- profile(house.plr)
plot(pr)
pairs(pr)
  • มีข้อมูลอะไรบ้างpr? หน้าความช่วยเหลือในโปรไฟล์เป็นข้อมูลทั่วไปและไม่มีแนวทางสำหรับ polr

  • กำลังplot(pr)แสดงอะไร ฉันเห็นกราฟหกตัว แต่ละคนมีแกน X ที่เป็นตัวเลขแม้ว่าฉลากจะเป็นตัวแปรตัวบ่งชี้ (ดูเหมือนว่าตัวแปรอินพุตที่เป็นตัวบ่งชี้สำหรับค่าลำดับ) จากนั้นแกน Y คือ "เอกภาพ" ซึ่งไม่ได้อธิบายอย่างสมบูรณ์

  • กำลังpairs(pr)แสดงอะไร ดูเหมือนพล็อตสำหรับตัวแปรอินพุตแต่ละคู่ แต่อีกครั้งฉันไม่เห็นคำอธิบายของแกน X หรือ Y

  • เราจะเข้าใจได้อย่างไรว่าตัวแบบให้พอดี? summary(house.plr)แสดง Residual Deviance 3479.149 และ AIC (Akaike Information Criterion?) จาก 3495.149 เป็นสิ่งที่ดีหรือไม่? ในกรณีที่สิ่งเหล่านั้นมีประโยชน์เป็นเพียงมาตรการแบบสัมพัทธ์ (เช่นการเปรียบเทียบกับแบบจำลองอื่น) การวัดแบบสัมบูรณ์ที่ดีคืออะไร ความเบี่ยงเบนที่เหลืออยู่ประมาณไคสแควร์กระจายกันหรือไม่? หนึ่งสามารถใช้ "% ทำนายอย่างถูกต้อง" กับข้อมูลต้นฉบับหรือการตรวจสอบข้ามบางอย่าง? วิธีที่ง่ายที่สุดในการทำเช่นนั้นคืออะไร?

  • มีวิธีการนำไปใช้และตีความanovaในรุ่นนี้อย่างไร เอกสารกล่าวว่า "มีวิธีการสำหรับฟังก์ชั่นการปรับแบบจำลองมาตรฐาน ได้แก่ การคาดการณ์, สรุป, vcov, anova" อย่างไรก็ตามการเรียกใช้anova(house.plr)ผลลัพธ์ในanova is not implemented for a single "polr" object

  • เราตีความค่า t สำหรับสัมประสิทธิ์แต่ละค่าอย่างไร ไม่เหมือนกับรุ่นบางรุ่นที่เหมาะสมไม่มีค่า P ที่นี่

ฉันรู้ว่านี่เป็นคำถามจำนวนมาก แต่มันก็สมเหตุสมผลที่ฉันจะถามเป็นชุดเดียว ("ฉันจะใช้สิ่งนี้ได้อย่างไร") มากกว่า 7 คำถามที่แตกต่างกัน ข้อมูลใด ๆ ที่ชื่นชม


3
@dfrankow ค่อนข้างหยาบและแน่นอนช่วยบางส่วนสองคำถามแรกของคุณ แต่methods("profile")จะให้ (S3 ในกรณีนี้) วิธีการที่เกี่ยวข้องกับprofileวัตถุR แล้วคุณจะเห็นกว่ามีวิธีเฉพาะสำหรับpolrผลลัพธ์ที่คุณสามารถเรียกดู ออนไลน์โดยพิมพ์getAnywhere("profile.polr")ที่พรอมต์ R
chl

1
ขอบคุณ! รหัสที่มาเป็นสิ่งที่ดี คำอธิบายจะดียิ่งขึ้น :)
dfrankow

1
มีคนแนะนำฉันให้กับ "สถิติประยุกต์สมัยใหม่พร้อม S" โดย Venables และ Ripley มาตรา 7.3 มี "ตัวอย่างตารางความถี่สี่ทิศทาง" ที่ครอบคลุมแบบจำลองบ้านหลังนี้อย่างกว้างขวาง กำลังอ่าน ..
dfrankow

อันที่จริงแล้วส่วนคือ "โมเดลอัตราต่อรองแบบเป็นสัดส่วน"
dfrankow

คำตอบ:


17

ฉันขอแนะนำให้คุณมองไปที่หนังสือที่เกี่ยวกับการวิเคราะห์ข้อมูลเด็ดขาด (cf อลันอาเกรสติวิเคราะห์หมวดหมู่ข้อมูล, 2002) สำหรับคำอธิบายที่ดีขึ้นและความเข้าใจในการสั่งซื้อการถดถอยโลจิสติก คำถามทั้งหมดที่คุณถามโดยทั่วไปจะตอบโดยบทไม่กี่บทในหนังสือดังกล่าว หากคุณสนใจเฉพาะRตัวอย่างที่เกี่ยวข้องการขยายตัวแบบเชิงเส้นใน RโดยJulian Faraway (CRC Press, 2008) เป็นข้อมูลอ้างอิงที่ดี

JiYipij=P(Yi=j)j=1,...,Jγij=P(Yij)γiJ=1J1

ตอนนี้เราต้องการที่จะเชื่อมโยงเพื่อตัวแปรxในกรณีของคุณมี 3 ระดับสั่งซื้อ: , , มันสมเหตุสมผลมากกว่าที่จะปฏิบัติต่อพวกเขาตามคำสั่งแทนที่จะสั่งไม่ได้ ตัวแปรที่เหลือคือตัวแปรของคุณ โมเดลเฉพาะที่คุณกำลังพิจารณาคือโมเดลอัตราต่อรองแบบสัดส่วนและเทียบเท่ากับคณิตศาสตร์:γijxSatlowmediumhigh

logit γj(xi)=θjβTxi,j=1J1
where γj(xi)=P(Yij|xi)

มันถูกเรียกเช่นนั้นเพราะราคาสัมพัทธ์สำหรับเปรียบเทียบและคือ:Yjx1x2

(γj(x1)1γj(x1))/(γj(x2)1γj(x2))=exp(βT(x1x2))

แจ้งให้ทราบล่วงหน้า, การแสดงออกดังกล่าวข้างต้นไม่ขึ้นอยู่กับเจแน่นอนว่าต้องมีการตรวจสอบสมมติฐานของอัตราต่อรองแบบสัดส่วนสำหรับชุดข้อมูลที่กำหนดj

ตอนนี้ฉันจะตอบคำถาม (1, 2, 4) บางข้อ

เราจะเข้าใจได้อย่างไรว่าตัวแบบให้พอดี? สรุป (house.plr) แสดง Residual Deviance 3479.149 และ AIC (Akaike Information Criterion?) จาก 3495.149 เป็นสิ่งที่ดีหรือไม่? ในกรณีที่สิ่งเหล่านั้นมีประโยชน์เป็นเพียงมาตรการแบบสัมพัทธ์ (เช่นการเปรียบเทียบกับแบบจำลองอื่น ๆ ) การวัดแบบสัมบูรณ์ที่ดีคืออะไร? ความเบี่ยงเบนที่เหลืออยู่ประมาณไคสแควร์กระจายกันหรือไม่? หนึ่งสามารถใช้ "% ทำนายอย่างถูกต้อง" กับข้อมูลต้นฉบับหรือการตรวจสอบข้ามบางอย่าง? วิธีที่ง่ายที่สุดในการทำเช่นนั้นคืออะไร?

รูปแบบที่เหมาะสมpolrเป็นพิเศษglmดังนั้นสมมติฐานทั้งหมดที่ถือสำหรับการglmถือแบบดั้งเดิมที่นี่ หากคุณดูแลพารามิเตอร์อย่างเหมาะสมคุณสามารถเข้าใจการแจกแจง โดยเฉพาะเพื่อทดสอบว่าแบบจำลองนั้นดีหรือไม่คุณอาจต้องทำการทดสอบแบบพอดีซึ่งจะทดสอบค่าว่างต่อไปนี้ (สังเกตว่านี่เป็นสิ่งที่บอบบางส่วนใหญ่คุณต้องการปฏิเสธค่าเป็นโมฆะ แต่ที่นี่คุณไม่ต้องการ ปฏิเสธมันเพื่อรับแบบที่ดี):

Ho: current model is good enough 

คุณจะใช้การทดสอบไคสแควร์สำหรับเรื่องนี้ ได้รับค่า p เป็น:

1-pchisq(deviance(house.plr),df.residual(house.plr))

เวลาส่วนใหญ่ที่คุณหวังว่าจะได้รับค่า p มากกว่า 0.05 เพื่อที่คุณจะไม่ปฏิเสธโมฆะเพื่อสรุปว่าแบบจำลองนั้นเหมาะสม (การเพิกเฉยต่อความถูกต้องตามหลักปรัชญา)

AIC ควรสูงเพื่อให้พอดีในเวลาเดียวกันคุณไม่ต้องการมีพารามิเตอร์จำนวนมาก stepAICเป็นวิธีที่ดีในการตรวจสอบนี้

ใช่คุณสามารถใช้การตรวจสอบความถูกต้องไขว้กันอย่างแน่นอนเพื่อดูว่าการคาดการณ์มีไว้หรือไม่ ดูpredictฟังก์ชั่น (ตัวเลือก: type = "probs") ?polrใน สิ่งที่คุณต้องดูแลคือผู้ร่วมทุน

ราคามีข้อมูลอะไรบ้าง? หน้าความช่วยเหลือในโปรไฟล์เป็นข้อมูลทั่วไปและไม่มีแนวทางสำหรับ polr

ในฐานะที่เป็นแหลมโดย @chl และคนอื่น ๆprมีข้อมูลทั้งหมดที่จำเป็นสำหรับการได้รับ CIs และข้อมูลที่เกี่ยวข้องอื่น ๆ polr fitน่าจะเป็นของ glms ทั้งหมดมีความเหมาะสมโดยใช้วิธีการประมาณน้ำหนักน้อยที่สุดสำหรับการบันทึก ในการปรับให้เหมาะสมนี้คุณจะได้รับข้อมูลจำนวนมาก (โปรดดูข้อมูลอ้างอิง) ซึ่งจะต้องใช้สำหรับการคำนวณค่าความแปรปรวนร่วม Covariance Matrix, CI, ค่า t ฯลฯ ซึ่งรวมถึงทั้งหมด

เราตีความค่า t สำหรับสัมประสิทธิ์แต่ละค่าอย่างไร ต่างจากรุ่นอื่น ๆ ที่เหมาะกับไม่มีค่า P ที่นี่

ซึ่งแตกต่างจากโมเดลเชิงเส้นปกติ (พิเศษglm) อื่น ๆglms ไม่มีการกระจาย t ที่ดีสำหรับสัมประสิทธิ์การถดถอย ดังนั้นสิ่งที่คุณจะได้คือการประมาณค่าพารามิเตอร์และเมทริกซ์ความแปรปรวนแปรปรวนเชิงซีโมติกของพวกเขาโดยใช้ทฤษฎีความน่าจะเป็นสูงสุด ดังนั้น:

Variance(β^)=(XTWX)1ϕ^

ค่าประมาณหารด้วยข้อผิดพลาดมาตรฐานคือสิ่งที่ BDR และ WV เรียกค่า t (ฉันถือว่าMASSการประชุมที่นี่) มันเทียบเท่ากับค่า t จากการถดถอยเชิงเส้นปกติ แต่ไม่เป็นไปตามการแจกแจงแบบ t เมื่อใช้ CLT จะเป็นการกระจายแบบปกติที่ไม่มีอาการ แต่พวกเขาไม่ต้องการใช้ประมาณนี้ (ฉันเดา) ดังนั้นจึงไม่มีค่า p (ฉันหวังว่าฉันจะไม่ผิดและถ้าฉันฉันหวังว่า BDR ไม่ได้อยู่ในฟอรัมนี้ฉันหวังว่าจะมีใครบางคนจะแก้ไขฉันถ้าฉันผิด)


ฉันจะเพิ่มมากขึ้น
suncoolsu

1
ขอบคุณสำหรับสิ่งนี้. ฉันอ่านมันหลายครั้ง ยังมีคำถามอีกมาก 1. ทำหน้าที่ใน R เราทดสอบสมมติฐานอัตราต่อรองได้อย่างไร 2. คุณแน่ใจหรือว่าการทดสอบไคสแควร์ถูกต้อง? ในตัวอย่างนี้มันส่งคืน 0 หมายถึง .. เส็งเคร็งพอดี? แต่ค่า t บางค่าค่อนข้างสูง (InflHigh 10.1, InflMedium 5.4, ContHigh 3.7) 3. อะไรคือแผนการหรือคู่ที่แสดง?
dfrankow

ขอบคุณสำหรับคำตอบที่กว้างขวางของคุณ suncoolsu ฉันอยู่ในสถานการณ์ที่คล้ายกันและมีคำถามสองสามข้อ 1. ฉันยังได้รับ 0 สำหรับทุกรุ่นโดยใช้สมการทดสอบไคสแควร์ของคุณ 2. หน้าวิกิพีเดียใน AIC กล่าวว่า "รูปแบบที่ต้องการคือรูปแบบที่มีค่า AIC ขั้นต่ำ" แต่คุณบอกว่า "AIC น่าจะสูงพอสมควร" ฉันพยายามที่จะกระทบยอดบัญชีเหล่านี้
Sam Swift

@dfrankow และ @Sam Swift ฉันขอโทษที่กำลังยุ่งอยู่กับการเขียนบทความ ตกลง - ถ้าคุณได้รับ p-value = 0 นั่นหมายความว่ารุ่นนั้นไม่เหมาะสมเนื่องจากความล้มเหลวในการทดสอบความพอดี เกี่ยวกับปัญหาของ AIC วิกิพีเดียและฉันกำลังใช้การประชุมที่แตกต่างกัน ฉันใช้อันที่ BDR และ WV ใช้อยู่ (เปรียบเทียบการขยายตัวแบบเชิงเส้นใน R โดย Dr. Julian Faraway)
suncoolsu

มีบางคำถามเฉพาะสำหรับ 0/1 ค่า P และการตีความ AIC คุณอาจพบว่ามีประโยชน์: stats.stackexchange.com/questions/15223/... stats.stackexchange.com/questions/81427/...
สกอตต์

3

ฉันสนุกกับการสนทนาเป็นอย่างมากที่นี่ แต่ฉันรู้สึกว่าคำตอบไม่ถูกต้องที่อยู่ทั้งหมด (ดีมาก) ส่วนประกอบกับคำถามที่คุณถาม ตัวอย่างครึ่งหลังของหน้านี้polrเป็นเพียงการทำโปรไฟล์ การอ้างอิงทางเทคนิคที่ดีที่นี่คือ Venerables และ Ripley ที่พูดถึงการทำโปรไฟล์และมันทำอะไร นี่เป็นเทคนิคที่สำคัญเมื่อคุณก้าวข้ามโซนความสะดวกสบายของรุ่นสำหรับครอบครัวแบบเอ็กซ์โพเนนเชียลที่เหมาะสมพร้อมความน่าจะเป็น (GLM ปกติ)

การออกเดินทางที่สำคัญที่นี่คือการใช้เกณฑ์เด็ดขาด คุณจะสังเกตเห็นว่า POLR ไม่ได้ประมาณระยะการสกัดกั้นตามปกติ ค่อนข้างจะมีพารามิเตอร์ที่น่ารำคาญ : เกณฑ์ที่ความเสี่ยงที่ติดตั้งมีแนวโน้มที่จะตกอยู่ในหมวดหมู่ที่เป็นไปได้ของการสะสมเนื่องจากขีด จำกัด เหล่านี้ไม่เคยถูกประเมินร่วมกันความแปรปรวนร่วมกับพารามิเตอร์โมเดลจึงไม่เป็นที่รู้จัก แตกต่างจาก GLM ที่เราไม่สามารถ "รบกวน" ค่าสัมประสิทธิ์จำนวนและมั่นใจว่ามันจะส่งผลกระทบต่อการประมาณการอื่น ๆ เราใช้การทำโปรไฟล์เพื่อทำบัญชีนี้สำหรับเกณฑ์ที่สร้างความรำคาญ Profiling เป็นเรื่องที่ยิ่งใหญ่ แต่โดยทั่วไปเป้าหมายคือทนทานการวัดความแปรปรวนของค่าสัมประสิทธิ์การถดถอยเมื่อรูปแบบการการเพิ่มโอกาสที่ผิดปกติเช่นเดียวกับ, , และk1klmernlspolrglm.nb.

หน้าความช่วยเหลือสำหรับ?profile.glmควรใช้งานบางอย่างในขณะที่polrวัตถุเป็นหลัก GLMs (รวมถึงเกณฑ์หมวดหมู่) สุดท้ายคุณจริงสามารถสูงสุดรหัสที่มาถ้ามันในการใช้งานใด ๆ getS3method('profile', 'polr')โดยใช้ ฉันใช้getS3methodฟังก์ชั่นนี้บ่อยๆเพราะในขณะที่ R ดูเหมือนจะยืนยันวิธีการหลายอย่างที่ควรถูกซ่อนไว้ใคร ๆ ก็สามารถเรียนรู้ได้อย่างน่าประหลาดใจมากเกี่ยวกับการใช้งานและวิธีการโดยการตรวจสอบโค้ด

•ข้อมูลอะไรบ้างที่มีอยู่? หน้าความช่วยเหลือในโปรไฟล์เป็นข้อมูลทั่วไปและไม่มีแนวทางสำหรับ polr

prเป็นprofile.polr, profileวัตถุ (คลาสที่สืบทอดprofile) มีการเข้าร่วมสำหรับ covariate แต่ละรายการ ผู้สร้างโปรไฟล์วนซ้ำโควาเรียตแต่ละตัวคำนวณแบบจำลองที่เหมาะสมที่สุดอีกครั้งกับค่าความแปรปรวนร่วมนั้นจับจ้องไปที่จำนวนที่แตกต่างกันเล็กน้อย ผลลัพธ์แสดงค่าคงที่ของโควาเรียตที่วัดเป็นความแตกต่างของ "คะแนน z" ที่ปรับขนาดจากมูลค่าโดยประมาณและผลกระทบคงที่ที่เกิดขึ้นในโควาเรียอื่น ตัวอย่างเช่นหากคุณดูpr$InflMediumคุณจะทราบว่าเมื่อ "z" เป็น 0 เอฟเฟกต์คงที่อื่น ๆ จะเหมือนกับที่พบในรูปแบบดั้งเดิม

•พล็อต (pr) แสดงอะไร ฉันเห็นกราฟหกตัว แต่ละคนมีแกน X ที่เป็นตัวเลขแม้ว่าฉลากจะเป็นตัวแปรตัวบ่งชี้ (ดูเหมือนว่าตัวแปรอินพุตที่เป็นตัวบ่งชี้สำหรับค่าลำดับ) จากนั้นแกน Y คือ "เอกภาพ" ซึ่งไม่ได้อธิบายอย่างสมบูรณ์

อีกครั้ง?plot.profileให้คำอธิบาย พล็อตคร่าวๆแสดงให้เห็นว่าสัมประสิทธิ์การถดถอยเป็นอย่างไร tau คือความแตกต่างของสัดส่วนคะแนน z ก่อนหน้าดังนั้นค่า 0 จึงให้ค่าสัมประสิทธิ์การฟิตที่ดีที่สุดซึ่งแสดงด้วยเครื่องหมายติ๊ก คุณจะไม่บอกว่าแบบนี้มีความประพฤติดี แต่ "เส้น" เหล่านั้นเป็นเส้นโค้งจริงๆ หากความเป็นไปได้นั้นมีพฤติกรรมที่ไม่เหมาะสมอย่างมากคุณจะสังเกตเห็นพฤติกรรมที่แปลกและคาดเดาไม่ได้ในโครงเรื่อง สิ่งนี้จะทำให้คุณประเมินผลโดยใช้การประมาณข้อผิดพลาดที่มีประสิทธิภาพมากขึ้น (bootstrap / jackknife) เพื่อคำนวณ CIs ที่ใช้method='profile', เพื่อถอดรหัสตัวแปรหรือเพื่อทำการวินิจฉัยอื่น ๆ

•การแสดงคู่ (pr) คืออะไร? ดูเหมือนพล็อตสำหรับตัวแปรอินพุตแต่ละคู่ แต่อีกครั้งฉันไม่เห็นคำอธิบายของแกน X หรือ Y

ไฟล์ความช่วยเหลือบอกว่า: "วิธีการจับคู่แสดงสำหรับแต่ละคู่ของพารามิเตอร์ x และ y สองเส้นโค้งที่ตัดกันโดยประมาณค่าความน่าจะเป็นสูงสุดซึ่งให้ตำแหน่งของจุดที่จุดสัมผัสของรูปทรงโปรไฟล์โปรไฟล์ bivariate กลายเป็นแนวตั้ง และแนวนอนตามลำดับในกรณีที่มีความเป็นไปได้ว่าโปรไฟล์ปกติ bivariate เส้นโค้งทั้งสองนี้จะเป็นเส้นตรงทำให้เงื่อนไขของ y | x และ x | y และรูปทรงจะเป็นรูปวงรี " โดยพื้นฐานแล้วพวกเขาจะช่วยให้คุณเห็นภาพจุดไข่ปลาความมั่นใจ แกนที่ไม่ใช่มุมฉากบ่งบอกถึงมาตรการที่แปรปรวนอย่างสูงเช่น InfMedium และ InfHigh ซึ่งเกี่ยวข้องอย่างสังหรณ์ใจ อีกครั้งโอกาสที่ผิดปกติจะนำไปสู่ภาพที่ค่อนข้างยุ่งเหยิงที่นี่

•เราจะเข้าใจได้อย่างไรว่าตัวแบบให้พอดี? สรุป (house.plr) แสดง Residual Deviance 3479.149 และ AIC (Akaike Information Criterion?) จาก 3495.149 เป็นสิ่งที่ดีหรือไม่? ในกรณีที่สิ่งเหล่านั้นมีประโยชน์เป็นเพียงมาตรการแบบสัมพัทธ์ (เช่นการเปรียบเทียบกับแบบจำลองอื่น ๆ ) การวัดแบบสัมบูรณ์ที่ดีคืออะไร? ความเบี่ยงเบนที่เหลืออยู่ประมาณไคสแควร์กระจายกันหรือไม่? หนึ่งสามารถใช้ "% ทำนายอย่างถูกต้อง" กับข้อมูลต้นฉบับหรือการตรวจสอบข้ามบางอย่าง? วิธีที่ง่ายที่สุดในการทำเช่นนั้นคืออะไร?

สมมติฐานหนึ่งที่ดีในการประเมินคือสมมติฐานที่ได้สัดส่วน สิ่งนี้สะท้อนให้เห็นในการทดสอบทั่วโลก (ซึ่งประเมิน polr เทียบกับรูปแบบการบันทึกแบบอิ่มตัว) ข้อ จำกัด ที่นี่คือข้อมูลขนาดใหญ่การทดสอบทั่วโลกล้มเหลวเสมอ เป็นผลให้การใช้กราฟิกและการตรวจสอบประมาณการ (betas) และความแม่นยำ (SEs) สำหรับโมเดล loglinear และ polr fit เป็นความคิดที่ดี หากพวกเขาไม่เห็นด้วยอย่างมากอาจมีบางอย่างผิดปกติ

ด้วยผลลัพธ์ที่ได้รับคำสั่งจึงเป็นการยากที่จะกำหนดข้อตกลงเป็นเปอร์เซ็นต์ คุณจะเลือกลักษณนามตามรุ่นได้อย่างไรและหากคุณทำอย่างไรคุณจะใช้ประสิทธิภาพของลักษณนามที่ไม่ดีได้อย่างไร modeเป็นทางเลือกที่ไม่ดี หากฉันมีการบันทึกหมวดหมู่ 10 รายการและการคาดคะเนของฉันอยู่เสมอ แต่มีการปิดหนึ่งหมวดหมู่บางทีนั่นอาจไม่ใช่เรื่องเลวร้าย นอกจากนี้แบบจำลองของฉันอาจทำนายโอกาส 40% ของการตอบสนอง 0 แต่ยังมีโอกาส 20% ที่ 8, 9, 10 ดังนั้นถ้าฉันสังเกตว่า 9 ดีหรือไม่ดี หากคุณต้องวัดข้อตกลงให้ใช้คัปปาถ่วงน้ำหนักหรือแม้แต่ MSE รูปแบบการบันทึกจะสร้างข้อตกลงที่ดีที่สุดเสมอ นั่นไม่ใช่สิ่งที่ POLR ทำ

•มีการนำไปใช้และตีความ anova ในรุ่นนี้อย่างไร เอกสารกล่าวว่า "มีวิธีการสำหรับฟังก์ชั่นการปรับแบบจำลองมาตรฐาน ได้แก่ การคาดการณ์, สรุป, vcov, anova" อย่างไรก็ตามการเรียกใช้ anova (house.plr) ส่งผลให้ anova ไม่ได้รับการดำเนินการสำหรับวัตถุ "polr" เดียว

คุณสามารถทดสอบโมเดลที่ซ้อนกันด้วยwaldtestและlrtestในlmtestแพ็คเกจใน R ซึ่งเทียบเท่ากับ ANOVA การตีความนั้นเหมือนกับ GLM ทุกประการ

•เราตีความค่า t สำหรับสัมประสิทธิ์แต่ละค่าอย่างไร ไม่เหมือนกับรุ่นบางรุ่นที่เหมาะสมไม่มีค่า P ที่นี่

อีกครั้งซึ่งแตกต่างจากโมเดลเชิงเส้นโมเดล POLR สามารถมีปัญหากับโอกาสผิดปกติดังนั้นการอนุมานบนพื้นฐานของ Hessian จึงไม่เสถียร มันคล้ายกับการปรับรุ่นที่ผสมให้ดูตัวอย่างเช่น helpfile on confint.merModสำหรับแพ็คเกจ lme4 ที่นี่การประเมินที่ทำด้วยโปรไฟล์แสดงความแปรปรวนร่วมเป็นอย่างดี โปรแกรมเมอร์จะทำสิ่งนี้ตามค่าเริ่มต้นยกเว้นการทำโปรไฟล์นั้นสามารถคำนวณได้อย่างเข้มข้นและทำให้พวกเขาอยู่ในมือของคุณ หากคุณต้องดูข้อสรุปจาก Wald ให้ใช้coeftest(house.plr)จากlrtestแพ็คเกจ


2

หากต้องการ 'ทดสอบ' (เช่นประเมินผล) สมมติฐานอัตราต่อรองแบบสัดส่วนใน R คุณสามารถใช้ส่วนที่เหลือ (RL) () ในแพ็คเกจการออกแบบของ Frank Harrell Jr. หากคุณพิมพ์? residuals.lrm จะมีตัวอย่างที่รวดเร็วในการทำซ้ำว่า Frank Harrell แนะนำให้ประเมินสมมติฐานการต่อรองแบบสัดส่วนอย่างไร (กล่าวคือมองเห็นไม่ใช่การทดสอบด้วยปุ่มกด) ประมาณการการออกแบบที่สั่งการถดถอยโลจิสติกโดยใช้ lrm () ซึ่งคุณสามารถทดแทน polr () จาก MASS

สำหรับตัวอย่างที่เป็นทางการมากขึ้นของวิธีการทดสอบสมมติฐานอัตราต่อรองแบบสัดส่วนใน R ให้ดูที่: กระดาษ: แบบจำลองการถดถอยการตอบสนองตามปกติในระบบนิเวศผู้แต่ง: Antoine Guisan และ Frank E. Harrell ที่มา: วารสารวิทยาศาสตร์พืช 11, ฉบับที่ 5 (ต.ค. , 2000), หน้า 617-626


3
ฉันขอขอบคุณคำตอบของคุณ อย่างไรก็ตามวัตถุประสงค์ของ StackExchange คือการให้คำตอบไม่ใช่การอ้างอิง นักสถิติดูเหมือนว่าจะมีปัญหาอ้างอิงนี้โดยเฉพาะ มีรายละเอียดใดบ้างที่คุณสามารถเพิ่มเกี่ยวกับวิธีการใช้ที่เหลือ lrm? ตัวอย่างเช่นคำสั่งตัวอย่างและตัวอย่างของการตีความกราฟสำหรับตัวอย่าง house.plr?
dfrankow

1
อัปเดตจากเว็บไซต์ของผู้เขียน: "แพ็คเกจการออกแบบล้าสมัยแล้วผู้ใช้ R ต้องใช้แพ็คเกจ rms แทน" มาร์คคำตอบของคุณมีประโยชน์มากสำหรับฉัน
Tal Galili
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.