ตัวแปรที่ต่อเนื่องขึ้นอยู่กับตัวแปรอิสระลำดับ


17

ด้วยตัวแปรy ที่ขึ้นต่อเนื่องและตัวแปรอิสระรวมถึงตัวแปรลำดับX 1ฉันจะพอดีกับตัวแบบเชิงเส้นได้Rอย่างไร? มีเอกสารเกี่ยวกับรูปแบบประเภทนี้หรือไม่?

คำตอบ:


29

@ Scortchi ของมีคุณครอบคลุมกับคำตอบนี้ในการเข้ารหัสสำหรับตัวแปรร่วมสั่งซื้อ ผมเคยซ้ำคำแนะนำเกี่ยวกับคำตอบของฉันเพื่อผลของสองน้ำเกลือทางประชากรกับคำตอบแบบสำรวจ (Likert ขนาด) โดยเฉพาะข้อเสนอแนะคือการใช้แพคเกจGertheiss ' (2013) ordPensและอ้างถึงGertheiss และ Tutz (2009a)สำหรับพื้นหลังทางทฤษฎีและการศึกษาแบบจำลอง

ฟังก์ชั่นที่เฉพาะเจาะจงคุณอาจต้องการคือ*ordSmooth สิ่งนี้จะทำให้สัมประสิทธิ์ของหุ่นจำลองระดับของตัวแปรตามลำดับให้มีความแตกต่างจากระดับตำแหน่งที่อยู่ติดกันน้อยลงซึ่งจะช่วยลดการ overfitting และปรับปรุงการทำนาย โดยทั่วไปแล้วจะทำงานได้ดีหรือ (บางครั้งมาก) ดีกว่าความเป็นไปได้สูงสุด (เช่นสี่เหลี่ยมจัตุรัสที่น้อยที่สุดในกรณีนี้) การประมาณค่าของแบบจำลองการถดถอยสำหรับข้อมูลต่อเนื่อง มันเข้ากันได้กับโมเดลเชิงเส้นทั่วไปทุกประเภทและช่วยให้คุณสามารถป้อนตัวทำนายที่ระบุและต่อเนื่องเป็นเมทริกซ์แยก

การอ้างอิงเพิ่มเติมหลายประการจาก Gertheiss, Tutz และเพื่อนร่วมงานมีอยู่ในรายการด้านล่าง บางส่วนของสิ่งเหล่านี้อาจมีทางเลือก - แม้กระทั่ง Gertheiss และ Tutz (2009a) จะพูดคุยเกี่ยวกับการสันแนว reroughing เป็นอีกทางเลือกหนึ่ง ฉันยังไม่ได้ขุดมันด้วยตัวเอง แต่พอเพียงเพื่อบอกว่านี่เป็นการแก้ปัญหาของ @ Erik เกี่ยวกับวรรณกรรมน้อยเกินไปเกี่ยวกับตัวทำนายลำดับ!

อ้างอิง

- Gertheiss, J. (2013, 14 มิถุนายน) ordPens: การเลือกและ / หรือการทำให้เรียบง่ายของตัวทำนายลำดับ , เวอร์ชั่น 0.2-1 แปลจากhttp://cran.r-project.org/web/packages/ordPens/ordPens.pdf
- Gertheiss, J. , Hogger, S. , Oberhauser, C. , & Tutz, G. (2011) การเลือกตัวแปรอิสระตามปกติที่มีการใช้งานกับการจำแนกระหว่างกลุ่มแกนทำงาน วารสารของสมาคมสถิติ Royal: Series C (สถิติประยุกต์), 60 (3), 377–395
- Gertheiss, J. , & Tutz, G. (2009a) การถดถอยที่ถูกลงโทษด้วยเครื่องมือทำนายลำดับ การทบทวนทางสถิติระหว่างประเทศ, 77 (3), 345–365 แปลจากhttp://epub.ub.uni-muenchen.de/2100/1/tr015.pdf
- Gertheiss, J. , & Tutz, G. (2009b) การเลือกคุณสมบัติที่อยู่ภายใต้การดูแลในการทำโปรไฟล์โปรตีโอมิกส์แบบแมสสเปกโตรเมตรีโดยการเพิ่มแบบบล็อก ชีวสารสนเทศศาสตร์, 25 (8), 1076–1077
- Gertheiss, J. , & Tutz, G. (2009c) วิธีการปรับขนาดและตัวแปรเพื่อนบ้านที่ใกล้ที่สุด วารสารวิชาเคมี, 23 (3), 149–151 - Gertheiss, J. & Tutz, G. (2010) การสร้างแบบจำลองกระจัดกระจายของตัวแปรอธิบาย categorial พงศาวดารของสถิติประยุกต์, 4 , 2150–2180
- Hofner, B. , Hothorn, T. , Kneib, T. , & Schmid, M. (2011) เฟรมเวิร์กสำหรับการเลือกโมเดลที่ไม่เอนเอียงบนพื้นฐานของการส่งเสริม วารสารสถิติคอมพิวเตอร์และกราฟฟิค, 20 (4), 956–971 แปลจากhttp://epub.ub.uni-muenchen.de/11243/1/TR072.pdf
- Oelker, M.-R. , Gertheiss, J. , & Tutz, G. (2012) การทำให้เป็นปกติและการเลือกแบบจำลองด้วยตัวทำนายตำแหน่งแบบ categorial และตัวดัดแปลงเอฟเฟกต์ในตัวแบบเชิงเส้นทั่วไป ภาควิชาสถิติ: รายงานเชิงเทคนิคเลขที่ 122 แปลจากhttp://epub.ub.uni-muenchen.de/13082/1/tr.gvcm.cat.pdf
- Oelker, M.-R. , & Tutz, G. (2013) บทลงโทษทั่วไปของครอบครัวสำหรับการรวมประเภทการลงโทษที่แตกต่างกันในโมเดลที่มีโครงสร้างทั่วไป ภาควิชาสถิติ: รายงานเชิงเทคนิคเลขที่ 139 แปลจากhttp://epub.ub.uni-muenchen.de/17664/1/tr.pirls.pdf
- Petry, S. , Flexeder, C. , & Tutz, G. (2011) เชือกหลอมเหลวคู่ กรมสถิติ: รายงานทางเทคนิคฉบับที่ 102. แปลจากhttp://epub.ub.uni-muenchen.de/12164/1/petry_etal_TR102_2011.pdf
- Rufibach, K. (2010) อัลกอริทึมชุดที่ใช้งานเพื่อประเมินพารามิเตอร์ในตัวแบบเชิงเส้นทั่วไปพร้อมตัวทำนายคำสั่ง สถิติการคำนวณและการวิเคราะห์ข้อมูล, 54 (6), 1442–1456 แปลจากhttp://arxiv.org/pdf/0902.0240.pdf?origin=publication_detail
- Tutz, G. (2011, ตุลาคม) วิธีการทำให้เป็นมาตรฐานสำหรับข้อมูลที่เป็นหมวดหมู่ มิวนิค: Ludwig-Maximilians-Universität แปลจากhttp://m.wu.ac.at/it/departments/statmath/resseminar/talktutz.pdf
- Tutz, G. , & Gertheiss, J. (2013) การจัดระดับเป็นตัวทำนาย - คำถามเก่า ๆ ของระดับสเกลและคำตอบบางอย่างPsychometrika , 1-20


15

เมื่อมีตัวทำนายหลายตัวและตัวทำนายความสนใจเป็นลำดับมันมักจะยากที่จะตัดสินใจว่าจะเขียนโค้ดตัวแปรอย่างไร การเข้ารหัสเป็นหมวดหมู่จะสูญเสียข้อมูลการสั่งซื้อในขณะที่การเข้ารหัสเป็นตัวเลขจะกำหนดความเป็นเส้นตรงกับผลกระทบของหมวดหมู่ที่สั่งซื้อซึ่งอาจห่างไกลจากผลกระทบที่แท้จริง สำหรับอดีตแล้วการถดถอยแบบไอโซโทนิกได้ถูกเสนอเป็นวิธีการแก้ปัญหาที่ไม่ใช่แบบโมโนโทนิก แต่เป็นขั้นตอนการเลือกรูปแบบการขับเคลื่อนข้อมูลซึ่งเหมือนกับขั้นตอนอื่น ๆ ที่ขับเคลื่อนด้วยข้อมูลจำเป็นต้องมีการประเมินอย่างรอบคอบ ของพารามิเตอร์ สำหรับหลังเส้นโค้งอาจลดบางส่วนของข้อสมมติเชิงเส้นแบบแข็ง แต่ยังต้องกำหนดหมายเลขให้กับหมวดหมู่ที่สั่งซื้อและผลลัพธ์จะอ่อนไหวต่อตัวเลือกเหล่านี้ ในบทความของเรา (Li and Shepherd, 2010, บทนำ, ย่อหน้าที่ 3-5)

YXZYZXZYX

XZ

เราได้พัฒนาแพ็คเกจ R, PResidualsซึ่งมีให้บริการจาก CRAN แพคเกจประกอบด้วยฟังก์ชันสำหรับการดำเนินการวิธีการของเราสำหรับประเภทผลลัพธ์เชิงเส้นและลำดับ เรากำลังทำงานเพื่อเพิ่มประเภทผลลัพธ์อื่น ๆ (เช่นการนับ) และคุณลักษณะ (เช่นการอนุญาตการโต้ตอบ) แพคเกจยังมีฟังก์ชั่นสำหรับการคำนวณส่วนที่เหลือของเราซึ่งเป็นระดับความน่าจะเป็นแบบจำลองการถดถอยแบบต่างๆ

อ้างอิง

Li, C. & Shepherd, BE (2010) ทดสอบการเชื่อมโยงระหว่างตัวแปรอันดับสองขณะปรับค่าความแปรปรวนร่วม JASA, 105, 612–620

Li, C. & Shepherd, BE (2012) ส่วนที่เหลือใหม่สำหรับผลลัพธ์ตามลำดับ Biometrika 99, 473–480


7

โดยทั่วไปมีวรรณกรรมมากมายเกี่ยวกับตัวแปรลำดับที่ขึ้นอยู่กับการใช้พวกมันเป็นตัวทำนาย ในทางปฏิบัติทางสถิติพวกเขามักจะสันนิษฐานว่าจะต่อเนื่องหรือเด็ดขาด คุณสามารถตรวจสอบว่าตัวแบบเชิงเส้นที่มีตัวทำนายเป็นตัวแปรต่อเนื่องดูเหมือนว่าเหมาะสมหรือไม่โดยการตรวจสอบส่วนที่เหลือ

บางครั้งพวกเขาก็เขียนทับด้วย ตัวอย่างจะใช้สำหรับตัวแปรอันดับ 1 ที่ระดับ 1,2 และ 3 เพื่อให้มีตัวแปรไบนารีดัมมี่ d1 สำหรับ x1> 1 และตัวแปรไบนารีดัมมี่ d2 สำหรับ x1> 2 จากนั้นค่าสัมประสิทธิ์สำหรับ d1 คือเอฟเฟกต์ที่คุณได้รับเมื่อคุณเพิ่มอันดับเป็น 2 ถึง 3 และค่าสัมประสิทธิ์สำหรับ d2 คือเอฟเฟกต์ที่คุณได้รับเมื่อคุณเรียงลำดับจาก 2 เป็น 3

สิ่งนี้ทำให้การตีความมักจะง่ายขึ้น แต่เทียบเท่ากับการใช้มันเป็นตัวแปรเด็ดขาดสำหรับวัตถุประสงค์ในทางปฏิบัติ

เจลแมนยังแนะนำว่าใคร ๆ ก็อาจใช้เลขลำดับพยากรณ์เป็นปัจจัยหลัก (สำหรับเอฟเฟ็กต์หลัก) และตัวแปรต่อเนื่อง (สำหรับการโต้ตอบ) เพื่อเพิ่มความยืดหยุ่นของแบบจำลอง

กลยุทธ์ส่วนบุคคลของฉันมักจะดูว่าการปฏิบัติต่อพวกเขาอย่างต่อเนื่องทำให้รู้สึกและผลลัพธ์ในรูปแบบที่เหมาะสมและใช้พวกเขาเป็นหมวดหมู่ในกรณีที่จำเป็น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.