หากการถดถอยเชิงเส้นสัมพันธ์กับสหสัมพันธ์ของเพียร์สันมีเทคนิคการถดถอยใด ๆ ที่เกี่ยวข้องกับสหสัมพันธ์ของเคนดัลล์และสเปียร์แมนหรือไม่?


27

บางทีคำถามนี้อาจไร้เดียงสา แต่:

หากการถดถอยเชิงเส้นสัมพันธ์อย่างใกล้ชิดกับสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันมีเทคนิคการถดถอยใด ๆ ที่เกี่ยวข้องกับสัมประสิทธิ์สหสัมพันธ์ของเคนดัลล์และสเปียร์แมนหรือไม่?


3
เป็นตัวอย่างง่ายๆที่คุณมีหนึ่งตัวแปรอธิบายและตัวแปรตาม: การถดถอยเชิงเส้นของอันดับของและyจะให้สัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนเป็นสัมประสิทธิ์การถดถอย และในกรณีนี้xและyสามารถใช้แทนกันได้ในการถดถอย xYxY
COOLSerdash

2
เพียงไม่กี่ความคิด Kendall's และ Spearman's ρเป็นทั้งค่าสัมประสิทธิ์สหสัมพันธ์ตามอันดับ ความสัมพันธ์ที่ต้องการระหว่างxและyจะต้องเกี่ยวข้องกับอันดับของพวกเขา อย่างไรก็ตามการคำนวณอันดับแนะนำการพึ่งพาระหว่างการสังเกตซึ่งจะกำหนดการพึ่งพาระหว่างข้อผิดพลาดการกำจัดการถดถอยเชิงเส้น อย่างไรก็ตามในการตั้งค่าที่แตกต่างกันการสร้างแบบจำลองโครงสร้างการพึ่งพาระหว่างxและyกับ copulas จะทำการเชื่อมโยงกับ Kendall's τและ / หรือ Spearman's ρที่เป็นไปได้ขึ้นอยู่กับทางเลือกของ copula τρxYxYτρ
QuantIbex

1
@QuantIbex การพึ่งพานั้นจำเป็นต้องบอกเป็นนัยถึง ? E[εผมεJ]0
shadowtalker

คำตอบ:


21

มีวิธีการที่ตรงไปตรงมามากที่จะใช้การวัดความสัมพันธ์เกือบทุกแบบเพื่อให้เหมาะสมกับการถดถอยเชิงเส้น

พิจารณาว่าหากความชันของความสัมพันธ์คือความสัมพันธ์ระหว่างy - β xและxควรจะเป็น0βY-βxx0 0

แน่นอนถ้ามันเป็นอะไรอื่นที่ไม่ใช่0จะมีความสัมพันธ์เชิงเส้นที่ไม่ได้รับการแก้ไข - ซึ่งเป็นสิ่งที่การวัดความสัมพันธ์จะยกขึ้น

ดังนั้นเราจึงอาจประเมินความชันโดยการค้นหาความชัน, ที่ทำให้ความสัมพันธ์ตัวอย่างระหว่างy - ˜ β xและxเป็น0β~Y-β~xx0 0ในหลายกรณี - เช่นเมื่อใช้การวัดตามระดับความสัมพันธ์จะเป็นขั้นตอนการทำงานของค่าของการประมาณความชันดังนั้นอาจมีช่วงเวลาที่ค่าเป็นศูนย์ ในกรณีนั้นเรามักจะกำหนดค่าประมาณตัวอย่างให้เป็นศูนย์กลางของช่วงเวลา บ่อยครั้งที่ฟังก์ชั่นขั้นตอนกระโดดจากศูนย์ด้านบนไปด้านล่างศูนย์ในบางจุดและในกรณีนั้นการประเมินอยู่ที่จุดกระโดด

คำจำกัดความนี้ใช้ได้ผลกับทุกระดับความสัมพันธ์และความสัมพันธ์ที่แข็งแกร่ง นอกจากนี้ยังสามารถใช้เพื่อรับช่วงเวลาสำหรับความลาดชัน (ในลักษณะปกติ - โดยการค้นหาลาดที่ทำเครื่องหมายชายแดนระหว่างความสัมพันธ์ที่สำคัญเพียงและความสัมพันธ์ที่ไม่มีนัยสำคัญเพียง)

นี่เป็นเพียงการกำหนดความชันแน่นอน ครั้งหนึ่งเคยเป็นความลาดชันเป็นที่คาด, ตัดได้ตามประมาณการที่ตั้งที่เหมาะสมในการคำนวณเหลือ x ด้วยค่าสหสัมพันธ์ที่อิงตามค่ามัธยฐานจึงเป็นทางเลือกทั่วไป แต่มีตัวเลือกที่เหมาะสมอื่น ๆ อีกมากมายY-β~x

นี่คือความสัมพันธ์ที่พล็อตกับความชันของcarข้อมูลใน R:

ป้อนคำอธิบายรูปภาพที่นี่

ความสัมพันธ์ของเพียร์สันข้าม 0 อย่างน้อยความชันกำลังสอง 3.932
ความสัมพันธ์ของเคนดัลล์ข้าม 0 ที่ความชันเทลเซนเสน, 3.667
ความสัมพันธ์ของสเปียร์แมนข้าม 0 ให้ความชัน "สเปียร์แมนไลน์" 3.714

นี่คือการประมาณความชันสามรายการสำหรับตัวอย่างของเรา ตอนนี้เราต้องการดัก เพื่อความง่ายฉันจะใช้ค่าเฉลี่ยที่เหลือสำหรับการสกัดกั้นแรกและค่ามัธยฐานสำหรับอีกสองอัน (มันไม่สำคัญมากในกรณีนี้):

           intercept
 Pearson:  -17.573 *     
 Kendall:  -15.667
 Spearman: -16.285

* (ความแตกต่างเล็กน้อยจากกำลังสองน้อยที่สุดเกิดจากข้อผิดพลาดในการปัดเศษในการประมาณความชันไม่ต้องสงสัยเลยว่ามีข้อผิดพลาดในการปัดเศษที่คล้ายกันในการประมาณอื่น ๆ )

เส้นติดตั้งที่สอดคล้องกัน (ใช้โทนสีเดียวกับด้านบน) คือ:

ป้อนคำอธิบายรูปภาพที่นี่

แก้ไข: โดยการเปรียบเทียบความชันของควอดเรนท์สหสัมพันธ์คือ 3.333

ทั้งความสัมพันธ์ของเคนดัลล์และความสัมพันธ์ของสเปียร์แมนนั้นมีความแข็งแกร่งมากขึ้นสำหรับผู้ที่มีอิทธิพลนอกมากกว่ากำลังสองน้อยที่สุด ดูที่นี่สำหรับตัวอย่างที่น่าทึ่งในกรณีของเคนดัลล์


(+1) คำอธิบายที่ยอดเยี่ยม! มีเหตุผลใดที่เคนดัลล์ดูเหมือนว่าจะชอบสเปียร์แมนมากกว่าในบริบทนี้ (อย่างน้อยก็ตัดสินจากข้อเท็จจริงที่ว่าความสัมพันธ์ของเคนดัลล์สอดคล้องกับตัวประมาณความชันที่มีชื่อ Theil-Sen ในขณะที่สเปียร์แมนไม่มี)
อะมีบาพูดว่า Reinstate Monica

4
มีสาเหตุหลายประการที่ทำให้เป็นเช่นนี้ ข้อแรกคือเส้น Theil-Sen มีตัวประมาณที่อธิบายได้ง่าย (ค่ามัธยฐานของความชันของคู่) ซึ่งสเปียร์แมนขาด; ในกลุ่มตัวอย่างขนาดเล็กเหมาะสำหรับการคำนวณด้วยมือ ความสัมพันธ์เคนดัลล์เข้าสู่ภาวะปกติได้เร็วขึ้นและสามารถใช้เวทย์มนตร์ทางคณิตศาสตร์ได้ง่ายขึ้น ดูเพิ่มเติมที่นี่และที่นี่
Glen_b -Reinstate Monica

20

XYY

χ2สถิติในรูปแบบ PO อยู่ตรงสถิติ Wilcoxon

แบบจำลอง PO เป็นกรณีพิเศษของโมเดลความน่าจะเป็นแบบสะสมทั่วไป (บางลิงค์สะสมการโทร) รวมถึง probit, อันตรายตามสัดส่วนและโมเดลบันทึกการใช้งานเสริม สำหรับกรณีศึกษาดูบทที่ 15 ของฉันเอกสารประกอบคำบรรยาย


4

Aaron Han (1987 in econometrics) เสนอตัวประมาณค่าสหสัมพันธ์อันดับสูงสุดที่เหมาะสมกับตัวแบบการถดถอยโดยการทำให้เป็นเอกภาพสูงสุด Dougherty and Thomas (2012 ในวรรณคดีจิตวิทยา) เพิ่งเสนออัลกอริทึมที่คล้ายกัน MRC มีงานมากมายที่แสดงคุณสมบัติของมัน

Aaron K. Han, การวิเคราะห์ที่ไม่ใช่พารามิเตอร์ของตัวแบบการถดถอยทั่วไป: ตัวประมาณค่าสหสัมพันธ์อันดับสูงสุด, วารสารเศรษฐมิติเล่มที่ 35, ประเด็นที่ 2–3, กรกฎาคม 2530, หน้า 303-316, ISSN 0304-4076, http: // dx.doi.org/10.1016/0304-4076(87)90030-3 ( http://www.sciencedirect.com/science/article/pii/0304407687900303 )

Dougherty, MR, & Thomas, RP (2012) การตัดสินใจที่แข็งแกร่งในโลกที่ไม่เชิงเส้น รีวิวจิตวิทยา, 119 (2), 321 แปลจากhttp://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.