เพียร์สันเป็นพารามิเตอร์ทำไมและ Spearman ไม่ใช่พารามิเตอร์


19

เห็นได้ชัดว่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันเป็นพารามิเตอร์และโรของสเปียร์แมนไม่ใช่พารามิเตอร์

ฉันมีปัญหาในการเข้าใจสิ่งนี้ ตามที่ฉันเข้าใจแล้ว Pearson คำนวณเป็น และคำนวณ Spearman ด้วยวิธีเดียวกันยกเว้นเราแทนที่ค่าทั้งหมดด้วยอันดับของพวกเขา

rxy=cov(X,Y)σxσy

Wikipedia พูดว่า

ความแตกต่างระหว่างโมเดลพารามิเตอร์และโมเดลที่ไม่ใช่พารามิเตอร์คืออดีตมีพารามิเตอร์จำนวนคงที่ในขณะที่รุ่นหลังจะเพิ่มจำนวนพารามิเตอร์ด้วยจำนวนข้อมูลการฝึกอบรม

แต่ฉันไม่เห็นพารามิเตอร์ใด ๆ ยกเว้นกลุ่มตัวอย่างเอง บางคนบอกว่าการทดสอบพาราเมทริกถือว่าการแจกแจงแบบปกติและบอกต่อไปว่าเพียร์สันถือว่าข้อมูลการแจกแจงแบบปกติ แต่ฉันล้มเหลวที่จะดูว่าทำไมเพียร์สันถึงต้องการ

ดังนั้นคำถามของฉันคืออะไรที่ทำให้พารามิเตอร์และไม่ใช่พารามิเตอร์ในบริบทของสถิติ? เพียร์สันกับสเปียร์แมนพอดีกันยังไง


6
มันเป็นคำถามที่ดีและมีข้อมูลที่ผิดมากมาย ตัวอย่างเช่นสมการของการทดสอบพารามิเตอร์และสมมติว่าการแจกแจงแบบปกตินั้นน่าเสียดายที่เกิดความสับสนบ่อยครั้งซึ่งผู้เขียนตำราเรียนอาจารย์หลักสูตรและผู้โพสต์อินเทอร์เน็ตจำนวนมากคัดลอกจากคนอื่นที่มีความสับสน
Nick Cox

5
บางทีความละเอียดเชิงบวกที่ง่ายที่สุดของคำถามคือ: ใช่ความสัมพันธ์ของสเปียร์แมนเป็นพารามิเตอร์ที่ประเมินความแข็งแกร่งเชิงปริมาณของความสัมพันธ์และคล้ายกับเพียร์สัน (ที่รูทมันเป็นแนวคิดเดียวกัน แต่ไม่ความสัมพันธ์ของสเปียร์แมนไม่ใช่พารามิเตอร์ที่มีคุณสมบัติในการแจกแจงในขณะที่เพียร์สันเป็นพารามิเตอร์ในการแจกแจงปกติแบบ bivariate (การตีความในอดีต มันเป็นความแตกต่างที่ดีที่จะเข้าใจได้โดยการเห็นว่าคำว่า "พารามิเตอร์" มีความรู้สึกหลายอย่าง
Nick Cox

@NickCox ทำไมคุณไม่โพสต์สิ่งนั้นเป็นคำตอบ
Richard Hardy

5
ประเด็นเกี่ยวกับความปกติของการแจกแจงจะกัดเฉพาะเมื่อคุณต้องการทดสอบความสำคัญกับสหสัมพันธ์ หากคุณใช้สหสัมพันธ์เป็นมาตรการเชิงพรรณนาเท่านั้นการไม่สัมพันธ์กันจะไม่เป็นอุปสรรคต่อการใช้สหสัมพันธ์ ความสัมพันธ์อาจมีประโยชน์เพียงเล็กน้อยกับตัวแปรไบนารีสองตัวตราบใดที่ทั้งคู่ต่างกัน คุณยังต้องระวังผลกระทบของค่าผิดปกติและอื่น ๆ อีกมากมาย
Nick Cox

1
เนื่องจากดูเหมือนว่ายังไม่ได้มีการกล่าวไว้อย่างชัดเจนดังนั้นฉันจึงต้องการย้ำว่าสถิติไม่ได้เป็น "พาราเมตริก" นั่นก็เหมือนกับการพูดว่าตัวเลขนั้นอร่อยคำคุณศัพท์ไม่สามารถใช้กับคำนามได้ แบบจำลองทางสถิติสามารถเป็นพารามิเตอร์ (ตามที่ระบุโดยใบเสนอราคา Wikipedia) เช่นเดียวกับการทดสอบและขั้นตอนที่เป็นไปตามพวกเขา สถิติ Spearman และ Pearson สามารถใช้ได้ทั้งในการตั้งค่าพารามิเตอร์และไม่ใช่พารามิเตอร์ เพิ่มเติมเกี่ยวกับเรื่องนี้ที่stats.stackexchange.com/questions/67204 สิ่งที่ทำให้พารารูปแบบของสภาพพื้นที่
whuber

คำตอบ:


17

ปัญหาคือ "nonparametric" มีความหมายที่แตกต่างกันสองอย่างในปัจจุบันนี้ คำจำกัดความในวิกิพีเดียนำไปใช้กับสิ่งต่าง ๆ เช่นการปรับเส้นโค้งที่ไม่ใช่พารามิเตอร์เช่นผ่านเส้นโค้งหรือการถดถอยท้องถิ่น ความหมายอื่น ๆ ซึ่งเก่ากว่านั้นเป็นไปตามแนวของ "การแจกฟรี" นั่นคือเทคนิคที่สามารถนำไปใช้ได้โดยไม่คำนึงถึงการแจกแจงแบบสันนิษฐานของข้อมูล อันหลังคืออันที่ใช้กับ Rho ของ Spearman เนื่องจากการเปลี่ยนแปลงอันดับหมายถึงว่ามันจะให้ผลลัพธ์เหมือนกันไม่ว่าการกระจายดั้งเดิมของคุณจะเป็นแบบใด


2
Nonparametric มีสองความหมาย แต่ความคิดเห็นในวิกิพีเดียใช้กับทั้งสองอย่างจริงๆ ในการถดถอยแบบไม่พารามิเตอร์มันหมายถึงความสัมพันธ์ที่ไม่ได้ จำกัด - พารามิเตอร์ ในด้าน 'การแจกฟรี' ของสิ่งต่าง ๆ มันหมายถึงโมเดลการกระจายที่ไม่ได้มีขอบเขต จำกัด
Glen_b -Reinstate Monica

1
หืมนั่นเป็นคำพูดจาก Wikipedia ไม่ใช่ฉัน มีคนอื่นเพิ่มไว้
Hong Ooi

2
การแก้ไขหลัก - ซึ่งฉันเชื่อว่าไม่ถูกต้องในรายละเอียดเดียวและไม่เพิ่มสิ่งใดที่มีประโยชน์เป็นพิเศษ - เกิดขึ้นเพื่อการตรวจทานเนื่องจากผู้ใช้ low = rep ถูกตรวจสอบและถูกปฏิเสธโดยบุคคลหนึ่ง แต่ถูกยอมรับโดยอัตโนมัติเมื่อ บุคคลที่สามพยายามแก้ไขเพื่อปรับปรุง (พวกเขาอาจไม่ได้ตระหนักว่านี่จะเป็นผลที่ตามมา) ฉันจะย้อนกลับไปแก้ไขต้นฉบับของคุณ คุณสามารถทำได้ทุกเมื่อที่มีการแก้ไขที่คุณไม่ชอบ
Glen_b -Reinstate Monica

ตอนนี้ย้อนกลับไปที่โพสต์ต้นฉบับของคุณเนื่องจากฉันคิดว่ามันเปลี่ยนโพสต์ของคุณมากเกินไปโดยไม่ได้รับข้อตกลงของคุณและไม่ฟังเหมือนที่คุณเห็นด้วย หากมีสิ่งใดที่คุณชอบเกี่ยวกับเรื่องนี้ให้คลิกลิงก์ "แก้ไข ... ที่ผ่านมา" เหนือชื่อของฉันและคัดลอกส่วนที่คุณชอบจากสิ่งที่เคยมีมาก่อนจากนั้นแก้ไขและวางมัน
Glen_b

เมื่อใดจึงควรใช้ Spearman Pearson ช่วยคุณได้อย่างไรเมื่อคุณใช้ Spearman
LéoLéopold Hertz 준영

3

ฉันคิดว่าเหตุผลเดียวที่ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันนั้นเรียกว่าพาราเมทริกคือเพราะคุณสามารถใช้มันเพื่อประเมินพารามิเตอร์ของการแจกแจงปกติหลายตัวแปร เช่นการแจกแจงแบบปกติ bivariateมี 5 พารามิเตอร์: สองวิธี, ความแปรปรวนสองค่าและค่าสัมประสิทธิ์สหสัมพันธ์ หลังสามารถประมาณด้วยสัมประสิทธิ์สหสัมพันธ์เพียร์สัน

ρ


ไม่ใช่พารามิเตอร์สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันในแง่ที่คุณต้องถือว่าเป็นเรื่องปกติในการทดสอบความสำคัญของมัน? นั่นคือมันไม่ถือว่าปกติเป็นสถิติ แต่คุณคิดว่าข้อมูลเป็นเรื่องปกติเมื่อคำนวณการแจกแจงสัมประสิทธิ์สหสัมพันธ์ตัวอย่างและทดสอบหรือไม่ นี่เป็นคำถามที่ซื่อสัตย์ฉันอาจผิด 100%
mugen

คุณช่วยอธิบายได้ไหมถ้าคุณทำสมมุติฐานการกระจายตัวเป็น sperman และ kendall?
LéoLéopold Hertz 준영

@ugen คุณไม่จำเป็นต้องมีกฎเกณฑ์ในการทดสอบความสำคัญของสหสัมพันธ์เพียร์สัน การทดสอบความสัมพันธ์ทั่วไปของ Pearson ทำเช่นนั้น คุณสามารถสร้างสมมติฐานที่แตกต่างกันและมาพร้อมกับการทดสอบที่แตกต่างกัน ... หรือแน่นอนหนึ่งสามารถทำการทดสอบการเปลี่ยนแปลงของโมฆะว่าประชากรสหสัมพันธ์เพียร์สันเป็นศูนย์ผลในการทดสอบที่ไม่ใช่พารามิเตอร์
Glen_b -Reinstate Monica

0

ฉันคิดว่าคำตอบที่ง่ายที่สุดคือการทดสอบ rho ของ Spearmen ใช้ข้อมูลลำดับ (ตัวเลขที่สามารถจัดอันดับ แต่ไม่บอกอะไรคุณเกี่ยวกับช่วงเวลาระหว่างตัวเลขเช่นไอศกรีม 3 รสชาติอยู่ในอันดับที่ 1, 2 และ 3 แต่นี่บอกคุณเท่านั้น รสชาติไม่เป็นที่ต้องการเท่าไร) ข้อมูลลำดับไม่สามารถใช้ในการทดสอบพารามิเตอร์

การทดสอบ r ของ Pearson ใช้ข้อมูลช่วงเวลาหรืออัตราส่วน (ตัวเลขที่มีช่วงเวลาคงที่เช่นวินาที, kg, mm) 1 มม. ไม่เพียง แต่มีขนาดเล็กกว่า 5 มม. เท่านั้น แต่คุณรู้อย่างแน่ชัดว่า ข้อมูลประเภทนี้สามารถใช้ในการทดสอบพารามิเตอร์


1
แน่นอนว่าเป็นไปได้ที่จะใช้โมเดลพาราเมตริก - และด้วยเหตุนี้การทดสอบพารามิเตอร์ - พร้อมข้อมูลลำดับ เราต้องการเพียงแค่เสนอการแจกแจงสำหรับตัวแปรนี้ที่มีจำนวน จำกัด และคงที่ของพารามิเตอร์และสมมติฐานที่เหมาะสมบางอย่างที่เกี่ยวข้องกับพารามิเตอร์เหล่านั้นและvoilaมีการทดสอบพารามิเตอร์ ความสัมพันธ์แบบเพียร์สันคำนวณในสถานการณ์ที่ตัวแปรหนึ่งหรือทั้งสองมีสองหมวดหมู่ (ติดป้ายด้วยตัวเลขสองตัวที่ต่างกันโดยทั่วไปคือ 0/1) ส่งผลให้เกิดการวัดความสัมพันธ์ที่ใช้กันทั่วไปสำหรับสถานการณ์เหล่านั้น
Glen_b
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.