ข้อมูลที่เชื่อมโยงในบริบทของสัมประสิทธิ์สหสัมพันธ์อันดับคืออะไร


16

ฉันไม่ได้อยู่ในฟิลด์สถิติ

ฉันเห็นคำว่า "ผูกข้อมูล" ในขณะที่อ่านเกี่ยวกับค่าสัมประสิทธิ์สหสัมพันธ์อันดับ

  • ข้อมูลที่เชื่อมโยงคืออะไร?
  • ตัวอย่างของข้อมูลที่เชื่อมโยงคืออะไร?

คำตอบ:


5

หมายถึงข้อมูลที่มีค่าเท่ากัน ตัวอย่างเช่นถ้าคุณมี 1,2,3,3,4 เป็นชุดข้อมูลดังนั้นทั้งสอง 3 จะผูกข้อมูล หากคุณมี 1,2,3,4,5,5,5,6,7,7 เป็นชุดข้อมูลดังนั้นชุดข้อมูล 5 และ 7 จะถูกผูกไว้


14

"ข้อมูลที่เชื่อมโยงกัน" เกิดขึ้นในบริบทของการทดสอบทางสถิติแบบไม่อิงพารามิเตอร์

การทดสอบแบบไม่อิงพารามิเตอร์ : การทดสอบที่ไม่ถือว่าการแจกแจงความน่าจะเป็นเช่นนั้นไม่ถือว่าเป็นเส้นโค้งรูประฆัง

Rank-based : การทดสอบแบบไม่มีพารามิเตอร์ระดับสูงเริ่มต้นด้วยการแปลงตัวเลข (เช่น "3 วัน", "5 วัน" และ "4 วัน") เป็นอันดับ (เช่น "ระยะเวลาที่สั้นที่สุด (3)", "ระยะเวลายาวนานที่สุด (ที่ 1) "," ระยะเวลาที่ยาวที่สุดที่สอง (ที่ 2) ") จากนั้นจะใช้วิธีการทดสอบตามพารามิเตอร์แบบดั้งเดิมกับอันดับเหล่านี้

ข้อมูลที่ผูกเป็นปัญหาเนื่องจากตัวเลขที่เหมือนกันในตอนนี้จำเป็นต้องถูกแปลงเป็นอันดับ บางครั้งมีการจัดอันดับแบบสุ่มบางครั้งมีการใช้อันดับเฉลี่ย สิ่งสำคัญที่สุดคือต้องมีการอธิบายโปรโตคอลสำหรับการทำลายอันดับที่ผูกกันเพื่อทำซ้ำผลลัพธ์


5

มันเป็นเพียงสองค่าข้อมูลที่เหมือนกันเช่นการสังเกต 7 สองครั้งในชุดข้อมูลเดียวกัน

สิ่งนี้เกิดขึ้นในบริบทของวิธีการทางสถิติที่ถือว่าข้อมูลมีการวัดอย่างต่อเนื่องและเป็นไปไม่ได้ดังนั้นการวัดที่เหมือนกันจึงเป็นไปไม่ได้ (หรือในทางเทคนิคค่าความน่าจะเป็นที่เหมือนกันคือศูนย์) ภาวะแทรกซ้อนที่เกิดขึ้นจริงในทางปฏิบัติเกิดขึ้นเมื่อวิธีการเหล่านี้ถูกนำไปใช้กับข้อมูลที่ถูกปัดเศษหรือถูกตัดเพื่อให้การวัดที่เหมือนกันนั้นไม่เพียงเป็นไปได้ แต่เป็นเรื่องธรรมดา


1
ฉันไม่เห็นด้วยกับเหตุผลนี้เนื่องจากคุณไม่สามารถพูดได้ว่าเป็นเพราะความน่าจะเป็นศูนย์ที่เหตุการณ์นี้จะไม่เกิดขึ้น นี่ไม่ใช่เหตุผลที่ดี
Henry.L

2

คำถามมีความสำคัญพื้นฐาน:

การสังเกต / ข้อมูล / คู่ที่ถูกผูกไว้คืออะไร?

Altough มักถูกกล่าวถึงเฉพาะในวิธีการแบบไม่ใช้พารามิเตอร์ความคิดนี้เป็นอิสระจากวิธีการแบบไม่ใช้พารามิเตอร์ มันถูกกล่าวถึงในวิธีการอิงพารามิเตอร์เพราะสถานการณ์เช่นนี้จะทำให้เกิดภาวะแทรกซ้อนที่คำนวณในการได้รับสถิติที่ใช้ในวิธีการอิงพารามิเตอร์เช่น Wilcoxon Signed สถิติอันดับที่ +T+

(ดังนั้นฉันจึงไม่คิดว่าคำตอบของ @ Ming-Chih Kao นั้นเหมาะสมโดยการแนะนำการทดสอบแบบไม่มีพารามิเตอร์ก่อน แต่เนื่องจากชื่อเรื่องคือ 'ข้อมูลอะไรที่เชื่อมโยงในบริบทของค่าสัมประสิทธิ์สหสัมพันธ์อันดับ' ฉันจะซื้อ)

Zi=XiYi

(Xi,Yi)

Zi

Zi

|Zi|

{(1,1)(1,1)},{(1,2)(1,2)(2,1)(2,1)(2,3)(2,3)(3,2)},{(3,0)}

ให้เราลองวิธีง่ายๆในการทำเช่นนี้เราจัดอันดับจากซ้ายไปขวาและให้:

Ri

|Zi|

Ri

|Zi|

Ri

|Zi|=1|Zi|=2

เรามอบหมายให้ผู้สังเกตการณ์แต่ละคนในอันดับแรกของกลุ่ม1++77=4เรามอบหมายให้ผู้สังเกตการณ์แต่ละคนในอันดับที่สองของกลุ่ม8+92=8.5. ดังนั้นเราจึงมี:

Rผม: 8.5 4 4 8.5 4 4 4 4 4 10

การจัดอันดับนี้ปรับเปลี่ยนและทำให้แต่ละการสังเกตผูกมีอิทธิพลเดียวกันในการคำนวณสถิติอันดับดังนั้นในการทดสอบอันดับ

อะไรคือวิธีการแก้ปัญหาการตรวจสอบ / ข้อมูล / คู่ที่เชื่อมโยงกัน?

(1) กำหนดอันดับเฉลี่ย นี่คือสิ่งที่เราทำข้างต้น โดยการจัดอันดับเดียวกันให้กับข้อมูลที่ถูกผูกไว้ในกลุ่มเดียวกันเราสร้างอิทธิพลของพวกเขาในการทดสอบการจัดอันดับที่เหมือนกันดังนั้นจึงกำจัดความไม่ถูกต้องที่เป็นไปได้ที่เกิดจากการสังเกตที่ผูกกัน

(2) กำหนดอันดับแบบสุ่ม เพียงแค่กำหนดอันดับแบบสุ่มให้กับแต่ละองค์ประกอบของกลุ่มที่ถูกผูก ข้อ จำกัด เพียงอย่างเดียวคือMaxRankfirstgroup<MinRanksecondgroup since if MaxRankfirstgroup>MinRanksecondgroup, that breaks the ranking law; if MaxRankfirstgroup=MinRanksecondgroup, then we have to merge two tied groups into one.

(3)Perturbation of data. This requires very careful consideration about the nature of the data. This works only if the data is not categorical(discrete). In the above example, we can just make a This will put different weights manually to each of the elements in the tied group. For a continuous distribution, for example, it makes little difference if you perturb it in ϵ manner.

(@John D. Cook 's answer is a bit misleading in this way. A better way of saying this point is that when the distribution is continuous, PX=x=0. However, we shall observe ties since our measurement is of limited accuracy, i.e. any sample space in reality is actually finite.) (@quarkdown27 's answer is simple but correct in each word.)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.