อันดับโดยรวมจากรายการหลายอันดับ


13

ฉันได้อ่านวรรณกรรมมากมายที่มีออนไลน์รวมถึงฟอรัมนี้โดยไม่มีโชคและหวังว่าใครบางคนสามารถช่วยปัญหาทางสถิติที่ฉันเผชิญอยู่ในขณะนี้:

ฉันมีข้อมูลอันดับ 5 รายการโดยแต่ละรายการประกอบด้วย 10 รายการที่จัดอันดับจากตำแหน่ง 1 (ดีที่สุด) ถึงตำแหน่ง 10 (แย่ที่สุด) เพื่อความเป็นบริบท 10 รายการในแต่ละรายการจะเหมือนกัน แต่ในการจัดอันดับที่แตกต่างกันเนื่องจากเทคนิคที่ใช้ในการตัดสินใจอันดับของพวกเขาแตกต่างกัน

ข้อมูลตัวอย่าง:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

ฉันกำลังมองหาวิธีในการตีความและวิเคราะห์ข้อมูลข้างต้นเพื่อให้ได้ผลลัพธ์สุดท้ายแสดงลำดับโดยรวมของแต่ละรายการตามการทดสอบแต่ละครั้งและตำแหน่งของมันเช่น

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

จนถึงตอนนี้ฉันได้พยายามตีความข้อมูลนี้จากการทดสอบสหสัมพันธ์ของเพียร์สัน, สหสัมพันธ์ของสเปียร์แมน, การทดสอบของเคนดัลล์เอกภาพ B และฟรีดแมน อย่างไรก็ตามฉันพบว่าผลลัพธ์เหล่านี้มักจะจับคู่รายการของฉัน (เช่นรายการเปรียบเทียบ 1 กับรายการ 2 จากนั้นรายการ 1 ถึงรายการ 3 .. ฯลฯ ) หรือมีผลลัพธ์เช่น Chi-Square, P-Values ​​เป็นต้นเกี่ยวกับภาพรวม ข้อมูล.

ไม่มีใครรู้วิธีที่ฉันสามารถตีความข้อมูลนี้ในวิธีการทางสถิติ (ในระดับบัณฑิตศึกษา / ปริญญาเอกที่ใช้บังคับ) เพื่อให้ฉันสามารถเข้าใจอันดับโดยรวมที่ส่งสัญญาณความสำคัญของแต่ละรายการในรายการในการทดสอบ 5 ครั้ง หรือถ้ามีเทคนิคหรือการทดสอบทางสถิติอีกประเภทที่ฉันสามารถตรวจสอบได้ฉันจะขอบคุณคำแนะนำหรือคำแนะนำใด ๆ

(อาจเป็นสิ่งที่น่าสังเกตว่าฉันได้ใช้เทคนิคทางคณิตศาสตร์ที่ง่ายขึ้นเช่นผลรวมการหาค่าเฉลี่ยการทดสอบขั้นต่ำขั้นสูงสุดเป็นต้น แต่ไม่รู้สึกว่าสิ่งเหล่านี้มีความสำคัญทางสถิติเพียงพอในระดับนี้)

ความช่วยเหลือหรือคำแนะนำใด ๆ ที่จะได้รับการชื่นชมอย่างมากขอบคุณสำหรับเวลาของคุณ


1
ผมพบว่าคำถามที่สองซึ่งตีความได้อย่างเหมาะสมปรากฏเป็นรายการที่ซ้ำกัน (และดังนั้นจึงมีอยู่แล้วให้คำตอบ): stats.stackexchange.com/search?q=valuation+rank มีเพียงพอหรือไม่ ถ้าไม่โปรดช่วยเราเข้าใจว่าอะไรเป็นพิเศษเกี่ยวกับสถานการณ์ของคุณ
whuber

ขอบคุณสำหรับคำตอบของคุณ ฉันได้ดูบทความเหล่านี้และฉันไม่แน่ใจว่าพวกเขาไม่ใช่สิ่งที่ฉันกำลังมองหาหรือว่ามันเป็นความเข้าใจของฉันที่ผิด ฉันได้รับความประทับใจในบทความเหล่านี้ว่าชุดข้อมูลแต่ละชุดมีตัวแปรหลายตัวที่มีความหมายแตกต่างกันและลำดับอาจแตกต่างกันหรือมีค่าจำนวนเต็มรายละเอียดมากกว่าอันดับ ฉันแค่มองหาวิธีการพิสูจน์ทางสถิติเพื่อให้สามารถพูดได้ว่า 'โดยรวมรายการที่สำคัญที่สุดคือรายการ X, ตามด้วย Y ... และสุดท้าย (หรือที่สำคัญน้อยที่สุด) รายการ Z' ฉันเกือบคิดว่าการวิเคราะห์เหล่านี้อยู่ในอันดับที่ 1-10 เป็นตัวเลขธรรมดา
เลียม

1
ประเด็นสำคัญข้อหนึ่งของหัวข้อเหล่านี้คือไม่มีวิธีการใด ๆ ที่ได้รับการพิสูจน์ทางสถิติ มันเป็นคำถามของการประเมิน : การรวมกันทางสถิติใด ๆ ของผลลัพธ์ของคุณสะท้อนถึงความรู้สึกของการแลกเปลี่ยนระหว่างพวกเขา ตัวอย่างเช่น "วัตถุ" ของคุณอาจเป็นรถยนต์และ "เทคนิค" อาจจัดอันดับตามคุณสมบัติต่าง ๆ : ต้นทุนประสิทธิภาพการใช้เชื้อเพลิงพลังงานความสะดวกสบาย ฯลฯ ความรู้สึกส่วนตัวของคุณเกี่ยวกับ "ดีที่สุด" อาจแตกต่างอย่างมากจากความรู้สึกของคนอื่นและ คุณทั้งสองจะพูดถูก
whuber

คุณได้รับคำตอบไหม กรุณาแสดงความคิดเห็นได้ที่นี่stats.stackexchange.com/questions/347336/…
Ray Coder

คำตอบ:


7

ฉันไม่แน่ใจว่าทำไมคุณถึงดูความสัมพันธ์และมาตรการที่คล้ายกัน ดูเหมือนจะไม่มีอะไรเกี่ยวข้อง

มีตัวเลือกจำนวนมากไม่มีดีกว่าตัวเลือกอื่น ๆ แต่ขึ้นอยู่กับสิ่งที่คุณต้องการ:

ใช้อันดับเฉลี่ยแล้วจัดอันดับค่าเฉลี่ย (แต่จะถือว่าข้อมูลเป็นช่วงเวลา)

ใช้อันดับมัธยฐานแล้วจัดอันดับมีเดียน (แต่อาจส่งผลให้เกิดความสัมพันธ์)

จดจำนวนคะแนนที่ 1 ของแต่ละรายการที่ได้รับและจัดอันดับตามคะแนนนี้

ใช้จำนวนคะแนนโหวตครั้งสุดท้ายและจัดอันดับ (ตรงกันข้ามอย่างชัดเจน) ตามนั้น

สร้างชุดค่าผสมที่มีน้ำหนักบางอย่างขึ้นอยู่กับสิ่งที่คุณคิดว่าเหมาะสม


4
จุดสำคัญที่เกิดขึ้นในหัวข้อที่ผมอ้างถึงในความคิดเห็น - และฉันคิดว่านี่เป็นปมของปัญหาทั้งหมด - เป็นว่าวิธีการทั้งหมดเหล่านี้โดยพลการ มีวิธีการวัตถุประสงค์อยู่ แต่พวกเขาต้องการการใช้ข้อมูลที่ไม่ได้อยู่ในข้อมูล นั่นคือสิ่งที่ทำให้นี่เป็นปัญหาของการประเมินค่ามากกว่าสถิติ
whuber

คุณจะแนะนำชุดค่าผสมถ่วงน้ำหนักเท่าไหร่?
อาร์ชี

4

ตามที่คนอื่น ๆ ได้ชี้ให้เห็นมีตัวเลือกมากมายที่คุณอาจติดตาม วิธีที่ฉันแนะนำขึ้นอยู่กับอันดับเฉลี่ยคือข้อเสนอแรกของปีเตอร์

ในกรณีนี้ความสำคัญทางสถิติของการจัดอันดับสุดท้ายสามารถตรวจสอบได้โดยการทดสอบทางสถิติสองขั้นตอน นี้เป็นขั้นตอนที่ไม่ใช่ตัวแปรประกอบด้วยการทดสอบฟรีดแมนด้วยการทดสอบการโพสต์นี้ที่สอดคล้องกันการทดสอบ Nemenyi ทั้งคู่ขึ้นอยู่กับอันดับเฉลี่ย วัตถุประสงค์ของการทดสอบฟรีดแมนคือการปฏิเสธสมมติฐานและสรุปได้ว่ามีมีความแตกต่างบางอย่างระหว่างรายการ หากเป็นเช่นนั้นเราจะดำเนินการทดสอบ Nemenyi เพื่อค้นหาว่ารายการใดแตกต่างกันไป (เราไม่ได้เริ่มต้นโดยตรงกับการทดสอบหลังจบเพื่อหลีกเลี่ยงความสำคัญที่พบโดยบังเอิญ)

รายละเอียดเพิ่มเติมเช่นค่าที่สำคัญสำหรับการทดสอบเหล่านี้ทั้งสองสามารถพบได้ในกระดาษโดย Demsar


2

ใช้ Tau-x (โดยที่ "x" อ้างถึง "eXtended" Tau-b) Tau-x เป็นค่าสหสัมพันธ์เทียบเท่าของตัววัดระยะทาง Kemeny-Snell - พิสูจน์แล้วว่าเป็นตัวชี้วัดระยะทางที่ไม่ซ้ำกันระหว่างรายการของรายการที่อยู่ในอันดับที่ตอบสนองความต้องการทั้งหมดของตัวชี้วัดระยะทาง ดูบทที่ 2 ของ "แบบจำลองทางคณิตศาสตร์ในสังคมศาสตร์" โดย Kemeny and Snell, "ค่าสัมประสิทธิ์สหสัมพันธ์อันดับใหม่ที่มีการประยุกต์ใช้กับปัญหาการจัดอันดับฉันทามติ, Edward Emond, David Mason, วารสารการวิเคราะห์การตัดสินใจแบบหลายเกณฑ์ 11: 17- 28 (2545)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.