คำนวณค่าเฉลี่ยของตัวแปรลำดับ


20

ฉันได้อ่านในหลาย ๆ แห่งที่คำนวณค่าเฉลี่ยของตัวแปรลำดับไม่เหมาะสม ฉันพยายามรับสัญชาตญาณว่าทำไมมันอาจไม่เหมาะสม ฉันคิดว่าเป็นเพราะโดยทั่วไปแล้วตัวแปรอันดับไม่ได้กระจายตามปกติและดังนั้นการคำนวณค่าเฉลี่ยจะให้การแสดงที่ไม่ถูกต้อง มีใครให้เหตุผลอย่างละเอียดมากขึ้นว่าทำไมการคำนวณค่าเฉลี่ยของตัวแปรลำดับอาจไม่เหมาะสม


8
ในการคำนวณค่าเฉลี่ยคุณต้องมีผลรวมก่อน เพื่อให้ผลรวมมีความหมายคุณต้องให้ 4 + 2 เท่ากับ 3 + 3 คุณต้องมี 4-3 = 3-2 = 2-1 ด้วยข้อมูลลำดับ - แม้ว่าหมวดหมู่จะมีป้ายกำกับ "1", "2", "3", "4" - นี่คือ (ค่อนข้างชัดเจน) ไม่จำเป็นต้องเป็นกรณี
Glen_b -Reinstate Monica

และทำไมค่ามัธยฐานจึงเหมาะสมกว่าเลขคณิตหมายความว่าอย่างไร

คำตอบ:


24

คำตอบสั้น ๆ ว่านี่คือการโต้เถียง ตรงกันข้ามกับคำแนะนำที่คุณพูดถึงผู้คนในหลากหลายสาขาใช้วิธีจัดอันดับตามลำดับและมักจะมีความสุขที่หมายถึงทำในสิ่งที่พวกเขาต้องการ ค่าเฉลี่ยระดับคะแนนหรือเทียบเท่าในระบบการศึกษาจำนวนมากเป็นตัวอย่างหนึ่ง

อย่างไรก็ตามข้อมูลเลขลำดับที่ไม่ได้กระจายตามปกตินั้นไม่ใช่เหตุผลที่ถูกต้องเพราะค่าเฉลี่ยคือ

  • ใช้กันอย่างแพร่หลายสำหรับการแจกแจงที่ไม่ปกติ

  • มีการกำหนดทางคณิตศาสตร์อย่างดีสำหรับการแจกแจงแบบไม่ปกติจำนวนมากยกเว้นในบางกรณีทางพยาธิวิทยา

อาจไม่ใช่ความคิดที่ดีที่จะใช้ค่าเฉลี่ยในทางปฏิบัติหากข้อมูลไม่ได้ถูกกระจายอย่างแน่นอน แต่ก็แตกต่างกัน

เหตุผลที่ดีกว่าสำหรับการไม่ใช้ค่าเฉลี่ยกับข้อมูลลำดับคือค่านั้นขึ้นอยู่กับแบบแผนการเข้ารหัส รหัสตัวเลขเช่น 1, 2, 3, 4 มักจะถูกเลือกเพื่อความเรียบง่ายหรือความสะดวกสบาย แต่โดยหลักการแล้วพวกเขาสามารถทำได้ 1, 23, 456, 7890 เท่า ๆ กันตามลำดับที่เกี่ยวข้อง การใช้ค่าเฉลี่ยในกรณีใดกรณีหนึ่งจะเกี่ยวข้องกับการประชุมเหล่านั้นอย่างแท้จริง (กล่าวคือราวกับว่าตัวเลขไม่ได้เป็นไปตามอำเภอใจ แต่สมเหตุสมผล) และไม่มีเหตุผลที่เข้มงวดในการทำเช่นนั้น คุณต้องการสเกลช่วงเวลาที่สามารถนำความแตกต่างที่เท่ากันระหว่างค่าต่างๆ ที่ฉันจะเป็นอาร์กิวเมนต์หลัก แต่ตามที่ระบุไว้แล้วคนมักจะไม่สนใจมันและจงใจเพราะพวกเขาพบว่ามีประโยชน์หมายถึงสิ่งที่นักทฤษฎีการวัดพูด

นี่เป็นตัวอย่างเพิ่มเติม บ่อยครั้งที่ผู้คนถูกขอให้เลือกหนึ่งใน "ไม่เห็นด้วยอย่างยิ่ง" ... "เห็นด้วยอย่างยิ่ง" และ (ขึ้นอยู่กับสิ่งที่ซอฟต์แวร์ต้องการ) รหัสนักวิจัยที่เป็น 1 .. 5 หรือ 0 .. 4 หรืออะไรก็ตามที่พวกเขาต้องการหรือประกาศ เป็นปัจจัยที่สั่งซื้อ (หรือคำใดก็ตามที่ซอฟต์แวร์ใช้) นี่คือการเข้ารหัสโดยพลการและซ่อนไว้จากคนที่ตอบคำถาม

แต่บ่อยครั้งที่ผู้คนถูกถาม (พูด) ในระดับ 1 ถึง 5 คุณจะให้คะแนนบางสิ่งอย่างไร ตัวอย่างมากมาย: เว็บไซต์กีฬาการแข่งขันประเภทอื่นและการศึกษา ที่นี่ผู้คนกำลังแสดงมาตราส่วนและถูกขอให้ใช้งาน เป็นที่เข้าใจกันอย่างกว้างขวางว่าไม่ใช่จำนวนเต็มเหมาะสม แต่คุณเพิ่งได้รับอนุญาตให้ใช้จำนวนเต็มเป็นแบบแผน ระดับนี้เป็นอันดับหรือไม่ บางคนตอบว่าใช่บางคนบอกว่าไม่ มิฉะนั้นแล้วส่วนหนึ่งของปัญหาก็คือสิ่งที่เป็นขนาดปกติเป็นพื้นที่คลุมเครือหรือ debated

พิจารณาผลการเรียนอีกครั้งสำหรับงานวิชาการพูดว่า E ถึง A บ่อยครั้งที่ผลการเรียนดังกล่าวได้รับการปฏิบัติเป็นตัวเลขเช่น 1 ถึง 5 และผู้คนมักคำนวณค่าเฉลี่ยสำหรับนักเรียนหลักสูตรโรงเรียน ฯลฯ และทำการวิเคราะห์ข้อมูลดังกล่าวเพิ่มเติม ในขณะที่มันยังคงเป็นความจริงที่ว่าแผนที่ใด ๆ ที่คะแนนเป็นตัวเลขเป็นข้อ แต่ยอมรับตราบเท่าที่มันจะเก็บรักษาการสั่งซื้อ แต่ในคนที่ปฏิบัติกำหนดและได้รับการเรียนรู้ที่มีคะแนนเทียบเท่าตัวเลขและรู้เกรดที่จะเฉลี่ย

เหตุผลเชิงปฏิบัติอย่างหนึ่งสำหรับการใช้วิธีการคือสื่อและโหมดมักจะเป็นบทสรุปที่ไม่ดีของข้อมูลในข้อมูล สมมติว่าคุณมีสเกลจากไม่เห็นด้วยอย่างยิ่งที่จะเห็นด้วยอย่างยิ่งและเพื่อความสะดวกในรหัสที่ 1 ถึง 5 ทีนี้ลองนึกภาพตัวอย่างหนึ่งรหัส 1, 1, 2, 2, 2 และอีก 1, 2, 2, 4, 5 มือของคุณถ้าคุณคิดว่าค่ามัธยฐานและโหมดเป็นเพียงบทสรุปที่สมเหตุสมผลเท่านั้นเพราะมันเป็นมาตราส่วนตามลำดับ ตอนนี้ยกมือของคุณถ้าคุณพบว่ามีประโยชน์เช่นกันโดยไม่คำนึงว่าผลรวมจะถูกกำหนดอย่างดี ฯลฯ

โดยธรรมชาติค่าเฉลี่ยจะเป็นข้อมูลสรุปที่ไวต่อความรู้สึกหากรหัสนั้นคือสแควร์สหรือลูกบาศก์ 1 ถึง 5 พูดและนั่นอาจไม่ใช่สิ่งที่คุณต้องการ (หากเป้าหมายของคุณคือการระบุใบปลิวสูงอย่างรวดเร็วอาจเป็นสิ่งที่คุณต้องการ!) แต่นั่นเป็นเหตุผลว่าทำไมการเข้ารหัสแบบดั้งเดิมด้วยรหัสจำนวนเต็มต่อเนื่องจึงเป็นทางเลือกที่ใช้งานได้จริงเพราะมันใช้งานได้ค่อนข้างดีในทางปฏิบัติ นั่นไม่ได้เป็นข้อโต้แย้งที่มีน้ำหนักใด ๆ กับนักทฤษฎีการวัดและไม่ควร แต่นักวิเคราะห์ข้อมูลควรสนใจที่จะผลิตบทสรุปที่มีข้อมูลมากมาย

ฉันเห็นด้วยกับทุกคนที่พูดว่า: ใช้การแจกแจงความถี่ระดับคะแนนทั้งหมด แต่นั่นไม่ใช่ประเด็นที่เป็นปัญหา


1
คำตอบที่ดีและการปฏิบัตินิยมเป็นสิ่งสำคัญ แต่ฉันจะเพิ่มบันทึกข้อควรระวัง เหตุผลที่ดีสำหรับการใช้วิธีการที่กำหนดขึ้นอย่างเป็นทางการเท่านั้นคือคุณสามารถเข้าถึงการประมาณความแน่นอน & c ตัวอย่างเช่นถ้าเรามี GPAs สองตัวพูด 4.53 และ 4.34 เราอาจต้องการทราบว่าหนึ่งคือ "อย่างมีนัยสำคัญ" ดีกว่าอีก แต่เนื่องจากขาดความเป็นทางการในการหาค่าเฉลี่ยของคะแนนเราจึงไม่ได้รับสิ่งต่าง ๆ เช่นช่วงความมั่นใจ & c
Stephen McAteer

1
@StephenMcAteer ฉันเห็นประเด็นของคุณในแง่ของวิธีการสอนในข้อความหรือหลักสูตรเบื้องต้นทั่วไป แต่ถ้าเป็นความปรารถนาการบูตสแตรปปิ้งได้จัดหาเทคโนโลยีที่ช่วยให้เกิดความมั่นใจในช่วงเวลาเกือบ 40 ปีแล้ว
Nick Cox

3

สมมติว่าเราใช้ค่าลำดับเช่น 1 สำหรับการไม่เห็นด้วยอย่างยิ่ง 2 สำหรับการไม่เห็นด้วย 3 สำหรับการตกลงและ 4 สำหรับการเห็นด้วยอย่างยิ่ง ถ้าคนสี่คนให้คำตอบ 1,2,3 และ 4 แล้วค่าเฉลี่ยคืออะไร? มันคือ (1 + 2 + 3 + 4) /4=2.50

ควรตีความอย่างไรเมื่อคนทั้งสี่ตอบโดยเฉลี่ยว่า "ไม่เห็นด้วยหรือเห็นด้วย" นั่นเป็นเหตุผลที่เราไม่ควรใช้ค่าเฉลี่ยสำหรับข้อมูลลำดับ


3
การเล่นทนายของมารน้อยในตัวอย่างนี้ฉันจะตีความ 2.5 ว่าเป็นครึ่งทางระหว่าง 2 "ไม่เห็นด้วย" และ 3 "ตกลง" นี่สมเหตุสมผลโดยเฉลี่ยเนื่องจากเรามี "ไม่เห็นด้วยอย่างยิ่ง" กับ "เห็นด้วยอย่างยิ่ง" และ "ไม่เห็นด้วย" กับ "เห็นด้วย"
TooTone

1
เห็นด้วยกับค่าเฉลี่ย 2.5 ในบริบทนี้ยังคงสมเหตุสมผลสำหรับฉัน - กลางคันระหว่างความไม่เห็นด้วยและเห็นด้วยหรือในคำอื่น ๆ ที่เป็นกลาง
luciano

3
ฉันคิดว่า Azeem ต้องการตัวอย่างที่ดีกว่า คุณสามารถคัดค้าน 2.5 เป็นค่าเฉลี่ยของ 1, 2, 3, 4 ลูกต่อครอบครัวในพื้นที่เดียวกันวิธีการที่จะตีความว่ามันไม่ได้เป็นหนึ่งในค่าที่กำหนดไว้ นั่นทำให้เกิดปัญหาที่แตกต่างกัน
Nick Cox

2
ฉันคิดว่าคุณสามารถเสริมสร้างคำตอบของคุณและฉันขอแนะนำให้คุณทำเช่นนั้น "เพราะค่าเฉลี่ยอาจเป็นค่าที่ไม่ได้กำหนด" ไม่ใช่ข้อโต้แย้งที่แข็งแกร่งที่นี่มีเหตุผลหรือมีเหตุผลทางจิตวิทยาและไม่ได้มุ่งเน้นที่ปัญหาที่ลึกกว่าว่าความแตกต่างที่เท่ากันหมายถึงความแตกต่างที่เท่ากันจริง ๆ หรือไม่
Nick Cox

1
ฉันไม่รู้ว่าฉันจะทำให้มันชัดเจนขึ้นได้อย่างไร (เช่น) "0-4", "5-19", "20-114" ได้รับคำสั่ง (ลำดับ) ในการมีลำดับธรรมชาติเพียงอย่างเดียวต่อการวัดเหล่านั้น (ขาดการกลับรายการ) ถ้าคุณต้องการที่จะเรียกพวกเขาสิ่งอื่น ๆ ด้วยเช่นกันที่ฉัน
Nick Cox

2

ฉันเห็นด้วยกับ @Azeem ทั้งหมด แต่การขับรถกลับบ้านตรงนี้ขอผมอธิบายเพิ่มเติมอีกหน่อย

สมมติว่าคุณมีข้อมูลอันดับในตัวอย่างจาก @Azeem ที่ช่วงของคุณมีตั้งแต่ 1 ถึง 4 และสมมติว่าคุณมีคนสองคนให้คะแนนบางอย่าง (เช่น Ice Cream) ในระดับนี้ ลองนึกภาพว่าคุณได้รับผลลัพธ์ต่อไปนี้:

  • บุคคลกพูด 4
  • บุคคล B พูด 3
  • บุคคล C กล่าวว่า 1
  • บุคคล D พูด 2

เมื่อคุณต้องการตีความผลลัพธ์คุณสามารถสรุปบางสิ่งได้ในระดับ:

  • Person A ชอบไอศกรีมมากกว่า Person B
  • Person D ชอบไอศกรีมมากกว่า Person C

อย่างไรก็ตามคุณไม่รู้อะไรเลยเกี่ยวกับช่วงเวลาระหว่างอันดับ ความแตกต่างระหว่าง 1 และ 2 เหมือนกับระหว่าง 3 และ 4 หรือไม่? การให้คะแนน 4 หมายความว่าบุคคลนั้นชอบไอศกรีมมากกว่าผู้ที่ให้คะแนนว่าเป็น 4 เท่าหรือไม่? และอื่น ๆ ... เมื่อคุณคำนวณค่าเฉลี่ยเลขคณิตคุณจะปฏิบัติกับตัวเลขราวกับว่าความแตกต่างระหว่างพวกเขาเท่ากัน แต่นั่นเป็นข้อสันนิษฐานที่แข็งแกร่งมากกับข้อมูลอันดับและคุณจะต้องพิสูจน์มัน


ฉันแก้ไขการอ้างอิงถึงคำตอบข้างต้น รู้รอบสามารถเปลี่ยนลำดับและอันที่จริงคำตอบที่ได้กล่าวมาข้างต้นอยู่ในขณะนี้ด้านล่างและสามารถเปลี่ยนแปลงได้ ดังนั้นอ้างอิงถึงโปสเตอร์ไม่ใช่ตำแหน่ง
นิคค็อกซ์

0

ฉันเห็นด้วยกับแนวคิดที่ว่าค่าเฉลี่ยเลขคณิตไม่สามารถพิสูจน์ได้อย่างแท้จริงในข้อมูลมาตราส่วน แทนที่จะคำนวณค่าเฉลี่ยเราสามารถใช้โหมดหรือค่ามัธยฐานในสถานการณ์เช่นนี้ซึ่งทำให้เราสามารถตีความผลลัพธ์ของเราได้อย่างมีความหมายมากขึ้น


นี่ไม่ได้ตอบคำถาม ว่าทำไมมันอาจไม่เหมาะสม
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.