ความแตกต่างคือสถิติสรุป: ค่าสัมประสิทธิ์จินีและส่วนเบี่ยงเบนมาตรฐาน


12

มีสถิติสรุปหลายอย่าง เมื่อคุณต้องการที่จะอธิบายการแพร่กระจายของการกระจายที่คุณสามารถใช้สำหรับตัวอย่างส่วนเบี่ยงเบนมาตรฐานหรือสัมประสิทธิ์จีนี

ฉันรู้ว่าค่าเบี่ยงเบนมาตรฐานขึ้นอยู่กับแนวโน้มกลางนั่นคือการเบี่ยงเบนจากค่าเฉลี่ยและค่าสัมประสิทธิ์ Gini เป็นการวัดทั่วไปของการกระจายตัว ผมยังไม่ทราบว่าค่าสัมประสิทธิ์ Gini มีลดลงและผูกไว้บน [0 1] และค่าเบี่ยงเบนมาตรฐานไม่ได้ คุณสมบัติเหล่านี้เป็นสิ่งที่ดีที่จะรู้ แต่ความเข้าใจส่วนเบี่ยงเบนมาตรฐานสามารถให้ Gini ไม่สามารถและหนีบในทางกลับกันได้? ถ้าฉันต้องเลือกที่จะใช้หนึ่งในสองสิ่งที่เป็นประโยชน์ของการใช้หนึ่งเมื่อเทียบกับคนอื่นเมื่อมันเป็นข้อมูลและลึกซึ้ง


1
คุณมีแท็กให้เลือกแปลก ๆ ฉันแก้ไขพวกเขา
อะมีบา

คำตอบ:


8

สองสิ่งที่ต้องพิจารณา

Gini มีขนาดอิสระในขณะที่ SD อยู่ในหน่วยดั้งเดิม

สมมติว่าเรามีการวัดล้อมรอบด้านบนและด้านล่าง SD ใช้มูลค่าสูงสุดหากการวัดครึ่งหนึ่งอยู่ที่แต่ละขอบเขตในขณะที่ Gini ใช้ค่าสูงสุดคือหนึ่งอยู่ในระดับหนึ่งและอีกส่วนที่เหลือจะอยู่ในระดับเดียวกัน


คุณคิดว่าเราสามารถขยายการใช้ Gini เพื่ออธิบายความเข้มข้น / ความแตกต่างในการวิเคราะห์อภิมานได้หรือไม่? มันอาจจะเป็นที่น่าสนใจเป็นวิธีการวัดปริมาณความเข้มข้นในเซลล์สืบพันธุ์และ ...
Joe_74

1
เนื่องจากข้อสันนิษฐานว่าเป็นผลกระทบปกติแล้วไม่มี แต่ฉันคิดว่าการอภิปรายที่เต็มไปด้วยเนื้อหานอกหัวข้อในหัวข้อนี้
mdewey

@ mdewey ประโยคสุดท้ายนั้นลึกซึ้งและช่วยฉันได้มากที่สุด ขอบคุณ!
Olivier_s_j

@ mdewey ฉันทดสอบตัวเองด้วยรหัสบางส่วน แต่มีสิ่งพิมพ์บางแห่งที่พูดถึงเรื่องนี้หรือไม่? หรือหลักฐาน? (ฉันหมายถึงประโยคสุดท้าย)
Olivier_s_j

@Ojtwist บทความ Wikipedia en.wikipedia.org/wiki/Gini_coefficientเป็นประโยชน์
mdewey

10

ค่าสัมประสิทธิ์ Gini ไม่แปรผันตามขนาดและมีขอบเขต, ค่าเบี่ยงเบนมาตรฐานคงที่กับการเปลี่ยนแปลงและไม่ จำกัด ดังนั้นจึงเป็นการยากที่จะเปรียบเทียบโดยตรง ตอนนี้คุณสามารถกำหนดเวอร์ชันเบี่ยงเบนมาตรฐานของการเบี่ยงเบนมาตรฐานโดยหารด้วยค่าเฉลี่ย (สัมประสิทธิ์การแปรผัน)

อย่างไรก็ตามดัชนี Gini ยังคงยึดตามค่าที่สองคือค่า squared ดังนั้นคุณสามารถคาดหวังว่าค่าที่สองจะได้รับอิทธิพลจากค่าผิดปกติมากขึ้น (ค่าต่ำหรือสูงเกินไป) สามารถพบได้ในมาตรการความไม่เท่าเทียมกันของรายได้ F De Maio, 2007:

การวัดความไม่เท่าเทียมกันของรายได้นี้คำนวณโดยการหารค่าเบี่ยงเบนมาตรฐานของการกระจายรายได้ด้วยค่าเฉลี่ย การกระจายรายได้ที่เท่าเทียมกันมากขึ้นจะมีค่าเบี่ยงเบนมาตรฐานที่น้อยกว่า เช่นนี้ประวัติย่อจะเล็กลงในสังคมที่เท่าเทียมกันมากขึ้น แม้จะเป็นหนึ่งในมาตรการที่ง่ายที่สุดของความไม่เท่าเทียมกันการใช้ CV นั้นค่อนข้าง จำกัด ในวรรณคดีสาธารณสุขและไม่ได้ให้ความสำคัญในการวิจัยเกี่ยวกับสมมติฐานความไม่เท่าเทียมกันของรายได้ นี่อาจเป็นผลมาจากข้อ จำกัด ที่สำคัญของการวัด CV: (1) มันไม่มีขอบเขตบนซึ่งต่างจากค่าสัมประสิทธิ์ Gini ซึ่งทำให้การตีความและการเปรียบเทียบค่อนข้างยาก และ (2) องค์ประกอบทั้งสองของ CV (ค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐาน) อาจได้รับอิทธิพลอย่างมากจากค่ารายได้ต่ำหรือสูงผิดปกติ ในคำอื่น ๆ

ดังนั้นสัมประสิทธิ์การแปรปรวนจึงน้อยกว่าและยังไม่ถูก จำกัด หากต้องการใช้ขั้นตอนเพิ่มเติมคุณสามารถลบค่าเฉลี่ยและหารด้วยส่วนเบี่ยงเบนสัมบูรณ์แทน ( ) ถึงปัจจัยคุณจะจบลงด้วยอัตราส่วนปกติของซึ่งสามารถล้อมรอบได้เนื่องจากสำหรับเวกเตอร์จุด(x)1 / 2 N 2 ( x ) 1 ( x ) 1(xm)=|xnm|1/2N2(x)1(x)N2(x)

ตอนนี้คุณมีดัชนี Gini และ อัตราส่วนสองมาตรการที่น่าสนใจของการกระจาย sparsity, ขนาดคงที่และขอบเขต1/2

พวกเขาถูกเปรียบเทียบในการเปรียบเทียบมาตรการ Sparsity , 2009 ทดสอบกับคุณสมบัติ sparsity ธรรมชาติที่แตกต่างกัน (Robin Hood, Scaling, Rising Tide, Cloning, Bill Gates และ Babies) ดัชนี Gini โดดเด่นที่สุด แต่รูปร่างของมันทำให้ยากต่อการใช้เป็นฟังก์ชั่นการสูญเสียและสามารถใช้เวอร์ชันปกติ1/2ในบริบทนี้

ดังนั้นหากคุณไม่ต้องการแสดงลักษณะการกระจายแบบเกาส์เซียนเกือบหากคุณต้องการวัดความกระจัดกระจายให้ใช้ดัชนี Gini ถ้าคุณต้องการส่งเสริมการกระจายแบบเบาบางระหว่างรุ่นต่าง ๆ คุณสามารถลองอัตราส่วนปกติได้

การบรรยายเพิ่มเติม: ความแตกต่างของค่าเฉลี่ยของ Gini: ตัวชี้วัดความแปรปรวนที่เหนือกว่าสำหรับการแจกแจงแบบไม่ปกติ Shlomo Yitzhaki, 2003 ซึ่งบทคัดย่ออาจปรากฏเป็นที่สนใจ:

จากมาตรการทั้งหมดของความแปรปรวนความแปรปรวนนั้นเป็นที่นิยมมากที่สุด บทความนี้ระบุว่า Gini's Mean Difference (GMD) ซึ่งเป็นดัชนีทางเลือกของความแปรปรวนแบ่งปันคุณสมบัติหลายอย่างกับความแปรปรวน แต่สามารถให้ข้อมูลเพิ่มเติมเกี่ยวกับคุณสมบัติของการแจกแจงที่ออกจากภาวะปกติ


1

ค่าเบี่ยงเบนมาตรฐานมีสเกล (พูด, ° K, เมตร, mmHg, ... ) โดยปกติสิ่งนี้มีอิทธิพลต่อการตัดสินขนาดของเรา ดังนั้นเรามักจะชอบค่าสัมประสิทธิ์การเปลี่ยนแปลงหรือดีกว่า (ในตัวอย่าง จำกัด ) ข้อผิดพลาดมาตรฐาน

ค่าสัมประสิทธิ์ Gini ถูกสร้างขึ้นจากค่าเปอร์เซ็นต์ (ไม่มีส่วนขยาย) และไม่มีขนาดในหน่วยของตนเอง (เช่นหมายเลข Mach) ใช้สัมประสิทธิ์ Gini หากคุณต้องการเปรียบเทียบความเท่าเทียมกันของการแบ่งปันกับสิ่งที่พบบ่อย (หุ้น 100%) โปรดทราบว่าสำหรับแอปพลิเคชันนี้สามารถใช้ส่วนเบี่ยงเบนมาตรฐานได้ดังนั้นฉันคิดว่าคำถามของคุณเพื่อเปรียบเทียบข้อดีและข้อเสียจะใช้กับแอปพลิเคชันประเภทนี้เท่านั้น ในกรณีนี้ค่าเบี่ยงเบนมาตรฐานก็จะกระโดดไป[0,1]ตัวบ่งชี้ทั้งสองจะขึ้นอยู่กับจำนวนหุ้น (ไม่ใช่ลบ) แต่ในทิศทางตรงกันข้าม: Gini เพิ่มขึ้นเมื่อจำนวนเพิ่มขึ้นส่วนเบี่ยงเบนมาตรฐานจะลดลง[0,1]

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.