ค่าสัมประสิทธิ์จินีและขอบเขตข้อผิดพลาด


11

ฉันมีชุดข้อมูลเวลาที่มี N = 14 นับในแต่ละช่วงเวลาและฉันต้องการคำนวณค่าสัมประสิทธิ์ Gini และข้อผิดพลาดมาตรฐานสำหรับการประมาณนี้ในแต่ละช่วงเวลา

เนื่องจากฉันมีเพียง N = 14 นับในแต่ละครั้งที่ฉันดำเนินการคำนวณความแปรปรวนของขนุนคือจากสม 7 ของ Tomson Ogwang 'วิธีการที่สะดวกในการคำนวณดัชนี Gini และ' ข้อผิดพลาดมาตรฐาน' ที่ไหนเป็นสัมประสิทธิ์จีนีของค่า N โดยไม่ต้ององค์ประกอบและเป็นค่าเฉลี่ยของk)var(G)=n-1n×Σk=1n(G(n,k)-G¯(n))2G(n,k)kG¯(x)G(n,k)

การปรับใช้สูตรไร้สาระโดยตรงสำหรับความแปรปรวน

calc.Gini.variance <- function(x) {
  N <- length(x)
  # using jacknifing as suggested by Tomson Ogwang - equation 7
  # in the Oxford Bulletin of Economics and Statistics, 62, 1 (2000)
  # ((n-1)/n) \times \sum_{k=1}^n (G(n,k)-\bar{G}(n))^2
  gini.bar <- Gini(x)

  gini.tmp <- vector(mode='numeric', length=N)
  for (k in 1:N) {
    gini.tmp[k] <- Gini(x[-k])
  }
  gini.bar <- mean(gini.tmp)
  sum((gini.tmp-gini.bar)^2)*(N-1)/N
 }
 calc.Gini.variance(c(1,2,2,3,4,99)) 
 # [1] 0.1696173
 Gini(c(1,2,2,3,4,99))
 # [1] 0.7462462

นี่เป็นวิธีการที่เหมาะสมสำหรับ N ตัวเล็กหรือไม่? ข้อเสนอแนะอื่น ๆ ?


บางทีคุณสามารถเพิ่มการคำนวณที่แท้จริงที่คุณใช้สำหรับทั้งการประมาณการตัวอย่างและข้อผิดพลาดมาตรฐานเนื่องจากหลายคนอาจไม่สามารถเข้าถึงกระดาษได้ตามลิงก์ที่ให้ไว้
พระคาร์ดินัล

คำตอบ:


5

ปัญหาหนึ่งคือเมื่อใช้ขนาดตัวอย่างขนาดเล็กและสถิติที่ซับซ้อน (สัมประสิทธิ์จินี) การกระจายความน่าจะเป็นของสถิติของคุณจะไม่ปกติประมาณดังนั้น "ข้อผิดพลาดมาตรฐาน" อาจทำให้เข้าใจผิดหากคุณตั้งใจจะใช้เพื่อสร้างช่วงความมั่นใจ หรือการทดสอบสมมติฐานขึ้นอยู่กับความปกติ

ฉันคิดว่า bootstrap เปอร์เซ็นไทล์จะเป็นวิธีที่ดีกว่าและง่ายต่อการนำไปใช้ ตัวอย่างเช่น:

> library(reldist) # just for the gini() function
> library(boot) # for the boot() function
> x <- c(1,2,2,3,4,99)
> gini(x)
[1] 0.7462462 # check get same result as in your question
> y <- boot(x, gini, 500)
> quantile(y$t, probs=c(0.025, 0.975))
     2.5%     97.5% 
0.6353158 0.7717868 
> plot(density(y$t))

ฉันไม่ได้แนบพล็อตที่สร้างในตอนท้าย แต่มันแสดงให้เห็นว่าช่วงความเชื่อมั่นนั้นมีความหลากหลายมากดังนั้นการใช้วิธีเช่น +/- 1.96 * se สำหรับช่วงความเชื่อมั่นจะทำให้เข้าใจผิด ฉันไม่ใช่แฟนตัวยงของวิธีการแจ็คไนฟ์สำหรับช่วงเวลาความเชื่อมั่นส่วนใหญ่ด้วยเหตุผลนี้ Jackknife ถูกประดิษฐ์ขึ้นเป็นเทคนิคการลดอคติสำหรับการประเมินจุดในขณะที่ช่วงความเชื่อมั่นมีความสำคัญต่อความคิดทั้งหมดของ bootstrap


ยังไม่มีข้อความ=14
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.