การกระจายแบบไม่ต่อเนื่องนี้มีชื่อหรือไม่?

การกระจายแบบไม่ต่อเนื่องนี้มีชื่อหรือไม่? สำหรับ $i \in 1...N$

$f(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j}$

ฉันเจอการกระจายตัวนี้จากรายการต่อไปนี้: ฉันมีรายการของรายการที่ถูกจัดอันดับโดยฟังก์ชั่นยูทิลิตี้ ฉันต้องการสุ่มเลือกหนึ่งในรายการโดยให้ความเอนเอียงไปยังจุดเริ่มต้นของรายการ ดังนั้นก่อนอื่นให้เลือกดัชนีระหว่าง 1 ถึงอย่างสม่ำเสมอ จากนั้นผมก็เลือกรายการระหว่างดัชนี 1 และเจฉันเชื่อว่ากระบวนการนี้ส่งผลให้เกิดการกระจายตัวข้างต้น $N$ $j$ $N$ $j$

— ทอม
แหล่งที่มา

นี่ไม่ใช่การกระจาย: มันไม่ได้ทำให้เป็นมาตรฐาน

— whuber

@ เมื่อฉันคิดอย่างนั้นในตอนแรก (และแสดงความคิดเห็นก่อนที่ฉันจะรู้ว่าฉันเข้าใจผิดและลบความคิดเห็น) แต่มันกลับกลายเป็นว่าฉันเข้าใจผิดนิยาม มันเป็นฟังก์ชันมวลความน่าจะเป็นแบบปกติ

— Glen_b -Reinstate Monica

มันเป็นมาตรฐาน 1/1 จะปรากฏในผลรวมแน่นอนหนึ่งครั้ง (จะอยู่ใน f (1)) 1/2 จะปรากฏขึ้นสองครั้งอย่างแน่นอน (จะอยู่ใน f (1) และ f (2)) เป็นต้นดังนั้นผลรวมของผลรวมทั้งหมดเหล่านั้นจะเป็น N และค่าคงที่ normalizing จะแสดงเป็น 1 / N ตรวจสอบ

— rcorty

ถึงจุดแม้ว่าฉันไม่รู้ว่า distro นี้เรียกว่าอะไร ฉันก็ไม่รู้เหมือนกันว่ากระบวนการที่คุณอธิบายนำไปสู่การ distro นี้ได้อย่างไร หนึ่งในความคิดของฉันก็คือมันฟังดูเหมือนกระบวนการแยกกันไม่ออกซึ่งเป็น googlable มาก

— rcorty

@Glen_b ขอบคุณ ผมได้อ่านข้อความนี้ในโทรศัพท์ของฉันซึ่งไม่ได้ทำให้อย่างชัดเจนเพียงพอ

f

$f$

— whuber

คำตอบ:

คุณมีรุ่น discretized ของการกระจายเข้าสู่ระบบเชิงลบ, ที่อยู่, การจัดจำหน่ายที่มีการสนับสนุนเป็นและผู้ที่เป็น pdf ที $[0, 1]$ $f(t) = - \log t$

หากต้องการดูสิ่งนี้ฉันจะกำหนดตัวแปรสุ่มของคุณใหม่เพื่อรับค่าในชุดแทนที่จะเป็นและเรียก ส่งผลให้เกิดการกระจายTจากนั้นฉันก็อ้างว่า $\{ 0, 1/N, 2/N, \ldots, 1 \}$ $\{0, 1, 2, \ldots, N \}$ $T$

P r (T = \frac{t}{N}) \to - \frac{1}{N} \log (\frac{t}{N})

$Pr\left( T = \frac{t}{N} \right) \rightarrow - \frac{1}{N} \log \left( \frac{t}{N} \right)$

เป็นขณะที่ $N, t \rightarrow \infty$ ค่าคงที่ (ประมาณ) $\frac{t}{N}$

ก่อนอื่นการทดลองแบบจำลองเล็กน้อยแสดงให้เห็นถึงการลู่เข้านี้ นี่คือตัวอย่างเล็ก ๆ จากการแจกจ่ายของคุณ:

t_sample <- function(N, size) {
  bounds <- sample(1:N, size=size, replace=TRUE)
  samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
  samples / N
}

นี่คือฮิสโตแกรมของตัวอย่างขนาดใหญ่ที่นำมาจากการแจกแจงของคุณ:

ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)

ป้อนคำอธิบายรูปภาพที่นี่

และนี่คือไฟล์ PDF ลอการิทึมที่วางซ้อน:

linsp <- 1:100 / 100
lines(linsp, -log(linsp))

ป้อนคำอธิบายรูปภาพที่นี่

เพื่อดูว่าทำไมการบรรจบกันนี้เกิดขึ้นให้เริ่มด้วยนิพจน์ของคุณ

P r (T = \frac{t}{N}) = \frac{1}{N} \sum_{j = t}^{N} \frac{1}{j}

$Pr \left( T = \frac{t}{N} \right) = \frac{1}{N} \sum_{j=t}^N \frac{1}{j}$

และคูณและหารด้วย $N$

P r (T = \frac{t}{N}) = \frac{1}{N} \sum_{j = t}^{N} \frac{N}{j} \frac{1}{N}

$Pr \left( T = \frac{t}{N} \right) = \frac{1}{N} \sum_{j=t}^N \frac{N}{j} \frac{1}{N}$

$g(x) = \frac{1}{x}$ $\frac{t}{N}$ $1$ $N$

P R (T = \frac{เสื้อ}{ยังไม่มีข้อความ}) \approx \frac{1}{ยังไม่มีข้อความ} \int_{\frac{เสื้อ}{ยังไม่มีข้อความ}}^{1} \frac{1}{x} d x = - \frac{1}{ยังไม่มีข้อความ} เข้าสู่ระบบ (\frac{เสื้อ}{ยังไม่มีข้อความ})

$Pr \left( T = \frac{t}{N} \right) \approx \frac{1}{N} \int_{\frac{t}{N}}^1 \frac{1}{x} dx = - \frac{1}{N} \log \left( \frac{t}{N} \right)$

ซึ่งเป็นนิพจน์ที่ฉันต้องการจะไปถึง

— Matthew Drury
แหล่งที่มา

คุณยินดีอย่างยิ่ง นี่เป็นคำถามที่ยอดเยี่ยมและฉันสนุกมากกับการทำงาน

— Matthew Drury

เรื่องนี้ดูเหมือนจะเกี่ยวข้องกับการกระจาย Whitworth (ฉันไม่เชื่อว่ามันคือการกระจาย Whitworth เพราะถ้าฉันจำได้ถูกต้องนั่นคือการกระจายของชุดของค่าที่สั่ง แต่ดูเหมือนว่ามันจะเชื่อมต่อกับมันและขึ้นอยู่กับแผนการรวมเดียวกัน)

มีการอภิปรายของ Whitworth (และการอ้างอิงจำนวนมาก) ใน

แอนโธนี Lawrance และโรเบิร์ตมาร์ค (2008)
"กระจายขนาดของ บริษัท ในอุตสาหกรรมที่มีทรัพยากร จำกัด"
เศรษฐศาสตร์ประยุกต์ฉบับ 40 ปัญหา 12 หน้า 1595-1607

(ดูเหมือนว่าจะเป็นรุ่นกระดาษทำงานได้ที่นี่ )

ยังดู

Nancy L Geller, (1979)
บททดสอบที่มีความสำคัญสำหรับการแจกแจงของ Whitworth,
วารสารของ American Society for Information Science , Vol.30 (4), pp.229-231

— Glen_b -Reinstate Monica
แหล่งที่มา

เพื่อให้คำตอบมีอยู่ในตัวเองคุณสามารถให้คำจำกัดความของการกระจาย Whitworth และอาจให้คำอธิบายเกี่ยวกับการเชื่อมต่อที่คุณเห็น

— whuber

@whuber ใช่มันควรจะเป็นความคิดเห็นตามที่ยืน ฉันจะแก้ไขรายละเอียดบางอย่าง แต่มันจะจบลงด้วยดีกว่าอีกต่อไป

— Glen_b -Reinstate Monica

แค่นิยามบางอย่างก็ใช้ได้

— whuber

ขอบคุณที่เข้าใจกัน แต่อย่างไรก็ตามมันจะเป็นผลลัพธ์

— Glen_b -Reinstate Monica