การแจกแจงเหนือรายการที่เรียงลำดับ


10

สมมติว่าเรามีรายการสั่งซื้อ

[a, b, c, ... x, y, z, ...]

ฉันกำลังมองหาตระกูลของการกระจายด้วยการสนับสนุนในรายการข้างต้นปกครองโดยพารามิเตอร์อัลฟาบางอย่างเพื่อที่:

  • สำหรับ alpha = 0 จะกำหนดความน่าจะเป็น1ให้กับรายการแรกด้านบนและ 0 สำหรับส่วนที่เหลือ aนั่นคือถ้าเราลิ้มลองจากรายการนี้ด้วยการเปลี่ยนเรามักจะได้รับ
  • เมื่ออัลฟาเพิ่มขึ้นเราจะกำหนดความน่าจะเป็นที่สูงขึ้นและสูงขึ้นให้กับส่วนที่เหลือของรายการโดยคำนึงถึงลำดับของรายการหลังจากการสลายตัวแบบเอ็กซ์โปเนนเชียล
  • เมื่อ alpha = 1 เรากำหนดความน่าจะเป็นที่เท่ากันให้กับทุกรายการในรายการดังนั้นการสุ่มตัวอย่างจากรายการนั้นคล้ายกับการละเว้นการสั่งซื้อ

นี่คล้ายกับการกระจายทางเรขาคณิต แต่มีความแตกต่างที่น่าสังเกต:

  • การกระจายตัวทางเรขาคณิตถูกกำหนดเหนือจำนวนธรรมชาติทั้งหมด ในกรณีของฉันด้านบนรายการมีขนาดคงที่
  • การแจกแจงเชิงเรขาคณิตไม่ได้ถูกกำหนดไว้สำหรับ alpha = 0

1
คุณดูเหมือนจะอธิบายครอบครัวของการแจกแจงเชิงเรขาคณิตที่ถูกตัดทอน อย่างไรก็ตามมีหลายครอบครัวที่ไม่มีที่สิ้นสุดในเชิงคุณภาพเหมือนคำอธิบายของคุณ ประเด็นก็คืออธิบายว่าคุณต้องการใช้ครอบครัวแบบนี้เพื่ออะไร
whuber

ขอบคุณ @whuber ใช่ฉันเข้าใจว่ามีการแจกแจงจำนวนมากที่เหมาะสมกับคำอธิบายนี้ มีสิ่งใดที่นึกขึ้นได้ไหม ฉันมีระบบที่เลือกองค์ประกอบแรกของรายการนี้ (คิดเป็นคะแนน) แต่ฉันต้องการสุ่มตัวเลือกนี้ (และตั้งค่าพารามิเตอร์การสุ่มแบบนี้) ฉันไม่ได้กำลังมองหา "ผุ" ประเภทใดประเภทหนึ่งโดยอ้างอิงจากอัลฟ่า ตราบใดที่ alpha = 0 หมายถึงไม่มีการสุ่มเช่นเลือกองค์ประกอบแรก 1 หมายถึง "เลือกองค์ประกอบใด ๆ " และอัลฟ่าระหว่าง 0 และ 1 หมายถึง "บางสิ่งบางอย่างในระหว่าง" อัลฟาทั้งสองมันจะดีพอ
Amelio Vazquez-Reina

คำตอบ:


11

rii{0,1,,n1}ni

pi=αrik=1nαrk

α=000=1α<11αn1αα=1n

α=1α0

α=0.5

p00.5005p10.2502p20.1251p30.0626p40.0313p50.0156p60.0078p70.0039p80.0020p90.0010

α

ป้อนคำอธิบายรูปภาพที่นี่


ดี นี่เป็นวิธีที่ฉลาดกว่าที่ฉันเคยคาดหวัง
Matthew Drury

@ Matewew นี่คือการแจกแจงเชิงเรขาคณิตที่ถูกตัดทอนซึ่งฉันอ้างถึงก่อนหน้านี้
whuber

4

ฉันจะพยายามสร้างตัวอย่างจากหลักการแรก

ลองแบ่งสามกลุ่มเป็นหน่วยการสร้างของเรา:

  • P คือการแจกแจงการแจกแจงความน่าจะเป็นหนึ่งในองค์ประกอบแรกของรายการ
  • 12141
  • U คือการกระจายแบบสม่ำเสมอเหนือรายการ

ตอนนี้เราต้องการนำตระกูลหนึ่งพารามิเตอร์ของการรวมกันเชิงบวกของการแจกแจงเหล่านี้

α(t)P+β(t)E+γ(t)U

α(t)+β(t)+γ(t)=1t[0,1]α(0)=1γ(1)=1

(α(t),β(t),γ(t))(1,0,0),(0,1,0),(0,0,1)t(0,1)

นี่คือตัวเลือกสำหรับเส้นโค้ง:

(1t(1t))(1t,0,t)+t(1t)(13,13,13)

(1t,0,t)(13,13,13)t(0,1)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.