ฉันจะวิเคราะห์ด้วยวิธีพิสูจน์ได้อย่างไรว่าการแบ่งจำนวนเงินแบบสุ่มส่งผลให้เกิดการแจกแจงแบบเลขชี้กำลัง (เช่นรายได้และความมั่งคั่ง)


36

ในบทความปัจจุบันในวิทยาศาสตร์นี้มีการเสนอต่อไปนี้:

สมมติว่าคุณแบ่งรายได้ 500 ล้านคนจาก 10,000 คน มีทางเดียวเท่านั้นที่จะให้ทุกคนมีส่วนร่วมได้ 50,000 หุ้น ดังนั้นหากคุณกำลังหารายได้แบบสุ่มความเท่าเทียมนั้นเป็นไปได้ยากมาก แต่มีวิธีนับไม่ถ้วนที่จะมอบเงินจำนวนมากให้กับคนจำนวนน้อยและคนจำนวนมากมีน้อยหรือไม่มีเลย ตามจริงแล้วทุกวิธีที่คุณสามารถแบ่งรายได้ส่วนใหญ่ผลิตรายได้แบบเอ็กซ์โปเนนเชียล

ฉันทำสิ่งนี้ด้วยรหัส R ต่อไปนี้ซึ่งดูเหมือนว่าจะยืนยันผล:

library(MASS)

w <- 500000000 #wealth
p <- 10000 #people

d <- diff(c(0,sort(runif(p-1,max=w)),w)) #wealth-distribution
h <- hist(d, col="red", main="Exponential decline", freq = FALSE, breaks = 45, xlim = c(0, quantile(d, 0.99)))

fit <- fitdistr(d,"exponential")
curve(dexp(x, rate = fit$estimate), col = "black", type="p", pch=16, add = TRUE)

ป้อนคำอธิบายรูปภาพที่นี่

คำถามของฉันฉัน
จะวิเคราะห์พิสูจน์ได้อย่างไรว่าการกระจายตัวที่เกิดขึ้นนั้นมีความหมายอย่างแน่นอน

ภาคผนวก
ขอบคุณสำหรับคำตอบและความคิดเห็นของคุณ ฉันคิดเกี่ยวกับปัญหาและคิดหาเหตุผลอย่างง่าย ๆ ดังต่อไปนี้ โดยทั่วไปแล้วสิ่งต่อไปนี้จะเกิดขึ้น (ระวัง: การคาดการณ์ล่วงหน้ามากเกินไป): คุณชอบตามจำนวนและโยนเหรียญ (ลำเอียง) ทุกครั้งที่คุณได้รับเช่นหัวหน้าคุณแบ่งจำนวนเงิน คุณแจกจ่ายพาร์ติชันที่เป็นผลลัพธ์ ในกรณีที่ไม่ต่อเนื่องเหรียญที่ทอยตามการกระจายแบบทวินามพาร์ติชั่นนั้นถูกกระจายแบบเรขาคณิต แอนะล็อกต่อเนื่องคือการแจกแจงปัวซองและการแจกแจงเอ็กซ์โพเนนเชียลตามลำดับ! (ด้วยเหตุผลเดียวกันมันก็กลายเป็นความชัดเจนอย่างสังหรณ์ใจว่าทำไมการกระจายแบบเรขาคณิตและเลขชี้กำลังมีสมบัติของความจำเสื่อม - เพราะเหรียญไม่มีหน่วยความจำเช่นกัน)


3
หากคุณให้เงินออกมาทีละตัวมีหลายวิธีในการกระจายพวกเขาอย่างเท่าเทียมกันและอีกมากมายเพื่อกระจายพวกเขาเกือบเท่า ๆ กัน (เช่นการกระจายที่เกือบปกติและมีค่าเฉลี่ยและเบี่ยงเบนมาตรฐานใกล้ )22450000224
เฮนรี่

@Henry: คุณช่วยอธิบายขั้นตอนนี้อีกหน่อยได้ไหม โดยเฉพาะอย่างยิ่งคุณหมายถึงอะไรโดย "หนึ่งต่อหนึ่ง"? บางทีคุณอาจให้รหัสของคุณด้วยซ้ำ ขอขอบคุณ.
vonjd

vonjd: เริ่มต้นด้วย 500 ล้านเหรียญ จัดสรรแต่ละเหรียญอย่างอิสระและสุ่มระหว่าง 10,000 คนที่มีความน่าจะเป็นที่เท่ากัน เพิ่มจำนวนเหรียญที่แต่ละคนจะได้รับ
Henry

@Henry: คำสั่งเดิมคือวิธีการกระจายเงินสดเป็นวิธีแจกแจงแบบทวีคูณ วิธีการกระจายเงินสดและวิธีการกระจายเหรียญไม่ใช่ isomorphic เนื่องจากมีเพียงวิธีเดียวที่จะกระจาย$ 500,000,000 อย่างสม่ำเสมอในหมู่ 10,000 คน (ให้แต่ละ$ 50,000) แต่มีวิธี 500,000,000! / ((50,000!) ^ 10,000) ของการกระจาย 50,000 เหรียญให้กับแต่ละ 10,000 คน
supercat

1
@Henry ในสถานการณ์ที่คุณอธิบายไว้ในความคิดเห็นบนสุดมันถูกกำหนดตั้งแต่ต้นว่าแต่ละคนมีความน่าจะเป็นเท่ากันในการรับเหรียญ เงื่อนไขนี้กำหนดน้ำหนักอย่างมากให้กับการแจกแจงแบบปกติแทนที่จะพิจารณาวิธีการกระจายเหรียญที่ต่างกันอย่างเท่าเทียมกัน
higgsss

คำตอบ:


27

ในการทำให้ปัญหาง่ายขึ้นให้ลองพิจารณากรณีที่ค่าอนุญาตของการแบ่งปันของแต่ละบุคคลนั้นไม่ต่อเนื่องเช่นจำนวนเต็ม เท่ากันเราสามารถจินตนาการถึงการแบ่ง "แกนรายได้" ในช่วงเวลาที่เท่ากันและประมาณค่าทั้งหมดที่ตกลงไปในช่วงเวลาที่กำหนดโดยจุดกึ่งกลาง

แสดงถึงรายได้รวมเป็น , ค่าที่อนุญาตเป็น , จำนวนคนทั้งหมดเป็นและสุดท้าย, จำนวนคนที่มีส่วนแบ่งเป็น , เงื่อนไขต่อไปนี้ น่าจะพอใจ: และ s x s N x s n s C 1 ( { n s } ) s n s - N = 0 , C 2 ( { n s } ) s n s x s - X = 0XsxsNxsns

C1({ns})snsN=0,
C2({ns})snsxsX=0.

ขอให้สังเกตว่าหลายวิธีในการแบ่งการแชร์สามารถแสดงถึงการกระจายแบบเดียวกัน ตัวอย่างเช่นหากเราพิจารณาแบ่ง$ 4 ระหว่างคนสองคนการให้$ 3 ถึง Alice และ$ 1 ถึง Bob และในทางกลับกันทั้งสองจะให้การแจกแจงที่เหมือนกัน เนื่องจากการแบ่งเป็นแบบสุ่มการกระจายที่มีจำนวนสูงสุดของวิธีที่สอดคล้องกันเพื่อแบ่งการแบ่งปันมีโอกาสที่ดีที่สุดที่จะเกิดขึ้น

เพื่อให้ได้การแจกแจงแบบนี้เราต้องขยาย ภายใต้ข้อ จำกัด ทั้งสองข้างต้น วิธีการคูณลากรองจ์เป็นวิธีการที่ยอมรับได้สำหรับเรื่องนี้ นอกจากนี้เราสามารถเลือกทำงานกับแทนด้วยตัวเองเนื่องจาก " " เป็นฟังก์ชั่นการเพิ่มเสียงเดียว นั่นคือ โดยที่เป็นตัวคูณของลากรองจ์ แจ้งให้ทราบว่าตามสูตรของสเตอร์ลิง ,

W({ns})N!sns!,
lnWWln
lnWns=λ1C1ns+λ2C1ns=λ1+λ2xs,
λ1,2
lnn!nlnnn,
นำไปสู่ ดังนั้น จากนั้นตามมาว่า ซึ่งเป็นการแจกแจงแบบเอ็กซ์โพเนนเชียล หนึ่งสามารถรับค่าของตัวคูณ Lagrange โดยใช้ข้อ จำกัด จากข้อ จำกัด แรก
dlnn!dnlnn.
lnWnslnns.
nsexp(λ1λ2xs),
N=snssexp(λ1λ2xs)1Δx0exp(λ1λ2x)dx=1λ2Δxexp(λ1),
ที่ใดคือระยะห่างระหว่างค่าที่อนุญาต ในทำนองเดียวกัน ดังนั้นเรามี Δx
X=snsxssxsexp(λ1λ2xs)1Δx0xexp(λ1λ2x)dx=1λ22Δxexp(λ1).
exp(λ1)=N2ΔxX,
และ ว่านี่เป็นจำนวนสูงสุดจริงๆแทนที่จะเป็นจุดต่ำสุดหรือจุดอานคุณสามารถเห็นได้จาก Hessian แห่ง . เนื่องจากเป็นเส้นตรงในมันจึงเหมือนกับ : และ
λ2=NX.
lnWλ1C1λ2C2C1,2nslnW
2lnWns2=1ns<0,
2lnWnsnr=0(sr).
ดังนั้นรัฐ Hessian จึงเป็นส่วนที่เว้าและสิ่งที่เราได้พบนั้นมีค่าสูงสุด

ฟังก์ชันคือการกระจายตัวของการแจกแจง สำหรับการแจกแจงโดยทั่วไปเราสังเกตว่าใกล้เคียงกับค่าที่เป็นไปได้มากที่สุดควรแคบพอ จะเห็นได้จากรัฐว่าเงื่อนไขนี้จำนวน1 (เป็นเงื่อนไขที่สูตรของสเตอร์ลิงน่าเชื่อถือ) ดังนั้นหากต้องการดูการแจกแจงแบบเอ็กซ์โปเนนเชียลพาร์ติชันในแกนรายได้ (ตรงกับถังขยะในฮิสโตแกรมของ OP) ควรกว้างพอดังนั้นจำนวนคนในพาร์ติชั่น กว่าความสามัคคี ตรงหางซึ่งมีแนวโน้มที่จะเป็นศูนย์เงื่อนไขนี้จะถูกกำหนดให้ล้มเหลวเสมอW({ns})W({ns})ns1ns

หมายเหตุ:นี่เป็นวิธีที่นักฟิสิกส์เข้าใจการกระจาย Boltzmannในกลศาสตร์เชิงสถิติ การกระจายการชี้แจงเป็นหลักที่แน่นอนสำหรับกรณีนี้ในขณะที่เราพิจารณา{23}N1023


1
ขอบคุณโปรดดูคำตอบของ Glen_b สิ่งนี้สอดคล้องกับคำตอบของคุณหรือไม่
vonjd

2
@ vonjd ไม่เป็นไร! ฉันคิดว่าคำตอบของเขาสอดคล้องกับของฉัน สำหรับฉันดูเหมือนว่าเขากำลังทำการเปรียบเทียบกับกระบวนการปัวซองในแง่ต่อไปนี้: พิจารณากระบวนการปัวซองด้วย "ช่วงเวลาเฉลี่ย" 50,000 และนับ 10,000 เหตุการณ์ จากนั้นโดยเฉลี่ย "ช่วงเวลารวม" คือ 50,000 x 10,000 = 500 ล้าน
higgsss

2
@vonjd ฉันปรับปรุงคำตอบของฉัน สิ่งที่สะดุดตาที่สุดคือฉันได้เพิ่มการอภิปรายเกี่ยวกับเงื่อนไขที่การกระจายที่เรามักสังเกตว่าเป็นสิ่งที่ใกล้เคียงกับการแจกแจงที่น่าจะเป็นไปได้มากที่สุด
higgsss

2
เมื่อพิจารณากรณีที่ไม่ต่อเนื่องจะเป็นประโยชน์หรือไม่หากสังเกตว่าสิ่ง T สามารถแบ่งได้ระหว่างคน N ((N + T-1) เลือก (N-1)) หากบุคคลแรกได้รับสิ่งต่าง ๆ จำนวนวิธีที่หนึ่งสามารถแจกจ่ายส่วนที่เหลือคือ ((N + Tf-2) เลือก (N-2)) ผลรวมของค่า f จาก 0 ถึง N คือจำนวนรวมของวิธีการกระจายทุกอย่าง
supercat

1
@supercat ดูเหมือนว่าจะมีวิธีอื่นในการหาค่าการแจกแจงเลขชี้กำลังสำหรับฉัน สมมติว่า (เราพิจารณาค่าของที่ไม่ใกล้กับส่วนท้ายของการแจกแจง) จากนั้นเลือกT} TN,ff(N+Tf2)(N2)=(N+Tf2)!/(N2)!/(Tf)! (N+Tf2)!/(Tf)!(Tf)N2TN2e(N2)f/T
higgsss

17

ในความเป็นจริงคุณสามารถพิสูจน์ได้ว่ามันไม่ได้เป็นเลขชี้กำลังเกือบจะเป็นเรื่องเล็กน้อย:

คำนวณความน่าจะเป็นที่หุ้นที่ให้ไว้มีค่ามากกว่าล้าน เปรียบเทียบกับความน่าจะเป็นที่ตัวแปรสุ่มอธิบายมากกว่าล้าน500500

อย่างไรก็ตามมันไม่ยากเกินไปที่จะเห็นว่าสำหรับตัวอย่างช่องว่างที่เหมือนกันของคุณว่าควรใกล้เคียงกับเลขชี้กำลัง

พิจารณากระบวนการปัวซง - เหตุการณ์ที่เกิดขึ้นโดยการสุ่มไปตามมิติ จำนวนเหตุการณ์ต่อหน่วยของช่วงเวลานั้นมีการแจกแจงแบบปัวซองและช่องว่างระหว่างเหตุการณ์เป็นแบบเอ็กซ์โปเนนเชียล

หากคุณใช้ช่วงเวลาคงที่เหตุการณ์ในกระบวนการปัวซองที่อยู่ในนั้นจะถูกกระจายอย่างสม่ำเสมอในช่วงเวลา ดูที่นี่

[อย่างไรก็ตามโปรดทราบว่าเนื่องจากช่วงเวลามี จำกัด คุณไม่สามารถสังเกตเห็นช่องว่างขนาดใหญ่กว่าความยาวช่วงเวลาและช่องว่างที่เกือบจะมีขนาดใหญ่นั้นจะไม่น่าเป็นไปได้ (พิจารณาตัวอย่างเช่นในช่วงหน่วย - ถ้าคุณเห็นช่องว่าง 0.04 และ 0.01 ช่องว่างถัดไปที่คุณเห็นไม่สามารถใหญ่กว่า 0.95)]

ดังนั้นนอกเหนือจากผลของการจำกัดความสนใจไปยังช่วงเวลาคงที่เกี่ยวกับการกระจายของช่องว่าง (ซึ่งจะลดลงสำหรับมีขนาดใหญ่, จำนวนคะแนนในช่วงเวลา) คุณคาดหวังว่าช่องว่างเหล่านั้นจะถูกแจกแจงชี้แจงn

ตอนนี้ในรหัสของคุณคุณกำลังหารช่วงหน่วยด้วยการใส่ชุดแล้วหาช่องว่างในสถิติการสั่งซื้อต่อเนื่อง ที่นี่ช่วงเวลาของหน่วยไม่ใช่เวลาหรือพื้นที่ แต่แสดงถึงมิติของเงิน (ลองนึกภาพเงินที่ 50,000 ล้านเซ็นต์ที่วางไว้ตั้งแต่ต้นจนจบและเรียกระยะทางที่ครอบคลุมช่วงหน่วยนั้น ๆ ยกเว้นที่นี่เรามีเศษเสี้ยวของหนึ่งเซ็นต์) เราวางเครื่องหมายและแบ่งช่วงเป็น "การแบ่งปัน" เนื่องจากการเชื่อมต่อระหว่างกระบวนการปัวซงและจุดเครื่องแบบในช่วงเวลาหนึ่งช่องว่างในสถิติการเรียงลำดับของเครื่องแบบจะมีแนวโน้มที่จะดูทวีคูณตราบใดที่ไม่เล็กเกินไปnn+1n

โดยเฉพาะอย่างยิ่งช่องว่างใด ๆ ที่เริ่มต้นในช่วงเวลาที่วางไว้เหนือกระบวนการปัวซงมีโอกาสที่จะ "ตรวจสอบ" (มีประสิทธิภาพตัดให้สั้นกว่าที่ควรจะเป็น) โดยการวิ่งเข้าสู่จุดสิ้นสุดของช่วงเวลา

ป้อนคำอธิบายรูปภาพที่นี่

ช่องว่างที่ยาวกว่ามีแนวโน้มที่จะทำเช่นนั้นมากกว่าช่องว่างที่สั้นกว่าและช่องว่างที่มากขึ้นในช่วงเวลาหมายความว่าความยาวของช่องว่างเฉลี่ยต้องลดลงนั่นคือช่องว่างสั้น ๆ แนวโน้มนี้ที่จะ 'ถูกตัดออก' จะมีผลต่อการกระจายของช่องว่างที่ยาวนานกว่าสั้นกว่า (และไม่มีโอกาสที่ช่องว่างใด ๆ ที่ จำกัด ในช่วงเวลานั้นจะเกินความยาวของช่วงเวลา - ดังนั้นการกระจายขนาดช่องว่างควรลดลงอย่างราบรื่น เป็นศูนย์ที่ขนาดของช่วงเวลาทั้งหมด)

ในแผนภาพช่วงเวลาที่ยาวที่สุดของปลายถูกตัดให้สั้นลงและช่วงเวลาที่สั้นกว่าที่จุดเริ่มต้นก็จะสั้นลงเช่นกัน ผลกระทบเหล่านี้ทำให้เราห่างจากการยกกำลังแบบทวีคูณ

(ในความเป็นจริงการกระจายตัวของช่องว่างระหว่างสถิติการสั่งซื้อเครื่องแบบ Beta (1, n).)n

ดังนั้นเราควรเห็นการกระจายตัวที่ดูเอ็กซ์โพเนนเชียลในค่าเล็ก ๆ แล้วก็เอ็กซ์โพเนนเชียลน้อยกว่าค่าที่มากขึ้นเนื่องจากความหนาแน่นของค่าที่มากที่สุดจะย่อตัวเร็วขึ้นn

นี่คือการจำลองการกระจายตัวของช่องว่างสำหรับ n = 2:

ป้อนคำอธิบายรูปภาพที่นี่

ไม่ได้อธิบายอย่างมาก

แต่สำหรับ n = 20 มันเริ่มที่จะดูใกล้ ๆ ในความเป็นจริงเป็นเติบโตขนาดใหญ่ก็จะมีการประมาณกันโดยชี้แจงที่มีค่าเฉลี่ย1}n1n+1

ป้อนคำอธิบายรูปภาพที่นี่

หากนั่นคือเลขชี้กำลังด้วยค่าเฉลี่ย 1/21 แล้วจะเหมือนกัน ... แต่เราเห็นได้ว่ามันไม่ใช่:exp(21x)

ป้อนคำอธิบายรูปภาพที่นี่

ความไม่สม่ำเสมอของค่าต่ำนั้นสอดคล้องกับค่ามากของช่องว่าง - ซึ่งเราคาดหวังจากการอภิปรายข้างต้นเนื่องจากผลของการ "ตัด" กระบวนการปัวซงถึงช่วง จำกัด หมายความว่าเราไม่เห็น ช่องว่างที่ใหญ่ที่สุด แต่เมื่อคุณใช้ค่ามากขึ้นเรื่อย ๆ มันจะพุ่งเข้าหาหางและผลลัพธ์ก็จะเริ่มมีลักษณะใกล้เคียงกันมากขึ้น ที่จอแสดงผลที่เทียบเท่าจะยากที่จะแยกความแตกต่างจากเครื่องแบบ - ช่องว่าง (คิดเป็นสัดส่วนของเงิน) ควรจะใกล้เคียงกับการแจกแจงแบบเอ็กซ์โปเนนเชียลยกเว้นค่าที่ไม่น่าเป็นไปได้และมีค่ามากที่สุดn=10000


2
ดังนั้นเพียงแค่เข้าใจคุณอย่างถูกต้อง: คุณกำลังบอกว่ามันไม่ใช่เลขชี้กำลัง?!? higgsss พิสูจน์ให้เห็นว่ามันเป็นเลขชี้กำลัง!
vonjd

3
ให้ฉันพูดคำตอบของฉัน: (i) "คุณสามารถพิสูจน์ได้ว่ามันไม่ใช่เลขชี้กำลัง" BUT (ii) สำหรับช่องว่างที่เหมือนกันที่คุณดู "... จะต้องใกล้เคียงกับ exponential" ... "ตราบใดที่ n ไม่ใช่ เล็กเกินไป." ... ไม่มีความชัดเจนอะไร?
Glen_b

5
ฉันได้ระบุหลักฐานที่ไม่สำคัญชัดเจนว่ามันไม่ได้เป็นเลขชี้กำลังในคำตอบของฉัน higgss ไม่ได้พิสูจน์ว่ามันเป็นเลขชี้กำลัง คำตอบนั้นดีมากสอดคล้องกับข้อความของฉัน ในนั้น higgsss พิสูจน์ว่ามันจะเป็นเลขชี้กำลังประมาณ :nsexp(λ1λ2xs)
Glen_b

2
ฉันคิดว่าคำตอบนี้เป็นวิธีที่ดีในการดูปัญหาและสมควรได้รับการโหวตมากขึ้น แต่ฉันกลัวว่าการเปรียบเทียบกับกระบวนการปัวซงทำงานอย่างไร (เช่นสิ่งที่ "เวลา" ตรงกับ) อาจไม่ชัดเจน คุณยินดีที่จะให้รายละเอียดเพิ่มเติมหรือไม่?
higgsss

3
@higgsss ฉันได้สร้างข้อความใหม่เล็กน้อย (ลบการอ้างอิงถึงเวลา) เพิ่มรายละเอียดเล็กน้อยและลิงก์ ฉันอาจเพิ่มการสนทนาเพิ่มเติมในภายหลัง หากคุณมีข้อเสนอแนะเฉพาะฉันจะสนใจในการปรับปรุงคำตอบของฉันเพิ่มเติม
Glen_b

8

ลองสมมุติว่าเงินนั้นหารด้วยอนันต์เพื่อเราสามารถจัดการกับจำนวนจริงแทนที่จะเป็นจำนวนเต็ม

จากนั้นการกระจายตัวแบบสม่ำเสมอของแบ่งพาร์ติชันทั่วบุคคลจะให้ความหนาแน่นของส่วนบุคคลสำหรับแต่ละสำหรับและความน่าจะเป็นสะสมสำหรับแต่ละบุคคลของt=500000000n=10000

p(x)=n1t(1xt)n2
0xt
P(Xx)=1(1xt)n1.

หากคุณต้องการใช้สิ่งนี้ให้ใช้การแจกแจงร่อแร่เพื่อจัดสรรจำนวนสุ่มให้กับบุคคลใด ๆ จากนั้นลดถึงและเป็นและทำซ้ำ โปรดทราบว่าเมื่อสิ่งนี้จะทำให้การกระจายส่วนบุคคลที่สม่ำเสมอในจำนวนที่เหลืออยู่เท่าที่ทุกคนคาดหวัง เมื่อคุณให้เงินที่เหลือทั้งหมดให้กับคนที่เหลืออยู่คนเดียวXttXnn1n=2n=1

การแสดงออกเหล่านี้เป็นพหุนามมากกว่าชี้แจง แต่สำหรับขนาดใหญ่คุณอาจจะพบว่ามันยากที่จะแยกแยะผลกระทบจากการกระจายชี้แจงกับพารามิเตอร์ใกล้กับ{t} การกระจายเป็น asymptotically ชี้แจงเพราะเป็น\ nnt(1ym)mexp(y)m


8

ในการพูดว่า "สมมติว่าคุณแบ่งรายได้ 500 ล้านคนจาก 10,000 คน" นั้นมีลักษณะเฉพาะที่ไม่เพียงพอที่จะตอบคำถาม มีกระบวนการสุ่มที่แตกต่างกันมากมายที่สามารถใช้ในการจัดสรรเงินจำนวนคงที่ให้กับคนจำนวนคงที่และแต่ละคนจะมีลักษณะของตัวเองสำหรับการกระจายผล นี่คือกระบวนการกำเนิดสามอย่างที่ฉันสามารถนึกได้และการแจกแจงความมั่งคั่งที่แต่ละคนสร้างขึ้น

library(MASS)

w <- 500000000 #wealth
p <- 10000 #people

วิธีที่ 1 โพสต์โดย OP:

เลือกหมายเลข 'p' จาก [0, w) อย่างสม่ำเสมอโดยการสุ่ม เรียงลำดับเหล่านี้ ผนวก '0' ที่ด้านหน้า แจกจำนวนเงินดอลล่าร์ที่แสดงโดยความแตกต่างระหว่างองค์ประกอบต่อเนื่องในรายการนี้

d <- diff(c(0,sort(runif(p-1,max=w)),w)) #wealth-distribution
h <- hist(d, col="red", main="Exponential decline", freq = FALSE, breaks = 45,
     xlim = c(0, quantile(d, 0.99)))
fit <- fitdistr(d,"exponential")
curve(dexp(x, rate = fit$estimate), col = "black", type="p", 
      pch=16, add = TRUE)

แบ่งช่วงเวลาที่สม่ำเสมอ

วิธีที่ 2:

เลือกหมายเลข 'p' จาก [0, w) อย่างสม่ำเสมอโดยการสุ่ม พิจารณา 'น้ำหนัก' เหล่านี้ดังนั้น 'w' จึงไม่สำคัญในขั้นนี้ ทำให้น้ำหนักปกติ แจกจำนวนเงินดอลล่าร์ที่แสดงด้วยเศษส่วนของ 'w' ที่สอดคล้องกับน้ำหนักแต่ละอัน

d <- runif(p,max=w) #weigh-distribution
d <- d/sum(d)*w #wealth-distribution
h <- hist(d, col="red", main="pretty uniform", freq = FALSE, breaks = 45, 
          xlim = c(0, quantile(d, 0.99)))

ลดน้ำหนักแล้ว

วิธีที่ 3:

เริ่มต้นด้วย 'p' 0s w ครั้งเพิ่ม 1 เข้ากับหนึ่งในนั้นเลือกอย่างสม่ำเสมอ

d <- rep(0, p)
for( i in 1:5000000){ ## for-loops in R are terrible, but this gives the idea.
    k <- floor(runif(1, max=p)) + 1    
    d[k] = (d[k] + 1)
}
h <- hist(d, col="red", main="kinda normalish?", freq = FALSE, breaks = 45,
          xlim = c(0, quantile(d, 0.99)))

ดอลลาร์ซ้ำ


4

ให้ฉันเพิ่มบางอย่างเกี่ยวกับภาคผนวกของคุณ

ในกรณีอย่างต่อเนื่องตามที่ Glen_b และ Henry กำหนดให้ PDF ที่แน่นอนสำหรับจำนวนเงินที่แต่ละคนได้รับคือ start โดยที่คือจำนวนคนและคือจำนวนเงินทั้งหมด

p(x)=N1X(1xX)N2,
NX

ในกรณีที่ไม่ต่อเนื่องสมมติว่ามีเหรียญจะแจกจ่ายความน่าจะเป็นสำหรับบุคคลใดบุคคลหนึ่งที่จะได้รับเหรียญคือ เมื่อมีสองกรณีที่เห็นด้วยกัน สำหรับมีขนาดใหญ่เพียงพอและตราบใดที่เราอยู่ห่างจากหางพวกมันดูเหมือนการแจกแจงแบบเลขชี้กำลังMm M»NN

p(m)=N1M+1j=0N3(1mMj)N2.
MNN

ในทั้งสองกรณีขณะที่เราสุ่มตัวอย่างครั้งจากการแจกแจงความน่าจะเป็นที่แท้จริงนี้จะมีข้อผิดพลาดที่เกี่ยวข้องกับขนาดตัวอย่างที่แน่นอนN

อย่างไรก็ตามการทำการวิเคราะห์ข้อผิดพลาดนั้นไม่ตรงไปตรงมาเพราะตัวอย่างที่แตกต่างกันในกรณีนี้ไม่เป็นอิสระ พวกเขาจะต้องรวมยอดรวมและจำนวนคนแรกที่ได้รับมีผลต่อการกระจายความน่าจะเป็นสำหรับคนที่สองเป็นต้น

คำตอบก่อนหน้าของฉันไม่ได้รับจากปัญหานี้ แต่ฉันคิดว่ามันจะมีประโยชน์ที่จะเห็นว่ามันสามารถแก้ไขได้ในวิธีการนี้


3

การวิเคราะห์ทางทฤษฎีที่ดีทำได้โดยคำตอบที่ upvote อย่างไรก็ตามนี่คือมุมมองเชิงประจักษ์ที่เรียบง่ายของฉันว่าทำไมการแจกแจงแบบเลขชี้กำลัง

เมื่อคุณกระจายเงินแบบสุ่มลองพิจารณาว่าคุณทำมันทีละตัว ให้ S เป็นผลรวมดั้งเดิม

สำหรับผู้ชายคนแรกคุณต้องเลือกจำนวนสุ่มระหว่าง 0 ถึง S ดังนั้นโดยเฉลี่ยคุณจะเลือก S / 2 และยังคงอยู่กับ S / 2

สำหรับผู้ชายคนที่สองคุณจะเลือกสุ่มระหว่าง 0 และโดยเฉลี่ยแล้ว S / 2 ดังนั้นโดยเฉลี่ยคุณจะเลือก S / 4 และอยู่กับ S / 4

ดังนั้นคุณจะต้องแบ่งผลรวมออกเป็นครึ่งทุกครั้ง (การพูดเชิงสถิติ)

แม้ว่าในตัวอย่างของชีวิตจริงคุณจะไม่ได้รับค่าที่ลดลงครึ่งหนึ่งอย่างต่อเนื่อง แต่นี่ก็แสดงให้เห็นว่าเหตุใดจึงควรคาดหวังว่าการแจกแจงจะแจกแจงแบบเลขชี้กำลัง


3
อัลกอริทึมของคุณจะให้เงินกับคนแรกมากกว่าคนอื่น ๆ มีวิธีการอื่น ๆ ที่ไม่มีอคตินี้
Henry

@Henry คุณจะเริ่มแบ่งปันเงินได้อย่างไร คุณต้องเริ่มต้นกับใครสักคน และเมื่อคุณทำเช่นนั้นคุณจะได้รับเงินทั้งหมดต่อหน้าคุณ การให้เศษส่วนแบบสุ่มแก่เขาหมายถึงการเลือกแบบสุ่มจากผลรวมทั้งหมด ไม่มีใครสามารถบอกได้ว่าการสันนิษฐานว่ามี "ชายคนแรก" ผิดเพราะมิฉะนั้นผู้ที่แบ่งปันเงินก็จะแบ่งจำนวนตามจำนวนคนเพราะเขารู้ล่วงหน้าว่ามีกี่คน นั่นเป็นเพียงมุมมองของฉัน: เมื่อคุณบอกว่าคุณแบ่งเงิน "สุ่ม" จะมีเพียงชายคนหนึ่งที่ได้รับเงินมากขึ้น
Bogdan Alexandru

Bogdan Alexandru: อัลกอริทึมของฉัน (คำตอบอื่น) มีคุณสมบัติที่การกระจายตัวของแต่ละคนเหมือนกันไม่ว่าพวกเขาจะถูกเลือกก่อนกลางหรือสุดท้าย นอกจากนี้ยังสอดคล้องกับความหนาแน่นสม่ำเสมอทั่วทั้งพื้นที่ที่ถูก จำกัด ด้วยจำนวนเงินทั้งหมดที่ได้รับการจัดสรร
Henry
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.