อะไรคือการกระจายของลูกเต๋าหลายเหลี่ยมที่ม้วนตัวทั้งหมดในคราวเดียว


15

นำของแข็ง 5 Platonic ออกจากชุดลูกเต๋า Dungeons & Dragons เหล่านี้ประกอบด้วยลูกเต๋า 4 ด้าน, 6 ด้าน (ธรรมเนียม), 8-sided, 12-sided และ 20-sided ทั้งหมดเริ่มต้นที่หมายเลข 1 และนับขึ้น 1 ด้วยจำนวนทั้งหมด

รีดพวกเขาทั้งหมดในครั้งเดียวนำผลรวมของพวกเขา (ผลรวมขั้นต่ำคือ 5, สูงสุดคือ 50) ทำหลาย ๆ ครั้ง การกระจายคืออะไร?

เห็นได้ชัดว่าพวกเขามีแนวโน้มไปสู่จุดต่ำสุดเนื่องจากมีตัวเลขที่ต่ำกว่าสูงกว่า แต่จะมีจุดเปลี่ยนที่เด่นในแต่ละเขตของการตายของแต่ละคนหรือไม่?

[แก้ไข: เห็นได้ชัดว่าสิ่งที่ดูเหมือนไม่ชัดเจน ตามที่ผู้วิจารณ์คนหนึ่งกล่าวว่าค่าเฉลี่ยคือ (5 + 50) /2=27.5 ฉันไม่ได้คาดหวังสิ่งนี้ ฉันยังอยากเห็นกราฟ] [แก้ไข 2: มันสมเหตุสมผลมากกว่าที่จะเห็นว่าการกระจายของ n ลูกเต๋าเหมือนกันกับแต่ละลูกเต๋าแยกกันรวมกัน]


1
คุณหมายถึงการกระจายของผลรวมของเครื่องแบบไม่ต่อเนื่อง ? [1,4]+[1,6]+[1,8]+[1,12]+[1,20]
gung - Reinstate Monica

2
วิธีหนึ่งในการตรวจสอบมันคือการจำลอง ใน hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE)))R: มันไม่ได้มีแนวโน้มไปสู่จุดต่ำสุด ของค่าที่เป็นไปได้ตั้งแต่ 5 ถึง 50 ค่าเฉลี่ยคือ 27.5 และการแจกแจง (มองเห็น) ไม่ไกลจากปกติ
David Robinson

2
ชุด D&D ของฉันมี d10 เช่นเดียวกับ 5 ที่คุณพูดถึง (รวมถึง decader ซึ่งฉันคิดว่าคุณไม่ได้รวม)
Glen_b

1
Wolfram Alpha คำนวณคำตอบว่า นี่คือฟังก์ชันสร้างความน่าจะเป็นซึ่งคุณสามารถอ่านการแจกแจงได้โดยตรง BTW คำถามนี้เป็นกรณีพิเศษของหนึ่งที่มีการถามและตอบในอย่างทั่วถึงstats.stackexchange.com/q/3614และstats.stackexchange.com/questions/116792
whuber

2
@AlecTeal: ง่าย ๆ นั่นแหละ หากคุณทำวิจัยของคุณคุณจะเห็นว่าฉันไม่มีคอมพิวเตอร์เพื่อทำการจำลองสถานการณ์เอง และหมุน 100 ครั้งดูเหมือนจะไม่ได้มีประสิทธิภาพสำหรับคำถามง่ายๆ
Marcos

คำตอบ:


18

ฉันไม่ต้องการทำพีชคณิต แต่คุณสามารถคำนวณ PMF ได้ง่ายพอ (เป็นเพียงการบิดซึ่งง่ายจริงๆในสเปรดชีต)

ฉันคำนวณสิ่งเหล่านี้ในสเปรดชีต *:

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

นี่คือจำนวนของวิธีการได้รับในแต่ละทั้งหมดฉัน ; P ( ฉัน)ความน่าจะเป็นที่P ( ฉัน) = n ( ฉัน) / 46,080 ผลลัพธ์ที่เป็นไปได้มากที่สุดเกิดขึ้นน้อยกว่า 5% ของเวลาn(i)ip(i)p(i)=n(i)/46080

แกน y คือความน่าจะเป็นที่แสดงเป็นเปอร์เซ็นต์ ป้อนคำอธิบายรูปภาพที่นี่

* วิธีที่ฉันใช้นั้นคล้ายกับขั้นตอนที่อธิบายไว้ที่นี่แม้ว่ากลไกที่แน่นอนที่เกี่ยวข้องในการตั้งค่าการเปลี่ยนแปลงเนื่องจากรายละเอียดส่วนติดต่อผู้ใช้เปลี่ยนแปลง (โพสต์นั้นมีอายุประมาณ 5 ปี แต่ฉันได้อัปเดตประมาณหนึ่งปีที่ผ่านมา) และฉันใช้แพ็คเกจอื่นในครั้งนี้ (ฉันทำใน Calc ของ LibreOffice ในครั้งนี้) ยังคงเป็นส่วนสำคัญของมัน


น่าทึ่งฉันไม่ได้คาดหวังการกระจายแบบสมมาตรเลย ฉันไม่แน่ใจว่าทำไมปรีชาของฉันจึงอยู่ไกล
Marcos

6
ผลรวมของตัวแปรสุ่มแบบสมมาตรอิสระก็มีความสมมาตรในการแจกแจงเช่นกัน
Glen_b -Reinstate Monica

กฎที่ดี มันถูกเผยแพร่ที่ไหนสักแห่ง?
Marcos

3
ใช่ แต่ประเด็นของฉันคือมันไม่สำคัญเกินกว่าที่จะรับวารสารเพื่อตีพิมพ์มันจะถูกกำหนดเป็นแบบฝึกหัดสำหรับนักเรียนเท่านั้น คุณสามารถใช้ความจริงที่ว่าฟังก์ชั่นลักษณะของตัวแปรสุ่มที่สมมาตรรอบจุดกำเนิดนั้นเป็นจริงและแม้กระทั่ง (ซึ่งความจริงที่คุณสามารถหาได้ระบุไว้ที่หน้าวิกิพีเดียในฟังก์ชั่นลักษณะ ) - ดีและฉันเดาว่าคุณต้องการ -to-one คุณสมบัติของ cfs vs pmfs เช่นกันหรือใช้ความสัมพันธ์แบบคู่เพื่อพิสูจน์ว่า cf ที่สม่ำเสมอยังแสดงถึง pmf ที่สมมาตร ...
Glen_b

2
... และความจริงที่ว่าผลิตภัณฑ์ของฟังก์ชั่นคู่ยังเป็นจริง แต่มันก็ชัดเจนเพียงพอจากการพิจารณาโดยตรงของวิธีการทำงานของการสนทนา - ในการทำหน้าที่ของสมมาตรสองฟังก์ชั่น (pmfs ในกรณีนี้) สำหรับทุกเทอมในผลรวมของ ผลิตภัณฑ์ที่ปลายด้านหนึ่งมีคำศัพท์ที่มีขนาดเท่ากันที่ปลายอีกด้านหนึ่ง
Glen_b -Reinstate Monica

7

ดังนั้นฉันทำรหัสนี้:

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

ผลลัพธ์คือพล็อตนี้ ป้อนคำอธิบายรูปภาพที่นี่

มันค่อนข้างจะดูแบบเกาส์เซียน ฉันคิดว่าเรา (อีกครั้ง) อาจแสดงให้เห็นถึงการเปลี่ยนแปลงในทฤษฎีบทขีด จำกัด กลาง


2
อืมมมมม้วนที่ต่ำที่สุดในการจำลองของคุณคือ 6 ความน่าจะเป็นที่จะกลิ้ง (หรือม้วนเดียวรักษาเอกลักษณ์ตายตัว) คือ 1: 4 * 1: 6 * 1: 8 * 1: 10 * 1: 12 * 1: 20 = 1: 460,800 ขั้นตอนของฉันต้องการขนาดตัวอย่าง N อย่างน้อยสองครั้ง (อาจเป็น 4x) จำนวนเงินนี้ (เช่นขีด จำกัด ของ Nyquist) เพื่อเปิดเผยข้อผิดพลาดในแบบจำลองของฉัน
Marcos

ประสบการณ์ของฉันกับ Nyquist ยังบอกว่าต่ำสุด 4x ... เสร็จแล้ว หาก 2 ล้านไม่เพียงพอแจ้งให้ฉันทราบว่าควรเป็นอย่างไร
EngrStudent - Reinstate Monica

3
n

1
@EngrStudent: BTW ผลลัพธ์ของคุณไม่ยืนยัน CLT ใช่ไหม
Marcos

1
@TheDoctor ไม่ไม่ยืนยัน CLT ด้วยเหตุผลหลายประการ
Glen_b

7

ความช่วยเหลือเล็กน้อยสำหรับสัญชาตญาณของคุณ:

ก่อนอื่นให้พิจารณาว่าจะเกิดอะไรขึ้นถ้าคุณเพิ่มใบหน้าหนึ่งใบหน้าทั้งหมดของตายหนึ่งเดียวเช่น d4 ดังนั้นแทนที่จะเป็น 1,2,3,4 ใบหน้าในขณะนี้จึงแสดงเป็น 2,3,4,5

เมื่อเปรียบเทียบกับสถานการณ์นี้กับของจริงแล้วจะเห็นได้ว่ายอดรวมทั้งหมดนั้นสูงกว่าที่เคยเป็นมา ซึ่งหมายความว่ารูปร่างของการกระจายไม่มีการเปลี่ยนแปลงมันถูกย้ายไปหนึ่งก้าวไปยังด้านข้าง

ตอนนี้ลบค่าเฉลี่ยของแต่ละตายจากทุกด้านของตายนั้น

สิ่งนี้จะทำให้การทำเครื่องหมายลูกเต๋า

  • -32-121232
  • -52-32-12123252
  • -72-52-32-1212325272

เป็นต้น

ตอนนี้ผลรวมของลูกเต๋าเหล่านี้ควรจะมีรูปร่างเหมือนเดิมโดยเลื่อนลงด้านล่างเท่านั้น มันควรจะชัดเจนว่าผลรวมนี้มีความสมมาตรประมาณศูนย์ ดังนั้นการกระจายตัวแบบดั้งเดิมจึงมีความสมมาตร


4

P(X=ผม)=พี(ผม)
Xผม0,1,...,n(0,1/6,1/6,1/6,1/6,1/6,1/6)พี(เสื้อ)=Σ06พี(ผม)เสื้อผมQ(J)J0,1,...,ม.พี(เสื้อ)Q(เสื้อ)
> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

และคุณสามารถตรวจสอบว่าถูกต้อง (ด้วยการคำนวณด้วยมือ) ทีนี้สำหรับคำถามจริงห้าลูกเต๋ามี 4,6,8,12,20 ข้าง ฉันจะทำการคำนวณโดยสมมติว่าโพรบเหมือนกันสำหรับแต่ละลูกเต๋า แล้ว:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

เนื้อเรื่องแสดงอยู่ด้านล่าง:

ป้อนคำอธิบายรูปภาพที่นี่

ตอนนี้คุณสามารถเปรียบเทียบโซลูชันที่แน่นอนนี้กับแบบจำลอง


1

ทฤษฎีขีด จำกัด กลางตอบคำถามของคุณ แม้ว่ารายละเอียดและข้อพิสูจน์ (และบทความ Wikipedia) นั้นค่อนข้างน่าสนใจ แต่สาระสำคัญของมันง่าย ตาม Wikipedia มันระบุว่า

ผลรวมของตัวแปรสุ่มจำนวนอิสระและแบบกระจายที่มีความแปรปรวนแบบ จำกัด จะมีแนวโน้มที่จะเป็นการแจกแจงแบบปกติเมื่อจำนวนตัวแปรเพิ่มขึ้น

ร่างหลักฐานสำหรับกรณีของคุณ:

เมื่อคุณพูดว่า“ ทอยลูกเต๋าทั้งหมดในครั้งเดียว” แต่ละทอยลูกเต๋าทั้งหมดจะเป็นตัวแปรสุ่ม

ลูกเต๋าของคุณมีตัวเลข จำกัด พิมพ์บนพวกเขา ผลรวมของค่าของพวกเขาจึงมีความแปรปรวนแน่นอน

ทุกครั้งที่คุณหมุนลูกเต๋าทั้งหมดการแจกแจงความน่าจะเป็นของผลลัพธ์จะเหมือนกัน (ลูกเต๋าไม่เปลี่ยนระหว่างม้วน)

หากคุณทอยลูกเต๋าอย่างยุติธรรมทุกครั้งที่คุณทอยลูกเต๋าผลลัพธ์จะเป็นอิสระ (ม้วนก่อนหน้าไม่มีผลต่อม้วนในอนาคต)

อิสระ? ตรวจสอบ กระจายเหมือนกันหรือไม่ ตรวจสอบ ความแปรปรวน จำกัด ? ตรวจสอบ ดังนั้นผลรวมมีแนวโน้มไปสู่การแจกแจงแบบปกติ

มันคงไม่สำคัญว่าการกระจายของลูกเต๋าหนึ่งลูกจะหมุนไปทางล่างสุดหรือไม่ ฉันจะไม่เป็นไรถ้ามีการกระจาย cusps ข้อสรุปทั้งหมดทำให้มันเรียบและทำให้มันเป็นเกาส์แบบสมมาตร คุณไม่จำเป็นต้องทำพีชคณิตหรือแบบจำลองใด ๆ เพื่อแสดงมัน! นั่นเป็นข้อมูลเชิงลึกที่น่าประหลาดใจของ CLT


3
ในขณะที่ CLT นั้นมีความเกี่ยวข้องและในขณะที่โพสต์อื่นแสดงการแจกแจงนั้นดูแบบเกาส์รัสเซียอย่างคร่าวๆเราเพียง แต่จัดการกับผลรวมของการแจกแจงอิสระที่ไม่เหมือนกัน 5 รายการเท่านั้น ดังนั้นจุดที่ 1) 5 ไม่ใหญ่พอที่จะเรียกทฤษฎีบทที่ใช้ "ที่ไม่มีที่สิ้นสุด" จุดที่ 2) คุณไม่สามารถใช้วานิลลา CLt ได้เพราะสิ่งที่คุณได้รับไม่ใช่สิ่งที่คุณต้องการ คุณต้องการ Lyapunov CLT ฉันคิดว่า
ปีเตอร์

2
คุณไม่จำเป็นต้องใช้ทฤษฎีขีด จำกัด กลางเพื่อบอกว่าผลรวมของตัวแปรสุ่มบางตัวที่มีการแจกแจงสมมาตรเกี่ยวกับศูนย์นั้น ๆ มีการกระจายแบบสมมาตรเกี่ยวกับผลรวมของศูนย์
เฮนรี่

@ ปีเตอร์: คุณไม่มีโครงสร้างหลักฐานของฉัน สหกรณ์กล่าวว่า“ม้วนทั้งหมดในครั้งเดียว.” ฉันกินม้วนของแต่ละทั้งหมดลูกเต๋าเป็นหนึ่งในตัวแปรสุ่ม ตัวแปรสุ่มเหล่านั้นมีการแจกแจงที่เหมือนกัน ไม่จำเป็นสำหรับ Lyapunov นอกจากนี้ OP บอกว่า "ทำหลาย ๆ ครั้ง" ซึ่งฉันใช้เพื่อหมายถึง "ในขีด จำกัด " ดังนั้นจุด # 1 ของคุณไม่ถูกต้อง เราไม่ได้รวมเพียงแค่ลูกเต๋า 5 ลูกที่นี่
Paul Cantrell

2
@PaulCantrell การหมุนของลูกเต๋าทั้งหมดคือผลรวมของตัวแปรอิสระห้าตัวที่ไม่เหมือนกัน OP กำลังถามเกี่ยวกับการกระจายของผลรวมนั้น คุณอาจทำการทอยลูกเต๋า 5 ลูกหลายม้วน แต่นั่นเป็นเพียงการสุ่มตัวอย่างจากการแจกแจงภายใต้คำถามไม่มีใครสรุปตัวอย่างเหล่านั้นได้
ปีเตอร์

1
@ PaulCantrell ฉันคิดว่ามันขึ้นอยู่กับว่าคุณตีความ "ทำหลาย ๆ ครั้ง" ทำหลาย ๆ ครั้งและรวมอีกครั้ง (รับค่าเดียว) หรือทำหลายครั้งแล้วดูฮิสโตแกรมของตัวอย่างเหล่านั้น (รับหลายค่า) ฉันเอาการตีความหลัง
ปีเตอร์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.