ความแตกต่างระหว่างตัวเลขที่กระจายอย่างสม่ำเสมอมีการแจกแจงแบบเดียวกันหรือไม่?


22

เรากลิ้งดายแบบ 6 ด้านเป็นจำนวนมาก

การคำนวณความแตกต่าง (ค่าสัมบูรณ์) ระหว่างม้วนและม้วนก่อนหน้านั้นคาดว่าจะมีการกระจายความแตกต่างอย่างสม่ำเสมอหรือไม่

เพื่ออธิบายด้วย 10 ม้วน:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

จะdiffค่าจะกระจายเหมือนกัน?


13
พล็อตฮิสโตแกรมอย่างน้อยรับความรู้สึก
gunes

2
ตรวจสอบการกระจาย Poisson
leftaroundabout

ลักษณะเช่นนี้ .... บ้าน
มนู H

@ มนู H, ฉันรับรองว่าวันทำการบ้านกำลังจะมาถึงแล้ว
HeyJude

คำตอบ:


37

ไม่มันไม่เหมือนกัน

คุณสามารถนับความเป็นไปได้ที่มีโอกาส36เท่ากันสำหรับความแตกต่างที่แน่นอน

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

ซึ่งให้การกระจายความน่าจะเป็นสำหรับความแตกต่างที่แท้จริงของ

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas ตารางในคำตอบนี้ขัดแย้งกับการยืนยันของคุณอย่างชัดเจนตัวอย่างเช่นมันแสดงให้เห็นว่ามีเพียงหนึ่งในความแตกต่างที่เป็นไปได้คือ 5 ในขณะที่ 6 ใน 6 เป็น 0 เนื่องจากความเป็นไปได้ทั้ง 36 มีความเป็นไปได้เท่าเทียมกัน
whuber

13
@onurcanbektas ฉันขอเชิญคุณอีกครั้งเพื่อพิจารณาตาราง เนื่องจากมันมีความแตกต่างสัมบูรณ์เพียง 5 ตัวเท่านั้นจึงไม่ชัดเจนว่าไม่เกินสองความแตกต่างสามารถเท่ากับ 5 ได้หรือไม่
whuber

14
@onurcanbektas สำหรับความแตกต่างง่าย ๆ (เช่นมีเครื่องหมายดังนั้นจำนวนเต็มตั้งแต่ -5 ถึง +5) การกระจายเป็นการแจกแจงสามเหลี่ยมที่ไม่ต่อเนื่องแบบสมมาตรกับโหมด (ค่าที่เป็นไปได้มากที่สุด) ที่ 0 สำหรับความแตกต่างที่แน่นอน โหมดคือ 1
เฮนรี่

2
อาจจะน่าสังเกตว่าความแตกต่างที่เซ็นชื่อแบบโมดูโล 6 มีการกระจายอย่างสม่ำเสมอแม้ว่า
Federico Poloni

2
@FedericoPoloni นี่ไม่ชัดเจนหรือไม่? ฉันหมายความว่าฉันไม่เคยคิดเกี่ยวกับเรื่องนี้มาก่อนอ่านความคิดเห็น แต่ก็ชัดเจนว่านี่เป็นเรื่องจริง
Cruncher

21

การใช้สัจพจน์พื้นฐานที่สุดเกี่ยวกับความน่าจะเป็นและจำนวนจริงเท่านั้นเราสามารถพิสูจน์ได้ว่าข้อความที่แข็งแกร่งกว่านี้:

ความแตกต่างของค่าอิสระสุ่มสองค่าที่กระจายแบบไม่คงที่ใด ๆXY ไม่เคยมีการแจกแจงแบบสม่ำเสมอ

(คำสั่งแบบอะนาล็อกสำหรับตัวแปรต่อเนื่องได้รับการพิสูจน์ที่Uniform PDF ของความแตกต่างของสอง rv )

แนวคิดคือโอกาสXYเป็นค่าที่สุดต้องน้อยกว่าโอกาสที่XYเป็นศูนย์เพราะมีเพียงวิธีเดียวในการเพิ่มXYในขณะที่มีหลายวิธีในการสร้างความแตกต่างศูนย์ เนื่องจากXและYมีการแจกแจงแบบเดียวกันดังนั้นจึงสามารถเท่ากัน นี่คือรายละเอียด

ก่อนสังเกตว่าตัวแปรสองตัวเป็นสมมุติฐานXและYในแต่ละคำถามสามารถบรรลุจำนวน จำกัด เพียงnของค่ากับความน่าจะเป็นบวกเพราะจะมีอย่างน้อยnเครื่องแบบมอบหมายกระจายพวกเขาทั้งหมดน่าจะเท่ากับความแตกต่างที่แตกต่างและ ถ้าnเป็นอนันต์ดังนั้นจะเป็นจำนวนความแตกต่างที่เป็นไปได้ที่มีค่าบวกความน่าจะเป็นที่เท่ากันดังนั้นผลรวมของโอกาสที่จะเป็นอนันต์ซึ่งเป็นไปไม่ได้

ถัดไปเนื่องจากความแตกต่างมี จำกัด จึงจะมีขนาดใหญ่ที่สุดในหมู่พวกเขา ความแตกต่างที่ใหญ่ที่สุดสามารถทำได้ก็ต่อเมื่อลบค่าที่น้อยที่สุดของY --let เรียกมันว่าmและสมมติว่ามันมีความเป็นไปได้q=Pr(Y=m) - จากค่าที่ใหญ่ที่สุดของX --let เรียกว่าหนึ่งMด้วยp=Pr(X=M). เนื่องจากXและYเป็นอิสระโอกาสของความแตกต่างนี้คือผลผลิตของโอกาสเหล่านี้

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

สุดท้ายเพราะXและYมีการกระจายเดียวกันมีหลายวิธีที่แตกต่างของพวกเขาสามารถผลิตค่า0. ในบรรดาวิธีการเหล่านี้จะมีกรณีที่X=Y=mและX=Y=M. เพราะการกระจายนี้เป็น nonconstant, mแตกต่างจากMM.นั่นแสดงให้เห็นว่าทั้งสองกรณีเหตุการณ์เคลื่อนและดังนั้นพวกเขาจะต้องมีส่วนร่วมอย่างน้อยจำนวนp2+q2ที่จะมีโอกาสที่XYเป็นศูนย์ นั่นคือ,

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

ตั้งแต่สี่เหลี่ยมของตัวเลขไม่ได้ลบ0(pq)2,มาจากไหนเราอนุมานจาก()ว่า

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

แสดงการกระจายของXYไม่เหมือนกันQED

แก้ไขเพื่อตอบสนองต่อความคิดเห็น

การวิเคราะห์ที่คล้ายกันของความแตกต่างแน่นอน|XY|ตั้งข้อสังเกตว่าเพราะXและYมีการกระจายเดียวกันm=M.สิ่งนี้ต้องการให้เราศึกษา Pr(XY=|Mm|)=2pq.เทคนิคพีชคณิตเดียวกันให้ผลลัพธ์เกือบเหมือนกัน แต่มีความเป็นไปได้ที่ 2 p q = 2 p q + ( p- q ) 2และ2 p q + p 2 + q 2 =2pq=2pq+(pq)22pq+p2+q2=1.ที่ระบบสมการมีโซลูชั่นที่ไม่ซ้ำกันp=q=1/2ที่สอดคล้องกับเหรียญยุติธรรม (เป็น "ตายสองด้าน") นอกเหนือจากข้อยกเว้นนี้ผลลัพธ์สำหรับความแตกต่างแบบสัมบูรณ์จะเหมือนกันกับความแตกต่างและด้วยเหตุผลพื้นฐานเดียวกันที่ได้รับ: กล่าวคือความแตกต่างแบบสัมบูรณ์ของตัวแปรสุ่มสองตัวไม่สามารถกระจายอย่างเท่าเทียมกันเมื่อใดก็ตามที่มีความแตกต่างมากกว่าสองประการ ด้วยความน่าจะเป็นในเชิงบวก

(สิ้นสุดการแก้ไข)


ลองใช้ผลลัพธ์นี้กับคำถามที่ถามถึงบางสิ่งที่ซับซ้อนกว่านี้เล็กน้อย

แต่ละรุ่นม้วนอิสระของตาย (ซึ่งอาจจะเป็นที่ไม่เป็นธรรมตาย) กับตัวแปรสุ่มXi, i=1,2,,n. ความแตกต่างที่สังเกตได้ในเหล่าnม้วนเป็นตัวเลข ΔXi=Xi+1Xi. เราอาจสงสัยว่าตัวเลขn1เหล่านี้กระจายกันอย่างไร นั่นเป็นคำถามเกี่ยวกับความคาดหวังทางสถิติ: จำนวนที่คาดหวังของΔXiนั่นเท่ากับศูนย์เช่น? จำนวนที่คาดหวังของΔXiเท่ากับ1คือเท่าใด ฯลฯ

ด้านปัญหาของคำถามนี้ก็คือΔXiมีความไม่เป็นอิสระ: ยกตัวอย่างเช่นΔX1=X2X1และΔX2=X3X2เกี่ยวข้องกับการม้วนเดียวกันX2.

อย่างไรก็ตามนี่ไม่ใช่เรื่องยาก เนื่องจากความคาดหวังทางสถิติเป็นสารเติมแต่งและความแตกต่างทั้งหมดมีการแจกแจงแบบเดียวกันหากเราเลือกค่าที่เป็นไปได้kของความแตกต่างจำนวนที่คาดหวังของความแตกต่างเท่ากับkในลำดับทั้งหมดของnม้วนคือn1เท่าของจำนวนที่คาดหวัง คูณความแตกต่างเท่ากับkในขั้นตอนเดียวของกระบวนการ ความคาดหวังในขั้นตอนเดียวนั้นคือPr(ΔXi=k) (สำหรับiใด ๆ) ความคาดหวังเหล่านี้จะเหมือนกันสำหรับkทั้งหมด(นั่นคือสม่ำเสมอ) และถ้าหากพวกเขาจะเหมือนกันสำหรับเดียว ΔXi. แต่เราเห็นแล้วว่าไม่มีΔXiมีการกระจายแบบสม่ำเสมอแม้ในขณะที่ความตายอาจมีอคติ ดังนั้นแม้ในความรู้สึกที่ลดลงของความถี่ที่คาดหวังความแตกต่างของม้วนนี้ไม่เหมือนกัน


@Michael จุดที่ดี: ฉันตอบคำถามตามที่ถาม (ซึ่งเป็นเรื่องเกี่ยวกับ "ความแตกต่าง") แทนที่จะเป็นภาพ (ซึ่งชัดเจนหมายถึงความแตกต่างแน่นอน) ใช้เทคนิคเดียวกัน - เพียงแค่ต้องพิจารณาทั้งความแตกต่างสูงสุดและต่ำสุด ในกรณีที่ผู้ที่มีความเป็นไปได้เพียงสอง (พร้อมด้วยศูนย์) เราจะได้รับความเท่าเทียมกันซึ่งเป็นที่ที่ Bernoulli ผลมาจาก (แสดงมันตัวอย่างเช่นไม่ซ้ำกัน) (1/2)
whuber

คำตอบที่พิสูจน์รุ่นเฉพาะของนี้ก็คือที่นี่
Reinstate Monica

ขอบคุณ @Ben: ฉันลืมหัวข้อนั้นไป เนื่องจากเป็นการอ้างอิงที่ดีกว่าตอนนี้ฉันเชื่อมโยงโดยตรงไปยังคำตอบนี้
whuber

12

ในระดับที่ใช้งานง่ายเหตุการณ์แบบสุ่มสามารถกระจายอย่างเท่าเทียมกันหากผลลัพธ์ทั้งหมดมีแนวโน้มเท่ากัน

เป็นเช่นนั้นสำหรับเหตุการณ์สุ่มที่เป็นปัญหาหรือไม่ - ความแตกต่างที่แน่นอนระหว่างลูกเต๋าสองลูก

ในกรณีนี้พอเพียงเพื่อดูความสุดขั้ว - อะไรคือค่าที่ใหญ่ที่สุดและเล็กที่สุดที่ความแตกต่างนี้อาจนำมาใช้?

เห็นได้ชัดว่า 0 มีขนาดเล็กที่สุด (เรากำลังดูความแตกต่างที่แน่นอนและม้วนสามารถเหมือนกัน) และ 5 คือที่ใหญ่ที่สุด ( 6vs 1)

เราสามารถแสดงกรณีที่เป็นไม่สม่ำเสมอโดยแสดงให้เห็นว่า0มีมากขึ้น (หรือน้อยกว่า) 5มีแนวโน้มที่จะเกิดขึ้นมากกว่า

ได้อย่างรวดเร็วมีเพียงสองวิธีที่ 5 ที่จะเกิดขึ้น - ถ้าลูกเต๋าแรกคือ 6 และครั้งที่สอง 1 หรือในทางกลับกัน 0 สามารถเกิดขึ้นได้กี่วิธี


1
+1 ฉันคิดว่านี่เป็นหัวใจของเรื่อง ฉันได้โพสต์คำถามทั่วไปที่ต้องอาศัยการสังเกตเดียวกันในท้ายที่สุด
whuber

5

ตามที่ Henry เสนอ ความแตกต่างของการแจกแจงแบบกระจายแบบสม่ำเสมอนั้นไม่ได้กระจายแบบสม่ำเสมอ

เพื่อแสดงสิ่งนี้กับข้อมูลจำลองเราสามารถใช้สคริปต์ R ที่ง่ายมาก:

barplot(table(sample(x=1:6, size=10000, replace=T)))

enter image description here

เราเห็นว่าสิ่งนี้ก่อให้เกิดการกระจายตัวที่สม่ำเสมอ ตอนนี้เรามาดูการกระจายตัวของความแตกต่างที่แน่นอนของสองตัวอย่างสุ่มจากการกระจายตัวนี้

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

enter image description here


6
ทำไมสิ่งนี้ถึงเกี่ยวข้องกับ CLT ซึ่งเกี่ยวข้องกับการกระจายแบบซีมโทติคของค่า iid จำนวนมาก?
whuber

2
nnn>1n=2n=2n=4n
krubo

3
@Krubo คำถามเดิมถามเกี่ยวกับการกระจายความแตกต่างระหว่างม้วนต่อเนื่องของตาย CLT ไม่มีอะไรจะพูดเกี่ยวกับเรื่องนี้ อันที่จริงไม่ว่าจะตายกี่ครั้งการกระจายความแตกต่างเหล่านั้นจะไม่เข้าเกณฑ์
whuber

การกระจายตัวนี้มีแนวโน้มที่จะเหมือนกันเนื่องจากจำนวนใบหน้าที่ตายมีแนวโน้มที่จะไม่มีที่สิ้นสุดหรือไม่? ไม่แน่ใจว่าจะแสดงอย่างไร แต่โดยสังหรณ์ใจมันรู้สึกเหมือนกับว่ามันมุ่งหน้าไปในทิศทางนั้น แต่ฉันไม่รู้ว่ามันถูก "บล็อก" ที่ไม่มีความรู้ในบางจุดก่อนที่จะแบนพอ
Cruncher

@ Cruncher คุณสามารถเปลี่ยนจำนวนใบหน้าที่ตายแล้วใน R-Code ได้อย่างง่ายดาย ยิ่งใบหน้ามีมากเท่าไหร่ลักษณะการกระจายบันไดก็จะยิ่งชัดเจนมากขึ้นเท่านั้น '1' มักจะเป็นจุดสูงสุดของบันไดนั้นและมีความแตกต่างที่มากขึ้นความน่าจะเป็นประมาณศูนย์ นอกจากนี้ความแตกต่างของ '0' นั้นหายากกว่า '1' (อย่างน้อยถ้าค่าที่น้อยที่สุดของ die คือ '1')
LuckyPal

2

คนอื่นทำงานคำนวณแล้วฉันจะให้คำตอบที่ดูเหมือนง่ายแก่ฉันมากขึ้น คุณต้องการที่จะศึกษาผลรวมของสอง unifrom rv (Z = X + (-Y)), การแจกแจงโดยรวมคือผลิตภัณฑ์ convcon (แยก):

P(Z=z)=k=P(X=k)P(Y=zk)

zkz

จากการประมวลผลสัญญาณเรารู้ว่าผลิตภัณฑ์ Convolution นั้นทำงานอย่างไร:

  • ผลิตภัณฑ์สังวัตนาของชุดฟังก์ชันสองชุด (สองสี่เหลี่ยม) จะให้รูปสามเหลี่ยม นี่คือตัวอย่างของวิกิพีเดียสำหรับฟังก์ชั่นต่อเนื่อง:

enter image description here

  • zz

  • โดยทั่วไปแล้วเรารู้ว่าฟังก์ชั่นเดียวที่มีความเสถียรโดยการโน้มน้าวใจคือฟังก์ชั่นของ Gaussian ie มีการแจกแจงแบบเกาส์เท่านั้นที่มีความเสถียรโดยการเพิ่ม (หรือมากกว่านั้นคือการรวมเชิงเส้น) นี่ก็หมายความว่าคุณจะไม่ได้รับการแจกแจงแบบเดียวกันเมื่อรวมการแจกแจงแบบเดียวกัน

สำหรับสาเหตุที่เราได้ผลลัพธ์เหล่านั้นคำตอบอยู่ที่การสลายตัวของ Fourrier ของฟังก์ชันเหล่านั้น การแปลง Fourrier ของผลิตภัณฑ์คอนโวลูชันเป็นผลิตภัณฑ์อย่างง่ายของการแปลง Fourrier ของแต่ละฟังก์ชัน สิ่งนี้ให้การเชื่อมโยงโดยตรงระหว่างสัมประสิทธิ์ Fourrier ของฟังก์ชันสี่เหลี่ยมผืนผ้าและสามเหลี่ยม


โปรดตรวจสอบความถูกต้องของการอ้างสิทธิ์และตรรกะของคำตอบของคุณ คำถามไม่ได้ว่าการบิดของการแจกแจงแบบสองแบบนั้นเหมือนกันหรือไม่: การบิดของการแจกแจงบางอย่างและการกลับเป็นแบบสม่ำเสมอหรือไม่ และมีตระกูลการกระจายมากกว่าครอบครัวเกาส์ที่มั่นคงภายใต้การ
โน้มน้าวใจ

คุณพูดถูกเกี่ยวกับการแจกแจงที่มั่นคง สำหรับคำถามฉันค่อนข้างมั่นใจว่านี่เป็นเรื่องเกี่ยวกับความแตกต่างของค่าสุ่มสองค่าที่มีการแจกแจงแบบเดียวกัน (ตามที่ระบุไว้ในชื่อเรื่อง) คำถามที่ว่าการกระจายตัวของการแจกแจงบางอย่างและการกลับรายการนั้นอาจมีขนาดใหญ่กว่าคำถามที่ถามไว้ที่นี่หรือไม่
lcrmorin

1

ถ้า x และ Y เป็นลูกเต๋าสองลูกติดต่อกันคุณสามารถเห็นภาพได้ |x-Y|=k (สำหรับ k=0,1,2,3,4,5) ดังต่อไปนี้โดยที่แต่ละสีสอดคล้องกับค่าที่แตกต่างกัน k:

consecutive dice rolls difference visualization

อย่างที่คุณเห็นได้อย่างง่ายดายจำนวนคะแนนของแต่ละสีไม่เหมือนกัน ดังนั้นความแตกต่างจะไม่กระจายอย่างสม่ำเสมอ


0

ปล่อย Dเสื้อ แสดงถึงความแตกต่างและ X มูลค่าของม้วนแล้ว P(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

So the function P(Dt=d) is not constant in d. This means that the distribution is not uniform.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.