Multinomial (1 / n, …, 1 / n) สามารถแสดงลักษณะเป็นดิริเคิต (1, .. , 1) ที่แยกส่วนได้หรือไม่?


24

ดังนั้นคำถามนี้จะยุ่งเล็กน้อย แต่ฉันจะรวมกราฟสีสันเพื่อชดเชย ก่อนอื่นมาที่พื้นหลังของคำถาม

พื้นหลัง

สมมติว่าคุณมีการแจกแจงพหุคูณแบบหลายมิติแบบมิติที่มีโพรไบท์เท่ากันในประเภทให้เป็นจำนวนปกติ ( ) จากการแจกแจงนั่นคือ:nnπ=(π1,,πn)c

(c1,,cn)Multinomial(1/n,,1/n)πi=cin

ตอนนี้การกระจายทั่วมีการสนับสนุนใน -simplex แต่มีขั้นตอนแบบแยก ตัวอย่างเช่นด้วยการกระจายนี้มีการสนับสนุนดังต่อไปนี้ (จุดสีแดง):πnn=3

ป้อนคำอธิบายรูปภาพที่นี่

การแจกแจงอื่นที่มีการรองรับที่คล้ายกันคือการแจกแจงแบบ -dimensionalนั่นคือการกระจายแบบสม่ำเสมอทั่วหน่วย simplex ตัวอย่างเช่นนี่คือการสุ่มจับจาก 3-dimesional :nDirichlet(1,,1)Dirichlet(1,1,1)

ป้อนคำอธิบายรูปภาพที่นี่

ตอนนี้ฉันมีความคิดว่าการกระจายของจากการแจกแจงอาจมีลักษณะเหมือนวาดจากที่มี discretized การสนับสนุนต่อเนื่องของ\ต่อเนื่องผมมีอยู่ในใจ (และที่ดูเหมือนว่าจะทำงานได้ดี) คือการใช้เวลาในแต่ละจุดในเริมและ "รอบมันออก" เพื่อจุดที่ใกล้ที่สุดที่อยู่ในการสนับสนุนของ\สำหรับ simplex แบบ 3 มิติคุณจะได้พาร์ทิชันต่อไปนี้โดยที่จุดในแต่ละพื้นที่สีควร "ปัดเศษ" เป็นจุดแดงที่ใกล้ที่สุด:πMultinomial(1/n,,1/n)Dirichlet(1,,1)ππ

ป้อนคำอธิบายรูปภาพที่นี่

เนื่องจากการแจกแจงไดริชเลตมีความสม่ำเสมอความหนาแน่น / ความน่าจะเป็นที่ได้ของแต่ละจุดจึงแปรผันตามพื้นที่ / ปริมาตรที่ได้รับ "ปัดเศษ" ในแต่ละจุด สำหรับกรณีสองมิติและสามมิติความน่าจะเป็นเหล่านี้คือ:

ป้อนคำอธิบายรูปภาพที่นี่ ( ความน่าจะเป็นเหล่านี้มาจากการจำลอง Monte Carlo )

ดังนั้นจึงดูเหมือนว่าอย่างน้อยสำหรับ 2 และ 3 มิติการกระจายความน่าจะเป็นผลมาจากการ discretizingในลักษณะนี้โดยเฉพาะอย่างยิ่งเป็นเช่นเดียวกับการกระจายความน่าจะเป็นสำหรับ\นั่นคือผลลัพธ์ปกติของการแจกแจงฉันได้ลองด้วย 4 มิติและดูเหมือนว่าจะทำงานที่นั่นDirichlet(1,,1)πMultinomial(1/n,,1/n)

คำถาม (s)

ดังนั้นคำถามหลักของฉันคือ:

เมื่อแยกแยะ Dirichlet ที่เหมือนกันในวิธีนี้โดยเฉพาะความสัมพันธ์กับถือเป็นมิติต่อไปหรือไม่? ความสัมพันธ์นั้นมีอยู่หรือไม่? (ฉันลองทำสิ่งนี้โดยใช้การจำลอง Monte Carlo ... )Multinomial(1/n,,1/n)

ต่อไปฉันสงสัยว่า:

  • หากความสัมพันธ์นี้เกิดขึ้นมันเป็นผลที่รู้กันหรือไม่ และมีแหล่งที่มาที่ฉันสามารถอ้างถึงสำหรับเรื่องนี้?
  • หาก discretization ของชุด Dirichlet นี้ไม่มีความสัมพันธ์นี้กับ Multinomial มีการก่อสร้างที่คล้ายกันบ้างไหม?

บริบทบางอย่าง

เหตุผลของฉันในการถามคำถามนี้คือฉันกำลังดูความคล้ายคลึงกันระหว่าง Bootstrap ที่ไม่ใช่พารามิเตอร์และ Bootstrap แบบเบย์แล้วสิ่งนี้ก็เกิดขึ้น ฉันได้สังเกตเห็นด้วยว่าลวดลายบนพื้นที่สีบน 3-dimesional simplex ด้านบนดูเหมือนว่า (และควรเป็น) แผนภาพ Voronoi วิธีหนึ่ง (ฉันหวังว่า) คุณสามารถคิดได้ว่านี่เป็นลำดับของ Triangle / Simpex ของ Pascal ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ) ในกรณีที่ขนาดของพื้นที่สีตามแถวที่สองของสามเหลี่ยมปาสกาลในกรณี 2 มิติแถวที่สามของจัตุรมุขของปาสคาลในกรณี 3 มิติและอื่น ๆ นี่จะอธิบายการเชื่อมต่อกับการกระจายพหุนาม แต่ที่นี่ฉันอยู่ในน้ำลึก ...


2
สนุก! (ตามปกติ) แต่ฉันคิดถึงการเชื่อมต่อถุงเท้า
ซีอาน

ฉันเริ่มวาดถุงเท้าด้วยการเปลี่ยน แต่แล้วผมเริ่มคิดเกี่ยวกับคชกรรม Boostrap สิ่งหนึ่งที่นำไปสู่การอื่น ๆ และว่าวิธีการที่ฉันจบลงที่นี่ :)
ราสมูส Baath

2
@ ซีอานอาจเป็นถุงเท้ามากกว่าลูกสุนัขที่ควรจะเป็นมิ่งขวัญแบบเบย์?
ทิม

คำตอบ:


14

ผู้ที่สองการกระจายแตกต่างกันสำหรับทุก4n4

เอกสาร

ฉันจะลดความซับซ้อนของคุณโดยปัจจัยเพื่อให้จุดขัดแตะมีพิกัดจำนวนเต็ม นี่ไม่เปลี่ยนแปลงอะไรเลยฉันแค่คิดว่ามันจะทำให้สัญกรณ์ยุ่งยากน้อยลงn

ให้เป็น -simplex, ให้เป็นตัวเรือนูนของจุด , ... ,ใน{n} ในคำอื่น ๆ เหล่านี้เป็นจุดที่ทุกคนมีพิกัดที่ไม่ใช่เชิงลบและที่พิกัดสรุปผลการnS(n1)(n,0,,0)(0,,0,n)Rnn

ให้แสดงถึงชุดของจุดขัดแตะนั่นคือจุดเหล่านั้นในที่พิกัดทั้งหมดเป็นส่วนประกอบΛS

ถ้าเป็นจุดตาข่ายเราปล่อยให้แสดงของเซลล์ Voronoiกำหนดเป็นจุดที่ผู้ที่อยู่ในซึ่งเป็น (อย่างเคร่งครัด) ใกล้ชิดกับกว่าไปยังจุดอื่น ๆ ใน\PVPSPΛ

เราใส่สองแจกแจงความน่าจะเราสามารถใส่ใน\หนึ่งคือการกระจายพหุนามที่จุดมีความน่าจะเป็นa_n!)! อื่น ๆ ที่เราจะเรียกรุ่น Dirichletและจะกำหนดให้แต่ละสัดส่วนน่าจะเป็นเสียงของV_PΛ(a1,...,an)2nn!/(a1!an!)PΛVP

เหตุผลที่ไม่เป็นทางการมาก

ผมอ้างว่ารูปแบบพหุนามและรูปแบบการกระจาย Dirichlet ให้แตกต่างกันในเมื่อใดก็ตามที่4Λn4

หากต้องการดูนี้พิจารณากรณีและจุดและ(3,1,0,0) ผมอ้างว่าและจะสอดคล้องกันผ่านการแปลโดยเวกเตอร์-1,0,0) ซึ่งหมายความว่าและมีระดับเสียงเท่ากันดังนั้นและจึงมีความน่าจะเป็นเหมือนกันในโมเดล Dirichlet ในอีกทางหนึ่งในโมเดลพหุนามพวกเขามีความน่าจะเป็นต่างกัน (และ ) และมัน หลังจากนั้นการแจกแจงต้องไม่เท่ากันn=4A=(2,2,0,0)B=(3,1,0,0)VAVB(1,1,0,0)VAVBAB244!/(2!2!)244!/3!

ความจริงที่ว่าและนั้นสอดคล้องกันดังต่อไปนี้จากการอ้างสิทธิ์ที่เป็นไปได้ แต่ไม่ชัดเจน (และค่อนข้างคลุมเครือ):VAVB

การอ้างสิทธิ์ที่เป็นไปได้ : รูปร่างและขนาดของนั้นได้รับผลกระทบจาก "เพื่อนบ้านที่ใกล้เคียง" ของเท่านั้น (นั่นคือคะแนนในซึ่งแตกต่างจากโดยเวกเตอร์ที่มีลักษณะดังนี้โดยที่และอาจอยู่ที่อื่น)VPPΛP(1,1,0,,0)11

เป็นเรื่องง่ายที่จะเห็นว่าการกำหนดค่า "เพื่อนบ้านทันที" ของและเหมือนกันและจากนั้นตามด้วยและนั้นสอดคล้องกันABVAVB

ในกรณีเราสามารถเล่นเกมเดียวกันโดยมีและตัวอย่างเช่นn5A=(2,2,n4,0,,0)B=(3,1,n4,0,,0)

ฉันไม่คิดว่าการอ้างสิทธิ์นี้ชัดเจนและฉันจะไม่พิสูจน์มันแทนที่จะใช้กลยุทธ์ที่แตกต่างออกไปเล็กน้อย แต่ผมคิดว่านี่เป็นคำตอบได้ง่ายขึ้นว่าทำไมการกระจายที่แตกต่างกันสำหรับ4n4

หลักฐานที่เข้มงวด

ใช้และตามที่อธิบายไว้อย่างไม่เป็นทางการข้างต้น เราจำเป็นต้องพิสูจน์ว่าและนั้นสอดคล้องกันเท่านั้นABVAVB

รับเราจะกำหนดดังต่อไปนี้:คือชุดของคะแนนซึ่ง<1 (ในรูปแบบที่ย่อยได้มากขึ้น: ให้ .เป็นชุดของจุดที่ความแตกต่างระหว่างสูงสุดและต่ำสุดน้อยกว่า 1)P=(p1,,pn)ΛWPWP(x1,,xn)Smax1in(aipi)min1in(aipi)<1vi=aipiWPvi

เราจะแสดงให้เห็นว่าW_PVP=WP

ขั้นตอนที่ 1

การอ้างสิทธิ์: W_PVPWP

นี้ค่อนข้างง่าย: สมมติว่าไม่ได้อยู่ในW_Pให้และสมมติ (โดยไม่สูญเสียของทั่วไป) ที่ ,v_i ตั้งแต่เรายังไม่ทราบว่าv_2X=(x1,,xn)WPvi=xipiv1=max1inviv2=min1inviv1v21i=1nvi=0v1>0>v2

ตอนนี้ให้p_n) ตั้งแต่และทั้งสองมีพิกัดที่ไม่ใช่เชิงลบจึงไม่และมันตามที่และอื่น ๆ\ ในทางกลับกัน0 ดังนั้นอย่างน้อยใกล้เคียงกับเป็นไปดังนั้นV_P การแสดง (โดยการเติมเต็ม) ที่นี้W_PQ=(p1+1,p21,p3,,pn)PXQQSQΛdist2(X,P)dist2(X,Q)=v12+v22(1v1)2(1+v2)2=2+2(v1v2)0XQPXVPVpWP

ขั้นตอนที่ 2

การอ้างสิทธิ์ :เป็นคู่กันไม่ได้WP

สมมติว่าเป็นอย่างอื่น ให้และเป็นจุดที่แตกต่างกันใน และให้W_Q ตั้งแต่และมีความแตกต่างทั้งในและจะต้องมีดัชนีหนึ่งที่และหนึ่งที่1 โดยไม่สูญเสียของทั่วไปเราคิดว่าและ1 การจัดเรียงและการเพิ่มร่วมกันเราได้รับ2P=(p1,,pn)Q=(q1,,qn)ΛXWPWQPQΛipiqi+1piqi1p1q1+1p2q21q1p1+p2q22

พิจารณาในขณะนี้ตัวเลขและx_2จากความจริงที่ว่าเรามี<1 ในทำนองเดียวกันหมายความว่า<1 เมื่อรวมเข้าด้วยกันเราจะได้และเรามีข้อขัดแย้งx1x2XWPx1p1(x2p2)<1XWQx2q2(x1q1)<1q1p1+p2q2<2

ขั้นตอนที่ 3

เราได้แสดงให้เห็นแล้วว่าและนั้นไม่ปะติดปะต่อ ปกถึงชุดของวัดเป็นศูนย์และมันตามที่ (ถึงชุดของวัดเป็นศูนย์) [เนื่องจากและเปิดอยู่เราจึงมีเหมือนกันทุกแต่นี่ไม่จำเป็นเลย]VPWPWPVPSWP=VPWPVPWP=VP

ตอนนี้เราเกือบจะเสร็จแล้ว พิจารณาจุดและ0) มันง่ายที่จะเห็นว่าและมีความสอดคล้องกันและการแปลซึ่งกันและกัน: วิธีเดียวที่พวกเขาอาจแตกต่างกันคือถ้าขอบเขตของ (นอกเหนือจากใบหน้าที่และโกหกทั้งสอง) จะ `` ตัด '' อาจเป็นหรือแต่ไม่ใช่อื่น ๆ แต่การที่จะไปถึงส่วนหนึ่งของขอบเขตของเราจะต้องเปลี่ยนหนึ่งพิกัดของหรืออย่างน้อย 1 ซึ่งเพียงพอที่จะรับประกันว่าจะพาเราออกจากA=(2,2,n4,0,,0)B=(3,1,n4,0,,0)WAWBSABWAWBSABWAและต่อไป ดังนั้นแม้ว่าจะดูแตกต่างจากจุดได้เปรียบและความแตกต่างอยู่ไกลเกินกว่าจะรับได้โดยคำจำกัดความของและและทำให้และสอดคล้องกันWBSABWAWBWAWB

หลังจากนั้นและมีปริมาตรเท่ากันดังนั้นโมเดล Dirichlet จึงกำหนดความน่าจะเป็นแบบเดียวกันแม้ว่าจะมีความน่าจะเป็นที่แตกต่างกันในรูปแบบพหุนามVAVB


ว้าว! ขอบคุณ! ดังนั้นการติดต่อเล็กน้อยผมก็หวังว่าเป็นอุบัติเหตุสำหรับผมคิดว่า ...
ราสมูส Baath
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.