ดังนั้นการกระจายเบต้า


13

เนื่องจากฉันแน่ใจว่าทุกคนที่นี่รู้อยู่แล้ว PDF ของการแจกแจงเบต้าXB(a,b)มอบให้โดย

f(x)=1B(a,b)xa1(1x)b1

ฉันตามล่าหาสถานที่เพื่ออธิบายต้นกำเนิดของสูตรนี้ แต่ฉันหามันไม่เจอ ทุกบทความที่ฉันพบในการแจกแจงเบต้าดูเหมือนว่าจะให้สูตรนี้แสดงให้เห็นถึงรูปร่างบางส่วนของมันแล้วตรงไปยังการอภิปรายช่วงเวลาและต่อจากที่นั่น

ฉันไม่ชอบใช้สูตรทางคณิตศาสตร์ที่ไม่สามารถหามาอธิบายได้ สำหรับดิสทริบิวชันอื่น ๆ (เช่นแกมม่าหรือทวินาม) มีการได้มาอย่างชัดเจนที่ฉันสามารถเรียนรู้และใช้งานได้ แต่ฉันไม่พบอะไรแบบนั้นสำหรับการแจกแจงแบบเบต้า

ดังนั้นคำถามของฉันคือ: ต้นกำเนิดของสูตรนี้คืออะไร? มันจะมาจากหลักการแรกในบริบทใดก็ตามที่ถูกพัฒนามาตั้งแต่แรก?

[เพื่อความกระจ่างแจ้งฉันไม่ได้ถามเกี่ยวกับวิธีการใช้การแจกแจงแบบเบต้าในสถิติแบบเบย์หรือความหมายในทางปฏิบัติในทางปฏิบัติ (ฉันได้อ่านตัวอย่างเบสบอล) ฉันแค่อยากรู้วิธีการหา PDF มีคำถามก่อนหน้านี้ที่ถามสิ่งที่คล้ายกัน แต่มันถูกทำเครื่องหมาย (ฉันคิดว่าไม่ถูกต้อง) เป็นคำถามซ้ำที่ไม่ได้แก้ปัญหาดังนั้นฉันจึงไม่สามารถค้นหาความช่วยเหลือได้ที่นี่]

แก้ไข 2017-05-06: ขอบคุณทุกคนสำหรับคำถาม ฉันคิดว่าคำอธิบายที่ดีของสิ่งที่ฉันต้องการมาจากคำตอบอย่างใดอย่างหนึ่งที่ฉันได้รับเมื่อฉันถามอาจารย์ผู้สอนหลักสูตรนี้:

"ฉันเดาว่าผู้คนจะได้รับความหนาแน่นปกติเป็นขีด จำกัด ของผลรวมของ n สิ่งหารด้วย sqrt (n) และคุณสามารถหาความหนาแน่นของปัวซองได้จากแนวคิดของเหตุการณ์ที่เกิดขึ้นในอัตราคงที่เช่นเดียวกันเพื่อให้ได้ ความหนาแน่นของเบต้าคุณจะต้องมีความคิดบางอย่างเกี่ยวกับสิ่งที่ทำให้การกระจายตัวของเบต้าเป็นอิสระจากและมีเหตุผลก่อนที่จะมีความหนาแน่น "

ดังนั้นความคิด "ab initio" ในความคิดเห็นน่าจะใกล้เคียงกับสิ่งที่ฉันกำลังมองหา ฉันไม่ใช่นักคณิตศาสตร์ แต่ฉันรู้สึกสะดวกสบายที่สุดเมื่อใช้คณิตศาสตร์ที่ฉันสามารถหามาได้ หากต้นกำเนิดนั้นสูงเกินกว่าที่ฉันจะจัดการได้ดังนั้นไม่ว่าจะเป็น แต่ถ้าไม่ใช่ฉันก็อยากจะเข้าใจพวกเขา


5
มาจากอะไร หากวิธีการทวินาม - คอนจูเกต - ก่อนไม่เป็นที่ยอมรับมีหลายทางเลือกอยู่ที่นี่ (เช่นสถิติการสั่งซื้อของตัวแปรสุ่มสม่ำเสมอสัดส่วนของตัวแปรแกมม่า)
GeoMatt22

3
หมายเหตุ: ประวัติทั้งหมดของการแจกแจงแบบเบต้ามีให้ในหน้า Wikipedia ที่ไม่น่าเชื่อในการเผยแพร่นี้ซึ่งมีรายละเอียดที่เป็นไปได้ทุกอย่าง!
ซีอาน

1
คำถามก่อนหน้านี้ถูกทำเครื่องหมายว่าซ้ำกับของคนอื่น ๆหลังจาก OP ชี้แจงสิ่งที่พวกเขาหลังจากที่ในความคิดเห็น whuber ถามคำถามแบบเดียวกันกับที่ @ Geomatt22 ทำที่นี่: "การสืบทอดหมายถึงการเชื่อมต่อแบบลอจิคัลจากสิ่งที่สันนิษฐานว่าเป็นสิ่งที่จะสร้างขึ้นคุณต้องการสมมติอะไร?"
Scortchi - Reinstate Monica

2
@ Aksakal แต่คำถามนั้นกว้างเกินไป - มันอาจจะเป็นไปได้ทุกทาง หากคุณพูดถูกฉันจะปิดให้กว้างเกินไปจนคำถามแคบลงจนไม่เหลือคำตอบที่เป็นไปได้
Glen_b

3
การสนทนาสั้น ๆ เกี่ยวกับบริบททางประวัติศาสตร์เล็กน้อยอยู่ที่นี่ (อย่างน้อยก็ในแง่ของความสัมพันธ์กับฟังก์ชั่นเบต้าที่ไม่สมบูรณ์) มันมีการเชื่อมต่อกับการแจกแจงแกมม่าและการกระจายอื่น ๆ มากมายนอกเหนือจากและเกิดขึ้นค่อนข้างสมเหตุสมผลในหลายวิธีที่แตกต่างกัน เป็นจุดที่ซีอานออกก็ยังมีต้นกำเนิดประวัติศาสตร์ในระบบเพียร์สัน คุณต้องการคำตอบแบบไหน สิ่งที่ได้รับ / สิ่งที่จะต้องได้รับ?
Glen_b

คำตอบ:


6

ในฐานะอดีตนักฟิสิกส์ฉันสามารถเห็นได้ว่ามันจะเกิดขึ้นได้อย่างไร นี่คือวิธีที่นักฟิสิกส์ดำเนินการ:

เมื่อพวกเขาพบกับอินทิกรัล จำกัด ของฟังก์ชันบวกเช่นฟังก์ชันเบต้า : พวกเขาสัญชาตญาณกำหนดความหนาแน่น: F ( s | x , Y ) = s x - 1 ( 1 - s ) Y - 1

B(x,y)=01tx1(1t)y1dt
ที่0<s<1
f(s|x,y)=sx1(1s)y101tx1(1t)y1dt=sx1(1s)y1B(x,y),
0<s<1

พวกเขาทำสิ่งนี้กับอินทิเกรตทุกชนิดตลอดเวลาจนเกิดการสะท้อนโดยไม่ต้องคิด พวกเขาเรียกขั้นตอนนี้ว่า "การทำให้เป็นมาตรฐาน" หรือชื่อที่คล้ายกัน แจ้งให้ทราบว่าโดยความหมายนิดหนาแน่นมีคุณสมบัติทั้งหมดที่คุณต้องการให้มีเช่นบวกอยู่เสมอและจะเพิ่มขึ้นอย่างใดอย่างหนึ่ง

f(t)

UPDATE

@ whuber ถามว่ามีอะไรพิเศษเกี่ยวกับการแจกเบต้าขณะที่ตรรกะข้างต้นสามารถนำไปใช้กับอินทิกรัลที่เหมาะสมได้ไม่ จำกัด จำนวน

ส่วนที่พิเศษมาจากการกระจายทวินาม ฉันจะเขียน PDF โดยใช้สัญลักษณ์ที่คล้ายกันกับเบต้าของฉันไม่ใช่เครื่องหมายปกติสำหรับพารามิเตอร์และตัวแปร:

f(x,y|s)=(y+xx)sx(1s)y

ที่นี่ - จำนวนความสำเร็จและความล้มเหลวและ - ความน่าจะเป็นของความสำเร็จ คุณสามารถดูว่านี่คล้ายกับตัวเศษในการแจกแจงเบต้าอย่างไร อันที่จริงถ้าคุณมองหาการกระจายแบบทวินามก่อนหน้านี้ก็จะเป็นการกระจายแบบเบต้า ไม่น่าแปลกใจเช่นกันเพราะโดเมนของ Beta คือ 0 ต่อ 1 และนั่นคือสิ่งที่คุณทำในทฤษฎีบท Bayes: รวมพารามิเตอร์ซึ่งน่าจะเป็นความสำเร็จในกรณีนี้ดังที่แสดงด้านล่าง: ที่นี่ - ความน่าจะเป็น (ความหนาแน่น) ของความน่าจะเป็นของความสำเร็จที่ได้รับ การตั้งค่าก่อนหน้าของการแจกแจงเบต้าและx,yss

f^(x|X)=f(X|s)f(s)01f(X|s)f(s)ds,
f(s)f(X|s)- ความหนาแน่นของชุดข้อมูลนี้ (เช่นความสำเร็จและความล้มเหลวที่สังเกต) ได้รับความน่าจะเป็นของs

1
@ Xi'an OP ดูเหมือนจะไม่สนใจประวัติศาสตร์
Aksakal

1
"คำอธิบายเกี่ยวกับต้นกำเนิดของสูตรนี้ ... ในบริบทใด ๆ ก็ตามที่ได้รับการพัฒนามาในอดีต" ฟังดูคล้ายกับประวัติศาสตร์สำหรับฉัน :-)
whuber

3
ฉันเชื่อว่าหนึ่งสามารถมีความสนใจทั้งในประวัติศาสตร์และหลักการแรกในเวลาเดียวกัน :-) ถึงแม้ว่าคำตอบของคุณจะถูกต้องทางคณิตศาสตร์ แต่มันก็กว้างเกินไป: เราสามารถสร้างความหนาแน่นของฟังก์ชั่นที่ไม่เป็นลบใด ๆ ที่มีอินทิกรัล จำกัด แล้วอะไรคือสิ่งที่พิเศษเกี่ยวกับตระกูลการแจกแจงนี้โดยเฉพาะ? ดังนั้นวิธีการของคุณดูเหมือนจะไม่เป็นที่น่าพอใจ
whuber

2
@ WillBradshaw ใช่ โดยปกติแล้วเรามองการแจกแจงทวินามเป็นฟังก์ชันของจำนวนความล้มเหลว (หรือความสำเร็จ) เนื่องจากความน่าจะเป็นและจำนวนการทดลองเป็นพารามิเตอร์ วิธีนี้จะเป็นการกระจายที่ไม่ต่อเนื่อง อย่างไรก็ตามหากคุณมองว่ามันเป็นฟังก์ชั่นของความน่าจะเป็นที่ให้จำนวนความสำเร็จและความล้มเหลวเป็นพารามิเตอร์มันจะกลายเป็นการแจกแจงแบบเบต้าเมื่อคุณปรับขนาดใหม่การกระจายแบบต่อเนื่องคือ btw
Aksakal

2
บทความวิกิพีเดียในการกระจายเบต้าร่องรอยไปยังคาร์ลเพียร์สันตรงตามที่แนะนำโดย @ ซีอาน สติเกอร์เลอร์ในประวัติความเป็นมาของสถิติ: การวัดความไม่แน่นอนก่อนปี 1900แสดงเรื่องราวสั้น ๆ เกี่ยวกับการได้มาของเพียร์สันโดยใช้สัญลักษณ์สมัยใหม่
whuber

15

ป้อนคำอธิบายรูปภาพที่นี่

Thomas Bayes (1763) ได้รับการแจกแจงแบบเบต้า [โดยไม่ใช้ชื่อนี้] เป็นตัวอย่างแรกของการแจกแจงหลัง , predating Leonhard Euler (1766)ทำงานในอินทิกรัลเบต้าที่ชี้ให้เห็นโดยGlen_bภายในสองสามปีออยเลอร์ (1729 หรือ 1738) [Opera Omnia, I14, 1 {24] เป็นวิธีที่จะพูดคุยฟังก์ชั่นปัจจัยซึ่งอาจจะเป็นเหตุผลที่ normalizing Beta คงจะเรียกว่าฟังก์ชั่นออยเลอร์ -เดวีส์B(a,b)กล่าวถึงวาลลิส (1616-1703) นิวตัน (1642-1726) และสเตอร์ลิง (1692-1770) จัดการกับกรณีพิเศษของอินทิกรัลแม้ก่อนหน้านี้ คาร์ลเพียร์สัน (1895) ครั้งแรกหมวดหมู่ครอบครัวของการกระจายนี้เป็นเพียร์สัน Type I


แม้ว่ามันจะไม่ปรากฏในอดีตตามลำดับการเข้าถึงการแจกแจงแบบง่าย ๆ คือการกระจายของฟิชเชอร์สซึ่งสอดคล้องกับการกระจายของอัตราส่วน ซึ่งฉันใช้จุดประสงค์ปกติสำหรับการประมาณค่าความแปรปรวนเช่นนี้ ปรากฏขึ้นและได้รับแรงบันดาลใจสำหรับการทดสอบความเท่าเทียมกันของความแปรปรวนสองแบบ จากนั้น ในขณะที่ตรงกันข้ามถ้าจากนั้น ค้นหาความหนาแน่นของ aF(p,q)

ϱ=σ^12/σ^22pσ^12χp2qσ^12χq2
pϱq+pϱB(p/2,q/2)
ωB(a,b)
ω/a(1ω)/bF(2a,2b)
B(a,b)การกระจายจึงเป็นการเปลี่ยนแปลงขั้นตอนของตัวแปร: เริ่มต้นจากความหนาแน่นของการแจกแจงแบบ , และพิจารณาการเปลี่ยนแปลงของตัวแปรซึ่งแปลงกลับเป็น Jacobian คือนำไปสู่ความหนาแน่นของการแปลง [ซึ่งค่าคงที่การปรับสภาพทั้งหมดได้มาจากการกำหนดความหนาแน่นเพื่อรวมเข้ากับหนึ่งF(p,q)
fp,q(x){px/q}p/21(1+px/q)(p+q)/2
y={px/q}{1+px/q}y(0,1)
x=qyp(1y)
dxdy=qp(1y)+qyp(1y)2=pq(1y)2
g(y)yp/21(1y)q/2+1(1y)2=yp/21(1y)q/2+1

2
+1 อาจเป็นเรื่องที่น่าสังเกตว่าเคเพียร์สันไม่เพียงแค่ "แจกแจง" การแจกแจงเบต้า: เขาได้มาจากการแก้ปัญหาของสมการเชิงอนุพันธ์ของครอบครัวซึ่งได้รับแรงบันดาลใจจากความสัมพันธ์ที่เขาสังเกตเห็นระหว่างสมการแตกต่างสำหรับสมการทวินาม การทำให้สมการความแตกต่างแบบทวินามกับการแจกแจงแบบ hypergeometric เป็นการวางนัยทั่วไปของสมการเชิงอนุพันธ์ซึ่งการแก้ปัญหานั้นรวมถึง "Type I" และ "Type II" การแจกแจงแบบเบต้า นี่เป็นชนิดของการเริ่มต้นที่ชัดเจนของ OP ที่ดูเหมือนว่าจะเป็นการแสวงหา
whuber

2
ฉันคิดว่าฉันสามารถเรียนรู้ได้มากจากการศึกษาคำตอบนี้ มันก้าวหน้าเกินไปสำหรับฉันในขณะนี้ แต่เมื่อฉันมีเวลาฉันจะกลับมาและค้นคว้าหัวข้อที่คุณพูดถึงจากนั้นลองอีกครั้งเพื่อทำความเข้าใจ ขอบคุณมาก. :)
Will Bradshaw

1

ก่อนอื่นฉันไม่เก่งในการอธิบายแนวคิดทางคณิตศาสตร์อย่างแม่นยำในหัวของฉัน แต่ฉันจะพยายามอย่างดีที่สุดโดยใช้ตัวอย่างง่ายๆ:

ลองนึกภาพคุณมีธนูลูกศรและเป้าหมายมากมาย สมมุติว่าอัตราการยิงของคุณ (สำหรับการกดปุ่มเป้าหมาย) นั้นเป็นฟังก์ชันของระยะทางไปยังศูนย์กลางของเป้าหมายและรูปแบบต่อไปนี้ โดยที่ x คือระยะห่างจากศูนย์กลาง ของเป้าหมาย ( ) สำหรับนี่จะเป็นการประมาณอันดับแรกของ Gaussian นั่นหมายความว่าคุณมักจะโดนวัวกระทิง ในทำนองเดียวกันมันใกล้เคียงกับเส้นโค้งรูประฆังใด ๆ ซึ่งเป็นผลมาจากการแพร่กระจายของอนุภาคบราวเนียนλ

λ=g(x)=λmax(q|xx0|)1q, q>0, 0λλmax
x0q=1/2

ทีนี้สมมุติว่าใครบางคนที่กล้าหาญ / โง่ ๆ พยายามหลอกคุณและกำจัดเป้าหมายในทุกช็อต ดังนั้นเราจึงทำให้เป็นตัวแปรสุ่ม ถ้าการกระจายตัวของการเคลื่อนไหวของบุคคลนั้นสามารถอธิบายได้ด้วย (p-1) - พลังของ (นั่นคือง่าย ๆ การเปลี่ยนแปลงของตัวแปรสุ่ม (จำ ) นำไปสู่การกระจายเบต้า :x0g(x)P(x0)=Cg(x)p1)P(λ)dλ=P(x0)dx0λ

P(λ)=P(g1(λ))|dg1(λ)dλ|=Cλp1(λmaxλ)q1

โดยที่ normalization normalคือฟังก์ชันเบต้า สำหรับตัวแปรที่มาตรฐานของการกระจายเบต้าที่เราจะตั้ง1Cλmax=1

กล่าวอีกนัยหนึ่งการแจกแจงแบบเบต้าสามารถมองได้ว่าเป็นการกระจายตัวของความน่าจะเป็นที่อยู่ตรงกลางของการแจกแจงแบบกระวนกระวายใจ

ฉันหวังว่าสิ่งที่ได้รับนี้จะใกล้เคียงกับความหมายของผู้สอนของคุณ โปรดทราบว่ารูปแบบการทำงานของและนั้นมีความยืดหยุ่นและเข้าถึงได้จากรูปสามเหลี่ยมเช่นการแจกแจงและการแจกแจงรูปตัวยู (ดูตัวอย่างด้านล่าง) ไปยังการกระจายที่แหลมอย่างรวดเร็วg(x)P(x0)

FYI: ฉันค้นพบสิ่งนี้เป็นผลข้างเคียงในงานปริญญาเอกของฉันและรายงานเกี่ยวกับเรื่องนี้ในวิทยานิพนธ์ของฉันในบริบทของเส้นโค้งการปรับแต่งเส้นประสาทที่ไม่หยุดนิ่ง การใช้แนวคิดที่อธิบายไว้ข้างต้นทำให้ได้การกระจายตัวของเบต้า - ปัวซองเพื่อการทำงานของระบบประสาท การกระจายนั้นสามารถเหมาะสมกับข้อมูล พารามิเตอร์ที่ติดตั้งอนุญาตให้ประเมินทั้งการแจกแจงรวมถึง jitter distributionโดยใช้การย้อนกลับ logics ส่วนผสม Beta-Poisson เป็นทางเลือกที่น่าสนใจและยืดหยุ่นในการกระจายแบบทวินามลบที่ใช้กันอย่างแพร่หลาย ด้านล่างคุณจะพบตัวอย่าง "Jitterg(x)p(x0) เบต้า "- แนวคิดในการดำเนินการ:

รุ่นกระวนกระวายใจที่นำไปสู่รูปแบบการ spiking Beta-Poisson

ตอบ : จำลองการกระจัด 1D ทดลองซึ่งดึงมาจากการกระจายตัวกระวนกระวายใจในสิ่งที่ใส่เข้าไป ( ) ฟิลด์การยิงแบบทดลองโดยเฉลี่ย (เส้นทึบสีดำ) กว้างกว่าและมีอัตราสูงสุดต่ำกว่าเมื่อเปรียบเทียบกับเส้นโค้งการปรับแต่งพื้นฐานโดยไม่ต้องกระวนกระวายใจ (เส้นทึบสีน้ำเงินพารามิเตอร์ที่ใช้: . B : การกระจายที่เกิดขึ้นของที่ข้าม N = 100 การทดลองและ pdf การวิเคราะห์ของการแจกแจงเบต้าC : การจำลองการนับจำนวนขัดขวางจากกระบวนการปัวซองด้วยพารามิเตอร์โดยที่ฉันแสดงถึงดัชนีของการทดลอง และการกระจาย Beta-Poisson ที่ได้รับตามที่ร่างไว้ข้างต้นP(jitter)g(x)p1λmax=10,p=.6,q=.5λ x 0 λ ฉันλx0λiD : สถานการณ์แบบอะนาล็อกใน 2D พร้อมมุมเลื่อนแบบสุ่มที่นำไปสู่สถิติที่เหมือนกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.