อะไรเป็นสิ่งที่เจ๋งมากเกี่ยวกับทฤษฎีบทการเป็นตัวแทนของเดอ Finetti


55

จากทฤษฎีสถิติโดย Mark J. Schervish (หน้า 12):

แม้ว่าทฤษฎีบทการเป็นตัวแทนของ DeFinetti 1.49 เป็นหัวใจสำคัญของการสร้างแบบจำลองพารามิเตอร์ แต่มันไม่ได้ถูกนำมาใช้จริง

ทฤษฎีบทเป็นศูนย์กลางของแบบจำลองพารามิเตอร์อย่างไร


2
ฉันคิดว่ามันเป็นศูนย์กลางของแบบจำลองเบย์ ฉันแค่คุยเรื่องนี้กับซิงเกิล มันมีความสำคัญในสถิติแบบเบย์ที่ถูกมองข้ามยกเว้นพวก Bayesians ที่เป็นผู้ติดตามของ deFinetti ดูการอ้างอิงของDiaconis และอิสระจากปี 1980 นี้
Michael Chernick

1
@cardinal: หน้า 12 (ฉันอัพเดทคำถาม)
gui11aume

2
โปรดทราบว่า Schervish กล่าวว่า "... ศูนย์กลางของ โมเดลพารามิเตอร์ ... " motivating
Zen

1
ฉันมักจะสงสัยว่าการแสดงเป็น "ของจริง" มากแค่ไหนและขึ้นอยู่กับการตีความของทฤษฎีบทเป็นพิเศษ สามารถใช้เพื่ออธิบายการแจกแจงก่อนหน้าเช่นเดียวกับการอธิบายโมเดลได้อย่างง่ายดาย
ความน่าจะเป็นที่เป็นไปได้

คำตอบ:


79

De Finetti ของตัวแทนทฤษฎีบทให้ในเวลาที่เดียวในการแปลความหมายของความน่าจะ subjectivistic ที่เหตุผลเลยนะêtreของแบบจำลองทางสถิติและความหมายของค่าพารามิเตอร์และการกระจายของพวกเขาก่อน

สมมติว่าตัวแปรสุ่มแสดงผลลัพธ์ของการโยนเหรียญต่อเนื่องโดยมีค่าและสอดคล้องกับผลลัพธ์ "หัว" และ "ก้อย" ตามลำดับ วิเคราะห์ในบริบทของการตีความ subjectivistic ของแคลคูลัสความน่าจะเป็นความหมายของรูปแบบ frequentist ปกติตามที่ 's มีความเป็นอิสระและกันกระจายเดอ Finetti ตั้งข้อสังเกตว่าสภาพของความเป็นอิสระจะบ่งบอกเช่นที่ และดังนั้นผลลัพธ์ของแรกโยนจะไม่เปลี่ยนความไม่แน่นอนเกี่ยวกับผลลัพธ์ของ 1 0 X ฉัน P { X n = x nX 1 = x 1 , , X n - 1 = x n - 1 } = P { X n = x n }X1,,Xn10Xin - 1 n เบื้องต้น 999 1 / 2 X ฉัน

P{Xn=xnX1=x1,,Xn1=xn1}=P{Xn=xn},
n1n- โยน ตัวอย่างเช่นถ้าฉันเชื่อว่านี่คือเหรียญที่สมดุลจากนั้นหลังจากได้รับข้อมูลว่าการโยนครั้งแรกกลายเป็น "หัว" ฉันก็ยังเชื่อตามเงื่อนไขว่าข้อมูลนั้น ความน่าจะเป็นของการได้รับ "หัว" ในการโยน 1000 เท่ากับ 1/2อย่างมีประสิทธิภาพสมมติฐานของความเป็นอิสระของจะบ่งบอกว่ามันเป็นไปไม่ได้ที่จะเรียนรู้อะไรเกี่ยวกับเหรียญโดยการสังเกตผลลัพธ์ของการโยนa priori9991/2Xi

การสังเกตนี้ทำให้ De Finetti นำไปสู่การเปิดตัวของสภาพที่อ่อนแอกว่าความเป็นอิสระที่จะแก้ไขข้อขัดแย้งที่เห็นได้ชัดนี้ กุญแจสำคัญในการแก้ปัญหาของ De Finetti เป็นรูปแบบสมมาตรแบบกระจายที่รู้จักกันในชื่อการแลกเปลี่ยน

Definition.สำหรับชุด จำกัด ที่กำหนดของวัตถุสุ่มให้แสดงถึงการกระจายตัวของพวกมัน เซต จำกัด นี้สามารถแลกเปลี่ยนได้ถ้า , สำหรับการเปลี่ยนแปลงทุกครั้ง\} ลำดับของวัตถุสุ่มสามารถแลกเปลี่ยนได้หากแต่ละเซตย่อยที่แน่นอนของมันสามารถแลกเปลี่ยนได้{Xi}i=1nμX1,,XnμX1,,Xn=μXπ(1),,Xπ(n)π:{1,,n}{1,,n}{Xi}i=1

หากว่าลำดับของตัวแปรสุ่มนั้นสามารถแลกเปลี่ยนได้ De Finetti ได้พิสูจน์ทฤษฎีบทที่โดดเด่นที่ให้ความกระจ่างเกี่ยวกับความหมายของแบบจำลองทางสถิติที่ใช้กันทั่วไป ในกรณีเฉพาะเมื่อรับค่าและทฤษฎีบทการเป็นตัวแทนของ De Finetti กล่าวว่าสามารถแลกเปลี่ยนได้ถ้าหากมีตัวแปรสุ่ม , ที่มีการแจกแจง , นั่นคือ ที่x_i ยิ่งกว่านั้นเรายังมีสิ่งนั้น {Xi}i=1Xi01{Xi}i=1Θ:Ω[0,1]μΘ

P{X1=x1,,Xn=xn}=[0,1]θs(1θ)nsdμΘ(θ),
s=i=1nxi
X¯n=1ni=1nXinΘalmost surely,
ซึ่งเป็นที่รู้จัก ในฐานะกฎที่แข็งแกร่งของ De Finetti

ทฤษฎีบทการเป็นตัวแทนนี้แสดงให้เห็นว่าแบบจำลองทางสถิติเกิดขึ้นได้อย่างไรในบริบทของ Bayesian: ภายใต้สมมติฐานของความสามารถแลกเปลี่ยนได้ของ , aเช่นนั้นตามมูลค่าของที่สังเกตได้คือเป็นอิสระและกระจายเหมือนกัน ยิ่งกว่านั้นกฎหมายที่รัดกุมของ De Finetti แสดงให้เห็นว่าเรามีความคิดเห็นก่อนหน้าเกี่ยวกับ unobservableซึ่งแสดงโดยการกระจายคือความคิดเห็นเกี่ยวกับขีด จำกัด ของก่อนที่เราจะมีข้อมูลเกี่ยวกับค่าของการรับรู้ ของใด ๆ{Xi}i=1there isparameter ΘΘconditionallyΘμΘX¯nXi's พารามิเตอร์มีบทบาทในการสร้าง บริษัท ย่อยที่มีประโยชน์ซึ่งช่วยให้เราได้รับความน่าจะเป็นตามเงื่อนไขที่เกี่ยวข้องกับสิ่งที่สังเกตได้ผ่านความสัมพันธ์เช่น Θ

P{Xn=1X1=x1,,Xn1=xn1}=E[ΘX1=x1,,Xn1=xn1].

2
ขอบคุณสำหรับคำตอบที่ลึกซึ้งนี้! ประเด็นของคุณเกี่ยวกับความเป็นอิสระเป็นสิ่งสำคัญมากที่ฉันตระหนักได้เป็นครั้งแรก
gui11aume

("มีประโยชน์" ดีกว่า :))
Neil G

1
ฉันเข้าใจคำสั่ง "มีพารามิเตอร์อยู่ดังนั้น (ให้ )เป็น iid" จากทฤษฎีบทแทนมันก็ดูเหมือนว่าทุกสิ่งที่เราได้มาคือtheta)] นั่นคือค่าคาดหวังของความหนาแน่นที่แท้จริงเป็นเช่นเดียวกับมูลค่าที่คาดว่าจะมีความหนาแน่น Bernoulli IID กับพารามิเตอร์\คุณช่วยอธิบายให้ฉันฟังได้อย่างไรว่าเราจะสามารถลดค่าที่คาดหวังไว้เพื่อที่เราจะเรียกร้องเกี่ยวกับความหนาแน่นที่แท้จริงได้หรือไม่? Θ X ฉัน E [ θ s ( 1 - θ ) s ] = E [ P ( X ฉัน = x ฉันΘΘXiθE[θs(1θ)s]=E[P(Xi=xii|θ)]θ
user795305

integrand เป็น\} เนื่องจากเป็นปัจจัยที่เป็นที่ 's กำลังตามเงื่อนไขที่กำหนด IID \Pr{X1=x1,,Xn=xnΘ=θ}i=1nPr{Xi=xiΘ=θ}=i=1nθxi(1θ)1xiXiΘ=θ
Zen

@ เซนขอบคุณ! ฉันเข้าใจประโยคแรก แต่ส่วนหนึ่ง "เนื่องจากมันเป็น "ยังไม่ชัดเจนสำหรับฉัน คุณจะรู้ได้อย่างไรว่ามันเป็นปัจจัยนั้น ดูเหมือนว่าคุณกำลังทิ้งคุณค่าที่คาดไว้จากตัวตนที่ฉันเขียนไว้ในความคิดเห็นก่อนหน้านี้ แต่ฉันไม่แน่ใจว่ามันถูกต้องหรือไม่ i=1nPr{Xi=xiΘ=θ}=i=1nθxi(1θ)1xi
user795305

17

ทุกอย่างถูกต้องทางคณิตศาสตร์ในคำตอบของเซน อย่างไรก็ตามฉันไม่เห็นด้วยในบางประเด็น โปรดทราบว่าฉันไม่ได้อ้าง / เชื่อในมุมมองของฉันคือสิ่งที่ดี ในทางตรงกันข้ามฉันรู้สึกว่าประเด็นเหล่านี้ยังไม่ชัดเจนสำหรับฉันเลย เหล่านี้เป็นคำถามเชิงปรัชญาเกี่ยวกับที่ฉันชอบที่จะหารือ (และแบบฝึกหัดภาษาอังกฤษที่ดีสำหรับฉัน) และฉันก็สนใจในคำแนะนำใด ๆ

  • เกี่ยวกับตัวอย่างที่มี "หัว" ความคิดเห็นของเซน: "สมมติฐานของความเป็นอิสระของจะแปลว่ามันเป็นไปไม่ได้ที่จะเรียนรู้ทุกอย่างเกี่ยวกับเหรียญโดยการสังเกตผลของการโยน" สิ่งนี้ไม่เป็นความจริงจากมุมมองของผู้ใช้บ่อย: การเรียนรู้เกี่ยวกับเหรียญหมายถึงการเรียนรู้เกี่ยวกับซึ่งเป็นไปได้โดยการประเมิน (ช่วงจุดประเมินหรือช่วงความมั่นใจ)จากผลลัพธ์ก่อนหน้า หากผู้ถี่สังเกต "หัว" เขา / เธอสรุปว่าน่าจะใกล้กับและจึงเป็นเช่นนั้น999Xiθθ999999θ1Pr(Xn=1)

  • ในตัวอย่างเหรียญนี้การสุ่มคืออะไร? ลองนึกภาพว่าคนสองคนเล่นเกมโยนเหรียญจำนวนไม่ จำกัด ด้วยเหรียญเดียวกันทำไมพวกเขาถึงพบแตกต่างกัน? ฉันทราบอยู่แล้วว่าลักษณะของการโยนเหรียญคือค่าคงที่ซึ่งเป็นค่าทั่วไปของสำหรับนักเล่นเกมทุกคน ("นักเล่นเกมเกือบทุกคน" ด้วยเหตุผลทางคณิตศาสตร์เชิงเทคนิค) ตัวอย่างที่เป็นรูปธรรมมากขึ้นซึ่งไม่มี interpretable สุ่มเป็นกรณีของการสุ่มแบบมี replacment ในประชากร จำกัด ของและ1Θθ=X¯θX¯Θ01

  • เกี่ยวกับหนังสือของ Schervish และคำถามที่เกิดขึ้นจาก OP ฉันคิดว่า (พูดเร็ว) Schervish หมายความว่าการแลกเปลี่ยนเป็นสมมติฐานที่ "ยอดเยี่ยม" และจากนั้นทฤษฎีบทของ DeFinetti ก็คือ "เจ๋ง" เพราะมันบอกว่าแบบจำลองที่แลกเปลี่ยนได้ทุกตัว แน่นอนฉันเห็นด้วยทั้งหมด อย่างไรก็ตามถ้าฉันสมมติว่าเป็นแบบจำลองการแลกเปลี่ยนเช่นและแล้วฉันจะมีความสนใจในการปฏิบัติเกี่ยวกับการอนุมานและ , ไม่เกี่ยวกับการก่อให้เกิดการ\ถ้าฉันสนใจที่จะรับรู้ฉันจะไม่เห็นความสนใจในการแลกเปลี่ยน(XiΘ=θ)iidBernoulli(θ)ΘBeta(a,b)abΘΘ

สายแล้ว...


4
สวัสดีStéphane! ขอบคุณสำหรับความคิดเห็นในคำตอบของฉัน เกี่ยวกับประเด็นแรกของคุณที่ในคำตอบของฉันทุกอย่างมีการระบุไว้ในบริบทของเบย์ ไม่มีความพยายามจริงที่จะสร้างความแตกต่างกับกระบวนทัศน์การอนุมานอื่น ๆ ในระยะสั้นฉันได้พยายามที่จะแสดงความหมายของทฤษฎีบท De Finetti สำหรับฉันเป็น Bayesian "this is not true from the frequentist perspective"
Zen

4
เกี่ยวกับสัญลักษณ์แสดงหัวข้อย่อยที่สองของคุณ: การสุ่มคือ (ตาม) ขีด จำกัด ของตามที่ระบุใน LLN ของ De Finetti ดังนั้นเมื่อ Bayesian บางคนบอกว่าของฉันก่อนหน้านี้คือเขาหมายความว่าการกระจายนี้แสดงถึงความไม่แน่นอนของเขาเกี่ยวกับขีด จำกัด นี้ก่อนที่จะเข้าถึงข้อมูล Bayesians ที่แตกต่างกันอาจมีนักบวชที่แตกต่างกัน แต่ด้วยเงื่อนไขที่เหมาะสมอย่างสม่ำเสมอพวกเขาจะมีข้อตกลงเกี่ยวกับ (ผู้ตกแต่งที่คล้ายกัน) เนื่องจากพวกเขาได้รับข้อมูลมากขึ้นเกี่ยวกับผลลัพธ์ของการโยน ΘX¯nΘμΘa posterioriΘ
เซน

แบบคงที่ แต่ไม่ทราบไม่ใช่แนวคิดแบบเบย์ θ
เซน

1
เกี่ยวกับสัญลักษณ์แสดงหัวข้อที่สามของคุณได้รับ: 1) Schervish นั้นเป็นนักสถิติแบบเบย์ 2) จำนวนเวลาและพลังงานที่เขาใช้คุยเรื่องการแลกเปลี่ยนในหนังสือของเขา ฉันเชื่อว่าบทบาทของทฤษฎีบทของ De Finetti สำหรับเขานั้นลึกซึ้งมาก แต่ฉันยอมรับว่ามันเจ๋งมาก!
Zen

2
เพื่อชี้แจงมุมมองของฉัน: ฉันไม่เชื่อว่ามีการสุ่มในรูปแบบเบส์ "แบบพื้นฐาน" (ไม่ใช่แบบลำดับชั้น) มีการแก้ไขที่ไม่รู้จักและการกระจายก่อนหน้านี้อธิบายถึงความเชื่อเกี่ยวกับมัน บทบาทของตัวแปรสุ่มเป็นเพียงการรักษาทางคณิตศาสตร์ของการอนุมานแบบเบย์มันไม่มีการตีความใด ๆ ในการทดลอง หากคุณสมมติจริงๆแลกเปลี่ยน แต่ไม่ได้เป็นอิสระสังเกตเช่นตัวอย่างของกระสุนที่สามของฉันแล้วคุณจะต้องใส่ hyperpriors บนและขθΘ θΘab
Stéphane Laurent

11

พวกคุณอาจสนใจบทความเกี่ยวกับเรื่องนี้ (การสมัครสมาชิกวารสารที่จำเป็นสำหรับการเข้าถึง - ลองเข้าถึงจากมหาวิทยาลัยของคุณ):

O'Neill, B. (2011) การแลกเปลี่ยน, ความสัมพันธ์และผลของ Bayes การทบทวนทางสถิติระหว่างประเทศ 77 (2), หน้า 241-250

บทความนี้กล่าวถึงทฤษฎีบทการเป็นตัวแทนเป็นพื้นฐานสำหรับแบบจำลอง IID แบบเบย์และแบบประจำและยังนำไปใช้กับตัวอย่างการโยนเหรียญ มันควรจะมีการถกเถียงกันอย่างถี่ถ้วนเกี่ยวกับการตั้งสมมติฐานของกระบวนทัศน์ของผู้ถี่ถ้วน จริง ๆ แล้วมันใช้ส่วนขยายที่กว้างกว่ากับทฤษฎีบทการแสดงซึ่งอยู่นอกเหนือจากโมเดลทวินาม แต่มันก็ยังควรมีประโยชน์


คุณอาจมีรุ่นกระดาษที่ใช้งานได้หรือไม่ ฉันไม่สามารถเข้าถึง atm :-(
IMA

1
@ สถานะฉันอ่านบทความนั้นหลังจากดูคำตอบของคุณ ฉันต้องบอกว่านั่นเป็นบทความที่ดีที่สุดที่แสดงให้เห็น Bayesian และ Frequentist เกี่ยวกับปัญหาที่ฉันเคยเห็น ฉันหวังว่าฉันจะอ่านบทความนี้เร็วขึ้นมาก (+1)
KevinKim
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.