นิยามของความน่าจะเป็นแบบบ่อย มีคำจำกัดความที่เป็นทางการหรือไม่?


10

มีคำจำกัดความที่เป็นทางการ (ทางคณิตศาสตร์) ของสิ่งที่ผู้ใช้บ่อยเข้าใจภายใต้ '' ความน่าจะเป็น 'หรือไม่ ฉันอ่านว่ามันเป็นความถี่สัมพัทธ์ของการเกิด '' ในระยะยาว '' แต่มีบางวิธีที่เป็นทางการในการกำหนดหรือไม่? มีการอ้างอิงที่รู้จักที่ฉันสามารถค้นหาคำจำกัดความนั้นได้หรือไม่?

แก้ไข:

ด้วยผู้ใช้บ่อย (ดูความคิดเห็นโดย @whuber และความคิดเห็นของฉันต่อคำตอบ @Kodiologist และ @Graeme Walsh ด้านล่างคำตอบนั้น) ฉันหมายถึงผู้ที่เชื่อในความถี่ระยะยาวที่มีอยู่นี้ บางทีนี่ (ส่วนหนึ่ง) ตอบคำถามของ @Tim ด้วย


7
โปรดอธิบายสิ่งที่คุณหมายถึงโดย "ผู้พบบ่อย" การใช้งานที่ฉันได้เห็นในหัวข้ออื่น ๆ บ่งชี้ว่าหลายคนไม่มีความรู้สึกที่สอดคล้องหรือชัดเจนว่าคำนี้หมายถึงอะไร คำจำกัดความจะช่วยให้คำตอบใด ๆ ที่เกี่ยวข้อง
whuber

5
@whuber ฉันเดาความหมายของ frequentist คือ "ไม่ใช่แบบเบย์" และแบบเบย์คือ "ไม่ใช่ frequentist" ในกรณีส่วนใหญ่ :)
ทิม

1
เกี่ยวข้องอย่างใกล้ชิด: en.wikipedia.org/wiki/Empirical_probability
Silverfish

2
ฉันกำลังจะบอกว่าstats.stackexchange.com/a/230943/113090นี้อาจเป็นที่สนใจของคุณ แต่แล้วฉันก็ตระหนักว่าคุณคือคนที่โพสต์คำตอบนั้นไม่เป็นไร อย่างไรก็ตามกระบวนการคิดของคุณอาจเป็นที่สนใจของคนอื่น ๆ ที่มีคำถามแบบเดียวกับคุณ (เช่นฉัน) "มีคำจำกัดความของความน่าจะเป็นประจำอย่างเป็นทางการ"
Chill2Macht

6
ฉันไม่แน่ใจว่าฉันจะมีพลังที่จะเขียนคำตอบเอง แต่ฉันอยากจะออกจากที่นี่เพื่อเชื่อมโยงไปยังรายการสารานุกรมปรัชญาสแตนฟอร์ดเรื่องการตีความความน่าจะเป็นที่ฉันโพสต์ภายใต้คำตอบของคุณในหัวข้อที่เกี่ยวข้อง ส่วนที่เกี่ยวกับการตีความ / คำจำกัดความที่ใช้บ่อยคือการอ่านที่ดี มันพูดอย่างกว้างขวางเกี่ยวกับปัญหาแนวคิดต่าง ๆ ด้วยความพยายามที่จะให้คำจำกัดความของความน่าจะเป็นประจำ
อะมีบา

คำตอบ:


4

TL; DRดูเหมือนจะไม่เป็นไปได้ที่จะนิยามคำจำกัดความความน่าจะเป็นแบบสม่ำเสมอที่สอดคล้องกับกรอบ Kolmogorov ซึ่งไม่ได้เป็นแบบวงกลมอย่างสมบูรณ์ (เช่นในแง่ของตรรกะแบบวงกลม)

ไม่นานดังนั้นฉันจึงได้อ่าน:ฉันต้องการที่จะระบุสิ่งที่ฉันเห็นว่าเป็นปัญหาที่อาจเกิดขึ้นกับคำจำกัดความของความน่าจะเป็นผู้สมัครก่อนสามารถตีความได้อย่างสมเหตุสมผลว่าเป็นตัวแปรสุ่มดังนั้นการแสดงออกข้างต้นจึงไม่ได้กำหนดอย่างแม่นยำในความหมายที่เข้มงวด เราจำเป็นต้องระบุโหมดการลู่เข้าสำหรับตัวแปรสุ่มนี้ไม่ว่าจะเป็นความน่าจะเป็นในการแจกแจงค่าเฉลี่ยหรือกำลังสองเฉลี่ย

limnnAn
nA

แต่แนวคิดเรื่องการบรรจบกันทั้งหมดเหล่านี้จำเป็นต้องมีการวัดความน่าจะเป็นในการกำหนดพื้นที่ความน่าจะเป็น แน่นอนว่าตัวเลือกที่ใช้งานง่ายนั้นคือการเลือกลู่เข้าหากันอย่างแน่นอน นี่เป็นคุณสมบัติที่ขีด จำกัด จำเป็นต้องมีอยู่ตามจุดยกเว้นในกรณีที่มีการวัดศูนย์ สิ่งใดที่ก่อให้เกิดชุดของศูนย์การวัดจะตรงกับครอบครัวของมาตรการใด ๆ ที่มีความต่อเนื่องกันด้วยความเคารพซึ่งกันและกัน - สิ่งนี้ช่วยให้เราสามารถกำหนดแนวคิดของการบรรจบกันเกือบทำให้แน่ใจว่าการ จำกัด ข้างต้นอย่างเข้มงวด การวัดสำหรับพื้นที่ที่สามารถวัดได้ของเหตุการณ์คือ (นั่นเป็นเพราะอาจเป็นการวัดใด ๆ อย่างต่อเนื่องอย่างแน่นอนด้วยความเคารพต่อการวัดที่เลือกไว้บางส่วน) สิ่งนี้จะป้องกันการเวียนในคำจำกัดความที่จะเกิดขึ้นจากการกำหนดมาตรการที่กำหนดไว้ล่วงหน้า

อย่างไรก็ตามหากเราใช้การบรรจบกันเกือบจะแน่นอนนั่นหมายความว่าเรากำลัง จำกัด ตัวเองให้เข้ากับสถานการณ์ของกฎหมายจำนวนมาก (ต่อจากนี้ไป SLLN) ผมขอกล่าวทฤษฎีบทนั้น (ตามที่ได้รับในหน้า 133 ของชุง) เพื่อการอ้างอิงที่นี่:

ให้เป็นลำดับของตัวแปรสุ่มแบบอิสระที่กระจายแบบเหมือนกัน จากนั้นเรามีที่X_n{Xn}

E|X1|<SnnE(X1)a.s.
E|X1|=limsupn|Sn|n=+a.s.
Sn:=X1+X2++Xn

สมมุติว่าเรามีพื้นที่ที่สามารถวัดได้และเราต้องการกำหนดความน่าจะเป็นของเหตุการณ์ด้วยความเคารพต่อความน่าจะเป็นแบบต่อเนื่องกันบางครอบครัวI} จากนั้นโดยทฤษฎีบทส่วนขยายของ Kolmogorov หรือทฤษฎีการขยาย Ionescu Tulcea (ฉันคิดว่าทั้งสองงาน) เราสามารถสร้างตระกูลของพื้นที่ผลิตภัณฑ์หนึ่งสำหรับแต่ละ\(โปรดสังเกตว่าการมีอยู่ของช่องว่างของผลิตภัณฑ์ที่ไม่มีที่สิ้นสุดซึ่งเป็นบทสรุปของทฤษฎีบทของ Kolmogorov กำหนดให้การวัดแต่ละช่องว่างเป็นดังนั้นเหตุใดฉันจึงจำกัดความเป็นไปได้แทนที่จะเป็นมาตรการโดยพลการ) จากนั้นกำหนด(X,F)AF{μi}iI{(j=1Xj)i}iIμi11Ajเป็นตัวแปรสุ่มตัวบ่งชี้คือซึ่งเท่ากับหากเกิดขึ้นในการคัดลอก th และหากไม่ได้กล่าวอีกนัยหนึ่งเห็นได้ชัดว่า (โดยที่หมายถึงความคาดหวังที่เกี่ยวกับ ) ดังนั้นกฎหมายที่เข้มแข็งของคนจำนวนมาก ใช้กับ (เพราะจากการก่อสร้าง1Aj0

nA=1A1+1A2++1An.
0Ei1Aj1Eiμi(j=1Xj)i1Ajมีการกระจายอย่างอิสระและเหมือนกัน - โปรดทราบว่าการกระจายอย่างอิสระหมายความว่าการวัดพื้นที่ของผลิตภัณฑ์นั้นคูณด้วยความเคารพต่อมาตรการพิกัด) ดังนั้นเราจึงได้รับและทำให้ความหมายของเราสำหรับความน่าจะเป็นของด้วยความเคารพธรรมชาติควรจะ{A}
nAnEi1A1a.s.
AμiE11A

ฉันเพิ่งรู้ว่าถึงแม้ว่าลำดับของตัวแปรแบบสุ่มจะมาบรรจบกันเกือบแน่นอนด้วยความเคารพถ้าหากว่ามันมาบรรจบกับ , ( ที่ ) ที่ไม่ได้หมายความว่ามันจะมาบรรจบกันเพื่อค่าเดียวกัน ; ในความเป็นจริง SLLN รับประกันว่าจะไม่เว้นแต่ซึ่งไม่เป็นความจริงทั่วไปnAnμi1μi2i1,i2IEi11A=Ei21A

หากเป็น "บัญญัติพอ" อย่างใดพูดเช่นกระจายเครื่องแบบสำหรับชุด จำกัด แล้วอาจจะได้ผลดี แต่ไม่ได้ให้ข้อมูลเชิงลึกใหม่ ๆ โดยเฉพาะอย่างยิ่งสำหรับการจัดจำหน่ายเครื่องแบบคือความน่าจะเป็นของเป็นเพียงสัดส่วนของจุดหรือเหตุการณ์ประถมศึกษาในซึ่ง เป็นของซึ่งดูเหมือนว่าค่อนข้างกลมสำหรับฉัน สำหรับตัวแปรสุ่มต่อเนื่องฉันไม่เห็นว่าเราจะเห็นด้วยกับทางเลือก "canonical" ของได้อย่างไรμE1A=|A||X|AXAμ

คือดูเหมือนว่าเหมาะสมที่จะกำหนดความถี่ของเหตุการณ์เป็นความน่าจะเป็นของเหตุการณ์ แต่ดูเหมือนจะไม่เหมาะสมที่จะกำหนดความน่าจะเป็นของเหตุการณ์ให้เป็นความถี่ (อย่างน้อยไม่มีวงกลม) นี่เป็นปัญหาโดยเฉพาะอย่างยิ่งเนื่องจากในชีวิตจริงเราไม่รู้จริง ๆ ว่าความน่าจะเป็นคืออะไร เราต้องประเมินมัน

โปรดทราบว่าคำจำกัดความของความถี่นี้สำหรับส่วนย่อยของพื้นที่ที่วัดได้นั้นขึ้นอยู่กับการวัดที่เลือกว่าเป็นพื้นที่น่าจะเป็น เช่นไม่มีมาตรการสินค้าหลายวท์สำเนาของ endowed กับเกอวัดตั้งแต่\ในทำนองเดียวกันการวัดโดยใช้การวัดผลิตภัณฑ์ที่ได้รับการยอมรับคือซึ่งทั้งระเบิดขึ้นไปไม่มีที่สิ้นสุดหากหรือไปที่ศูนย์ถ้ากล่าวคือทฤษฎีบทส่วนขยายของ Kolmogorov และ Tulcea นั้นเป็นผลลัพธ์ที่พิเศษมากโดยเฉพาะกับมาตรการความน่าจะเป็นRμ(R)=j=1nX(μ(X))nμ(X)>1μ(X)<1


1
ขอบคุณสำหรับคำตอบที่ดี (+1) ฉันยอมรับว่ามี 'ปัญหา' 'ที่มีคำจำกัดความในแง่ของความถี่สัมพัทธ์ในระยะยาวซึ่งอาจเป็นหนึ่งในเหตุผลที่ Kolmogorov พัฒนา Grundbegriffe ของเขา อย่างไรก็ตามเมื่อเราพูดถึงผู้ที่พบบ่อยเราต้องวางตัวเองในกรอบเวลาก่อนที่ทฤษฎีของ Kolmogorov ที่ฉันคิดว่า?

2
@fcop ฉันเดาอย่างสุจริตฉันไม่มีความคิด ฉันเดาว่าสิ่งที่ฉันพยายามจะพูดคือฉันไม่เห็นว่าการให้เหตุผลที่เข้มงวดสำหรับความเข้าใจความน่าจะเป็นที่เกิดขึ้นบ่อยครั้งอาจนำไปสู่คำจำกัดความที่มีประโยชน์ / ไม่เป็นวงกลม
Chill2Macht

@fcop ฉันซาบซึ้งในความกรุณาอย่างมาก - วันนี้ฉันอารมณ์ไม่ดีจริงๆ มันมีพื้นค่อนข้างฉัน (ในทางที่ดี) อีกครั้งฉันซาบซึ้งจริงๆ
Chill2Macht

ไม่ต้องพูดถึงมันคำตอบของคุณพัฒนาขึ้นมาอย่างดีและมีเสียงทางคณิตศาสตร์

6

ฉันไม่คิดว่าจะมีคำจำกัดความทางคณิตศาสตร์หรือเปล่า ความแตกต่างระหว่างการตีความความน่าจะเป็นต่าง ๆ นั้นไม่แตกต่างกันในการกำหนดความน่าจะเป็นทางคณิตศาสตร์ ความน่าจะเป็นอาจจะหมายทางคณิตศาสตร์ด้วยวิธีนี้: ถ้าเป็นพื้นที่วัดกับแล้วน่าจะเป็นของเหตุการณ์ใด ๆเป็นเพียง(S) ฉันหวังว่าคุณยอมรับว่าคำจำกัดความนี้เป็นกลางสำหรับคำถามเช่นว่าเราควรตีความความน่าจะเป็นในแบบประจำหรือแบบเบย์(Ω,Σ,μ)μ(Ω)=1SΣμ(S)


ไม่เป็นไร แต่ความน่าจะเป็นแบบนี้นิยามที่เติมเต็มสัจพจน์ของ Kolmogorov นั้นเป็นนามธรรมมากมันต้องมีการนิยามไว้ในบางกรณี มันเหมือนกับ 'วงกลมคือชุดของจุดที่อยู่ในระยะห่างที่กำหนดจากจุดคงที่' มันไม่ได้หมายความว่าอะไรตราบใดที่คุณไม่ได้บอกว่าคุณเป็นตัวชี้วัดพื้นที่ใด: คุณควรพูดว่าคำจำกัดความของ '' ระยะทาง '' คืออะไร ฉันคิดว่าการกำหนดเป็นความถี่ relatve ระยะยาวจะเติมเต็มความจริงของ Kolmogorov คุณคิดอย่างไร? ป.ล. ความเห็นใน @Silverfish ก็เติมเต็มความจริงเหล่านี้ด้วย μP

(ต่อ) ดังนั้นในระยะสั้นฉันสามารถนิยาม ( defineเป็นคำที่ถูกต้อง) หลายที่เติมเต็มความจริงของ Kolmogorov และสิ่งเหล่านี้ล้วนเป็นความน่าจะเป็นที่ถูกต้องตามทฤษฎีสัจพจน์ μ

เนื้อหาของระบบ Kolmogorov ให้พื้นฐานซึ่งเป็นจริง - ซึ่งไม่จำเป็นต้องนำมาซึ่งการตีความบ่อยหรือ Bayesian ในจิตวิญญาณของมุมมองผู้ใช้บ่อยความคิดพื้นฐานคือเมื่อจำนวนการทดลองเพิ่มขึ้นในความเป็นจริงความถี่เชิงประจักษ์จะคงที่ไปรอบ ๆ หรือแปรเปลี่ยนเป็นบางค่า ความน่าจะเป็นของเหตุการณ์ แม้ว่าวิธีความถี่จะปรับปรุงวิธีการแบบดั้งเดิม แต่การขาดความเข้มงวดก็นำไปสู่รากฐานที่เป็นจริง นี่เป็นคำถามเกี่ยวกับประวัติศาสตร์ของทฤษฎีความน่าจะเป็นหรือไม่?
limn(nA/n)=PA=P(A).
แกรมวอลช์

@ Graeme Walsh: คุณสามารถใส่คำตอบลงในนั้นและเติมเต็มด้วยข้อโต้แย้งว่าทำไมนิยามของนี้สอดคล้องกับสัจพจน์ของ Kolmogorov หรือไม่? (แน่นอนหนึ่งสามารถถามการดำรงอยู่ของขีด จำกัด แต่แล้วเราอาจพูดได้ว่าผู้ที่พบบ่อยคือผู้ที่ '' เชื่อ '' ในการดำรงอยู่ของมันได้หรือไม่)P(A)

2
@fcop ในฐานะที่วอลช์บันทึกไว้ "คำจำกัดความ" นี้ไม่เข้มงวด
ประสาทวิทยา
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.