การบรรจบกันของความน่าจะเป็นเทียบกับการบรรจบกันเกือบ


67

ฉันไม่เคยหาความแตกต่างระหว่างการบรรจบกันทั้งสองแบบนี้ (หรืออันที่จริงแล้วการบรรจบกันชนิดต่าง ๆ แต่ฉันพูดถึงสองสิ่งนี้โดยเฉพาะอย่างยิ่งเนื่องจากกฎที่อ่อนแอและแข็งแกร่งของคนจำนวนมาก)

แน่นอนฉันสามารถอ้างอิงคำนิยามของแต่ละคนและยกตัวอย่างที่พวกเขาต่างกัน แต่ฉันก็ยังไม่ค่อยเข้าใจ

เป็นวิธีที่ดีในการเข้าใจความแตกต่างอะไร ทำไมความแตกต่างจึงสำคัญ มีตัวอย่างที่น่าจดจำโดยเฉพาะอย่างยิ่งที่พวกเขาแตกต่างกันอย่างไร


นอกจากนี้คำตอบสำหรับเรื่องนี้: stats.stackexchange.com/questions/72859/…
kjetil b halvorsen

คำตอบ:


67

จากมุมมองของฉันความแตกต่างเป็นสิ่งสำคัญ แต่ส่วนใหญ่ด้วยเหตุผลทางปรัชญา สมมติว่าคุณมีอุปกรณ์บางอย่างที่ปรับปรุงตามเวลา ดังนั้นทุกครั้งที่คุณใช้อุปกรณ์ความน่าจะเป็นของความล้มเหลวจะน้อยกว่าก่อนหน้า

ความน่าจะเป็นแบบการบรรจบกันบอกว่าโอกาสของความล้มเหลวจะเป็นศูนย์เนื่องจากจำนวนการใช้งานมีค่าไม่สิ้นสุด ดังนั้นหลังจากใช้อุปกรณ์ไปหลายครั้งคุณสามารถมั่นใจได้ว่าอุปกรณ์ทำงานได้อย่างถูกต้อง แต่ก็อาจล้มเหลวก็ไม่น่าเป็นไปได้

การบรรจบกันเกือบจะแข็งแกร่งขึ้นเล็กน้อย มันบอกว่าจำนวนรวมของความล้มเหลวเป็นแน่นอน นั่นคือถ้าคุณนับจำนวนความล้มเหลวเมื่อจำนวนการใช้งานไปถึงระยะอนันต์คุณจะได้รับจำนวน จำกัด ผลกระทบของสิ่งนี้มีดังต่อไปนี้: เมื่อคุณใช้อุปกรณ์มากขึ้นเรื่อย ๆ คุณจะได้รับความล้มเหลวทั้งหมดหลังจากการใช้งานจำนวน จำกัด จากนั้นเครื่องจะทำงานได้อย่างสมบูรณ์แบบ

ในขณะที่ศรีคานต์ชี้ให้เห็นว่าคุณไม่รู้จริง ๆ ว่าเมื่อใดที่คุณล้มเหลวจากความล้มเหลวทั้งหมดดังนั้นจากมุมมองที่ใช้งานได้จริงไม่มีความแตกต่างกันมากนักระหว่างการบรรจบกันทั้งสองโหมด

อย่างไรก็ตามโดยส่วนตัวฉันดีใจมากที่ยกตัวอย่างเช่นกฎหมายที่แข็งแกร่งของคนจำนวนมากต่างจากกฎหมายที่อ่อนแอ เพราะตอนนี้การทดลองทางวิทยาศาสตร์เพื่อให้ได้ความเร็วแสงนั้นถูกต้องในการหาค่าเฉลี่ย อย่างน้อยในทางทฤษฎีหลังจากได้รับข้อมูลที่เพียงพอคุณสามารถเข้าใกล้ความเร็วที่แท้จริงของแสงโดยพลการ จะไม่มีความล้มเหลวใด ๆ (ไม่น่าจะเป็นไปได้) ในกระบวนการหาค่าเฉลี่ย

ให้ฉันอธิบายสิ่งที่ฉันหมายถึงโดย '' ความล้มเหลว (แต่ไม่น่าจะเป็นไปได้) ในกระบวนการหาค่าเฉลี่ย '' เลือกเล็ก ๆ โดยพลการ คุณได้รับประมาณการของความเร็วของแสง (หรือบางปริมาณอื่น ๆ ) ที่มีบางส่วน 'คุณค่าที่แท้จริง `พูด\คุณคำนวณค่าเฉลี่ย ในฐานะที่เราได้รับข้อมูลมากขึ้น (เพิ่มขึ้น) เราสามารถคำนวณสำหรับแต่ละ1,2, กฎหมายที่อ่อนแอบอกว่า (ภายใต้สมมติฐานบางอย่างเกี่ยวกับ ) ว่าความน่าจะเป็น เมื่อไปที่δ>0nX1,X2,,Xnμ

Sn=1nk=1nXk.
nSnn=1,2,Xn
P(|Snμ|>δ)0
n. กฎหมายที่รัดกุมกล่าวว่าจำนวนครั้งที่มีขนาดใหญ่กว่ามี จำกัด (มีความน่าจะเป็น 1) นั่นคือถ้าเรากำหนดฟังก์ชันตัวบ่งชี้ที่ส่งคืนหนึ่งเมื่อและศูนย์มิฉะนั้น ลู่เข้าหากัน สิ่งนี้จะช่วยให้คุณมั่นใจในค่าของมากเพราะมันรับประกัน (เช่นความน่าจะเป็น 1) การมีอยู่ของจำกัด บางอย่างที่สำหรับ (เช่นค่าเฉลี่ยไม่เคยล้มเหลวสำหรับ|Snμ|δI(|Snμ|>δ)|Snμ|>δ
n=1I(|Snμ|>δ)
Snn0|Snμ|<δn>n0n>n0) โปรดทราบว่ากฎหมายที่อ่อนแอไม่ให้การรับประกันเช่นนั้น

1
ขอบคุณฉันชอบการบรรจบกันของมุมมองแบบไม่มีที่สิ้นสุด!
raegtin

1
ฉันคิดว่าคุณหมายถึงนับได้และไม่จำเป็นต้อง จำกัด ฉันผิดหรือเปล่า? หรือฉันกำลังผสมกับอินทิกรัล
Royi

เพื่อให้แม่นยำยิ่งขึ้นชุดของเหตุการณ์ที่เกิดขึ้น (หรือไม่) ขึ้นอยู่กับการวัดค่าศูนย์ -> ความน่าจะเป็นที่จะเกิดศูนย์
Royi

ฉันไม่แน่ใจว่าฉันเข้าใจการโต้แย้งที่เกือบจะแน่นอนว่าช่วยให้คุณ "มั่นใจมาก" เพียงเพราะมีอยู่ไม่ได้บอกคุณถ้าคุณไปถึง ไฟไนต์ไม่ได้แปลว่าเล็กหรือใช้งานได้จริง โดยตัวมันเองกฎหมายที่แข็งแกร่งดูเหมือนจะไม่บอกคุณเมื่อคุณได้มาถึงหรือเมื่อคุณจะเข้าถึงn_0n0n0
โจเซฟการ์วิน

33

ฉันรู้ว่าคำถามนี้ได้รับการตอบแล้ว (และค่อนข้างดีในมุมมองของฉัน) แต่ก็มีคำถามที่แตกต่างกันที่นี่ที่มีความคิดเห็น @NRH ที่กล่าวถึงคำอธิบายแบบกราฟิกและแทนที่จะนำภาพที่มีก็จะดูเหมือนเหมาะสมมากขึ้นเพื่อ วางไว้ที่นี่

ดังนั้นที่นี่ไป มันไม่เจ๋งเท่าแพ็คเกจ R แต่มันมีอยู่ในตัวเองและไม่ต้องการการสมัครสมาชิกกับ JSTOR

ในเรื่องต่อไปนี้เรากำลังพูดถึงการเดินแบบสุ่มง่าย ๆมีความน่าจะเป็นที่เท่ากันและเรากำลังคำนวณหาค่าเฉลี่ยวิ่ง Xi=±1

Snn=1ni=1nXi,n=1,2,.

กฎหมายที่แข็งแกร่งของคนจำนวนมาก

SLLN (บรรจบกันเกือบจะแน่นอน) บอกว่าเราสามารถมั่นใจได้ 100% ว่าเส้นโค้งนี้ยื่นออกไปทางขวาในที่สุดในบางเวลา จำกัด ตกอยู่ในวงดนตรีตลอดไปหลังจากนั้น (ไปทางขวา)

รหัส R ที่ใช้ในการสร้างกราฟนี้อยู่ด้านล่าง

n <- 1000;  m <- 50; e <- 0.05
s <- cumsum(2*(rbinom(n, size=1, prob=0.5) - 0.5))
plot(s/seq.int(n), type = "l", ylim = c(-0.4, 0.4))
abline(h = c(-e,e), lty = 2)

กฎหมายที่อ่อนแอของจำนวนมาก

WLLN (ลู่เข้าในความน่าจะเป็น) บอกว่าส่วนใหญ่ของเส้นทางตัวอย่างจะอยู่ในแถบทางด้านขวามือในเวลาที่ (สำหรับข้างต้นดูเหมือนว่าประมาณ 48 หรือ 9 จาก 50) เราไม่สามารถตรวจสอบที่ใด ๆโดยเฉพาะอย่างยิ่งโค้งจะอยู่ในช่วงเวลา จำกัด ใด ๆ แต่มองไปที่มวลของก๋วยเตี๋ยวข้างต้นนั้นต้องการจะเดิมพันที่ปลอดภัยสวย WLLN ยังบอกด้วยว่าเราสามารถสร้างสัดส่วนของบะหมี่ภายในใกล้เคียงกับ 1 เท่าที่เราต้องการโดยการทำพล็อตให้กว้างพอสมควรn

รหัส R ของกราฟจะตามมา (อีกครั้งคือข้ามป้ายกำกับ)

x <- matrix(2*(rbinom(n*m, size=1, prob=0.5) - 0.5), ncol = m)
y <- apply(x, 2, function(z) cumsum(z)/seq_along(z))
matplot(y, type = "l", ylim = c(-0.4,0.4))
abline(h = c(-e,e), lty = 2, lwd = 2)

6

ฉันเข้าใจมันดังนี้

การลู่เข้าในความน่าจะเป็น

ความน่าจะเป็นที่ลำดับของตัวแปรสุ่มเท่ากับค่าเป้าหมายนั้นลดลงแบบ asymptotically และเข้าใกล้ 0 แต่ไม่เคยได้ 0 จริง

เกือบจะบรรจบกันแน่นอน

ลำดับของตัวแปรสุ่มจะเท่ากับค่าเป้าหมาย asymptotically แต่คุณไม่สามารถทำนายได้ว่าจะเกิดอะไรขึ้น

การบรรจบกันเกือบจะแน่ใจว่าเป็นเงื่อนไขที่แข็งแกร่งในพฤติกรรมของลำดับของตัวแปรสุ่มเพราะมันระบุว่า ในทางตรงกันข้ามการบรรจบกันในความน่ากล่าวว่า "ในขณะที่บางสิ่งบางอย่างมีแนวโน้มที่จะเกิดขึ้น" ความน่าจะเป็นของ "บางสิ่งบางอย่างไม่ได้เกิดขึ้น" ลดลง asymptotically แต่ไม่เคยจริงถึง 0 (สิ่งที่ลำดับของตัวแปรสุ่มบรรจบกับค่าโดยเฉพาะอย่างยิ่ง)

วิกิพีเดียมีตัวอย่างของทั้งสองบางอย่างที่จะช่วยชี้แจงข้างต้น (โดยเฉพาะอย่างยิ่งในการดูตัวอย่างของการยิงธนูในบริบทของการบรรจบกันใน prob และเป็นตัวอย่างขององค์กรการกุศลในบริบทของเกือบแน่ใจบรรจบกันที่)

จากมุมมองเชิงปฏิบัติความน่าจะเป็นที่มาบรรจบกันก็เพียงพอแล้วที่เราไม่สนใจเป็นพิเศษเกี่ยวกับเหตุการณ์ที่ไม่น่าจะเกิดขึ้น ตัวอย่างเช่นความสอดคล้องของตัวประมาณนั้นเป็นการรวมตัวกันของความน่าจะเป็น ดังนั้นเมื่อใช้การประมาณที่สอดคล้องกันเรายอมรับโดยปริยายว่าความจริงที่ว่าในกลุ่มตัวอย่างขนาดใหญ่มีความน่าจะเป็นน้อยมากที่การประมาณของเราอยู่ไกลจากค่าที่แท้จริง เราอาศัยอยู่กับ 'ข้อบกพร่อง' ของความเป็นไปได้ในการลู่เข้าหากันในขณะที่เรารู้ว่าความน่าจะเป็นของตัวประมาณความห่างไกลจากความจริงนั้นไม่มีขนาดเล็ก


ความพยายามแก้ไขระบุว่าสิ่งนี้ควรอ่าน "ความน่าจะเป็นที่ลำดับของตัวแปรสุ่มไม่เท่ากับค่าเป้าหมาย ... "
gung - Reinstate Monica

"ความน่าจะเป็นที่ลำดับของตัวแปรสุ่มเท่ากับค่าเป้าหมายนั้นลดลงแบบ asymptotically และเข้าใกล้ 0 แต่ไม่เคยบรรลุถึง 0" มันควรจะเป็นจริงหรือไม่อาจไม่เคยได้รับ 0
Jyotish Robin

@gung ความน่าจะเป็นที่จะเท่ากับค่าเป้าหมายที่เข้าใกล้ 1 หรือความน่าจะเป็นที่มันไม่เท่ากับค่าเป้าหมายที่เข้าหา 0 นิยามปัจจุบันไม่ถูกต้อง
Undertherainbow

5

หากคุณสนุกกับการอธิบายด้วยสายตามีบทความ'Teacher's Corner' ที่ดีเกี่ยวกับเรื่องนี้ใน American Statisticsian (อ้างอิงด้านล่าง) เป็นโบนัสผู้เขียนรวมแพ็คเกจ Rเพื่ออำนวยความสะดวกในการเรียนรู้

@article{lafaye09,
  title={Understanding Convergence Concepts: A Visual-Minded and Graphical Simulation-Based Approach},
  author={Lafaye de Micheaux, P. and Liquet, B.},
  journal={The American Statistician},
  volume={63},
  number={2},
  pages={173--178},
  year={2009},
  publisher={ASA}
}

1

คนสุดท้ายนี้อธิบายได้ดีมาก หากคุณใช้ลำดับของตัวแปรสุ่ม Xn = 1 ด้วยความน่าจะเป็น 1 / n และเป็นศูนย์มิฉะนั้น มันง่ายที่จะเห็นการ จำกัด ว่าสิ่งนี้น่าจะเป็นศูนย์ในความน่าจะเป็น ตามที่เขาพูดความน่าจะเป็นไม่ได้สนใจว่าเราอาจลงไปได้ เกือบจะแน่นอน

เกือบจะบอกเป็นนัยถึงการลู่เข้าในความน่าจะเป็น แต่ไม่ใช่วิธีอื่นรอบ ๆ ใช่ไหม?


5
ยินดีต้อนรับสู่เว็บไซต์ @ Tim-Brown เราขอขอบคุณสำหรับความช่วยเหลือในการตอบคำถามที่นี่ สิ่งหนึ่งที่ควรทราบคือการระบุคำตอบอื่น ๆ โดยชื่อผู้ใช้ของผู้ตอบคำถามว่า "คนสุดท้ายนี้" จะไม่มีประสิทธิภาพมากนัก เช่นรายชื่อจะถูกเรียงลำดับใหม่เมื่อเวลาผ่านไปเมื่อมีคนลงคะแนน คุณอาจต้องการที่จะอ่านของเราคำถามที่พบบ่อย
gung - Reinstate Monica

0

สิ่งหนึ่งที่ช่วยให้ฉันเข้าใจความแตกต่างคือความเท่าเทียมกันดังต่อไปนี้

P(limn|XnX|=0)=1⇐⇒limn(supm>=n|XmX|>ϵ)=0 ϵ>0

ในการเปรียบเทียบการรวมสุ่ม:

limnP(|XnX|>ϵ)=0 ϵ>0

เมื่อเปรียบเทียบด้านขวาของความสมดุลบนกับการลู่เข้า Stochastic ความแตกต่างจะชัดเจนขึ้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.