เกิดอะไรขึ้นถ้าความน่าจะเป็นไม่เท่ากันใน“ .632 กฎ”


11

คำถามนี้ได้มาจากคำถามนี้เกี่ยวกับ".632 Rule" ฉันกำลังเขียนโดยมีการอ้างอิงโดยเฉพาะกับคำตอบ / สัญกรณ์ของ user603 เท่าที่มันง่ายขึ้นเรื่อง

คำตอบที่ขึ้นต้นด้วยตัวอย่างที่มีขนาดด้วยการเปลี่ยนจากรายการที่แตกต่างกันในคอลเลกชัน (โทร) มัน N. ความน่าจะเป็นว่าตัวอย่างจะแตกต่างจากองค์ประกอบเฉพาะของ N คือแล้วn,nithsim(11/n).

ในคำตอบนั้นองค์ประกอบทั้งหมดของ N มีโอกาสเท่าเทียมกันในการถูกสุ่มจับ

คำถามของฉันคือ: สมมติว่าในคำถามข้างต้นรายการที่จะวาดนั้นเป็นสิ่งที่พวกเขามีการกระจายตามปกติ นั่นคือเราแบ่งเส้นโค้งปกติมาตรฐานจากถึงเป็น (พูด) 100 ช่วงเวลาที่มีความยาวเท่ากัน แต่ละรายการ 100 ใน N มีความน่าจะเป็นที่จะถูกดึงที่เท่ากับพื้นที่ subtended โดยเส้นโค้งในช่วงเวลาที่เกี่ยวข้องZ=4Z=4

ความคิดของฉันเป็นดังนี้:

การให้เหตุผลมีความคล้ายคลึงกับคำตอบที่ฉันคิดไว้ ความน่าจะเป็นที่โดยที่เป็นองค์ประกอบของ N คือซึ่งคือความน่าจะเป็นของการวาดsimmP(sim)=(1Fi)Fisi.

ความน่าจะเป็นที่องค์ประกอบเฉพาะ m อยู่ในตัวอย่าง S ของขนาด n คือ

= 1 - n Π 1 ( 1 - F ฉัน )

P(mS)=1P(mS)=11nP(sim)
=11n(1Fi).

ดูเหมือนว่าการคำนวณจะแสดงให้เห็นว่าเมื่อความยาวของช่วงย่อยมีขนาดเล็กคำตอบก็จะรวมเป็นจำนวนเดียวกันกับในกรณีแรก (ความน่าจะเป็นที่เท่ากันทั้งหมด)si

สิ่งนี้ดูเหมือนจะเป็นเรื่องง่าย (สำหรับฉัน) เพราะการก่อสร้างดูเหมือนจะโยนองค์ประกอบของ N ซึ่งหายากดังนั้นฉันคาดว่าจะมีจำนวนน้อยกว่า. 632

นอกจากนี้ถ้านี่ถูกต้องฉันคิดว่าเราคงมี

limn1n(1Fi)=lim(11/n)n=1/e,

ซึ่งฉันยังไม่รู้ว่าเป็นจริงหรือเท็จ

แก้ไข: ถ้าเป็นจริงมันอาจจะพูดทั่วไป

ขอบคุณสำหรับข้อมูลเชิงลึกใด ๆ


ฉันเพิ่งถามเกี่ยวกับสมการสุดท้ายของคณิตศาสตร์ SE (คำถามที่ 791114) เพราะฉันก็สนใจว่ามันพูดถึงเรื่องทั่วไปได้อย่างไร
daniel

... และคำตอบสั้น ๆ ก็คือความเท่าเทียมกันสุดท้ายนั้นถูกต้องสำหรับไฟล์ PDF ที่มีพฤติกรรมดีดังนั้นคำตอบของคำถามก็คือกฎ.. 632 มีไว้สำหรับการแจกแจงพื้นฐานที่หลากหลาย
daniel

ฉันสามารถยกคำตอบของคนอื่นจากเว็บไซต์อื่นและโพสต์ที่นี่เป็นของฉันได้หรือไม่ นั่นเป็นเหตุผลที่ฉันโพสต์ความคิดเห็นสั้น ๆ อาจมีวิธีที่ยอมรับได้ในการทำเช่นนี้ถ้าเป็นเช่นนั้น
daniel

แน่นอนคุณสามารถเพียงแค่พูดถึงแหล่งที่มาในบางจุด :)
Firebug

@Firebug: คุณสามารถชี้ไปที่อินสแตนซ์ที่ทำสิ่งนี้เพื่อให้ฉันสามารถเห็นสิ่งที่คุณหมายถึง? ขอบคุณ
daniel

คำตอบ:


2

คำถามถามเกี่ยวกับพฤติกรรมการ จำกัด ของ

(1)=1i=1n(1Fi)

เมื่อเติบโตและลดขนาดลงอย่างสม่ำเสมอในลักษณะที่ (a) ทั้งหมดไม่เป็นลบและ (b) รวมเป็นเอกภาพ (สิ่งเหล่านี้มาจากการสร้างและสัจพจน์ของความน่าจะเป็น)F ฉันF ฉันnFi Fi

ตามคำนิยามผลิตภัณฑ์นี้เป็นเลขชี้กำลังของลอการิทึม:

i=1n(1Fi)=exp(i=1nlog(1Fi)).

ทฤษฎีบทของเทย์เลอร์ (ที่มีรูปแบบลากรองจ์ของส่วนที่เหลือ)ซึ่งนำไปใช้กับได้กำหนดว่าlog

log(1Fi)=Fi12ϕi2Fi12Fi2

สำหรับบางในช่วงF_i] ในคำอื่น ๆ ลอการิทึมเหล่านี้เท่ากับถึงคำที่มีบางส่วนที่มากที่สุดครั้ง 2 แต่เมื่อมีขนาดใหญ่พอที่จะรับรองได้ว่าทั้งหมดจะเล็กกว่าที่ได้รับ (เงื่อนไขที่แน่นอนโดยการหดตัวอย่างสม่ำเสมอของ ) จากนั้น (b) หมายถึงและดังนั้นจึงϕi[0,Fi]Fi 1/2Fi2nFiϵ>0Finϵ>Fi=1

i=1nFi2i=1nϵ2<i=1n(1n)2=1n.

ดังนั้น

1=i=1nFii=1nlog(1Fi)i=1nFi121n=112n

บีบลอการิทึมระหว่างสองลำดับบรรจบกับ-1ตั้งแต่อย่างต่อเนื่องของผลิตภัณฑ์ลู่เพื่อชี้แจงของขีด จำกัด นี้,(-1) ดังนั้น1expi=1n(1Fi)exp(1)

limn(1i=1n(1Fi))=1exp(1)0.632,

QED


การวิเคราะห์นี้ดูอย่างละเอียดยิ่งขึ้นแสดงให้เห็นว่าข้อผิดพลาดในการประมาณนี้ (ซึ่งจะเป็นขอบเขตที่ต่ำกว่า ) จะไม่ใหญ่กว่า ตัวอย่างเช่นการหารของการแจกแจงแบบปกติมาตรฐานไปยังระหว่างและจะให้ค่าสูงสุดใกล้กับโหมดซึ่งจะมีค่าเท่ากับพื้นที่ของรูปสี่เหลี่ยมผืนผ้าที่นั่น0.012 ขอบเขตที่กล่าวถึงข้างต้นกำหนดค่าของสูตรจะอยู่ภายในของค่า จำกัด ข้อผิดพลาดที่แท้จริงคือลำดับความสำคัญน้อยกว่าn=400-44 F ฉัน 0ประสบการณ์(-1 / 2) / 500.012(1)0.0110.001041ฉัน 1

(exp((n/2)max(Fi2))1)exp(1).
n=40044Fi0exp(1/2)/500.012(1)0.0110.0010410.001041นี่คือการคำนวณในR(ซึ่งเราสามารถเชื่อถือได้เพราะไม่มีใด ๆ ที่ค่อนข้างเล็กเมื่อเทียบกับ ):fi1
f <- diff(pnorm(seq(-4, 4, length.out=401))) # The normal "slices".
f <- f / sum(f)                              # Make them sum to unity.
exp(-1) - prod(1 - f)                        # Compute the error.

แท้จริง1 - prod(1-f)คือขณะที่คือ0.63212061 - ประสบการณ์( - 1 ) 0.6321206 ...0.63316151exp(1)0.6321206


2
การวิเคราะห์ข้อผิดพลาดเป็นสิ่งที่มีประโยชน์มากสำหรับคำตอบนี้
แด
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.