ใช่เราสามารถรับผลลัพธ์แบบอะนาล็อกได้โดยใช้ค่าเฉลี่ยและความแปรปรวนตัวอย่างอาจมีความประหลาดใจเล็กน้อยเกิดขึ้นในกระบวนการ
ก่อนอื่นเราต้องปรับแต่งคำสั่งคำถามเพียงเล็กน้อยและตั้งสมมติฐานบางอย่าง ที่สำคัญมันควรจะชัดเจนว่าเราไม่สามารถหวังที่จะเปลี่ยนความแปรปรวนประชากรด้วยความแปรปรวนตัวอย่างทางด้านขวามือตั้งแต่หลังเป็นแบบสุ่ม ! ดังนั้นเราจึงให้ความสนใจกับความไม่เท่าเทียม
ในกรณีที่ไม่ชัดเจนว่าสิ่งเหล่านี้เทียบเท่าโปรดทราบว่าเราได้แทนที่ด้วยในความไม่เท่าเทียมเดิมโดยไม่มีการสูญเสียทั่วไปt t σ
P(X−EX≥tσ)≤11+t2.
ttσ
ประการที่สองเราคิดว่าเรามีตัวอย่างสุ่มและเราสนใจขอบเขตบนของปริมาณอะนา
โดยที่เป็นตัวอย่าง Mean และคือค่าเบี่ยงเบนมาตรฐานตัวอย่างP ( X 1 - ˉ X ≥ t S ) ˉ X SX1,…,XnP(X1−X¯≥tS)X¯S
ก้าวไปข้างหน้าครึ่งก้าว
โปรดทราบว่าโดยการใช้อสมการ Chebyshev เดิมด้านเดียวกับเราได้รับ
โดยที่ซึ่งมีขนาดเล็กกว่าทางด้านขวาของรุ่นดั้งเดิม มันสมเหตุสมผลแล้ว! การรับรู้ตัวแปรสุ่มจากตัวอย่างใด ๆ จะมีแนวโน้มที่จะใกล้เคียงกับค่าเฉลี่ยตัวอย่างมากขึ้นกว่าค่าเฉลี่ยของประชากร ดังที่เราจะเห็นด้านล่างเราจะได้รับการแทนที่โดยภายใต้สมมติฐานทั่วไปมากยิ่งขึ้น P ( X 1 - ˉ X ≥ t σ ) ≤ 1X1−X¯σ2=Var(X1)σS
P(X1−X¯≥tσ)≤11+nn−1t2
σ2=Var(X1)σS
รุ่นตัวอย่างของ Chebyshev ด้านเดียว
เรียกร้อง : ให้เป็นตัวอย่างที่สุ่มดังกล่าวว่า0 จากนั้นโดยเฉพาะอย่างยิ่งรุ่นตัวอย่างของขอบเขตจะเข้มงวดกว่ารุ่นประชากรดั้งเดิมP ( S = 0 ) = 0 P ( X 1 - ˉ X ≥ t S ) ≤ 1X1,…,XnP(S=0)=0
P(X1−X¯≥tS)≤11+nn−1t2.
หมายเหตุ : เราไม่คิดว่ามีค่าเฉลี่ยหรือความแปรปรวนแน่นอน!Xi
พิสูจน์ ความคิดคือการปรับการพิสูจน์ของอสมการ Chebyshev ด้านเดียวดั้งเดิมและใช้สมมาตรในกระบวนการ ก่อนอื่นให้ตั้งค่าเพื่อความสะดวกสบาย จากนั้นสังเกตว่า
P ( Y 1 ≥ t S ) = 1Yi=Xi−X¯
P(Y1≥tS)=1n∑i=1nP(Yi≥tS)=E1n∑i=1n1(Yi≥tS).
ตอนนี้สำหรับบน ,
{ S > 0 } 1 ( Y ฉัน ≥ เสื้อS ) = 1 ( Y ฉัน + เสื้อคS ≥ เสื้อS ( 1 + C ) ) ≤ 1 ( ( Y ฉัน + เสื้อคS ) 2 ≥ ที2 ( 1 + c ) 2 S 2 ) ≤ ( Yc>0{S>0}
1(Yi≥tS)=1(Yi+tcS≥tS(1+c))≤1((Yi+tcS)2≥t2(1+c)2S2)≤(Yi+tcS)2t2(1+c)2S2.
จากนั้น
เนื่องจากและ .ˉ Y = 0 ∑ i Y 2 i = ( n - 1 ) S 2
1n∑i1(Yi≥tS)≤1n∑i(Yi+tcS)2t2(1+c)2S2=(n−1)S2+nt2c2S2nt2(1+c)2S2=(n−1)+nt2c2nt2(1+c)2,
Y¯=0∑iY2i=(n−1)S2
ทางด้านขวามือเป็นค่าคงที่ ( ! ) ดังนั้นการคาดหวังจากทั้งสองฝ่ายจึงทำให้
ในที่สุดการย่อตัวลงเหนือให้ผลซึ่งหลังจากพีชคณิตตัวน้อยสร้างผลลัพธ์ขึ้นมา
P(X1−X¯≥tS)≤(n−1)+nt2c2nt2(1+c)2.
cc=n−1nt2
เงื่อนไขทางเทคนิคที่น่ารำคาญ
โปรดทราบว่าเราต้องสมมติเพื่อให้สามารถหารด้วยในการวิเคราะห์ นี่ไม่ใช่ปัญหาสำหรับการแจกแจงแบบต่อเนื่องอย่างแน่นอน แต่เป็นการวางความไม่สะดวกสำหรับการแยกแบบ สำหรับการกระจายที่ไม่ต่อเนื่องมีความน่าจะเป็นบางอย่างที่สังเกตทั้งหมดเท่ากันซึ่งในกรณีนี้สำหรับทุกและ0P(S=0)=0S20=Yi=tS=0it>0
เราสามารถกระดิกทางของเราออกมาโดยการตั้งค่า0) จากนั้นการถกเถียงอย่างรอบคอบเกี่ยวกับการโต้แย้งแสดงให้เห็นว่าทุกอย่างต้องผ่านการเปลี่ยนแปลงอย่างแท้จริงและเราได้รับq=P(S=0)
ข้อพิสูจน์ 1 . สำหรับกรณีเรามีq=P(S=0)>0
P(X1−X¯≥tS)≤(1−q)11+nn−1t2+q.
พิสูจน์ Split ได้ที่เหตุการณ์ที่เกิดขึ้นและ\} หลักฐานก่อนหน้านี้ผ่านไปแล้วสำหรับและกรณีนั้นเล็กน้อย{S>0}{S=0}{S>0}{S=0}
ผลลัพธ์ความไม่เท่าเทียมที่สะอาดกว่าเล็กน้อยหากเราแทนที่ความไม่เท่ากันแบบไม่ จำกัด ในคำแถลงความน่าจะเป็นรุ่นที่เข้มงวด
ควันหลง 2 ให้ (อาจเป็นศูนย์) จากนั้นq=P(S=0)
P(X1−X¯>tS)≤(1−q)11+nn−1t2.
คำพูดสุดท้าย : ตัวอย่างรุ่นของความไม่เท่าเทียมกันนั้นไม่จำเป็นต้องใช้สมมติฐานบน (นอกเหนือจากนั้นก็ไม่ได้เป็นค่าคงที่เกือบแน่นอนในกรณีความไม่เสมอภาคแบบไม่ จำกัด ซึ่งเวอร์ชั่นดั้งเดิมก็ถือว่าโดยปริยาย) โดยสาระสำคัญเพราะตัวอย่างเฉลี่ยและความแปรปรวนตัวอย่างมีอยู่เสมอไม่ว่า analogs ของประชากรจะมีหรือไม่X