ข้อผิดพลาดโดยประมาณของช่วงความมั่นใจสำหรับค่าเฉลี่ยเมื่อ


15

Let {Xi}i=1nจะเป็นครอบครัวของตัวแปรสุ่ม IID สละค่าใน[0,1]มีค่าเฉลี่ยμและแปรปรวนσ2 2 ช่วงความเชื่อมั่นที่ง่ายสำหรับค่าเฉลี่ยโดยใช้σเมื่อใดก็ตามที่เป็นที่รู้จักกันจะได้รับจาก

P(|X¯μ|>ε)σ2nε21nε2(1).

นอกจากนี้เนื่องจากX¯μσ/nถูกกระจายแบบ asymptotically เป็นตัวแปรสุ่มมาตรฐานแบบปกติการแจกแจงแบบปกติบางครั้งใช้เพื่อ "สร้าง" ช่วงความมั่นใจโดยประมาณ


ในหลายทางเลือกสอบสถิติคำตอบที่ผมได้มีการใช้ประมาณแทนนี้(1)เมื่อใดก็ตามที่n30 30 ฉันมักจะรู้สึกไม่สบายใจกับสิ่งนี้มาก (เกินกว่าที่คุณจะจินตนาการได้) เนื่องจากข้อผิดพลาดการประมาณนั้นไม่ได้ถูกคำนวณปริมาณ


  • ใช้ประมาณปกติมากกว่าทำไม(1) ?

  • ฉันไม่ต้องการใช้กฎกับคนตาบอดอีกเลย มีการอ้างอิงที่ดีที่สามารถสนับสนุนฉันในการปฏิเสธที่จะทำเช่นนั้นและให้ทางเลือกที่เหมาะสมหรือไม่? ( ( 1 )เป็นตัวอย่างของสิ่งที่ฉันพิจารณาทางเลือกที่เหมาะสม)n30(1)

ที่นี่ในขณะที่และE [ | X | 3 ]ไม่เป็นที่รู้จักพวกมันถูกล้อมรอบได้ง่ายσE[|X|3]

โปรดทราบว่าคำถามของฉันเป็นคำขออ้างอิงโดยเฉพาะอย่างยิ่งเกี่ยวกับความเชื่อมั่นและดังนั้นจึงแตกต่างจากความแตกต่างจากคำถามที่ได้รับการแนะนำให้เป็นที่ซ้ำกันบางส่วนที่นี่และที่นี่ มันไม่มีคำตอบ


2
คุณอาจต้องปรับปรุงการประมาณที่พบในการอ้างอิงแบบดั้งเดิมและใช้ประโยชน์จากความจริงที่ว่าอยู่ใน( 0 , 1 )ซึ่งตามที่คุณสังเกตเห็นให้ข้อมูลเกี่ยวกับช่วงเวลา ฉันเชื่อว่าเครื่องมือวิเศษนั้นจะเป็นทฤษฎีบท Berry – Esseen! Xi(0,1)
Yves

1
ด้วยขอบเขตเหล่านั้นความแปรปรวนไม่สามารถมากกว่า 0.25 ดีกว่า 1 ได้ไหม
คาร์โล

คำตอบ:


3

เหตุใดจึงต้องใช้การประมาณปกติ

มันง่ายเหมือนการบอกว่าควรใช้ข้อมูลมากกว่าน้อยกว่า สมการ (1) ใช้ทฤษฎีบทเซฟของ หมายเหตุวิธีที่มันไม่ใช้ข้อมูลใด ๆ เกี่ยวกับรูปร่างของการกระจายของคุณนั่นคือมันใช้งานได้กับการกระจายที่มีความแปรปรวนที่กำหนด ดังนั้นหากคุณใช้ข้อมูลบางอย่างเกี่ยวกับรูปร่างการกระจายของคุณคุณจะต้องได้รับการประมาณที่ดีขึ้น หากคุณรู้ว่าการกระจายตัวของคุณคือเกาส์เซียนด้วยการใช้ความรู้นี้คุณจะได้รับการประมาณการที่ดี

เนื่องจากคุณใช้ทฤษฎีบทขีด จำกัด กลางอยู่แล้วทำไมไม่ใช้การประมาณแบบเกาส์ของขอบเขต? พวกเขากำลังจะดีขึ้นจริง ๆ แล้วเข้มงวดมากขึ้น (หรือคมชัดขึ้น) เพราะการประมาณการเหล่านี้ขึ้นอยู่กับความรู้เกี่ยวกับรูปร่างซึ่งเป็นข้อมูลเพิ่มเติม

กฎของหัวแม่มือ 30 เป็นตำนานซึ่งเป็นประโยชน์จากอคติยืนยัน มันเพิ่งถูกคัดลอกจากหนังสือเล่มหนึ่งไปยังอีกเล่มหนึ่ง เมื่อฉันพบการอ้างอิงแนะนำกฎนี้ในกระดาษในปี 1950 มันไม่ได้เป็นหลักฐานที่มั่นคงอย่างที่ฉันจำได้ มันเป็นการศึกษาเชิงประจักษ์ โดยพื้นฐานแล้วเหตุผลเดียวที่ใช้เพราะเป็นงานประเภทนั้น คุณไม่เห็นว่าละเมิดบ่อยนัก

ปรับปรุงค้นหากระดาษโดย Zachary R. Smith และ Craig S. Wells " ทฤษฎีบทขีด จำกัด กลางและขนาดตัวอย่าง " พวกเขานำเสนอการศึกษาเชิงประจักษ์ของการลู่เข้าสู่ CLT สำหรับการแจกแจงแบบต่าง ๆ แน่นอนว่าเลขเวทย์ 30 นั้นใช้ไม่ได้ในหลายกรณี


+1 สำหรับคำอธิบายที่สมเหตุสมผล แต่มีความเสี่ยงในการใช้ข้อมูลที่ไม่ถูกต้องใช่ไหม CLT ไม่ได้พูดอะไรเกี่ยวกับการกระจายของสำหรับการแก้ไขn X¯n
Olivier

ถูกต้อง CLT ไม่ได้พูดอะไรเกี่ยวกับการกระจายตัวของตัวอย่าง จำกัด แต่ดังนั้นอย่าสมการแบบอสมมาตร อย่างไรก็ตามอย่างปฏิเสธไม่ได้ว่าพวกเขามีข้อมูลที่เป็นประโยชน์นั่นคือเหตุผลที่ จำกัด ความสัมพันธ์ที่จะใช้ทุกที่ ปัญหาของ Chebyshev คือกว้างมากจนไม่ค่อยใช้นอกห้องเรียน ยกตัวอย่างเช่นค่าเบี่ยงเบนมาตรฐานหนึ่งค่าความน่าจะเป็นคือ - ข้อมูลที่ใช้งานได้ยาก<1/k2=1
Aksakal

แต่สำหรับรับค่า 0 หรือ 1 ที่มีความน่าจะเป็นเท่ากันการใช้ Chebyshev ของคุณนั้นเฉียบคม ;) ปัญหาคือ Chebyshev นำไปใช้กับค่าเฉลี่ยตัวอย่างจะไม่เฉียบคมเมื่อnเติบโต Xn
Olivier

ฉันไม่รู้เกี่ยวกับกระดาษของ Smith และ Wells ฉันพยายามทำซ้ำใน R และไม่สามารถกู้คืนข้อสรุปของพวกเขา ...
Alex Nelson

9

ปัญหาเกี่ยวกับการใช้ความไม่เท่าเทียมกันของ Chebyshev เพื่อให้ได้ช่วงเวลาสำหรับค่าที่แท้จริงคือมันให้ขอบเขตที่ต่ำกว่าสำหรับความน่าจะเป็นซึ่งบางครั้งยิ่งไปกว่านั้นเล็กน้อยหรือเพื่อที่จะไม่น่ารำคาญ ช่วงความเชื่อมั่น เรามี

P(|X¯-μ|>ε)=1-P(X¯-εμX¯+ε)

P(X¯-εμX¯+ε)1-1nε2

เราเห็นว่าขึ้นอยู่กับขนาดตัวอย่างถ้าเราลด "มากเกินไป" เราจะได้คำตอบเล็กน้อย "ความน่าจะเป็นมากกว่าศูนย์"ε

นอกเหนือจากนั้นสิ่งที่เราได้รับจากวิธีการนี้เป็นข้อสรุปของรูปแบบ "" ความน่าจะเป็นของตกอยู่ใน[ ˉ X ± ε ]คือเท่ากับหรือมากกว่า ..."μ[X¯±ε]

แต่สมมติว่าเราดีอยู่กับเรื่องนี้และแสดงว่าความน่าจะเป็นขั้นต่ำที่เรามีความสะดวกสบาย ดังนั้นเราต้องการpmin

11nε2=pminε=1(1pmin)n

ด้วยขนาดตัวอย่างขนาดเล็กและความน่าจะเป็นขั้นต่ำที่ต้องการสูงสิ่งนี้อาจทำให้ช่วงความมั่นใจกว้างเป็นที่น่าพอใจ เช่นสำหรับและn = 100เราจะได้รับε 0.316ซึ่งตัวอย่างสำหรับตัวแปรรับการรักษาโดย OP ที่มีขอบเขตใน[ 0 , 1 ]ดูเหมือนจะใหญ่เกินไปที่จะเป็นประโยชน์pmin=0.9n=100ε.316[0,1]

แต่วิธีการนั้นถูกต้องและไม่มีการแจกจ่ายดังนั้นอาจมีบางครั้งที่มันมีประโยชน์

บางคนอาจต้องการตรวจสอบความไม่เท่าเทียมกันของ Vysochanskij – Petunin ที่ กล่าวถึงในคำตอบอื่นซึ่งถือเป็นการแจกแจง unimodal อย่างต่อเนื่องและปรับแต่งความไม่เท่าเทียมของ Chebyshev


ฉันไม่เห็นด้วยกับปัญหาที่เกิดขึ้นกับ Chebychev เพราะมันให้ขอบเขตที่ต่ำกว่าสำหรับความน่าจะเป็นเท่านั้น ในการตั้งค่าที่ปลอดการแจกจ่ายขอบเขตที่ต่ำที่สุดคือสิ่งที่ดีที่สุดที่เราคาดหวัง คำถามที่สำคัญคือ Chebychev คมชัดหรือไม่? เป็นความยาว Chebychev CI ของระบบมากกว่าที่คาดในระดับคงที่ ? ฉันตอบคำถามนี้ในโพสต์ของฉันจากมุมมองเฉพาะ อย่างไรก็ตามฉันยังคงพยายามที่จะเข้าใจว่า Chebychev สำหรับค่าเฉลี่ยตัวอย่างจะล้มเหลวเสมอไปในแง่ที่แข็งแกร่งขึ้น α
Olivier

ความยาวของ CI ไม่ได้อยู่ภายใต้การประมาณค่าเนื่องจากไม่มีความยาวเดียวที่ไม่รู้จักดังนั้นฉันไม่แน่ใจว่าคุณหมายถึงอะไรโดยใช้คำว่า "การประมาณค่าเกิน" ที่นี่ วิธีการที่แตกต่างกันนำเสนอ CI ที่แตกต่างกันซึ่งแน่นอนว่าเราสามารถพยายามประเมินและประเมินผลได้
Alecos Papadopoulos

การประเมินมากเกินไปเป็นตัวเลือกคำที่ไม่ดีขอบคุณสำหรับการชี้ให้เห็น โดย "ความยาวที่เกินความคาดหมายอย่างเป็นระบบ" ฉันหมายความว่าวิธีการได้รับ CI มักให้ผลตอบแทนมากกว่าที่จำเป็น
Olivier

1
@ Olivier โดยทั่วไปการพูดความไม่เท่าเทียมกัน Chebyshev เป็นที่รู้จักกันว่าเป็นความไม่เท่าเทียมกันหลวมและใช้มากขึ้นเป็นเครื่องมือในการพิสูจน์ทฤษฎีและพิสูจน์มากกว่าในการประยุกต์ใช้
Alecos Papadopoulos

2
@ Olivier "โดยทั่วไปการพูด" ครอบคลุมถึงคุณสมบัติของคุณฉันจะบอกว่า
Alecos Papadopoulos

7

คำตอบสั้น ๆ ก็คือว่ามันสามารถไปได้สวยไม่ดี แต่ถ้าหนึ่งหรือทั้งสองหางของการกระจายการสุ่มตัวอย่างที่เป็นจริงไขมัน

รหัส R นี้สร้างชุดตัวแปรแกมม่าจำนวน 30 ชุดและใช้ค่าเฉลี่ย มันสามารถใช้เพื่อให้เข้าใจว่าการกระจายตัวตัวอย่างของค่าเฉลี่ยนั้นเป็นอย่างไร หากประมาณปกติทำงานตามที่ต้องการผลที่ควรจะเป็นประมาณตามปกติที่มีค่าเฉลี่ยที่ 1 1/(30 * shape)และความแปรปรวน

f = function(shape){replicate(1E6, mean(rgamma(30, shape, shape)))}

เมื่อshapeเป็น 1.0 การแจกแจงแกมม่าจะเป็นการแจกแจงแบบเอ็กซ์โพเนนเชียลซึ่งค่อนข้างไม่ธรรมดา อย่างไรก็ตามชิ้นส่วนที่ไม่ใช่แบบเกาส์นั้นโดยเฉลี่ยแล้วการประมาณแบบเกาส์ก็ไม่ได้แย่มาก:

histogram & density plot

เห็นได้ชัดว่ามีอคติและควรหลีกเลี่ยงเมื่อเป็นไปได้ แต่โดยสุจริตแล้วระดับความลำเอียงนั้นคงไม่ใช่ปัญหาใหญ่ที่สุดที่ต้องเผชิญกับการศึกษาทั่วไป

ที่กล่าวว่าสิ่งต่าง ๆ จะเลวร้ายลงมาก ด้วยf(0.01)ฮิสโตแกรมมีลักษณะดังนี้:

histogram

บันทึกการแปลง 30 จุดข้อมูลตัวอย่างก่อนค่าเฉลี่ยช่วยมากแม้ว่า:

histogram

โดยทั่วไปการแจกแจงแบบมีหางยาว (หนึ่งหรือทั้งสองด้านของการแจกแจง) จะต้องใช้ตัวอย่างมากที่สุดก่อนที่การประมาณแบบเกาส์จะเริ่มเชื่อถือได้ มีแม้กระทั่งกรณีพยาธิวิทยาที่จะไม่มีข้อมูลเพียงพอสำหรับการประมาณแบบเกาส์ในการทำงาน แต่คุณอาจจะมีปัญหาที่ร้ายแรงกว่าในกรณีนั้น (เนื่องจากการกระจายตัวตัวอย่างไม่มีค่าเฉลี่ยหรือความแปรปรวนที่เริ่มต้นดี ด้วย)


ฉันพบว่าการทดลองนั้นเกี่ยวข้องและน่าสนใจมาก ฉันจะไม่ใช้สิ่งนี้เป็นคำตอบอย่างไรก็ตามมันไม่ได้ตอบโจทย์ปัญหา
Olivier

1
crux คืออะไร
David J. Harris

คำตอบของคุณไม่ได้ให้ฐานรากที่เข้มงวดสำหรับการปฏิบัติทางสถิติเสียง มันให้เพียงตัวอย่าง หมายเหตุเช่นกันว่าตัวแปรแบบสุ่มที่ฉันพิจารณามีขอบเขตเปลี่ยนแปลงสิ่งที่เป็นกรณีที่เลวร้ายที่สุด
Olivier

@Glen_b: คำตอบนี้ไม่เกี่ยวข้องกับคำถามที่คุณแก้ไข ฉันควรทิ้งไว้ที่นี่หรือคุณจะแนะนำอย่างอื่นอีกไหม
David J. Harris

3

ปัญหากับช่วงความเชื่อมั่นของ Chebyshev

ตามที่กล่าวไว้โดย Carlo เรามี . นี้ต่อไปนี้จากVar(X)μ(1-μ) ดังนั้นช่วงความเชื่อมั่นμจะได้รับจาก P(| ˉ X -μ|ε)1σ214Var(X)μ(1μ)μ ปัญหาคือความไม่เท่าเทียมกันในแง่หนึ่งค่อนข้างจะหลวมเมื่อnมีขนาดใหญ่ การปรับปรุงจะถูกกำหนดโดยขอบเขตของ Hoeffding และแสดงไว้ด้านล่าง อย่างไรก็ตามเราสามารถแสดงให้เห็นว่ามันแย่แค่ไหนที่สามารถใช้ทฤษฎีบท Berry-Esseen ที่Yves ชี้ให้เห็น ให้Xiมีความแปรปรวน1

P(|X¯μ|ε)14nε2.
nXiกรณีที่เป็นไปได้ที่เลวร้ายที่สุด ทฤษฎีบทหมายความว่า P(| ˉ X -μ|ε14 ที่SFคือฟังก์ชันการเอาชีวิตรอดของการแจกแจงแบบปกติมาตรฐาน โดยเฉพาะอย่างยิ่งกับε=16เราได้รับSF(16)e-58(อ้างอิงจาก Scipy) ดังนั้นโดยพื้นฐานแล้ว P(|ˉX-μ|8P(|X¯μ|ε2n)2SF(ε)+8n,SFε=16SF(16)e58 ในขณะที่ความไม่เท่าเทียมกัน Chebyshev หมายถึง P ( | ˉ X - μ |8
P(|X¯μ|8n)8n+0,()
P(|X¯μ|8n)1256.
()

การเปรียบเทียบความยาวของช่วงความมั่นใจ

(1α)Z(α,n)C(α,n)σ=12(α,n) เป็นค่าคงที่ที่ใหญ่กว่า Z(α,n)เป็นอิสระจาก n. แม่นยำสำหรับทุกคนn,

(α,n)=κ(α)Z(α,n),κ(α)=(ISF(α2)α)-1,
ที่ไหน ISFเป็นฟังก์ชันการอยู่รอดแบบผกผันของการแจกแจงแบบปกติมาตรฐาน ฉันพล็อตต่ำกว่าค่าคงที่การคูณ

enter image description here

โดยเฉพาะอย่างยิ่ง 95% ช่วงความมั่นใจในระดับที่ได้รับโดยใช้อสมการ Chebyshev เป็นเรื่องเกี่ยวกับ 2.3 ครั้งใหญ่กว่าช่วงความเชื่อมั่นระดับเดียวกันที่ได้รับโดยใช้การประมาณปกติ


ใช้ขอบเขตของ Hoeffding

ขอบเขตของ Hoeffding ให้

P(|X¯-μ|ε)2อี-2nε2.
ดังนั้น (1-α)ระดับความเชื่อมั่นระดับ μ คือ
(X¯ε,X¯+ε),ε=lnα22n,
of length H(α,n)=2ε. I plot below the lengths of the different confidence intervals (Chebyshev inequality: C; normal approximation (σ=1/2): Z; Hoeffding's inequality: H) for α=0.05.

enter image description here


Very interesting! I have though some corrections to suggest you toghether with a big puzzlement: first, you should take out absolute value from the Hoeffding's unequality definition, it's P(X¯με)e2nε2 or P(|X¯μ|ε)2e2nε2; the second correction is less important, α is generally taken to be 0.05 or lower, while 0.95 is addressed as 1α, it's a bit confusing to see them switched in your post.
carlo

Last and more important: I found your result incredible, so I tried to replicate it in R and I got a completely opposite result: normal approximation gives smaller confidence intervals to me! this is the code I used: curve(sqrt(-log(.025)/2/x), to= 100, col= 'red', xlab= 'n', ylab= 'half interval') #Hoeffding ; curve(qnorm(.975, 0, .5/sqrt(x)), to= 100, add= T, col= 'darkgreen') #normal approximation
carlo

0

let's start with the number 30: it's, as anyone will say, a rule of thumb. but how can we find a number that fits better to our data? It's actually mostly a matter of skewness: even the strangest distribution will fast converge to normal if they are simmetric and continuous, skewed data will be much slower. I remember learning that a binomial distribution can be properly approximated to normal when its variance is greater than 9; for this example it's to be considered that discrete distribution also have the problem that they need great numbers to simulate continuity, but think to this: a simmetric binomial distribution will reach that variance with n = 36, if p = 0.1 instead, n must go up to 100 (variabile trasformation, however, would help a lot)!

หากคุณต้องการใช้ความแปรปรวนแทนปล่อยการประมาณแบบเกาส์เซียนพิจารณาความไม่เท่าเทียมกันของ Vysochanskij – Petunin กับ Chebichev มันต้องการการสันนิษฐานของการกระจายค่าเฉลี่ยที่ไม่แน่นอน แต่นี่เป็นสิ่งที่ปลอดภัยมากที่มีขนาดตัวอย่างใด ๆ มากกว่า 2


คุณสามารถเพิ่มการอ้างอิงสำหรับ "Vysochanskij – Petunin inequality" ได้หรือไม่? ไม่เคยได้ยินเลย!
kjetil b halvorsen

wikipedia docet
carlo

Can you express the rate of convergence in terms of the skewdness? Why is a sample size of, you'd say 2, enough for unimodality? How is the Vysochanskij–Petunin inequality an improvement over Chebychev if you need to double or triple the sample size for it to apply?
Olivier

I made a fast google search and I found out that binomial distribution is actually often used to explain different sample size need for skewed data, but I didn't find, and I guess there is no accepted "rate of convergence in terms of the skewdness".
carlo

Vysochanskij–Petunin inequality is more efficent than Chebychev's, so it doesn't need a greater sample at all, but it has some use constraints: first, you have to have a continuous distribution, than, it has to be unimodal (no local modes are allowed). It may seem strange to drop normality assumption to adopt another one, but if your data is not discrete, sample mean should eliminate local modes even with very small samples. Fact is that mean has much of a bell distribution and, also if it can be skewed or have fat tails, it quickly comes to only have one mode.
carlo
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.