ตัวอย่างการแจกแจงที่จำเป็นต้องใช้ขนาดตัวอย่างขนาดใหญ่สำหรับทฤษฎีบทขีด จำกัด กลาง


19

หนังสือบางเล่มระบุขนาดของกลุ่มตัวอย่างที่มีขนาด 30 หรือสูงกว่าเป็นสิ่งที่จำเป็นสำหรับเซ็นทรัล จำกัด ทฤษฎีบทที่จะให้ประมาณการที่ดีสำหรับ{X} X¯

ฉันรู้ว่านี่ไม่เพียงพอสำหรับการแจกแจงทั้งหมด

ฉันต้องการเห็นตัวอย่างของการแจกแจงที่ถึงแม้จะมีขนาดตัวอย่างขนาดใหญ่ (อาจเป็น 100 หรือ 1,000 หรือสูงกว่า) การกระจายตัวของค่าเฉลี่ยตัวอย่างก็ยังค่อนข้างเบ้

ฉันรู้ว่าฉันเคยเห็นตัวอย่างเหล่านี้มาก่อน แต่ฉันจำไม่ได้ว่าอยู่ที่ไหนและหาไม่พบ


5
พิจารณาการแจกแจงแกมมากับพารามิเตอร์รูปร่างααปรับสเกลเป็น 1 (ไม่สำคัญ) สมมติว่าคุณถือว่าGamma(α0,1)เป็นเพียง "พอปกติ" จากนั้นการกระจายที่คุณจำเป็นต้องได้รับการสังเกต 1000 จะเป็นปกติพอมีGamma(α0/1000,1)การกระจาย
Glen_b -Reinstate Monica

1
@Glen_b ทำไมไม่ลองสร้างคำตอบอย่างเป็นทางการและพัฒนามันสักหน่อยล่ะ?
gung - Reinstate Monica

4
การแจกจ่ายที่ปนเปื้อนอย่างเพียงพอจะทำงานตามตัวอย่างเดียวกับตัวอย่างของ @ Glen_b เช่นเมื่อการกระจายพื้นฐานเป็นส่วนผสมของ Normal (0,1) และ Normal (ค่ามาก, 1) โดยที่หลังมีความน่าจะเป็นเพียงเล็กน้อยที่จะปรากฏขึ้นจากนั้นสิ่งที่น่าสนใจเกิดขึ้น: (1) ส่วนใหญ่แล้ว การปนเปื้อนไม่ปรากฏขึ้นและไม่มีหลักฐานความเบ้ แต่ (2) บางครั้งการปนเปื้อนปรากฏขึ้นและความเบ้ในตัวอย่างมีขนาดใหญ่มาก การกระจายตัวของค่าเฉลี่ยตัวอย่างจะเบ้สูงโดยไม่คำนึงถึง แต่ bootstrapping ( เช่น ) มักจะไม่ตรวจจับ
whuber

1
ตัวอย่างของ @ whuber เป็นคำแนะนำซึ่งแสดงให้เห็นว่าทฤษฎีบทขีด จำกัด กลางสามารถในทางทฤษฎีสามารถทำให้เข้าใจผิดโดยพลการ ในการทดลองภาคปฏิบัติฉันคิดว่าเราต้องถามตัวเองว่าอาจมีผลกระทบขนาดใหญ่ที่เกิดขึ้นน้อยมากและใช้ผลลัพธ์ทางทฤษฎีด้วยความรอบคอบเล็กน้อย
David Epstein

คำตอบ:


19

หนังสือบางเล่มระบุขนาดของกลุ่มตัวอย่างที่มีขนาด 30 หรือสูงกว่าเป็นสิ่งที่จำเป็นสำหรับเซ็นทรัล จำกัด ทฤษฎีบทที่จะให้ประมาณการที่ดีสำหรับ XX¯

กฎทั่วไปของหัวแม่มือนี้ไร้ประโยชน์อย่างสมบูรณ์ มีการแจกแจงแบบไม่ปกติซึ่ง n = 2 จะโอเคและการแจกแจงแบบไม่ปกติซึ่งใหญ่กว่านั้นไม่เพียงพอ - โดยไม่มีข้อ จำกัด ที่ชัดเจนเกี่ยวกับสถานการณ์กฎจะทำให้เข้าใจผิด ในกรณีใด ๆ แม้ว่าจะเป็นชนิดของความจริงที่จำเป็นnจะแตกต่างกันไปขึ้นอยู่กับสิ่งที่คุณกำลังทำ บ่อยครั้งที่คุณได้รับการประมาณค่าที่ดีใกล้กับกึ่งกลางของการแจกแจงที่n ตัวเล็กแต่ต้องการn ที่ใหญ่กว่ามากเพื่อให้ได้การประมาณที่เหมาะสมที่ส่วนท้ายnnnn

แก้ไข: ดูคำตอบสำหรับคำถามนี้สำหรับความคิดเห็นจำนวนมาก แต่เห็นได้ชัดว่าเป็นเอกฉันท์เกี่ยวกับปัญหานั้นและลิงก์ที่ดีบางส่วน ฉันจะไม่ใช้จุดนี้เนื่องจากคุณเข้าใจแล้วอย่างชัดเจน

ฉันอยากเห็นตัวอย่างของการแจกแจงที่แม้จะมีขนาดตัวอย่างใหญ่ (อาจเป็น 100 หรือ 1,000 หรือสูงกว่า) การกระจายตัวของค่าเฉลี่ยตัวอย่างก็ยังค่อนข้างเบ้

ตัวอย่างค่อนข้างง่ายต่อการสร้าง วิธีง่าย ๆ อย่างหนึ่งคือการหาการแจกแจงแบบแบ่งไม่ได้ที่ไม่ธรรมดาและหารมัน หากคุณมีสิ่งใดสิ่งหนึ่งที่จะเข้าใกล้ปกติเมื่อคุณหาค่าเฉลี่ยหรือหาผลรวมมันเริ่มที่ขอบเขตของ 'ใกล้เคียงปกติ' แล้วหารมันเท่าที่คุณต้องการ ตัวอย่างเช่น:

พิจารณาการแจกแจงแกมมากับพารามิเตอร์รูปร่างαปรับสเกลเป็น 1 (สเกลไม่สำคัญ) สมมติว่าคุณมองว่าGamma ( α 0 , 1 )เป็น "ปกติเพียงพอ" จากนั้นการกระจายที่คุณต้องได้รับการสังเกต 1,000 ครั้งเพื่อให้เป็นปกติอย่างเพียงพอมีแกมม่าαGamma(α0,1)การกระจายGamma(α0/1000,1)

ดังนั้นหากคุณรู้สึกว่าแกมม่าที่มีนั้นเป็น 'ปกติพอ' -α=20

Gamma (20) pdf

จากนั้นหารด้วย 1,000 เพื่อรับ α = 0.02 :α=20α=0.02

Gamma (0.02) pdf

โดยเฉลี่ย 1,000 คนจะมีรูปร่างของ pdf แรก (แต่ไม่ใช่ระดับ)

σ/n

@ ประเด็นของ whuber เกี่ยวกับการแจกแจงที่ปนเปื้อนนั้นดีมาก มันอาจจ่ายเงินเพื่อลองจำลองสถานการณ์กับกรณีนั้นและดูว่าสิ่งต่าง ๆ มีพฤติกรรมอย่างไรในตัวอย่างจำนวนมาก



9

คุณอาจพบว่าบทความนี้มีประโยชน์ (หรืออย่างน้อยก็น่าสนใจ):

http://www.umass.edu/remp/Papers/Smith&Wells_NERA06.pdf

นักวิจัยของ UMass ทำการศึกษาคล้ายกับสิ่งที่คุณขอ ข้อมูลตัวอย่างบางประเภทมีขนาดเท่าไรตามการกระจายแบบปกติเนื่องจาก CLT เห็นได้ชัดว่าข้อมูลจำนวนมากที่รวบรวมไว้สำหรับการทดลองทางจิตวิทยาไม่ได้อยู่ใกล้กับที่แจกจ่ายตามปกติดังนั้นระเบียบวินัยจึงอาศัย CLT ค่อนข้างมากในการอนุมานสถิติของพวกเขา

α=0.05

Table 2. Percentage of replications that departed normality based on the KS-test. 
 Sample Size 
           5   10   15   20   25  30 
Normal   100   95   70   65   60  35 
Uniform  100  100  100  100  100  95 
Bimodal  100  100  100   75   85  50

พอผิดปกติ 65 เปอร์เซ็นต์ของข้อมูลที่กระจายตามปกติถูกปฏิเสธด้วยขนาดตัวอย่าง 20 และแม้จะมีขนาดตัวอย่าง 30 และ 35% ก็ยังถูกปฏิเสธ

จากนั้นพวกเขาทดสอบการแจกแจงแบบเบ้อย่างหนักหลายครั้งที่สร้างขึ้นโดยใช้วิธีพลังงานของ Fleishman:

Y=aX+bX2+cX3+dX4

X หมายถึงค่าที่ดึงมาจากการแจกแจงแบบปกติในขณะที่ a, b, c และ d เป็นค่าคงที่ (โปรดสังเกตว่า a = -c)

พวกเขาทำการทดสอบด้วยขนาดตัวอย่างสูงสุด 300

Skew  Kurt   A      B      C       D 
1.75  3.75  -0.399  0.930  0.399  -0.036 
1.50  3.75  -0.221  0.866  0.221   0.027 
1.25  3.75  -0.161  0.819  0.161   0.049 
1.00  3.75  -0.119  0.789  0.119   0.062 

พวกเขาพบว่าในระดับสูงสุดของความลาดเอียงและเคิร์ต (1.75 และ 3.75) ที่ขนาดตัวอย่าง 300 ไม่ได้ผลิตตัวอย่างหมายความว่าตามการกระจายปกติ

น่าเสียดายที่ฉันไม่คิดว่านี่คือสิ่งที่คุณกำลังมองหา แต่ฉันก็สะดุดมันและพบว่ามันน่าสนใจและคิดว่าคุณก็อาจจะ


4
" ผิดปกติ 65% ของข้อมูลที่กระจายตามปกติถูกปฏิเสธด้วยขนาดตัวอย่าง 20 และแม้แต่ขนาดตัวอย่าง 30 และ 35% ก็ยังถูกปฏิเสธ " - ดูเหมือนว่าพวกเขากำลังใช้การทดสอบผิด เป็นแบบทดสอบของปกติกับข้อมูลที่ระบุไว้ตามปกติสมบูรณ์ (ซึ่งเป็นสิ่งทดสอบสำหรับ) ถ้าพวกเขากำลังใช้มันขวามันจะต้องเป็นที่แน่นอน
Glen_b -Reinstate Monica

5
@Glen_b: มีข้อผิดพลาดที่อาจเกิดขึ้นได้หลายแหล่งที่นี่ ถ้าคุณอ่านเอกสารคุณจะทราบว่าสิ่งที่ถูกระบุว่าเป็น "ปกติ" ที่นี่เป็น variates สุ่มปกติจริงที่มีค่าเฉลี่ย 50 และส่วนเบี่ยงเบนมาตรฐานของ 10 ปัดเศษให้เต็มที่ใกล้เคียงที่สุด ดังนั้นในแง่นั้นการทดสอบที่ใช้อยู่แล้วก็ใช้การแจกแจงแบบ misspecified ประการที่สองก็ยังปรากฏว่าพวกเขาทำการทดสอบไม่ถูกต้องเนื่องจากความพยายามของฉันในการจำลองแสดงให้เห็นว่าสำหรับค่าเฉลี่ยตัวอย่างโดยใช้การสังเกต 20 แบบความน่าจะเป็นในการปฏิเสธประมาณ 27% (ต่อ)
สำคัญ

5
(ต่อ.) ประการที่สามโดยไม่คำนึงถึงข้างต้นซอฟต์แวร์บางคนอาจใช้asymptoticการจัดจำหน่ายและไม่ได้เกิดขึ้นจริงอย่างใดอย่างหนึ่ง แต่ที่มีขนาดตัวอย่าง 10K นี้ไม่ควรเรื่องมากเกินไป (ถ้ามีความสัมพันธ์ที่ไม่ได้รับการเหนี่ยวนำให้เกิดเทียมในข้อมูล) ในที่สุดเราพบคำสั่งที่ค่อนข้างแปลก ๆ ดังต่อไปนี้ใกล้ถึงจุดสิ้นสุดของเอกสารนั้น: น่าเสียดายที่คุณสมบัติของการทดสอบ KS ใน S-PLUS จำกัด การทำงาน ค่า p สำหรับการศึกษาปัจจุบันถูกรวบรวมทั้งหมดด้วยการส่งซ้ำหลาย ๆ ครั้ง จำเป็นต้องใช้โปรแกรมในการคำนวณค่า p และทำการตัดสินโดยเปรียบเทียบกับระดับอัลฟ่าที่เลือก
พระคาร์ดินัล

3
สวัสดี @Glen_b ฉันไม่เชื่อว่าการปัดเศษจะลดอัตราการปฏิเสธที่นี่เพราะฉันเชื่อว่าพวกเขาทดสอบกับการแจกแจงแบบปกติมาตรฐานจริงโดยใช้ข้อมูลที่ถูกปัดเศษ (ซึ่งเป็นสิ่งที่ฉันหมายถึงโดยการบอกว่าการทดสอบใช้การกระจายแบบผิดพลาด) (บางทีคุณอาจคิดว่าจะใช้การทดสอบ KS กับการกระจายแบบไม่ต่อเนื่อง) ขนาดตัวอย่างสำหรับการทดสอบ KS คือ 10,000 ไม่ใช่ 20 พวกเขาทำซ้ำ 20 ครั้งที่ขนาดตัวอย่าง 10,000 คนเพื่อให้ได้ตาราง อย่างน้อยนั่นคือความเข้าใจของฉันเกี่ยวกับคำอธิบายจากการอ่านข้ามเอกสาร
พระคาร์ดินัล

3
@ cardinal - คุณถูกต้องแน่นอนดังนั้นอาจเป็นแหล่งที่มาของการปฏิเสธที่สำคัญในตัวอย่างขนาดใหญ่ Re: " ขนาดตัวอย่างสำหรับการทดสอบ KS คือ 10,000 ไม่ใช่ 20 " ... โอเคนี่ฟังดูแปลกขึ้นเรื่อย ๆ มีใครเหลือสงสัยว่าทำไมพวกเขาถึงคิดว่าเงื่อนไขเหล่านั้นมีค่ามากแทนที่จะพูดอีกด้านหนึ่ง
Glen_b -Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.