จะทำการทดสอบแบบทดสอบของนักเรียนที่มีขนาดตัวอย่างค่าเฉลี่ยตัวอย่างและค่าเฉลี่ยประชากรได้อย่างไร


28

นักเรียน -test ต้องใช้กลุ่มตัวอย่างส่วนเบี่ยงเบนมาตรฐานsอย่างไรก็ตามฉันจะคำนวณหาเมื่อทราบขนาดตัวอย่างและค่าเฉลี่ยตัวอย่างเท่านั้นเสื้อss

ตัวอย่างเช่นถ้าขนาดตัวอย่างคือและค่าเฉลี่ยตัวอย่างคือฉันจะพยายามสร้างรายการตัวอย่างตัวอย่างที่มีค่าแต่ละตัวอย่าง คาดว่าค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างเป็น0สิ่งนี้จะสร้างปัญหาการหารด้วยศูนย์ในการทดสอบ49112491120เสื้อ

ข้อมูลเพิ่มเติม:
รายได้เฉลี่ยของคนงานโรงงาน ACME North เป็น\มีรายงานว่าตัวอย่างที่สุ่มจากคนงานในโรงงาน ACME ใต้มีรายได้ต่อปี\ความแตกต่างนี้มีนัยสำคัญทางสถิติหรือไม่$20049$112

ฉันถูกต้องในการบอกว่าประชากรเฉลี่ย ?$200


คุณพยายามแก้ไขปัญหาอะไร มันจะช่วยให้เราช่วยคุณถ้าคุณบอกเราเพิ่มเติม
pmgjones

แน่ใจ ฉันเพิ่มปัญหาตัวอย่าง
ชุด

คำตอบ:


32

นี้อาจจะแปลกใจมาก แต่จะแก้ปัญหานี้คุณไม่จำเป็นต้องประมาณการs ในความเป็นจริงคุณไม่จำเป็นต้องรู้อะไรเกี่ยวกับการแพร่กระจายของข้อมูล (แม้ว่ามันจะเป็นประโยชน์แน่นอน) ตัวอย่างเช่น Wall, Boen และ Tweedie ในบทความปี 2001 อธิบายถึงวิธีการหาช่วงความมั่นใจที่ จำกัด สำหรับค่าเฉลี่ยของการแจกแจงแบบ unimodal ใด ๆ ที่อิงจากการจับสลากเดี่ยว

ในกรณีปัจจุบันเรามีพื้นฐานบางอย่างเพื่อดูค่าเฉลี่ยตัวอย่าง 112 จากการแจกแจงแบบปกติโดยประมาณ (กล่าวคือการกระจายตัวตัวอย่างของค่าเฉลี่ยของตัวอย่างแบบง่าย 49 เงินเดือน) เราคาดการณ์โดยปริยายว่ามีคนงานในโรงงานค่อนข้างมากและการกระจายเงินเดือนของพวกเขานั้นไม่เบ้หรือต่อเนื่องหลายรูปแบบเพื่อให้ทฤษฎีบทขีด จำกัด กลางปฏิบัติไม่ได้ จากนั้นอนุรักษ์ 90% CI สำหรับค่าเฉลี่ยขยายไปถึง

112+5.84 |112|,

ชัดเจนครอบคลุมค่าเฉลี่ยที่แท้จริงของ 200 (ดู Wall และสูตร 3) จากข้อมูลที่มีอยู่อย่าง จำกัด และสมมติฐานที่ทำไว้ที่นี่เราจึงไม่สามารถสรุปได้ว่า 112 แตกต่างอย่างมีนัยสำคัญจาก 200

การอ้างอิง: "ช่วงความเชื่อมั่นที่มีประสิทธิภาพสำหรับค่าเฉลี่ยกับตัวอย่างขนาดหนึ่งและสอง" ชาวอเมริกันสถิติพฤษภาคม 2544 ฉบับ 55 หมายเลข 2: หน้า 102-105 ( pdf )


4
ใช่แล้ว! นั่นเป็นเหตุผลว่าทำไมมันถึงคุ้มค่าที่จะศึกษา: ความท้าทายต่อสัญชาตญาณของเราคือการศึกษาที่ยอดเยี่ยม ฉันได้เรียนรู้สิ่งนี้ครั้งแรกจากเอกสารที่ชัดเจนบนหน้าเว็บของ Carlos Rodriguez '(SUNY Albany) แต่ฉันไม่พบมันในเช้านี้: ดูเหมือนว่าเซิร์ฟเวอร์จะไม่ทำงาน ลองใช้ Google "สถิติ carlos rogriguez" ในภายหลัง (บทความของเขาควรจะอยู่ที่omega.albany.edu/8008/confint.htmlแต่นี่อาจเป็น URL เก่า)
whuber

4
น่าอัศจรรย์ ฉันไม่รู้ ขอบคุณสำหรับการอ้างอิง
Rob Hyndman

4
ขอบคุณ - โอกาสใด ๆ ที่เป็นกระดาษของ Rodriguez ที่คุณกำลังคิดอยู่ arxiv.org/abs/bayes-an/9504001
ARS

2
มันเยี่ยมมาก อย่างไรก็ตามฉันอยากรู้ว่าทำไมคุณถึงใช้สูตร (3) (ซึ่งมาจาก Edelman) ซึ่ง Wall et al อธิบายว่า "กว้างเกินความจำเป็น" ในตอนท้ายของย่อหน้าก่อนที่จะกล่าวถึง (3) พวกเขาใช้ 4.84 (ตรงกับเล็กกว่า 5.84) 1 ครั้งสำหรับช่วง 90% ซึ่งมาจากสมการของพวกเขา (4) ไม่ต้องสงสัยเลยว่าฉันพลาดอะไรไป
Glen_b -Reinstate Monica

2
@Glen_b ตรงกันข้ามมีแนวโน้มมากที่สุดที่ฉันพลาดบางสิ่งบางอย่าง ฉันจะใส่ใจว่าในครั้งต่อไปที่ฉันต้องการเอกสารนี้ แต่ในขณะเดียวกันความแตกต่างของค่าคงที่ไม่ส่งผลต่อการวิเคราะห์ที่นี่
whuber

13

นี่ดูเหมือนจะเป็นคำถามที่มีการวางแผนเล็กน้อย 49 คือจตุรัสที่แน่นอนของ 7 ค่าของการแจกแจงแบบ t กับ 48 DoF สำหรับการทดสอบสองด้านที่ p <0.05 เกือบ 2 (2.01)

เราปฏิเสธสมมติฐานว่างของความเท่าเทียมกันของวิธีการถ้า | sample_mean - popn_mean | > 2 * StdError เช่น 200-112> 2 * SE ดังนั้น SE <44, SD คือ 7 <44 * 30 = 308

มันเป็นไปไม่ได้ที่จะได้รับการแจกแจงแบบปกติด้วยค่าเฉลี่ย 112 กับค่าเบี่ยงเบนมาตรฐานที่ 308 (หรือมากกว่า) โดยไม่มีค่าจ้างติดลบ

ค่าจ้างที่ได้รับมีขอบเขตด้านล่างพวกเขามีแนวโน้มที่จะเอียงดังนั้นสมมติว่าการกระจายล็อกปกติจะเหมาะสมกว่า แต่ก็ยังต้องการค่าจ้างผันแปรสูงเพื่อหลีกเลี่ยง p <0.05 ในการทดสอบ t


3

μ=0.999* * * *112+0.001* * * *88112=20049/1000<0.05ค่าเฉลี่ยตัวอย่างจะเป็น 112 ในความเป็นจริงโดยการปรับอัตราส่วนของคนงาน / ซีอีโอและเงินเดือนของซีอีโอเราสามารถทำให้มันเป็นไปได้โดยพลการไม่น่าเป็นไปได้ที่ตัวอย่างของพนักงาน 49 คนจะวาดซีอีโอ และค่าเฉลี่ยของกลุ่มตัวอย่างที่ 112 ดังนั้นโดยไม่ต้องทำบางสมมติฐานเกี่ยวกับการกระจายพื้นฐานคุณไม่สามารถวาดอนุมานใด ๆ เกี่ยวกับประชากรเฉลี่ย


2
$

1
(1) การจับที่ดี (2), ใช่ฉันสามารถทำให้การติดตั้งปัญหา asymptotically อ้อนเพื่อให้ได้ผลลัพธ์คงโพสต์เฉพาะกิจ ความผิดฉันเอง. อย่างไรก็ตามฉันไม่แน่ใจว่า OP กำลังพยายามทดสอบอีกต่อไป หากพวกเขารู้ว่าค่าเฉลี่ยประชากรคือ 200 ทำไมพวกเขาถึงพยายามทดสอบ
shabbychef

1
BTW เห็นได้ชัดว่าเงินเดือนของ CEO / อัตราส่วนเงินเดือนที่จ่ายน้อยที่สุดที่ 400 นั้นไม่ถือว่ารุนแรงมาก แม้ว่า 800 จะค่อนข้างผิดปกติ
shabbychef

2

ฉันคิดว่าคุณหมายถึงการทดสอบตัวอย่างหนึ่งตัวอย่าง เป้าหมายคือเพื่อเปรียบเทียบค่าเฉลี่ยของตัวอย่างของคุณกับค่าเฉลี่ยของสมมติฐาน จากนั้นคำนวณ (สมมติว่าประชากรของคุณคือเกาส์เซียน) ค่า P ที่ตอบคำถามนี้: หากค่าเฉลี่ยประชากรเป็นค่าสมมุติจริงมันจะไม่น่าเป็นไปได้ที่จะวาดตัวอย่างที่ค่าเฉลี่ยอยู่ไกลจากค่านั้น (หรือมากกว่า) คุณสังเกต? แน่นอนคำตอบสำหรับคำถามนั้นขึ้นอยู่กับขนาดตัวอย่าง แต่ก็ยังขึ้นอยู่กับความแปรปรวน หากข้อมูลของคุณมีจำนวนมากกระจายข้อมูลเหล่านั้นสอดคล้องกับค่าเฉลี่ยของประชากรหลากหลาย หากข้อมูลของคุณแน่นจริง ๆ ข้อมูลเหล่านั้นสอดคล้องกับค่าเฉลี่ยของจำนวนประชากร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.