ฉันจะกำจัดรายละเอียดและการทดลองทางชีวภาพทั้งหมดและเสนอราคาเพียงปัญหาในมือและสิ่งที่ฉันทำทางสถิติ ฉันอยากจะรู้ว่ามันถูกต้องหรือไม่และจะทำอย่างไรต่อไป หากข้อมูล (หรือคำอธิบายของฉัน) ไม่ชัดเจนเพียงพอฉันจะพยายามอธิบายให้ดีขึ้นโดยแก้ไข
สมมติว่าฉันมีสองกลุ่ม / สังเกต X และ Y มีขนาดและ 40 ฉันต้องการทราบว่าค่าเฉลี่ยของการสังเกตทั้งสองนี้เท่ากันหรือไม่ คำถามแรกของฉันคือ:
หากสมมติฐานเป็นที่พอใจจะต้องใช้การทดสอบสองตัวอย่างพารามิเตอร์ที่นี่? ฉันถามสิ่งนี้เพราะจากความเข้าใจของฉันมันมักจะใช้เมื่อขนาดเล็ก?
ฉันพล็อตฮิสโทแกรมของทั้ง X และ Y และพวกมันไม่ได้กระจายตามปกติซึ่งเป็นหนึ่งในสมมติฐานของการทดสอบสองตัวอย่าง ความสับสนของฉันคือว่าฉันคิดว่าพวกเขาเป็นสองประชากรและนั่นคือเหตุผลที่ฉันตรวจสอบการกระจายปกติ แต่ฉันกำลังจะทำการทดสอบสองตัวอย่าง ... นี่ถูกไหม?
จากทฤษฎีบทขีด จำกัด กลางฉันเข้าใจว่าถ้าคุณทำการสุ่มตัวอย่าง (โดยมี / ไม่มีการซ้ำซ้อนขึ้นอยู่กับขนาดประชากรของคุณ) หลาย ๆ ครั้งและคำนวณค่าเฉลี่ยของตัวอย่างในแต่ละครั้งมันจะกระจายโดยประมาณปกติ และค่าเฉลี่ยของตัวแปรสุ่มนี้จะเป็นการประมาณค่าเฉลี่ยของประชากรที่ดี ดังนั้นฉันจึงตัดสินใจทำทั้ง X และ Y 1,000 ครั้งและได้รับตัวอย่างและฉันกำหนดตัวแปรสุ่มให้กับค่าเฉลี่ยของแต่ละตัวอย่าง พล็อตนั้นกระจายตามปกติอย่างมาก ค่าเฉลี่ยของ X และ Y เท่ากับ 4.2 และ 15.8 (ซึ่งเหมือนกับประชากร + - 0.15) และความแปรปรวนเท่ากับ 0.95 และ 12.11
ฉันทำการทดสอบ t-test สำหรับการสังเกตทั้งสองนี้ (1,000 จุดข้อมูลแต่ละจุด) ด้วยความแปรปรวนที่ไม่เท่ากันเนื่องจากมันแตกต่างกันมาก (0.95 และ 12.11) และสมมติฐานว่างถูกปฏิเสธ
มันสมเหตุสมผลหรือไม่? นี่เป็นวิธีที่ถูกต้อง / มีความหมายหรือการทดสอบซีสองตัวอย่างนั้นเพียงพอหรือผิดทั้งหมดหรือไม่?ฉันยังได้ทำการทดสอบแบบวิลคอกซันแบบไม่มีพารามิเตอร์เพื่อให้แน่ใจว่า (บน X และ Y ดั้งเดิม) และสมมติฐานว่างก็ถูกปฏิเสธเช่นกัน ในกรณีที่วิธีการก่อนหน้านี้ของฉันผิดอย่างสิ้นเชิงฉันคิดว่าการทดสอบแบบไม่มีพารามิเตอร์นั้นดียกเว้นกำลังทางสถิติ
ในทั้งสองกรณีวิธีการที่แตกต่างกันอย่างมีนัยสำคัญ อย่างไรก็ตามฉันต้องการทราบว่าวิธีใดวิธีหนึ่งหรือทั้งสองอย่างผิดพลาด / ผิดทั้งหมดหรือไม่ถ้าเป็นเช่นนั้นทางเลือกคืออะไร?