“ กลับกัน” ชาปิโร่ - วิลค์


11

การทดสอบ Sharipo-Wilk อ้างอิงจากวิกิพีเดียทดสอบสมมติฐานว่าง ( ) "ประชากรจะกระจายตามปกติ"H0

ฉันกำลังมองหาการทดสอบคล้ายกันกับ "ประชากรไม่ได้กระจายตามปกติ"H0

หลังจากมีการทดสอบฉันต้องการคำนวณเพื่อปฏิเสธที่ระดับนัยสำคัญ iff ; พิสูจน์ให้เห็นว่าประชากรของฉันกระจายตามปกติH 0 α p < αpH0αp<α

โปรดทราบว่าการใช้การทดสอบ Sharipo-Wilk และการยอมรับ iffเป็นวิธีที่ไม่ถูกต้องเนื่องจากมันหมายถึง "เรามีหลักฐานไม่เพียงพอที่จะพิสูจน์ว่า H0 ไม่ได้ถือ" p > αH0p>α

หัวข้อที่เกี่ยวข้อง - ความหมายของ -valuep , เป็นปกติทดสอบไร้ประโยชน์? แต่ฉันไม่เห็นวิธีแก้ไขปัญหาของฉัน

คำถาม:ฉันควรใช้แบบทดสอบใด? มันนำมาใช้ใน R หรือไม่?


6
สมมติฐานว่างของ "ไม่กระจายแบบปกติ" ไม่สามารถใช้งานได้ พื้นที่นี้จะรวมถึงการแจกแจงทั้งหมดโดยพลการใกล้กับ แต่ไม่มากปกติการแจกแจง คุณให้ชุดข้อมูล จำกัด ใด ๆ แก่ฉัน ฉันเลือกการกระจายเชิงประจักษ์ซึ่งไม่ปกติดังนั้นจึงเป็นของสเปซว่าง ปฏิเสธไม่ได้
A. เวบบ์

5
คำถามนี้เหมือนกันกับคำถามที่คุณถามไปก่อน คำตอบที่เหมาะสมจะอธิบายว่าการทดสอบสมมติฐานทางสถิติทำงานอย่างไรซึ่งเป็นสาเหตุที่ฉันชี้ให้คุณดูstats.stackexchange.com/questions/31ในความคิดเห็นคำถามอื่นของคุณ
whuber

5
ในขณะที่สมมติฐานว่าง "ไม่ปกติกระจาย" เป็นไปไม่ได้สมมุติฐานว่าง "คือการกระจายด้วยค่าสัมบูรณ์ของความดี - แห่ง - พอดีสถิติที่อย่างน้อยที่สุดก็แตกต่างกันเหมือน " ตามแนวของการทดสอบความเท่าเทียมดูสมเหตุสมผล กล่าวอีกนัยหนึ่งเราควรจะสามารถทดสอบกับโมฆะของ "ไม่ปกติอย่างน้อยนี้มาก " @gung ได้แนะนำสิ่งนี้อย่างแม่นยำในคำตอบของเขา ε
Alexis

คำตอบ:


10

ไม่มีสิ่งเช่นการทดสอบว่าข้อมูลของคุณมีการกระจายตามปกติ มีเพียงการทดสอบว่าข้อมูลของคุณไม่ได้รับการกระจายตามปกติ ดังนั้นจึงมีการทดสอบเหมือนชาปิโร - วิลก์ที่ (มีอีกหลายคน) แต่ไม่มีการทดสอบที่เป็นโมฆะว่าประชากรไม่ปกติและสมมติฐานทางเลือกคือประชากรปกติ H0:normal

สิ่งที่คุณทำได้คือหาว่าการเบี่ยงเบนแบบไหนที่คุณสนใจ (เช่นความเบ้) และความเบี่ยงเบนนั้นจะต้องใหญ่ขนาดไหนก่อนที่มันจะรบกวนคุณ จากนั้นคุณสามารถทดสอบเพื่อดูว่าค่าเบี่ยงเบนจากค่าปกติในข้อมูลของคุณน้อยกว่าค่าวิกฤตหรือไม่ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับแนวคิดทั่วไปมันอาจช่วยให้อ่านคำตอบของฉันที่นี่: ทำไมนักสถิติพูดว่าผลลัพธ์ที่ไม่สำคัญหมายความว่า“ คุณไม่สามารถปฏิเสธโมฆะ” ได้เมื่อเทียบกับการยอมรับสมมติฐานว่าง


5

ฉันต้องการคำนวณค่า p เพื่อปฏิเสธ H0 ที่ระดับนัยสำคัญα iff p <α; พิสูจน์ให้เห็นว่าประชากรของฉันกระจายตามปกติ

การแจกแจงแบบปกติเกิดขึ้นเมื่อข้อมูลถูกสร้างขึ้นโดยชุดของเหตุการณ์เพิ่มเติม iid (ดูภาพ quincunx ด้านล่าง) นั่นหมายความว่าไม่มีการตอบกลับและไม่มีความสัมพันธ์กันเสียงนั้นเหมือนกระบวนการที่นำไปสู่ข้อมูลของคุณหรือไม่ หากไม่เป็นเช่นนั้นอาจไม่ปกติ

มีโอกาสที่ประเภทของกระบวนการอาจเกิดขึ้นในกรณีของคุณ สิ่งที่ใกล้เคียงที่สุดที่คุณสามารถ "พิสูจน์" ได้คือการรวบรวมข้อมูลมากพอที่จะแยกแยะการแจกแจงอื่น ๆ ที่ผู้คนสามารถเกิดขึ้นได้ (ซึ่งอาจไม่เป็นประโยชน์) อีกวิธีคือการอนุมานการแจกแจงแบบปกติจากทฤษฎีบางอย่างพร้อมกับการทำนายอื่น ๆ หากข้อมูลสอดคล้องกับพวกเขาทั้งหมดและไม่มีใครสามารถคิดคำอธิบายอื่นได้นั่นจะเป็นหลักฐานที่ดีในการสนับสนุนการแจกแจงแบบปกติ

https://upload.wikimedia.org/wikipedia/commons/7/7f/Quincunx_%28Galton_Box%29_-_Galton_1889_diagram.png https://en.wikipedia.org/wiki/Bean_machine

ทีนี้ถ้าคุณไม่คาดหวังว่าการแจกจ่ายแบบเฉพาะเจาะจงจะยังคงมีเหตุผลที่จะใช้การแจกแจงแบบปกติเพื่อสรุปข้อมูล แต่จำไว้ว่านี่เป็นตัวเลือกที่สำคัญที่สุดเพราะไม่รู้ ( https://en.wikipedia.org/wiki/) Principle_of_maximum_entropy ) ในกรณีนี้คุณไม่ต้องการที่จะรู้ว่าประชากรมีการกระจายตามปกติหรือไม่ แต่คุณต้องการที่จะรู้ว่าการกระจายตัวปกตินั้นเป็นการประมาณที่สมเหตุสมผลหรือไม่สำหรับขั้นตอนต่อไปของคุณ

ในกรณีนี้คุณควรให้ข้อมูลของคุณ (หรือสร้างข้อมูลที่คล้ายกัน) พร้อมกับคำอธิบายว่าคุณวางแผนจะทำอะไรกับมันจากนั้นให้ถามว่า "ในกรณีใดที่สมมติว่าเป็นเรื่องปกติในกรณีนี้ทำให้ฉันเข้าใจผิด"


จริง ๆ แล้วฉันรู้ว่าข้อมูลเป็นปกติ (การวัดอย่างอิสระบนคอมพิวเตอร์อิสระ) แต่ฉันจำเป็นต้องตั้งสมมติฐานบางอย่างสำหรับวิทยานิพนธ์ของฉัน .. ขอบคุณสำหรับการชี้แจงและตัวอย่าง :)
petrbel

1
อนึ่ง Krieger ได้ให้คำวิจารณ์ที่น่ารักเกี่ยวกับการใช้Quincunxของ Galton ใน Krieger, N. (2012) ใครคือ "ประชากร" คืออะไร? การถกเถียงทางประวัติศาสตร์การถกเถียงในปัจจุบันและความหมายเพื่อทำความเข้าใจ“ สุขภาพของประชากร” และแก้ไขความไม่เท่าเทียมของสุขภาพ ไตรมาสของ Milbank , 90 (4): 634–681
Alexis

@petrbel สถานการณ์นั้นแตกต่างจากที่อธิบายไว้ข้างต้นอย่างละเอียด คุณสามารถสร้าง quincunx โดยที่แต่ละการสังเกตคือ iid แต่กระบวนการที่สร้างข้อมูลไม่ใช่ ดูที่นี่สำหรับตัวอย่างบันทึกปกติ: LIMPERT และคณะ การแจกแจงแบบล็อกปกติทั่วทั้งวิทยาศาสตร์: กุญแจและเบาะแส พฤษภาคม 2544 / ฉบับ 51 ลำดับที่ 5. วิทยาศาสตร์ชีวภาพ
Livid

1
@Alexis ฉันเห็นว่า Krieger (2012) ทำซ้ำตัวเลขจาก Limpert et al (2001) และทำให้ประเด็นที่พลาดโดย petrbel: "การปรับเปลี่ยนโครงสร้างสามารถเปลี่ยนความน่าจะเป็นผลลัพธ์ได้แม้กระทั่งวัตถุที่เหมือนกัน
Livid

2

คุณจะไม่สามารถ "พิสูจน์" สมมติฐานทั่วไปในข้อมูลของคุณได้ เสนอหลักฐานเพียงเพื่อเป็นข้อสันนิษฐาน การทดสอบชาปิโร - วิลค์เป็นวิธีหนึ่งในการทำสิ่งนี้และใช้ตลอดเวลาในการพิสูจน์สมมติฐานของนอร์มอล เหตุผลก็คือคุณเริ่มต้นด้วยการสมมติเรื่องความเป็นจริง จากนั้นคุณถามข้อมูลของฉันขอแนะนำให้ฉันตั้งสมมติฐานว่างี่เง่าหรือไม่? ดังนั้นคุณจะไปข้างหน้าและทดสอบกับ Shapiro-Wilk หากคุณล้มเหลวในการปฏิเสธสมมติฐานว่างจากนั้นข้อมูลไม่แนะนำให้คุณสมมติว่าโง่

แจ้งให้ทราบล่วงหน้าผู้คนใช้ตรรกะที่คล้ายกันนี้ตลอดเวลาในการปฏิบัติ - ไม่เพียง แต่ในบริบทของการทดสอบ Shapiro-Wilk พวกเขาต้องการใช้การถดถอยเชิงเส้นดู scatterplot และดูว่าการถดถอยเชิงเส้นเป็นความคิดที่โง่ หรือพวกเขาสันนิษฐานว่าเป็น heteroscedasticity และพล็อตข้อผิดพลาดพล็อตเพื่อดูว่านี่เป็นความคิดที่โง่Y,X


การฝึกฝนที่คุณบอกว่าเป็นวิธีที่ไม่ถูกต้อง Petrbel ที่กล่าวถึง การทดสอบมักจะสอดคล้องกันดังนั้นขนาดของกลุ่มตัวอย่างที่ใหญ่กว่าความน่าจะเป็นที่จะประกาศเกณฑ์ปกติเป็นแนวคิดที่โง่ นี่คือความโง่เง่าเนื่องจากขนาดตัวอย่างที่ใหญ่กว่าข้อสันนิษฐานเชิงบรรทัดฐานนั้นมีความสำคัญน้อยกว่าเนื่องจากความทนทานของกระบวนการส่วนใหญ่
Horst Grünbusch

@ HorstGrünbuschคุณไม่เห็นด้วยหรือไม่ว่าการทดสอบ Shapiro-Wilk เป็นวิธีที่ถูกต้องในการทดสอบสมมุติฐานของข้อมูลว่าเป็นข้อมูลปกติหรือไม่?
TrynnaDoStat

หากคุณยอมรับว่าเป็นแนวทางที่ถูกต้องฉันไม่แน่ใจว่าสิ่งที่คุณไม่เห็นด้วยในคำตอบของฉัน
TrynnaDoStat

ฉบับที่ดูขัดแย้งที่นี่: stats.stackexchange.com/questions/2492/... นอกจากนี้มันไม่ถูกต้องที่จะทดสอบสมมติฐานว่างว่าสองตัวอย่างมีความแปรปรวนเดียวกันและใช้การทดสอบ Satterthwaite ต่อเมื่อความแปรปรวนแตกต่างกันอย่างมีนัยสำคัญและอื่น ๆ ทดสอบ t สำหรับตัวอย่าง homoskedastic เพียงแค่จำลองขั้นตอนการคอมโพสิตนี้ด้วยตัวคุณเอง: คุณสามารถให้ผลผลิตอัตราประเภท-I-ข้อผิดพลาดถึง22α
Horst Grünbusch

@ HorstGrünbuschดูเหมือนว่าปัญหาของคุณกับคำตอบของฉันเกี่ยวข้องกับแนวคิดการทดสอบสมมติฐานโดยทั่วไป ความจริงที่ว่าในหลาย ๆ สถานการณ์การทดสอบสมมติฐานจะปฏิเสธโมฆะด้วยความน่าจะเป็น 1 เมื่อขนาดตัวอย่างเข้าใกล้อนันต์
TrynnaDoStat
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.