การทดสอบสมมติฐานการกระจาย - มีจุดประสงค์อะไรถ้าคุณไม่สามารถ“ ยอมรับ” สมมติฐานว่างของคุณได้?


26

การทดสอบสมมติฐานต่าง ๆ เช่นการทดสอบ GOF, Kolmogorov-Smirnov, Anderson-Darling ฯลฯ ตามรูปแบบพื้นฐานนี้:χ2

H0 : ข้อมูลเป็นไปตามการแจกแจงที่กำหนด

H1 : ข้อมูลไม่เป็นไปตามการแจกแจงที่กำหนด

โดยทั่วไปคนหนึ่งประเมินการอ้างสิทธิ์ว่าข้อมูลที่ให้มาบางส่วนมีการแจกแจงที่ให้มาบางส่วนและหากมีใครปฏิเสธข้อมูลนั้นไม่เหมาะสมสำหรับการแจกแจงที่กำหนดในระดับ αH0α

แต่ถ้าเราไม่ปฏิเสธล่ะ ฉันได้รับเสมอสอนว่าหนึ่งไม่สามารถ "ยอมรับ"ดังนั้นโดยทั่วไปเราไม่ได้มีหลักฐานที่จะปฏิเสธH_0นั่นคือไม่มีหลักฐานว่าเราปฏิเสธว่าข้อมูลเป็นไปตามการกระจายที่กำหนดH 0 H 0H0H0H0

ดังนั้นคำถามของฉันคืออะไรคือจุดของการทดสอบดังกล่าวถ้าเราไม่สามารถสรุปได้ว่าข้อมูลตามการกระจายที่กำหนดหรือไม่


1
มันเป็นเรื่องน่าดึงดูดอย่างยิ่งที่จะตอบเพียง "สิ่งที่เป็นจุดทดสอบ [โดยทั่วไป] ถ้าใครไม่ยอมรับสมมติฐานว่าง?" ในทุกกรณีการทดสอบทางสถิติไม่ได้เป็นพื้นฐานในการตัดสินใจ แต่เราตัดสินใจและใช้ข้อมูลเพื่อหาปริมาณความเสี่ยง / ค่าใช้จ่ายของข้อผิดพลาด Type I / II หากเราเพียงสรุปคุณภาพหรือระดับของกราฟิกที่มีประโยชน์ QQplots และสถิติการทำนายเราจะได้รับคำแนะนำอย่างถูกต้องเกี่ยวกับความเสี่ยงของ "การยอมรับโมฆะ"
AdamO

@AdamO เมื่อฉันถามเรื่องนี้เมื่อสามปีที่แล้วฉันเพิ่งจบปริญญาตรีคณิตศาสตร์ (เน้นสถิติ) ระดับ ตอนนี้ฉันกำลังอยู่ครึ่งทางแม้ว่าโปรแกรมสถิติของ MS และหลังจากทำงานอย่างมืออาชีพแล้วฉันก็เข้าใจสิ่งนี้แล้ว มันเป็นเรื่องที่โชคร้ายจริงๆที่การสอนสถิติในโปรแกรมปริญญาตรีจำนวนมาก แต่ฉันพูดนอกเรื่อง
Clarinetist

คำตอบ:


37

การพูดอย่างกว้าง ๆ (ไม่ใช่แค่ในการทดสอบความพอดี แต่ในสถานการณ์อื่น ๆ ) คุณไม่สามารถสรุปได้ว่าค่าว่างนั้นเป็นจริงเพราะมีทางเลือกอื่นที่แยกไม่ออกจากค่า null ในขนาดตัวอย่างที่กำหนดอย่างมีประสิทธิภาพ

นี่คือการแจกแจงสองแบบคือแบบมาตรฐานปกติ (เส้นทึบสีเขียว) และแบบที่คล้ายกัน (ปกติ 90% มาตรฐานและเบต้ามาตรฐาน 10% (2,2) ที่ทำเครื่องหมายด้วยเส้นประสีแดง):

ป้อนคำอธิบายรูปภาพที่นี่

สีแดงไม่ปกติ ที่พูดว่าเรามีโอกาสเล็กน้อยที่จะสังเกตเห็นความแตกต่างดังนั้นเราจึงไม่สามารถยืนยันได้ว่าข้อมูลนั้นมาจากการแจกแจงแบบปกติ - จะเป็นอย่างไรถ้ามาจากการแจกแจงแบบไม่ธรรมดาเหมือนสีแดงแทน?n=100

เศษส่วนที่น้อยกว่าของ betas มาตรฐานที่มีพารามิเตอร์เท่ากัน แต่ใหญ่กว่านั้นจะยากกว่าที่จะเห็นความแตกต่างจากปกติ

แต่ที่ได้รับข้อมูลจริงเกือบจะไม่เคยจากการกระจายง่ายๆถ้าเรามีคำพยากรณ์ที่สมบูรณ์แบบ (หรืออย่างมีประสิทธิภาพขนาดตัวอย่างไม่มีที่สิ้นสุด) เราจะเป็นหลักเสมอปฏิเสธสมมติฐานที่ว่าข้อมูลที่ได้จากรูปแบบการกระจายบางอย่างง่าย

ดังที่จอร์จบ็อกซ์กล่าวไว้ว่า " ทุกรุ่นผิด แต่มีประโยชน์ "

ลองพิจารณาตัวอย่างเช่นการทดสอบภาวะปกติ มันอาจจะเป็นว่าข้อมูลที่จริงมาจากสิ่งที่ใกล้เคียงกับปกติ แต่พวกเขาจะเคยเป็นว่าปกติ? พวกเขาอาจจะไม่เคย

สิ่งที่ดีที่สุดที่คุณสามารถหวังได้จากการทดสอบรูปแบบนั้นคือสถานการณ์ที่คุณอธิบาย (ดูตัวอย่างการโพสต์การทดสอบภาวะปกติเป็นสิ่งที่ไร้ประโยชน์หรือไม่แต่มีจำนวนโพสต์อื่น ๆ ที่นี่ที่สร้างประเด็นที่เกี่ยวข้อง)

นี่เป็นส่วนหนึ่งของเหตุผลที่ฉันมักจะแนะนำให้คนอื่น ๆ ว่าคำถามที่พวกเขาสนใจจริง ๆ (ซึ่งมักจะเป็นสิ่งที่ใกล้เคียงกับ 'ข้อมูลของฉันอยู่ใกล้พอที่จะเผยแพร่ที่ฉันสามารถทำการอนุมานที่เหมาะสมบนพื้นฐานนั้น') ไม่ตอบรับอย่างดีจากการทดสอบความดีพอดี ในกรณีของภาวะปกติมักจะใช้วิธีอนุมานที่พวกเขาต้องการที่จะใช้ (t- ทดสอบการถดถอย ฯลฯ ) มีแนวโน้มที่จะทำงานได้ค่อนข้างดีในกลุ่มตัวอย่างขนาดใหญ่ - บ่อยครั้งที่การกระจายตัวดั้งเดิมค่อนข้างชัดเจนไม่ใช่ปกติ - เมื่อความดีของ การทดสอบแบบที่จะมีโอกาสมากที่จะปฏิเสธปกติ การใช้เพียงเล็กน้อยมีขั้นตอนที่น่าจะบอกคุณได้ว่าข้อมูลของคุณไม่ปกติเมื่อคำถามนั้นไม่สำคัญF

พิจารณาภาพด้านบนอีกครั้ง การกระจายสีแดงนั้นไม่ปกติและด้วยกลุ่มตัวอย่างที่มีขนาดใหญ่มากเราสามารถปฏิเสธการทดสอบปกติจากตัวอย่าง ... แต่ที่ขนาดตัวอย่างที่เล็กกว่าการถดถอยและการทดสอบตัวอย่างสองครั้ง (และการทดสอบอื่น ๆ อีกมากมาย นอกจากนี้) จะประพฤติตัวเป็นอย่างดีจนทำให้ไม่มีจุดหมายที่จะต้องกังวลเกี่ยวกับสิ่งที่ไม่ใช่เรื่องปกติแม้เพียงเล็กน้อย

ข้อพิจารณาที่คล้ายกันนี้ไม่เพียงขยายไปสู่การแจกแจงอื่น ๆ เท่านั้น แต่ส่วนใหญ่จะเป็นการทดสอบสมมติฐานจำนวนมากโดยทั่วไป (เช่นการทดสอบสองด้านของเป็นต้น) หนึ่งอาจถามคำถามแบบเดียวกัน - อะไรคือจุดของการทดสอบดังกล่าวถ้าเราไม่สามารถสรุปได้ว่าค่าเฉลี่ยใช้ค่าเฉพาะหรือไม่μ=μ0

คุณอาจสามารถระบุรูปแบบเฉพาะของการเบี่ยงเบนและดูการทดสอบความเท่ากันได้ แต่มันค่อนข้างมีเล่ห์เหลี่ยมเหมาะสมเพราะมีหลายวิธีที่การกระจายจะใกล้เคียง แต่แตกต่างจากสมมุติฐานที่แตกต่างกัน รูปแบบของความแตกต่างอาจมีผลกระทบต่อการวิเคราะห์ต่างกัน หากทางเลือกนั้นเป็นตระกูลที่กว้างขึ้นซึ่งรวมถึงโมฆะเป็นกรณีพิเศษการทดสอบความเท่ากันนั้นสมเหตุสมผลมากขึ้น (เช่นการทดสอบแบบเอ็กซ์โปเนนเชียลเทียบกับแกมม่า) - และแน่นอนว่าวิธีการ "ทดสอบสองด้านเดียว" ดำเนินไป เป็นวิธีที่จะทำให้เป็นรูปธรรม "ใกล้พอ" (หรืออาจเป็นไปได้ว่าถ้าแบบจำลองแกมม่าเป็นจริง แต่ในความเป็นจริงแล้วตัวเองจะมั่นใจได้อย่างแท้จริงว่าจะถูกปฏิเสธโดยความดีสามัญของการทดสอบแบบพอดี

ความเหมาะสมของการทดสอบแบบพอดี (และบ่อยครั้งกว่านั้นคือการทดสอบสมมติฐาน) เหมาะสำหรับสถานการณ์ที่มีข้อ จำกัด คำถามที่คนมักจะต้องการคำตอบนั้นไม่แม่นยำ แต่ค่อนข้างคลุมเครือและยากที่จะตอบ - แต่อย่างที่ John Tukey กล่าวว่า " ดีกว่าคำตอบที่ถูกต้องสำหรับคำถามที่ถูกต้องซึ่งมักจะคลุมเครือกว่าคำตอบที่ถูกต้อง คำถามที่ผิดซึ่งสามารถทำให้แม่นยำเสมอ "

แนวทางที่สมเหตุสมผลในการตอบคำถามที่คลุมเครือมากขึ้นอาจรวมถึงการจำลองและการตรวจสอบซ้ำอีกครั้งเพื่อประเมินความอ่อนไหวของการวิเคราะห์ที่ต้องการกับข้อสันนิษฐานที่คุณกำลังพิจารณาเปรียบเทียบกับสถานการณ์อื่น ๆ ที่สอดคล้องกับข้อมูลที่มีอยู่

(เป็นส่วนหนึ่งของพื้นฐานสำหรับวิธีการที่แข็งแกร่งผ่าน - การปนเปื้อน - โดยดูจากผลกระทบของการอยู่ภายในระยะหนึ่งในความรู้สึก Kolmogorov-Smirnov)ε


เกลนนี่คือคำตอบที่ดี มีแหล่งข้อมูลเพิ่มเติมเกี่ยวกับ "วิธีการที่สมเหตุสมผลในการตอบคำถามที่คลุมเครือมากกว่านี้" หรือไม่? มันจะดีมากถ้าได้เห็นตัวอย่างการทำงานที่ผู้คนตอบรับ "ข้อมูลของฉันอยู่ใกล้พอที่จะแจกจ่าย X สำหรับจุดประสงค์ของฉันได้หรือไม่" ในบริบท
Stumpy Joe Pete

2
@StumpyJoePete มีตัวอย่างของคำตอบสำหรับคำถามที่คลุมเครือ (แต่แตกต่างกันเล็กน้อย) ที่นี่ที่ซึ่งการจำลองใช้เพื่อตัดสินโดยประมาณว่าขนาดของกลุ่มตัวอย่างมันอาจจะสมเหตุสมผลที่จะใช้การทดสอบ t กับเบ้ (เลขชี้กำลัง, พูด) ข้อมูล. จากนั้นในคำถามติดตามผู้ใช้ OP ขึ้นมาพร้อมกับข้อมูลเพิ่มเติมเกี่ยวกับตัวอย่าง (มันไม่ต่อเนื่องและเมื่อมันปรากฏออกมาจะยิ่งเอียงมากกว่า "เลขชี้กำลัง" ที่จะแนะนำ), ... (ctd)
Glen_b

2
(ctd) ... ปัญหาได้รับการสำรวจอย่างละเอียดยิ่งขึ้นอีกครั้งโดยใช้การจำลอง แน่นอนว่าในทางปฏิบัติจะต้องมี 'การกลับไปกลับมา' มากขึ้นเพื่อให้แน่ใจว่าเหมาะสมกับความต้องการที่แท้จริงของบุคคลแทนที่จะคาดเดาจากคำอธิบายเบื้องต้น
Glen_b -Reinstate Monica

ขอบคุณ! นั่นคือสิ่งที่ฉันกำลังมองหา
Stumpy Joe Pete

17

ฉันที่สอง @ Glen_b คำตอบและเพิ่มว่าโดยทั่วไปปัญหา "การขาดหลักฐานไม่ใช่หลักฐานการขาด" ทำให้การทดสอบสมมติฐานและP- ค่ามีประโยชน์น้อยกว่าที่พวกเขาดูเหมือน การคาดคะเนมักเป็นวิธีที่ดีกว่าแม้ในการประเมินความเหมาะสม หนึ่งสามารถใช้ระยะทาง Kolmogorov-Smirnov เป็นตัววัด มันยากที่จะใช้โดยไม่มีข้อผิดพลาด วิธีอนุรักษ์นิยมจะใช้ความเชื่อมั่นสูงสุดของระยะทาง KS เพื่อเป็นแนวทางในการสร้างแบบจำลอง สิ่งนี้จะนำไปสู่ความไม่แน่นอนอย่างมากซึ่งอาจนำไปสู่ข้อสรุปว่าการเลือกวิธีการที่มีประสิทธิภาพในสถานที่แรกเป็นที่ต้องการ ด้วยความคิดนั้นและกลับไปสู่เป้าหมายดั้งเดิมเมื่อเปรียบเทียบการกระจายเชิงประจักษ์กับรูปแบบพาราเมตริกที่เป็นไปได้มากกว่า 2 รูปแบบความแปรปรวนที่แท้จริงของการแจกแจงติดตั้งสุดท้ายนั้นไม่มีความแม่นยำที่ดีไปกว่าฟังก์ชั่นการแจกแจงเชิงประจักษ์ ดังนั้นหากไม่มีทฤษฎีเรื่องที่จะผลักดันการเลือกการแจกแจง


3
ฉันไม่สามารถเข้าใจเหตุผลที่สิ่งนี้ถูกลดระดับลงได้ มีบางจุดที่ดีที่นี่ มันจะช่วยได้ถ้าคน downvoting จะอธิบายสิ่งที่พวกเขาเห็นว่าเป็นปัญหา บางทีเราต้องการเรียนรู้บางสิ่ง
Glen_b -Reinstate Monica

9

2

ฉันคิดว่านี่เป็นตัวอย่างที่สมบูรณ์แบบเพื่อแสดงให้เห็นถึงความแตกต่างระหว่างงานวิชาการและการตัดสินใจเชิงปฏิบัติ ในการตั้งค่าด้านการศึกษา (ฉันอยู่ที่ไหน) คุณสามารถโต้เถียงในแบบที่คุณต้องการตราบเท่าที่ผู้อื่นเห็นว่าเหมาะสม ดังนั้นโดยพื้นฐานแล้วเราจบลงด้วยการไม่มีที่สิ้นสุดบางครั้งเป็นวงกลมต่อรองราคากันได้ ในแง่นี้สิ่งนี้ช่วยให้ผู้คนสามารถทำงานได้

อย่างไรก็ตามหากคุณอยู่ในตำแหน่งที่จะตัดสินใจได้จริงคำตอบก็คือใช่หรือไม่ใช่ การไม่แน่ใจจะทำลายชื่อเสียงของคุณในฐานะผู้มีอำนาจตัดสินใจ แน่นอนว่าการเลือกนั้นไม่เพียง แต่เกี่ยวข้องกับสถิติเท่านั้น แต่บางครั้งก็เป็นองค์ประกอบของการเดิมพันและการก้าวกระโดดของความเชื่อ โดยสรุปการออกกำลังกายประเภทนี้มีประโยชน์ในการตัดสินใจ อย่างไรก็ตามการตัดสินใจของคุณเพียงอย่างเดียวในการทดสอบสมมติฐานนี้เป็นเรื่องที่แตกต่างอย่างสิ้นเชิง


2
นั่นไม่ถูกต้อง IMHO หนังสือที่ดีที่สุดที่ผมเคยอ่านที่อธิบายว่าทำไมหนึ่งที่ทำให้การตัดสินใจที่ดีขึ้นโดยการผสมผสานความไม่แน่นอนเสมอเข้าสู่ขั้นตอนของการตัดสินใจทุกเนทสีเงินของสัญญาณและเสียง ตัวอย่างเช่นผู้เล่นโป๊กเกอร์ที่ชนะเลิศคือผู้ที่ไม่เคยเชื่อเลยว่าความน่าจะเป็นของไพ่ในมือคือ 0 หรือ 1
Frank Harrell

1
@ FrankHarrell ฉันสงสัยว่าคุณจะตอบคำถามเช่นว่าจะสร้างถนนหรือไม่เพื่อซื้อหุ้น มันเป็นคำถามที่ใช่หรือไม่ คำถามเหล่านี้เป็นคำถามที่ผู้มีอำนาจตัดสินใจที่แท้จริงต้องตอบ
LaTeXFan

1
@ FrankHarrell สถิติแน่นอนมีบทบาทในการช่วยในการตัดสินใจ อย่างไรก็ตามจากมุมมองที่แข็งแกร่งสิ่งที่เราทำคือการประมาณความเป็นจริง มีหลายสิ่งหลายอย่างที่คณิตศาสตร์ไม่สามารถอธิบายได้ และนี่คือสิ่งที่วิธีการอื่นเข้ามาเล่นเหมือนสัญชาตญาณ
LaTeXFan

1
P

1
@ FrankHarrell ขอบคุณสำหรับความคิดเห็นของคุณ ฉันคิดว่าความแตกต่างของคุณระหว่างการตัดสินใจที่ยกเลิกไม่ได้และเป็นจุดที่ดี ในสาระสำคัญมันเป็นเรื่องเกี่ยวกับมิติเวลาของปัญหา ภายในระยะเวลาอันสั้นการตัดสินใจส่วนใหญ่จะยกเลิกไม่ได้ นี่คือสิ่งที่เกิดขึ้นเมื่อมีคนโทรเข้ามาเพื่อโทรออก ในทางกลับกันถ้าเราสามารถมีมุมมองระยะยาวคุณก็พูดถูก - ดีกว่าที่จะมีระบบที่สามารถตอบสนองต่อการเปลี่ยนแปลงในสถานการณ์ ถึงแม้ว่าความเสียหายทางการเงินหรือทางกายภาพจะไม่สามารถหลีกเลี่ยงได้
LaTeXFan

2

ประเด็นก็คือจากมุมมองทางสถิติล้วนๆคุณไม่สามารถยอมรับได้แต่ในทางปฏิบัติคุณทำ ตัวอย่างเช่นหากคุณกำลังประเมินความเสี่ยงของพอร์ตโฟลิโอโดยใช้มาตรการที่มีความเสี่ยงหรือการวัดที่คล้ายกันการกระจายผลตอบแทนของพอร์ตโฟลิโอนั้นค่อนข้างสำคัญ นั่นเป็นเพราะความเสี่ยงถูกกำหนดโดยหางของการกระจายของคุณ

ในกรณีหนังสือข้อความการแจกแจงแบบปกติมักใช้เป็นตัวอย่าง อย่างไรก็ตามหากผลตอบแทนของคุณมีไขมันหาง (ซึ่งมักจะทำ) การประมาณการกระจายแบบปกติจะประเมินความเสี่ยงต่ำเกินไป ดังนั้นจึงเป็นสิ่งสำคัญในการตรวจสอบผลตอบแทนและตัดสินใจว่าคุณจะใช้การประมาณปกติหรือไม่ โปรดทราบว่านี่ไม่ได้หมายถึงการรันการทดสอบทางสถิติ แต่อาจเป็น QQ-plot หรือวิธีการอื่น อย่างไรก็ตามคุณต้องตัดสินใจในบางจุดจากการวิเคราะห์ผลตอบแทนและแบบจำลองการคืนสินค้าของคุณและใช้แบบปกติหรือไม่

ดังนั้นสำหรับวัตถุประสงค์ในทางปฏิบัติทั้งหมดที่ไม่ปฏิเสธจริงๆหมายถึงยอมรับแม้ว่าจะไม่ได้อยู่ในความหมายทางสถิติที่เข้มงวด คุณจะยอมรับการใช้งานปกติและใช้มันในการคำนวณของคุณซึ่งจะแสดงให้ผู้บริหารระดับสูงทราบทุกวันต่อผู้กำกับดูแลผู้สอบบัญชีและอื่น ๆ การไม่ปฏิเสธในกรณีนี้มีผลกระทบที่ไกลเกินจริงในทุกแง่มุม หรือมีประสิทธิภาพมากกว่าผลลัพธ์ทางสถิติที่งี่เง่า


0

ไม่มีจำเลยในศาลที่ไร้เดียงสาเลย พวกเขามีความผิด (ปฏิเสธสมมติฐานว่างของผู้บริสุทธิ์) หรือไม่ผิด (อย่าปฏิเสธข้อสันนิษฐานของความไร้เดียงสา)

การขาดหลักฐานไม่ใช่หลักฐานการขาด


-1

ดังนั้นคำถามของฉันคืออะไรคือจุดของการทดสอบดังกล่าวถ้าเราไม่สามารถสรุปได้ว่าข้อมูลตามการกระจายที่กำหนดหรือไม่

หากคุณมีการแจกแจงทางเลือก (หรือชุดการกระจาย) ในใจเพื่อเปรียบเทียบกับมันอาจเป็นเครื่องมือที่มีประโยชน์

ฉันจะบอกว่า: ฉันมีข้อสังเกตหลายอย่างซึ่งฉันคิดว่าอาจจะเผยแพร่ได้ตามปกติ (ฉันคิดว่าเป็นเช่นนั้นเพราะฉันได้เห็นการสังเกตของตัวละครที่คล้ายกันซึ่งฉันพอใจตามด้วยเส้นโค้งปกติอย่างสมเหตุสมผล) ฉันยังคิดว่าพวกเขาอาจไม่ทำตามเส้นโค้งปกติ แต่เป็นเส้นโค้งที่ไม่ปกติ (ฉันคิดว่าอาจเป็นเพราะฉันได้เห็นแหล่งข้อมูลเช่นนี้ซึ่งไม่เป็นไปตามเส้นโค้งปกติ แต่ยกตัวอย่างเช่นความเบ้ ฯลฯ ) 3 ฉันก็ทำการสอบถามตามแนวการสังเกต: ถ้าการสังเกต มาจากการกระจายตัวแบบธรรมดาไคสแควร์ที่เกิดขึ้นบ่อยแค่ไหน บทสรุปคือ "ค่อนข้างน้อยมากเพียงสองครั้งในหนึ่งร้อย" จากนั้นฉันทำการสอบถามไม่ระบุและไม่คำนวณ แต่ฉันเชื่อว่าจำเป็นอย่างยิ่งสำหรับการโต้แย้งที่ถูกต้องดังต่อไปนี้: หากการแจกแจงนั้นไม่ปกติประสบการณ์นี้ซึ่งตัดสินโดยความแตกต่างของไคสแควร์จะเกิดขึ้นค่อนข้างบ่อย (สิ่งที่ฉันต้องทำก็คือจินตนาการว่าเส้นโค้งที่ไม่ปกติมีลักษณะเบ้กระจายของการแจกแจง) ดังนั้นฉันจึงปฏิเสธสมมติฐานปกติบนหลักการที่ฉันยอมรับว่าสมมติฐานทางเลือกหนึ่งซึ่งเหตุการณ์ที่มีประสบการณ์จะมากกว่านี้ บ่อย. ฉันพูดว่าการปฏิเสธสมมติฐานว่างจะใช้ได้เฉพาะในความเต็มใจที่จะยอมรับทางเลือกอื่น (ทางเลือกนี้ไม่จำเป็นต้องกำหนดอย่างแม่นยำในทุกประการ) ) ฉันจึงปฏิเสธสมมติฐานปกติเกี่ยวกับหลักการที่ฉันยอมรับว่าหนึ่งในสมมติฐานทางเลือกที่พิจารณาซึ่งเหตุการณ์ที่มีประสบการณ์จะบ่อยขึ้น ฉันพูดว่าการปฏิเสธสมมติฐานว่างจะใช้ได้เฉพาะในความเต็มใจที่จะยอมรับทางเลือกอื่น (ทางเลือกนี้ไม่จำเป็นต้องกำหนดอย่างแม่นยำในทุกประการ) ) ฉันจึงปฏิเสธสมมติฐานปกติเกี่ยวกับหลักการที่ฉันยอมรับว่าหนึ่งในสมมติฐานทางเลือกที่พิจารณาซึ่งเหตุการณ์ที่มีประสบการณ์จะบ่อยขึ้น ฉันพูดว่าการปฏิเสธสมมติฐานว่างจะใช้ได้เฉพาะในความเต็มใจที่จะยอมรับทางเลือกอื่น (ทางเลือกนี้ไม่จำเป็นต้องกำหนดอย่างแม่นยำในทุกประการ)

ตอนนี้แนวการให้เหตุผลที่ฉันอธิบายไว้เมื่อเทียบกับสิ่งที่ฉันอธิบายตามปกติยิ่งขึ้นจะอธิบายว่าทำไมการตัดสินใจของฉันแตกต่างจากงานประจำในกรณีที่สามและสี่

สำหรับกรณีที่สามหลังจากที่ฉันลองทดสอบไคสแควร์แล้วฉันก็มาถึงข้อสรุปว่าจากสมมติฐานที่ไม่มีความแตกต่างจากภาวะปกติการกระจายที่มีไคสแควร์ขนาดใหญ่จะไม่ค่อยเกิดขึ้น จนถึงตอนนี้เราอยู่ในตำแหน่งเดียวกับที่เราเคยมาถึงจุดนี้ในกรณีที่สอง แต่ตอนนี้ให้ฉันตรวจสอบความน่าจะเป็นที่ประสบการณ์นี้จะเกิดขึ้นหากวัสดุดั้งเดิมเป็นสิ่งที่ไม่ปกติ ประสบการณ์นี้จะเกิดขึ้นบ่อยขึ้นหรือไม่ ไม่มีเหตุผลที่จะพูดเช่นนั้น การแจกแจงสมมาตรอย่างสมบูรณ์แบบคือความเบ้เป็นศูนย์ (มีร้อยละ 50 ของคดีในแต่ละด้านของค่าเฉลี่ย) และการตรวจสอบคร่าวๆของความแตกต่างจากความถี่ที่คาดหวังในชั้นเรียนที่แตกต่างกันแสดงว่าพวกเขาไม่ใช่ อุณหภูมิคือ การเบี่ยงเบนบวกและการเบี่ยงเบนลบสลับกันตามลำดับแบบสุ่ม การแจกแจงแบบนี้ไม่ควรคาดหวังจากกราฟที่ไม่เป็นไปตามปกติ ดังนั้นเราจึงไม่มีเหตุผลที่จะปฏิเสธโค้งปกติ

มุมมองของฉันคือว่าไม่มีเหตุผลที่ถูกต้องสำหรับการปฏิเสธสมมติฐานว่างยกเว้นในความเต็มใจที่จะทำให้เป็นทางเลือกหนึ่ง

ความยากลำบากบางประการของการตีความที่พบในการประยุกต์ใช้การทดสอบ Chi-Square โจเซฟเบอร์สัน วารสารสมาคมสถิติอเมริกัน ฉบับ 33, ฉบับที่ 203 (ก.ย. , 1938), หน้า 526-536


1
ใบเสนอราคา / กระดาษของ Berkson ดูมีความเกี่ยวข้องและสมเหตุสมผลสำหรับฉัน มันเป็นความรู้ที่ได้รับความนิยมว่ามีขนาดตัวอย่างมากพอที่การแจกแจงแบบสันนิษฐานใด ๆ จะถูกปฏิเสธแม้ว่าจะเกิดจากข้อผิดพลาดในการวัดเท่านั้น หากเราพบว่าข้อมูลนั้นไม่น่าจะเกิดขึ้นภายใต้การกระจายตัวบางอย่างเราไม่ควรลองคิดดูว่าทางเลือกที่ดีกว่าจะเป็นอย่างไร และถ้าเราไม่สามารถพิสูจน์ตัวเลือกอื่น ๆ เหล่านี้ได้เราก็ควรสมมติว่ามีการแจกแจงที่ง่ายที่สุดเท่าที่จะทำได้? มีใครอธิบายได้ไหมว่าเพราะเหตุใดปัญหานี้จึงถูกลดระดับลง
Livid
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.