ทำไมต้องสอนและใช้การทดสอบสมมติฐานต่อไป (เมื่อมีช่วงความมั่นใจ)


56

เหตุใดจึงต้องสอนและใช้การทดสอบสมมติฐาน (ด้วยแนวคิดที่ยากทั้งหมดและเป็นความผิดทางสถิติมากที่สุด) สำหรับปัญหาที่มีการประมาณช่วงเวลา (ความเชื่อมั่น bootstrap ความน่าเชื่อถือหรืออะไรก็ตาม) คำอธิบายที่ดีที่สุด (ถ้ามี) ให้กับนักเรียนคืออะไร? ประเพณีเท่านั้น มุมมองจะได้รับการต้อนรับอย่างมาก



4
คำพูดเหล่านี้มีความเหมาะสมมาก ทุกรุ่นผิด แต่บางรุ่นก็มีประโยชน์
mpiktas

คำตอบ:


60

นี่เป็นความเห็นส่วนตัวของฉันดังนั้นฉันจึงไม่แน่ใจว่าคำตอบนั้นมีคุณสมบัติเหมาะสม

ทำไมเราควรสอนการทดสอบสมมติฐาน

เหตุผลสั้น ๆ ข้อใหญ่อย่างหนึ่งคือในทุกโอกาสที่คุณจะต้องอ่านประโยคนี้มีการทดสอบสมมุติฐานหลายร้อยถ้าไม่นับพัน (หรือหลายล้าน) ภายใต้รัศมี 10 ฟุตที่คุณนั่ง

โทรศัพท์มือถือของคุณจะแน่นอนโดยใช้การทดสอบอัตราส่วนในการตัดสินใจหรือไม่ก็อยู่ในช่วงของสถานีฐาน ฮาร์ดแวร์ WiFi ของแล็ปท็อปของคุณกำลังทำเช่นเดียวกันในการสื่อสารกับเราเตอร์ของคุณ

ไมโครเวฟที่คุณเคยใช้ในการอุ่นเครื่องใหม่โดยอัตโนมัติว่าพิซซ่าอายุสองวันใช้การทดสอบสมมติฐานเพื่อตัดสินใจว่าพิซซ่าของคุณร้อนพอหรือไม่

ระบบควบคุมแรงฉุดของรถเตะเข้ามาเมื่อคุณให้ก๊าซมากเกินไปบนถนนน้ำแข็งหรือระบบเตือนแรงดันลมยางแจ้งให้คุณทราบว่ายางด้านผู้โดยสารด้านหลังของคุณต่ำผิดปกติและไฟหน้าของคุณเข้ามาอัตโนมัติประมาณ 5: 19.00 น. ในเวลาพลบค่ำ

iPad ของคุณกำลังแสดงหน้านี้ในรูปแบบแนวนอนตามการอ่านมาตรความเร่ง (มีเสียงดัง)

บริษัท บัตรเครดิตของคุณปิดบัตรของคุณเมื่อ "คุณ" ซื้อทีวีจอแบนที่ Best Buy ในเท็กซัสและแหวนเพชร $ 2,000 ที่ Zales ในห้างสรรพสินค้าในรัฐวอชิงตันภายในสองชั่วโมงในการซื้ออาหารกลางวันแก๊สและภาพยนตร์ ใกล้บ้านของคุณในเขตชานเมืองพิตส์เบิร์ก

บิตหลายแสนบิตที่ถูกส่งไปแสดงหน้าเว็บนี้ในเบราว์เซอร์ของคุณแต่ละคนได้รับการทดสอบสมมติฐานเพื่อตรวจสอบว่าพวกเขาน่าจะเป็น 0 หรือ 1 (นอกเหนือจากการแก้ไขข้อผิดพลาดที่น่าทึ่ง)

มองไปทางขวาของคุณเพียงเล็กน้อยในหัวข้อ "ที่เกี่ยวข้อง" เหล่านั้น

ทุกสิ่งเหล่านี้ "เกิดขึ้น" เนื่องจากการทดสอบสมมติฐาน สำหรับสิ่งเหล่านี้หลายอย่างการประมาณช่วงเวลาของพารามิเตอร์บางอย่างสามารถคำนวณได้ แต่โดยเฉพาะอย่างยิ่งสำหรับกระบวนการอุตสาหกรรมอัตโนมัติการใช้และความเข้าใจในการทดสอบสมมติฐานเป็นสิ่งสำคัญ


ในระดับสถิติเชิงทฤษฎีมากขึ้นแนวคิดที่สำคัญของกำลังทางสถิติเกิดขึ้นค่อนข้างเป็นธรรมชาติจากกรอบการทดสอบการตัดสินใจเชิงทฤษฎี / สมมุติฐาน นอกจากนี้ฉันเชื่อว่า "แม้แต่" นักคณิตศาสตร์บริสุทธิ์สามารถชื่นชมความงามและความเรียบง่ายของบทแทรกของ Neyman – Pearson และหลักฐานของมัน

นี่ไม่ได้เป็นการบอกว่าการทดสอบสมมติฐานได้รับการสอนหรือเข้าใจดี โดยและขนาดใหญ่ก็ไม่ได้ และในขณะที่ฉันจะยอมรับว่า - โดยเฉพาะอย่างยิ่งในวิทยาศาสตร์การแพทย์ - การรายงานช่วงเวลาประมาณพร้อมกับขนาดและผลของการปฏิบัติกับนัยสำคัญทางสถิติเกือบจะเป็นที่นิยมในระดับสากลมากกว่าการทดสอบสมมติฐานทางการใด ๆ นี่ไม่ได้หมายความว่าการทดสอบสมมติฐาน แนวคิดไม่สำคัญและน่าสนใจในสิทธิของตนเอง


2
ขอบคุณสำหรับรายการตัวอย่างที่น่าสนใจ ด้วยวัตถุประสงค์ของคำถาม: เพื่อสนับสนุนการอภิปรายในการทบทวนหลักสูตรสถิติของเราเราจะพยายามหารายละเอียดเพิ่มเติมเกี่ยวกับการใช้งานการทดสอบในอุปกรณ์ที่ทันสมัยอาจเป็นแรงจูงใจที่ดีสำหรับนักศึกษาวิศวกรรมของเรา
Washington S. Silva

3
ตัวอย่างส่วนใหญ่ของคุณไม่ต้องการการทดสอบสมมติฐานแบบดั้งเดิม (หมายถึงระดับความเชื่อมั่นที่แน่นอน) แต่เป็นขั้นตอนการตัดสินใจ
kjetil b halvorsen

1
เรียน @kjetil: ความอัปยศดูเหมือนที่นี่เล็กน้อยจะซื่อสัตย์ ที่จริงคำถามไม่ได้ถามอะไรที่เฉพาะเจาะจงเกี่ยวกับการทดสอบสมมติฐานแบบคลาสสิกและคำตอบของฉันก็ไม่ได้ทำให้สมมติฐานนั้นเช่นกัน! ( การทดสอบสมมติฐานถูกตีความอย่างกว้างขวางที่นี่และมีเหตุผลที่ดี)
พระคาร์ดินัล

1
ฉันต้องซื้อไมโครเวฟพร้อมอุ่นอัตโนมัติ
jmbejara

2
นี่เป็นคำตอบฝีปากมาก แต่ฉันจะขอบคุณมากถ้าคุณอธิบายเพิ่มเติมเล็กน้อยว่าทำไมสิ่งเหล่านี้ทั้งหมดคือ "การทดสอบสมมติฐาน" ฉันเข้าใจว่าตัวอย่างทั้งหมดของคุณเกี่ยวกับการตัดสินใจแบบไบนารีอัตโนมัติ ฉันคิดว่าในกรณีส่วนใหญ่มีการวัดค่าบางอย่างและเปรียบเทียบกับทางลัดเพื่อตัดสินใจว่ามันสูงกว่าหรือต่ำกว่านั้นหรือไม่ สิ่งนี้มีคุณสมบัติเป็น "การทดสอบสมมติฐาน" สำหรับคุณหรือคุณหมายถึงอย่างอื่นหรือไม่ ฉันเดาว่าเมื่อ OP ถามว่าทำไมการทดสอบสมมติฐานจึงยังคงได้รับการสอนพวกเขาไม่ได้หมายถึงการกำหนดเกณฑ์ขั้นต่ำอย่างง่าย
อะมีบาพูดว่า Reinstate Monica

29

ฉันสอนการทดสอบสมมติฐานด้วยเหตุผลหลายประการ หนึ่งคือประวัติศาสตร์ที่พวกเขาจะต้องเข้าใจร่างใหญ่ของการวิจัยก่อนหน้าพวกเขาอ่านและทำความเข้าใจในมุมมองการทดสอบสมมติฐาน อย่างที่สองก็คือแม้ในยุคปัจจุบันนักวิจัยบางคนยังคงใช้มันโดยปริยายบ่อยครั้งเมื่อทำการวิเคราะห์ทางสถิติชนิดอื่น ๆ

แต่เมื่อฉันสอนฉันจะสอนในกรอบของการสร้างแบบจำลองว่าสมมติฐานและการประมาณการเหล่านี้เป็นส่วนของแบบจำลองอาคาร ด้วยวิธีนี้จึงค่อนข้างง่ายที่จะเปลี่ยนเป็นการเปรียบเทียบแบบจำลองที่ซับซ้อนและน่าสนใจในเชิงทฤษฎีมากกว่า การวิจัยมักจะทำให้ทฤษฎีขัดแย้งกันเองมากกว่าที่จะเป็นทฤษฎีและไม่มีอะไรเลย

ความบาปของการทดสอบสมมติฐานไม่ได้มีอยู่ในคณิตศาสตร์และการใช้การคำนวณเหล่านั้นอย่างเหมาะสม ในกรณีที่พวกเขาโกหกเป็นหลักในการพึ่งพาและตีความผิด หากนักวิจัยไร้เดียงสาส่วนใหญ่ใช้การประมาณแบบช่วงเวลาโดยไม่รับรู้ถึงความสัมพันธ์ใด ๆ กับสิ่งเหล่านี้ที่เราเรียกว่าสมมติฐานเราอาจเรียกว่าบาป


+1 ขอบคุณ เถียงกันดี แต่ในหลักสูตรเบื้องต้นไม่มีการเลือกรูปแบบในแง่ที่เข้มงวด คุณสามารถอ้างอิงบริบทอื่น ๆ ที่เหมาะสมสำหรับการเปิดตัวการทดสอบสมมติฐานได้หรือไม่ เป็นที่ยอมรับได้หรือไม่ที่จะรายงานผลลัพธ์ของการทดสอบโดยไม่มีการประมาณกำลังไฟ?
Washington S. Silva

2
ไม่มีการเลือกรูปแบบในหลักสูตรเบื้องต้นไม่จำเป็น หากคุณกำลังพิจารณาเปลี่ยนหลักสูตรให้ถือว่าเป็นจุดเริ่มต้นที่ดี
จอห์น

20

โดยส่วนตัวฉันรู้สึกว่าเราจะดีกว่าโดยไม่ต้องทดสอบสมมติฐาน ที่เดียวที่ฉันสามารถนึกได้ว่าการทดสอบสมมติฐานนำเสนอบางสิ่งที่ไม่ซ้ำใครและมีประโยชน์อยู่ในขอบเขตของการทดสอบสมมติฐานร่วมกันหลายระดับอย่างอิสระ ตัวอย่างประกอบด้วย ANOVA สำหรับการเปรียบเทียบมากกว่าสองกลุ่มการทดสอบพร้อมกันที่รวมเอฟเฟกต์หลักและการโต้ตอบ (การทดสอบผลกระทบทั้งหมด) และการทดสอบพร้อมกันที่รวมคำเชิงเส้นและไม่เชิงเส้นที่เกี่ยวข้องกับตัวทำนายแบบต่อเนื่อง สำหรับสิ่งที่ง่ายประมาณค่าแบบช่วงเป็นเรื่องง่ายและโอกาสน้อยมากที่จะทำให้เข้าใจผิดกว่า -values ดังที่กล่าวไว้อย่างดีในกระดาษคลาสสิกการขาดหลักฐานไม่ได้เป็นหลักฐานการขาดงานค่า value ขนาดใหญ่ไม่มีข้อมูล P P PPPP- ค่าเพียงให้หลักฐานกับสมมติฐานที่ไม่เคยเห็นด้วยกับมัน (การตอบสนองของชาวประมงเมื่อถูกถามว่าจะตีความขนาดใหญ่ได้อย่างไร - "รับข้อมูลเพิ่มเติม") ความมั่นใจหรือช่วงเวลาที่น่าเชื่อถือทำให้นักวิจัยซื่อสัตย์มากขึ้นโดยอธิบายว่าเธอไม่รู้อะไรมากP


2
ฉันจะไม่ทำเช่นนั้นในบางสาขา "ที่เดียวเท่านั้น ... " และ "รวม ANOVA ... " หมายความว่าคุณได้ครอบคลุมกล่องเครื่องมือทางสถิติจำนวนมหาศาล
Fomite

4
ฉันคิดว่ามีหลายสิ่งที่ต้องพูดสำหรับตำแหน่งนี้ เนื่องจากนักวิจัยหลายคนส่วนใหญ่ต้องการทราบเกี่ยวกับรูปแบบในข้อมูลของพวกเขาฉันมักจะสงสัยว่าถ้าเราสามารถตั้งค่าสถิติจำนวนมากได้อย่างสมเหตุสมผล (แน่นอนว่านี่จะถือว่าแผนการจะทำได้อย่างชาญฉลาดและชาญฉลาดและการทดสอบสมมติฐานจะไม่เลวถ้าเราสามารถพูดได้เกี่ยวกับพวกเขา)
gung - Reinstate Monica

1
จู้จี้จุกจิกฉันไม่เห็นด้วยกับคำพูด "ขาดหลักฐานไม่ใช่หลักฐานขาด" การไม่มีหลักฐานสำหรับผลกระทบนั้นไม่ได้เป็นการพิสูจน์ว่าไม่มีผลกระทบใด ๆ แต่มันก็ถือเป็นหลักฐานที่แสดงถึงผลกระทบที่มีอยู่ คำถามนี้เกี่ยวกับหลักฐานที่มีต่อผลกระทบที่ไม่ได้เกิดขึ้นมากน้อยเพียงใด ปัญหาเกี่ยวกับค่า p ใหญ่ ๆ ที่ฉันคิดว่าคือในกรณีการแจกแจงแบบปกติค่า p ใหญ่ ๆนั้นเป็นหลักฐานสำหรับสมมุติฐาน และเนื่องจากการแจกแจงแบบปกตินั้นเป็นเรื่องธรรมดาผู้คนจึงเห็นสิ่งนี้และคาดการณ์
ความน่าจะเป็นทาง

5
Largeหมายถึงหนึ่งในหลาย ๆ สิ่ง: ความแตกต่างเล็ก, ความแปรปรวนใหญ่เกินไปหรือขนาดตัวอย่างน้อยเกินไป ดังนั้นชื่อเรื่องของการขาดหลักฐาน P
Frank Harrell

11

ฉันคิดว่ามันขึ้นอยู่กับที่การทดสอบสมมติฐานที่คุณกำลังพูดคุยเกี่ยวกับ ว่า "คลาสสิก" การทดสอบสมมติฐาน (Neyman เพียร์สัน) ก็บอกว่าจะมีข้อบกพร่องเพราะมันไม่เหมาะสมสภาพกับสิ่งที่เกิดขึ้นจริงเมื่อคุณได้ทดสอบ มันถูกออกแบบมาเพื่อทำงาน "โดยไม่คำนึงถึง" ของสิ่งที่คุณเห็นในระยะยาว แต่หากไม่มีเงื่อนไขสามารถนำไปสู่ผลลัพธ์ที่ทำให้เข้าใจผิดในแต่ละกรณี นี่เป็นเพียงเพราะขั้นตอน "ไม่สนใจ" เกี่ยวกับแต่ละกรณีในระยะยาว

การทดสอบสมมติฐานสามารถใช้ในกรอบการตัดสินใจเชิงทฤษฎีซึ่งฉันคิดว่าเป็นวิธีที่ดีกว่ามากในการทำความเข้าใจ คุณสามารถทบทวนปัญหานี้ได้สองการตัดสินใจ:

  1. "ฉันจะทำเหมือนกับว่าเป็นจริง"H0
  2. "ฉันจะทำราวกับว่าเป็นจริง"HA

กรอบการตัดสินใจนั้นง่ายต่อการเข้าใจมากขึ้นเพราะมันแยกแนวคิดของ "คุณจะทำอะไร" อย่างชัดเจน และ "ความจริงคืออะไร" (ผ่านข้อมูลก่อนหน้าของคุณ)

คุณสามารถใช้ "ทฤษฎีการตัดสินใจ" (DT) กับคำถามของคุณ แต่เพื่อที่จะหยุดการทดสอบสมมติฐาน DT บอกว่าคุณต้องมีทางเลือกอื่นให้คุณ ดังนั้นคำถามคือหากการทดสอบสมมติฐานถูกยกเลิกจะเกิดอะไรขึ้น ฉันนึกถึงคำตอบของคำถามนี้ไม่ได้ ฉันสามารถคิดถึงวิธีทางเลือกในการทดสอบสมมติฐานเท่านั้น

(หมายเหตุ: ในบริบทของการทดสอบสมมติฐานข้อมูลการกระจายตัวตัวอย่างการแจกแจงก่อนหน้าและฟังก์ชั่นการสูญเสียเป็นข้อมูลก่อนหน้าทั้งหมดเพราะได้รับมาก่อนการตัดสินใจ)


เป้าหมายของฉันคือการรวบรวมความคิดเห็นของผู้เชี่ยวชาญเพื่อเพิ่มการอภิปรายเกี่ยวกับการปรับปรุงหลักสูตรในสถิติที่ดำเนินการต่อเนื่องที่สถาบันที่ฉันทำงานในบราซิล มีการบรรลุวัตถุประสงค์โดยมีความคิดเห็นเช่นเดียวกับ @cardinal, @Andrew Robinson, @probabilityislogic และ @JMS เห็นได้ชัดว่าการทดสอบสมมติฐาน (ผ่าน NP, DT หรือ Byes) ควรได้รับการสอนเป็นอย่างดี แต่ความท้าทายในการสร้างหลักสูตรตามความเหมาะสมเนื่องจากความเป็นสากลของการสอนสถิตินั้นมีความซับซ้อนเท่ากันหรือมีความซับซ้อนมากกว่าเทคนิค ขอขอบคุณสำหรับการสนับสนุนของคุณ.
Washington S. Silva

1
ฉันชอบทฤษฎีการตัดสินใจถ้าทำอย่างเคร่งครัดโดยใช้วิธีเบย์ที่รวมฟังก์ชั่นการสูญเสีย / ยูทิลิตี้ที่สมเหตุสมผล หากฟังก์ชั่นดังกล่าวไม่สามารถใช้ได้ฉันมักจะชอบการประมาณช่วงเวลา
Frank Harrell

@ FrankHarrell - ฉันเห็นด้วย แต่ฉันก็ยังคงประมาณคลาสของช่วงเวลาเป็น "ทฤษฎีการตัดสินใจ" ซึ่งฟังก์ชันยูทิลิตี้มักจะขึ้นอยู่กับเนื้อหาข้อมูล (เช่นข้อสรุปที่ใช้ข้อมูลที่เรามีดีกว่า) - และนี่คือการเพิ่มประสิทธิภาพ โดยการกระจายตัวหลังและอาจเป็นตัวทำนายอนาคตถ้าคำทำนายนั้นเป็นที่สนใจ การประมาณค่าแบบช่วงช่วยให้การสรุปด้านหลังสะดวก และช่วงความเชื่อมั่นที่ดี (เช่นตาม MLE) ให้การประมาณที่ดีมากกับสิ่งนี้เมื่อข้อมูลที่อยู่นอกข้อมูลในมือมีน้อย
ความน่าจะเป็นที่จะเกิดขึ้น

โดยปกติคุณจะใช้การประมาณช่วงเวลาเมื่อคุณไม่มีการตัดสินใจเฉพาะเจาะจง (ซึ่งอาจเป็นสาเหตุหลักที่ทำให้คุณไม่มีฟังก์ชั่นการสูญเสียที่สมเหตุสมผล) และจำเป็นต้องให้ความสำคัญกับสถานการณ์ที่แตกต่างกัน
ความน่าจะเป็นทาง

9

ถ้าฉันเป็นนักเล่นประจำบ่อยๆฉันจะเตือนคุณว่าช่วงความเชื่อมั่นค่อนข้างสม่ำเสมอเพียงแค่ทดสอบสมมติฐานกลับหัวคือเมื่อช่วง 95% เป็นอีกวิธีหนึ่งในการอธิบายประเด็นทั้งหมดที่การทดสอบที่เกี่ยวข้องกับข้อมูลของคุณจะไม่ปฏิเสธที่. 05 ชั้น ในสถานการณ์เหล่านี้การตั้งค่าสำหรับอีกคนหนึ่งเป็นคำถามของการแสดงออกมากกว่าวิธีการ

แน่นอนว่างานนิทรรศการมีความสำคัญ แต่ฉันคิดว่านั่นจะเป็นข้อโต้แย้งที่ดีทีเดียว มันเป็นเรื่องที่ชัดเจนและชัดเจนที่จะอธิบายวิธีการทั้งสองนี้ว่าเป็นการสรุปข้อสรุปเดียวกันจากมุมมองที่ต่างกัน (ความจริงที่ว่าไม่ใช่ตัวประมาณช่วงเวลาทั้งหมดเป็นการทดสอบแบบกลับด้านจึงไม่ใช่ความจริงที่น่าอึดอัดใจ

ความหมายที่รุนแรงมากขึ้นมาจากการตัดสินใจที่จะกำหนดเงื่อนไขในการสังเกตตามที่ระบุไว้ข้างต้น อย่างไรก็ตามแม้ในการล่าถอยบ่อยครั้งผู้สังเกตการณ์ก็สามารถสังเกตได้ว่ามีสถานการณ์มากมาย (อาจไม่ใช่เสียงส่วนใหญ่) ซึ่งการปรับเงื่อนไขในการสังเกตจะไม่ฉลาดหรือไม่แจ่มใส สำหรับการตั้งค่า HT / CI คือ (ไม่ใช่ 'คือ') สิ่งที่ต้องการและควรได้รับการสอนเช่นนี้


การพูดอย่างเป็นทางการการทดสอบสมมติฐานใด ๆ ที่มีค่าอัลฟาผูกกับอัตราข้อผิดพลาด Type I สามารถเปลี่ยนเป็นช่วงความมั่นใจด้วยพารามิเตอร์ความครอบคลุม (1-alpha) และในทางกลับกันไม่มี ฉันไม่คิดว่าคุณจะต้องเป็นนักเล่นตัวจริงไม่ยอมใครง่ายๆที่จะเชื่อว่านี่เป็นคำจำกัดความ :-)
Keith Winstein

3
@ Keith ไม่มีข้อโต้แย้งเกี่ยวกับคำจำกัดความ แต่คุณต้องเป็นผู้ใช้บ่อยในการพิจารณาพวกเขาให้เป็นมากกว่าบิตที่น่าสนใจและมีประโยชน์ของคณิตศาสตร์ นั่นคือถ้าคุณคิดสุ่มตัวอย่างคุณสมบัติตามทฤษฎีมีความสำคัญสำหรับการอนุมานเชิงสถิติแล้วคุณจะ (หรือควร) เป็นอย่างเท่าเทียมกันกระตือรือร้นในช่วงความเชื่อมั่นและการทดสอบสมมติฐานตั้งแต่ที่เราเห็นพวกเขามีความสมมาตรนี้ Mine เป็นคำตอบของผู้ถามที่ขัดแย้งกันระหว่าง 'ดี' CIs และ 'ไม่ดี' HTs ด้วยการจับพวกมันเข้าด้วยกันฉันต้องการหาความแตกต่างที่เกิดขึ้นกับคำตอบอื่น ๆ
conjugateprior

7

ในการสอนการทดสอบสมมติฐานของเนย์แมนเพียร์สันให้กับนักเรียนสถิติช่วงต้นฉันมักจะพยายามหามันในสภาพแวดล้อมดั้งเดิมนั่นคือการตัดสินใจ ดังนั้นโครงสร้างพื้นฐานของข้อผิดพลาดประเภท 1 และประเภท 2 จึงสมเหตุสมผลเช่นเดียวกับแนวคิดที่ว่าคุณอาจยอมรับสมมติฐานว่าง

เราต้องตัดสินใจเราคิดว่าผลลัพธ์ของการตัดสินใจของเราสามารถปรับปรุงได้โดยความรู้เกี่ยวกับพารามิเตอร์เรามีเพียงแค่การประมาณของพารามิเตอร์นั้น เรายังต้องตัดสินใจ ถ้าอย่างนั้นการตัดสินใจที่ดีที่สุดในบริบทของการประมาณค่าพารามิเตอร์คืออะไร?

สำหรับฉันแล้วดูเหมือนว่าในการตั้งค่าดั้งเดิม (การตัดสินใจในหน้าของความไม่แน่นอน) การทดสอบสมมติฐาน NP ทำให้รู้สึกที่สมบูรณ์แบบ ดูเช่น N & P 1933 โดยเฉพาะ p 291

Neyman และ Pearson ในปัญหาของการทดสอบที่มีประสิทธิภาพที่สุดของสมมติฐานทางสถิติ ปรัชญาการทำธุรกรรมของราชสมาคมแห่งลอนดอน ชุด A, เอกสารที่มีลักษณะทางคณิตศาสตร์หรือทางกายภาพ (1933) ฉบับ 231 หน้า 289-337


4

การทดสอบสมมติฐานเป็นวิธีที่มีประโยชน์ในการจัดเฟรมคำถามจำนวนมาก: ผลของการรักษาเป็นศูนย์หรือไม่เป็นศูนย์หรือไม่? ความสามารถระหว่างข้อความเช่นสิ่งเหล่านี้และแบบจำลองทางสถิติหรือขั้นตอน (รวมถึงการสร้างตัวประมาณช่วงเวลา) เป็นสิ่งสำคัญสำหรับผู้ปฏิบัติงานที่ฉันคิดว่า

นอกจากนี้ยังมีการกล่าวถึงช่วงความเชื่อมั่น (ในความหมายดั้งเดิม) ที่ไม่ได้มี "บาปง่าย" น้อยกว่าการทดสอบสมมุติฐาน - นักเรียนที่เรียนรู้เกี่ยวกับคำจำกัดความที่แท้จริงของช่วงความมั่นใจคืออะไร?

บางทีปัญหาอาจไม่ใช่การทดสอบสมมติฐานหรือการประมาณช่วงเวลาเนื่องจากเป็นรุ่นคลาสสิคที่เหมือนกัน สูตร Bayesian หลีกเลี่ยงสิ่งเหล่านี้ได้เป็นอย่างดี


2
@JMS, "นักเรียนอินโทรจำนวนเท่าไหร่รู้คำจำกัดความที่แท้จริงของช่วงความมั่นใจ?" หรือผู้สำเร็จการศึกษาระดับปริญญาเอกด้านสถิติสำหรับเรื่องนั้น
พระคาร์ดินัล

มาก! บังเอิญฉันไม่ได้ตั้งใจจะขุดคุ้ยที่นักเรียนหรือผู้ฝึกสอนในแถบใด ๆ แต่มันบ้าไปหน่อยที่จะคาดหวังว่าจิตยิมนาสติกจากคนที่ไม่ได้สมัครเพื่อทำงานขั้นสูงในด้านสถิติ
JMS

2
มีกี่คนที่สามารถบอกความหมายที่แท้จริงของ CIs ได้? และมีกี่คนที่ใช้พวกเขาอย่างสม่ำเสมอด้วยคำจำกัดความนี้? มันยากเกินไปที่จะไม่คิดว่า "พารามิเตอร์น่าจะอยู่ในช่วงเวลาที่กล่าว" - แม้ว่าคุณจะรู้ว่ามันไม่ใช่ CI ก็ตาม
ความน่าจะเป็นทาง

เป็นส่วนหนึ่งของการทำรายงานตามปกติ
วอชิงตันเอส. ซิลวา

1
สิ่งที่ฉันพยายามแสดงคือการทดสอบสมมติฐานที่ไม่ได้มาพร้อมกับการประมาณการของพลังงานเป็นที่น่าสงสัยมากและการประมาณช่วงเวลานั้นไม่มีแหล่งที่มาของภาวะแทรกซ้อนเพิ่มเติม
Washington S. Silva

2

เหตุผลคือการตัดสินใจ ในการตัดสินใจส่วนใหญ่ทำให้คุณทำหรือไม่ คุณอาจดูช่วงเวลาตลอดทั้งวันในที่สุดมีช่วงเวลาที่คุณตัดสินใจที่จะทำหรือไม่

การทดสอบสมมติฐานตรงกับความเป็นจริงที่เรียบง่ายของ YES / NO

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.