ฉันอ่านค่า value, อัตราข้อผิดพลาดประเภท 1, ระดับนัยสำคัญ, การคำนวณพลังงาน, ขนาดผลกระทบและการอภิปราย Fisher vs Neyman-Pearson นี่ทำให้ฉันรู้สึกท่วมท้นไปเล็กน้อย ฉันขอโทษสำหรับกำแพงข้อความ แต่ฉันรู้สึกว่าจำเป็นต้องให้ภาพรวมของความเข้าใจปัจจุบันของฉันเกี่ยวกับแนวคิดเหล่านี้ก่อนที่ฉันจะย้ายไปยังคำถามจริงของฉัน
จากสิ่งที่ฉันรวบรวมมาค่าเป็นเพียงการวัดความประหลาดใจความน่าจะเป็นที่จะได้ผลลัพธ์อย่างน้อยที่สุดเท่าที่เป็นไปได้เนื่องจากสมมติฐานว่างเป็นจริง ฟิชเชอร์มีจุดประสงค์เพื่อให้มันเป็นมาตรการต่อเนื่อง
ในกรอบงานของ Neyman-Pearson คุณเลือกระดับนัยสำคัญล่วงหน้าและใช้สิ่งนี้เป็นจุดตัด (โดยพลการ) ระดับนัยสำคัญเท่ากับอัตราข้อผิดพลาดประเภท 1 มันถูกกำหนดโดยความถี่ในระยะยาวเช่นถ้าคุณต้องทำการทดสอบซ้ำ 1,000 ครั้งและสมมติฐานว่างเป็นจริงการประมาณ 50 ของการทดลองเหล่านั้นจะส่งผลอย่างมีนัยสำคัญเนื่องจากความแปรปรวนของการสุ่มตัวอย่าง โดยการเลือกระดับความสำคัญเราจะป้องกันตนเองจากความผิดพลาดเชิงบวกเหล่านี้ด้วยความน่าจะเป็น แบบดั้งเดิมจะไม่ปรากฏในกรอบนี้
หากเราพบค่า 0.01 นี่ไม่ได้หมายความว่าอัตราความผิดพลาดประเภท 1 คือ 0.01 ข้อผิดพลาดประเภท 1 จะถูกระบุเป็นค่าเริ่มต้น ฉันเชื่อว่านี่เป็นหนึ่งในข้อโต้แย้งที่สำคัญในการอภิปราย Fisher vs NP เนื่องจากค่า value มักถูกรายงานเป็น 0.05 *, 0.01 **, 0.001 *** สิ่งนี้อาจทำให้ผู้คนเข้าใจผิดในการบอกว่าผลกระทบมีความสำคัญที่ค่าแทนที่จะเป็นค่านัยสำคัญที่แน่นอนพี
ฉันยังตระหนักว่าค่าเป็นค่าของขนาดตัวอย่าง ดังนั้นจึงไม่สามารถใช้เป็นการวัดแบบสัมบูรณ์ ค่าขนาดเล็กอาจชี้ไปที่ผลขนาดเล็กและไม่เกี่ยวข้องในการทดสอบตัวอย่างขนาดใหญ่ ในการแก้ปัญหานี้เป็นสิ่งสำคัญที่จะทำการคำนวณขนาดกำลังไฟ / เอฟเฟกต์เมื่อพิจารณาขนาดตัวอย่างสำหรับการทดสอบของคุณ บอกเราว่ามีผลหรือไม่ไม่ใช่มีขนาดใหญ่แค่ไหน ดูซัลลิแวน 2012พีพี
คำถามของฉัน: ฉันจะกระทบยอดข้อเท็จจริงที่ว่าค่าเป็นการวัดความประหลาดใจได้อย่างไร (เล็กลง = น่าเชื่อถือยิ่งขึ้น) ในขณะเดียวกันก็ไม่สามารถมองว่าเป็นการวัดที่สมบูรณ์ได้?
สิ่งที่ฉันสับสนเกี่ยวกับคือต่อไปนี้: เราสามารถมั่นใจในเล็กกว่าขนาดใหญ่ได้หรือไม่? ในความรู้สึกของชาวประมงฉันจะบอกว่าใช่เราแปลกใจมากขึ้น ในกรอบการทำงาน NP การเลือกระดับนัยสำคัญที่ต่ำกว่าจะบ่งบอกว่าเรากำลังปกป้องตัวเองอย่างรุนแรงยิ่งขึ้นจากผลบวกที่ผิดพลาด
แต่ในทางกลับกันค่าจะขึ้นอยู่กับขนาดตัวอย่าง พวกเขาไม่ใช่การวัดที่แน่นอน ดังนั้นเราจึงไม่สามารถบอกได้ว่า 0.001593 สำคัญกว่า 0.0439 แต่สิ่งนี้จะบอกเป็นนัยในกรอบของฟิชเชอร์: เราจะต้องประหลาดใจกับมูลค่าที่สูงเช่นนี้ แม้จะมีการอภิปรายเกี่ยวกับคำที่มีความสำคัญสูงในการเป็นผู้เรียกชื่อผิด: มันผิดหรือไม่ที่จะอ้างถึงผลลัพธ์ว่า "สำคัญมาก"?
ฉันได้ยินมาว่าค่าในบางสาขาของวิทยาศาสตร์นั้นถือว่ามีความสำคัญเมื่อมันมีค่าน้อยกว่า 0.0001 ในขณะที่ค่าอื่น ๆ ที่อยู่รอบ ๆ 0.01 นั้นถือว่ามีความสำคัญมาก
คำถามที่เกี่ยวข้อง: