เนื่องจากความคิดเห็นของคุณฉันจะแยกออกเป็นสองส่วน:
P-ค่า
ในการทดสอบสมมติฐานทางสถิติคุณสามารถค้นหา 'หลักฐานทางสถิติ' สำหรับสมมติฐานทางเลือก ดังที่ฉันอธิบายในสิ่งต่อไปนี้หากเราไม่ยอมรับสมมติฐานว่าง มันคล้ายกับ 'พิสูจน์โดยความขัดแย้ง' ในวิชาคณิตศาสตร์
ดังนั้นหากเราต้องการที่จะหาหลักฐานทางสถิติ 'จากนั้นเราคิดตรงข้ามซึ่งเราแสดงของสิ่งที่เราพยายามที่จะพิสูจน์ซึ่งเราเรียกว่าเอช 1 หลังจากนี้เราวาดตัวอย่างและจากตัวอย่างเราคำนวณสถิติทดสอบที่เรียกว่า (เช่นค่า t ในการทดสอบ t)H0H1
จากนั้นเมื่อเราสมมติว่านั้นเป็นจริงและตัวอย่างของเราถูกสุ่มจากการแจกแจงภายใต้H 0เราสามารถคำนวณความน่าจะเป็นของการสังเกตค่าที่สูงกว่าหรือเท่ากับค่าที่ได้จากตัวอย่าง (สุ่ม) ของเรา ความน่าจะเป็นนี้เรียกว่าค่า pH0H0
หากค่านี้เป็น '' พอเพียง '' กล่าวคือมีขนาดเล็กกว่าระดับนัยสำคัญที่เราเลือกไว้เราจะปฏิเสธและเราพิจารณาว่าH 1นั้นคือ 'การพิสูจน์ทางสถิติ'H0H1
มีหลายสิ่งที่สำคัญในการทำเช่นนี้:
- เราได้รับความน่าจะเป็นภายใต้สมมติฐานที่ว่าเป็นจริงH0
- เราได้สุ่มตัวอย่างจากการกระจายที่สันนิษฐานภายใต้H0
- เราตัดสินใจที่จะพบหลักฐานสำหรับหากสถิติการทดสอบที่ได้จากตัวอย่างสุ่มมีความน่าจะเป็นต่ำ ดังนั้นจึงเป็นไปไม่ได้ที่จะเกินในขณะที่H 0เป็นจริงและในกรณีเหล่านี้เราทำข้อผิดพลาดประเภทที่ 1 H1H0
ดังนั้นอะไรคือข้อผิดพลาดแบบที่ 1: ข้อผิดพลาดแบบที่ 1 เกิดขึ้นเมื่อตัวอย่างที่สุ่มมาจากนำไปสู่ข้อสรุปว่าH 0เป็นเท็จในความเป็นจริงขณะที่มันเป็นจริงH0H0
โปรดทราบว่านี่หมายความว่าค่าp ไม่ใช่ความน่าจะเป็นของข้อผิดพลาดประเภทที่ 1 อันที่จริงข้อผิดพลาดประเภทที่ 1 คือการตัดสินใจที่ผิดพลาดโดยการทดสอบและการตัดสินใจสามารถทำได้โดยการเปรียบเทียบค่า p-value กับระดับนัยสำคัญที่เลือกไว้กับค่า p-value เพียงอย่างเดียวอย่างใดอย่างหนึ่งไม่สามารถตัดสินใจได้ p-value ไปยังระดับนัยสำคัญที่เลือกได้ซึ่งการตัดสินใจและตราบใดที่ไม่มีการตัดสินใจข้อผิดพลาดประเภทที่ 1 ก็ยังไม่ถูกกำหนดไว้
ค่า p คืออะไร? การปฏิเสธที่ไม่ถูกต้องของนั้นเกิดจากการที่เราวาดตัวอย่างแบบสุ่มภายใต้H 0ดังนั้นอาจเป็นไปได้ว่าเรามี '' โชคร้าย '' โดยการวาดตัวอย่างและสิ่งที่นำไปสู่ 'โชคร้าย' เป็นการปฏิเสธที่ผิดพลาดของH 0H0H0H0 0ดังนั้นค่า p (แม้ว่านี่จะไม่ถูกต้องทั้งหมด) ก็เหมือนกับความน่าจะเป็นที่จะวาด '' ตัวอย่างที่ไม่ดี '' การตีความที่ถูกต้องของ p-value คือความน่าจะเป็นที่สถิติการทดสอบสูงกว่าหรือเท่ากับค่าของสถิติการทดสอบที่ได้จากตัวอย่างที่สุ่มแบบสุ่มภายใต้H0
อัตราการค้นพบที่ผิด (FDR)
ตามที่อธิบายไว้ข้างต้นในแต่ละครั้งสมมติฐานถูกปฏิเสธพิจารณานี้เป็น 'หลักฐานทางสถิติสำหรับ 1 ดังนั้นเราจึงได้พบความรู้ทางวิทยาศาสตร์ใหม่จึงจะเรียกว่าการค้นพบ อธิบายด้วยข้างต้นคือเราสามารถทำการค้นพบที่ผิดพลาด (เช่นการปฏิเสธH 0 ) เมื่อเราทำข้อผิดพลาดประเภทที่ 1 ในกรณีนี้เรามีความเชื่อผิด ๆ เกี่ยวกับความจริงทางวิทยาศาสตร์ เราต้องการค้นพบสิ่งที่แท้จริงจริง ๆ เท่านั้นดังนั้นเราจึงพยายามทำให้การค้นพบที่ผิดพลาดให้น้อยที่สุดนั่นคือเราจะควบคุมข้อผิดพลาดประเภทที่ 1 มันไม่ได้เป็นเรื่องยากมากที่จะเห็นว่าน่าจะเป็นของความผิดพลาดประเภทคือระดับนัยสำคัญที่เลือกα ดังนั้นเพื่อควบคุมข้อผิดพลาดประเภท I หนึ่งจึงแก้ไขαH1H0αα- ระดับที่สะท้อนถึงความตั้งใจที่จะยอมรับ '' หลักฐานเท็จ ''
โดยสัญชาตญาณนี่หมายความว่าถ้าเราดึงตัวอย่างจำนวนมากและแต่ละตัวอย่างเราทำการทดสอบ ของการทดสอบเหล่านี้จะนำไปสู่ข้อสรุปที่ผิด เป็นสิ่งสำคัญที่จะต้องทราบว่าเรา'เฉลี่ยมากกว่าตัวอย่างจำนวนมาก'; การทดสอบเดียวกันหลายตัวอย่าง α
ถ้าเราใช้ตัวอย่างเดียวกันทำการทดสอบที่แตกต่างกันจำนวนมากเรามีข้อผิดพลาดในการทดสอบหลายครั้ง (ดูที่ anser ของฉันในขอบเขตข้อผิดพลาดที่เหมาะสำหรับครอบครัว: การใช้ชุดข้อมูลอีกครั้งในการศึกษาที่แตกต่างกันของคำถามอิสระ ) ในกรณีนั้นเราสามารถควบคุมอัตราเงินเฟ้อโดยใช้เทคนิคเพื่อควบคุมอัตราความผิดพลาดที่เหมาะกับครอบครัว (FWER)เช่นการแก้ไข Bonferroniα
วิธีการที่แตกต่างกันกว่า FWER คือการควบคุมอัตราการค้นพบที่ผิดพลาด (FDR) ในกรณีนั้นมีการควบคุมจำนวนการค้นพบที่ผิด (FD) ในการค้นพบทั้งหมด (D) ดังนั้นจึงมีการควบคุม , D คือจำนวนของการปฏิเสธH0FDDH0
ดังนั้นความน่าจะเป็นที่ผิดพลาดประเภทที่ 1นั้นเกี่ยวกับการดำเนินการทดสอบเดียวกันกับตัวอย่างที่แตกต่างกันมากมาย สำหรับจำนวนมากของกลุ่มตัวอย่างประเภทที่น่าจะเป็นข้อผิดพลาดที่จะมาบรรจบกันจำนวนตัวอย่างที่นำไปสู่การปฏิเสธเท็จหารด้วยจำนวนของกลุ่มตัวอย่างที่วาด
FDRจะทำอย่างไรกับการทดสอบหลายตัวอย่างเดียวกันและสำหรับจำนวนมากของการทดสอบก็จะมาบรรจบกันกับจำนวนของการทดสอบที่ผิดพลาดประเภทที่ทำ (เช่นจำนวนของการค้นพบที่ผิดพลาด) หารด้วยผลรวมจำนวนการปฏิเสธของH0
โปรดทราบว่าการเปรียบเทียบทั้งสองย่อหน้าข้างต้น:
- บริบทแตกต่างกัน หนึ่งการทดสอบและตัวอย่างจำนวนมากเมื่อเทียบกับการทดสอบจำนวนมากและหนึ่งตัวอย่าง
- ตัวหารสำหรับการคำนวณความน่าจะเป็นที่ผิดพลาดประเภทที่ 1 นั้นแตกต่างจากตัวหารสำหรับการคำนวณ FDR อย่างชัดเจน ตัวเศษมีลักษณะคล้ายกัน แต่มีบริบทที่แตกต่างกัน
FDR บอกคุณว่าถ้าคุณทำการทดสอบหลายอย่างในตัวอย่างเดียวกันและคุณพบ 1,000 การค้นพบ (เช่นการปฏิเสธของ ) จากนั้นด้วย FDR ที่ 0.38 คุณจะมีการค้นพบที่ผิดพลาด0.38 × 1,000H00.38 × 1,000
The p – value represents the probability of making a type I error, or rejecting the null hypothesis when it is true
ค่า p แสดงถึงความน่าจะเป็น apriori ในการสร้างข้อผิดพลาดประเภทที่ 1 นั่นคือการปฏิเสธสมมติฐานว่างภายใต้สมมติฐานที่ว่ามันเป็นความจริง