ทำไมชื่อ Type 1, 2 error


21

อะไรคือแรงจูงใจในการแนะนำระดับเพิ่มเติมของการอ้อมไปจากเชิงพรรณนา 'false positive' ถึงจำนวนเต็ม '1'? 'บวกผิด' ยาวเกินไปจริง ๆ หรือ


10
ฉันอยู่กับคุณมันเป็นชื่อที่น่ากลัว ฉันใช้ทุกโอกาสที่จะไม่ใช้มัน
แมทธิวดรูรี่

5
เหมือนกัน. ฉันจำไม่ได้ว่าอันไหนจนกระทั่งฉันได้ยินวิธีนี้มีประโยชน์อย่างไม่น่าเชื่อที่จะบอกพวกเขาว่าแตกต่างออกไป ... ในเรื่องThe Boy Who Cried Wolfชาวบ้านทำผิดประเภท 1เป็นครั้งแรกและครั้งที่สองทำให้เกิดข้อผิดพลาดประเภท 2
Sam

1
@ Sam ฉันจำได้เหมือนใน " สิ่งแรกที่นักวิจัยทำหลังจากค้นพบเอฟเฟกต์คือการเผยแพร่" แต่ในบานหน้าต่างด้านขวามีลิงค์ไปยังคำถามที่มี 84 upvotes เกี่ยวกับวิธีการจำได้
Vorac

ฉันมักจะพบ 'false positive' และ 'false positive' ทำให้เกิดความสับสนมาก ในยา 'บวก' หมายถึง 'มีสภาพ' (ซึ่งสับสนอยู่แล้วและเป็นที่มาของเรื่องตลกมากมาย) แต่การทดสอบ (สถิติ) ชนิดใดที่ใช้ในการพิจารณาว่าคุณมีอาการหรือไม่ เป็นบวกมีเงื่อนไขเท่ากับการทดสอบถูกปฏิเสธสำหรับสุขภาพ (เช่นการทดสอบในระดับที่มีสุขภาพดีของส่วนประกอบบางอย่างเช่นธาตุเหล็กในเลือด) หรือเท่ากับการทดสอบไม่ถูกปฏิเสธสำหรับความเจ็บป่วย (เช่นการทดสอบเครื่องหมาย ที่บ่งบอกถึงโรคสภาพหรืออย่างอื่นเช่นการตั้งครรภ์)? H 0H0H0
Sextus Empiricus

คำตอบ:


21

เป็นคำถามที่ยอดเยี่ยมกระตุ้นให้ฉันไปที่ Google :) ต่อ Wikipedia (ด้วยการแก้ไขการจัดรูปแบบเล็กน้อย):

ข้อผิดพลาดประเภท I (หรือข้อผิดพลาดชนิดแรก) คือการปฏิเสธสมมติฐานที่ไม่เป็นจริง

ข้อผิดพลาด type II (หรือข้อผิดพลาดของชนิดที่สอง) คือความล้มเหลวในการปฏิเสธสมมติฐานว่างเปล่า

ยิ่งไปกว่าหน้ามันกล่าวถึงนิรุกติศาสตร์:

ในปี 1928 Jerzy Neyman (1894–1981) และ Egon Pearson (2438-2523) นักสถิติที่มีชื่อเสียงทั้งสองพูดคุยถึงปัญหาที่เกี่ยวข้องกับ "การตัดสินใจว่าตัวอย่างที่เฉพาะเจาะจงอาจถูกพิจารณาว่ามีแนวโน้มที่จะถูกสุ่มจากประชากรบางกลุ่ม "...

"... ในการทดสอบสมมติฐานต้องคำนึงถึงสองข้อในการพิจารณา (1) เราจะต้องสามารถลดโอกาสที่จะปฏิเสธสมมติฐานที่แท้จริงให้มีค่าต่ำตามที่ต้องการ (2) การทดสอบจะต้องคิดขึ้นมา จะปฏิเสธสมมติฐานที่ทดสอบเมื่อมีแนวโน้มว่าจะเป็นเท็จ "

พวกเขายังตั้งข้อสังเกตอีกด้วยว่าในการตัดสินใจว่าจะปฏิเสธหรือไม่ยอมรับสมมติฐานที่เฉพาะเจาะจงในหมู่ "ชุดของสมมติฐานทางเลือก", , , . . มันเป็นเรื่องง่ายที่จะทำให้เกิดข้อผิดพลาด:H 2H1H2

"... [และ] ข้อผิดพลาดเหล่านี้จะเป็นสองประเภท:

  • (I) เราปฏิเสธ [นั่นคือสมมติฐานที่จะทดสอบ] เมื่อเป็นจริง H0
  • (II) เราไม่สามารถปฏิเสธ เมื่อสมมติฐานทางเลือกหรือเป็นจริงH A H 1H0HAH1

    ในกระดาษเดียวกันพวกเขาเรียกแหล่งที่มาของข้อผิดพลาดทั้งสองข้อผิดพลาดของประเภทที่ 1 และข้อผิดพลาดของประเภทที่สองตามลำดับ

  • ดังนั้นดูเหมือนว่าข้อผิดพลาดประเภทแรกจะขึ้นอยู่กับงานต้นฉบับของฟิชเชอร์ในการทดสอบที่สำคัญ ข้อผิดพลาดประเภทที่สองนั้นขึ้นอยู่กับการขยายงานของฟิชเชอร์ของเนย์แมนและเพียร์สันกล่าวคือการนำเสนอสมมติฐานทางเลือกและการทดสอบสมมติฐาน ดูที่นี่สำหรับรายละเอียดเพิ่มเติม

    ดูเหมือนว่าลำดับของข้อผิดพลาดเหล่านี้จะระบุตามหมายเลขของพวกเขาตามที่กำหนดโดย Neyman และ Pearson


    1
    เหตุผลทางประวัติศาสตร์ - ไม่น่าแปลกใจ เช่นเดียวกับ<-มาโครการแทนที่ข้อความของ R และ C ++ ขอขอบคุณที่ตอบคำถามที่ได้รับการวิจัยไม่ดีของฉัน และขอขอบคุณ @gung สำหรับการแก้ไขคำถามที่ดี
    Vorac

    3
    "ลำดับที่พวกเขาคิดเกี่ยวกับเรื่องนี้" ได้รับอิทธิพลอย่างมากจากงานก่อนหน้านี้ของฟิชเชอร์หรือไม่? คือจนกระทั่งเนย์แมนและเพียร์สันแนะนำแนวคิดของสมมติฐานทางเลือกว่ามี "ประเภท" ข้อผิดพลาดเพียงอันเดียว (ปฏิเสธ H_0 เมื่อเป็นจริง) พร้อมกับ H_A ความเป็นไปได้ของข้อผิดพลาด "ประเภทที่สอง" มา
    ขับรถเหล็ก

    ฉันแน่ใจว่ามันเป็น
    ilanman

    จุดเล็ก ๆ จุดหนึ่งที่อาจเพิ่มได้คือบทความในปี 1928 เรื่อง"การใช้และการตีความเกณฑ์การทดสอบบางอย่างเพื่อวัตถุประสงค์ของการอนุมานเชิงสถิติ"ยังไม่ได้กำหนดแหล่งที่มาของข้อผิดพลาดที่แตกต่างกันเช่นข้อผิดพลาด 'type I' และ 'type II' (แทนที่จะพูดถึงประเภทที่สั่งเมื่อเกี่ยวข้องกับการแจกจ่ายของ Pearson) มันเป็นในปี 1933 ที่เนย์แมนและเพียร์สันกำหนดไว้เป็นประเภทที่ 1 และประเภทที่สอง
    Sextus Empiricus

    มันจะเป็นการดีที่จะยืดการอ้างอิงด้วยการอ้างอิงที่ถูกต้อง หรืออย่างน้อยที่สุดคำพูดแรก "... ในการทดสอบสมมติฐานการพิจารณาสองข้อ ... " ไม่ใช่จากบทความในปี 1928
    Sextus Empiricus
    โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
    Licensed under cc by-sa 3.0 with attribution required.