d ไพรม์ที่มีความน่าจะเป็น 100% ของอัตราการเข้าชมและความน่าจะเป็นการแจ้งเตือนที่ผิดพลาด 0%


10

ฉันต้องการคำนวณd primeสำหรับภารกิจหน่วยความจำที่เกี่ยวข้องกับการตรวจจับรายการเก่าและใหม่ ปัญหาที่ฉันมีคือบางวิชามีอัตราการเข้าชม 1 และ / หรืออัตราการเตือนที่ผิดพลาดเป็น 0 ซึ่งทำให้ความน่าจะเป็น 100% และ 0% ตามลำดับ

สูตรสำหรับd primeคือd' = z(H) - z(F)ที่ใดz(H)และz(F)เป็นการแปลง z ของอัตราการเข้าชมและการเตือนที่ผิดพลาดตามลำดับ

ในการคำนวณการแปลง z ฉันใช้ฟังก์ชัน Excel NORMSINV (เช่นz(H)=NORMSINV(hit rate)) อย่างไรก็ตามหากอัตราการเข้าชมหรืออัตราการเตือนที่ผิดพลาดเป็น 1 หรือ 0 ตามลำดับฟังก์ชันจะส่งคืนข้อผิดพลาด นี่เป็นเพราะการแปลง z ตามที่ฉันเข้าใจระบุพื้นที่ใต้เส้นโค้ง ROC ซึ่งไม่อนุญาตให้มีความน่าจะเป็นทางคณิตศาสตร์ 100% หรือ 0% ในกรณีนี้ฉันไม่แน่ใจวิธีคำนวณ d 'สำหรับตัวแบบที่มีประสิทธิภาพตามเพดาน

เว็บไซต์หนึ่งแนะนำให้เปลี่ยนอัตรา 1 และ 0 ด้วย 1 - 1 / (2N) และ 1 / 2N โดยที่ N เป็นจำนวนครั้งสูงสุดและการเตือนที่ผิดพลาด เว็บไซต์อื่นบอกว่า "ทั้ง H และ F ไม่สามารถเป็น 0 หรือ 1 (ถ้าเป็นเช่นนั้นให้ปรับขึ้นหรือลงเล็กน้อย)" ดูเหมือนว่าจะไม่มีข้อ จำกัด ใครบ้างมีความคิดเห็นเกี่ยวกับเรื่องนี้หรือต้องการที่จะชี้ให้ฉันไปยังแหล่งข้อมูลที่เหมาะสม?

คำตอบ:


13

Stanislaw & Todorov (1999)มีการอภิปรายที่ดีของนี้ภายใต้หัวข้อHit และเท็จ-Alarm ราคาของศูนย์หรือหนึ่ง

พวกเขาหารือเกี่ยวกับข้อดีข้อเสียของวิธีการต่าง ๆ สำหรับการจัดการกับค่าสุดขีดเหล่านี้ ได้แก่ :

  • ใช้สถิติที่ไม่ใช่พารามิเตอร์เช่นแทนที่จะเป็น (Craig, 1979)d Ad

  • รวบรวมข้อมูลจากหลายวิชาก่อนคำนวณสถิติ (Macmillan & Kaplan, 1985)

  • เพิ่ม 0.5 ทั้งจำนวนการเข้าชมและจำนวนการเตือนที่ผิดพลาดและเพิ่ม 1 ทั้งจำนวนการทดลองสัญญาณและจำนวนการทดลองเสียง ขนานนามว่าloglinear (Hautus, 1995)

  • ปรับเฉพาะค่าสุดขีดโดยแทนที่อัตรา 0 ด้วยและอัตรา 1 ด้วยโดยที่คือจำนวนสัญญาณหรือการทดลองเสียง (Macmillan & Kaplan, 1985)( n - 0.5 ) / n n0.5/n(n0.5)/nn

ในที่สุดทางเลือกขึ้นอยู่กับคุณ ส่วนตัวผมชอบวิธีที่สาม วิธีแรกมีข้อเสียเปรียบที่ตีความได้น้อยกว่าสำหรับผู้อ่านของคุณที่คุ้นเคยกับมากขึ้น วิธีที่สองอาจไม่เหมาะสมหากคุณสนใจในพฤติกรรมที่มีหัวเรื่องเดียว วิธีที่สี่คือเอนเอียงเพราะคุณไม่ได้ปฏิบัติต่อจุดข้อมูลของคุณอย่างเท่าเทียมกันd Ad


MacMillan & Kaplan เป็นข้อมูลอ้างอิงที่ได้รับความนิยม แต่ฉันเชื่อว่ามีนักเขียนชาวกรีกหรือรัสเซียที่มาก่อนพวกเขาสำหรับคำแนะนำเดียวกัน ... ชื่อยาวเกินไปสำหรับฉันที่จะจำ การมองอย่างรวดเร็วของฉันที่ S&T คือมันไม่ครอบคลุมมาก แต่มันเตือนฉันว่าฉันอาจเข้าใจผิดไม่ได้พูดถึง A ' แน่นอนว่าเมื่อคุณทำเช่นนั้นแล้วคุณจะต้องอธิบายความหมายของการสลับไปใช้ที่ไม่ใช่พารามิเตอร์
John

6

ทั้งสองเว็บไซต์เสนอสิ่งเดียวกัน แต่มีวิธีหนึ่งที่จะเลือกจำนวนการปรับค่าอย่างสม่ำเสมอ มีสาเหตุมาจากคนจำนวนมาก แต่ฉันไม่คิดว่าจะมีใครรู้ว่าใครมาก่อน เขตข้อมูลที่แตกต่างกันมีหนังสือน้ำเชื้อที่แตกต่างกันหรือผู้เขียนในการตรวจจับสัญญาณ สิ่งสำคัญคือวิธีการที่คุณเลือกนั้นสมเหตุสมผล

วิธีการหนึ่งที่คุณโพสต์มักใช้เพื่อบอกเป็นนัยว่าหากคุณมีชุดรายการที่ใหญ่กว่า (2N) คุณจะสามารถตรวจพบข้อผิดพลาดอย่างน้อยหนึ่งรายการ หากนี่เป็นวิธีที่เหมาะสมในการคิดเกี่ยวกับปัญหาแสดงว่าคุณทำเสร็จแล้ว ฉันสงสัยว่ามันเป็นการทดสอบหน่วยความจำ ในอนาคตคุณอาจต้องการเพิ่ม N เพื่อประกันสิ่งนี้มีโอกาสน้อยมากที่จะเกิดขึ้น อย่างไรก็ตามวิธีนี้สามารถกู้ได้หากคุณคิดว่าเป็นวิธีที่แตกต่าง คุณกำลังปรับค่าเฉลี่ยของสองหน่วยความจำในจำนวนที่เท่ากัน ในกรณีนี้คุณกำลังบอกว่าในการทดสอบอีกครั้ง (สมมติว่ามีรายการใหม่หรือพวกเขาลืมรายการเก่าทั้งหมด) จะมีข้อผิดพลาด หรือเพียงแค่คุณเลือกครึ่งทางระหว่างคะแนนที่ไม่สมบูรณ์สูงสุดที่คุณสามารถวัดได้และคะแนนที่สมบูรณ์แบบ

นี่เป็นปัญหาที่ไม่มีวิธีแก้ปัญหาสากลที่เรียบง่าย คำถามแรกที่คุณต้องถามคือคุณเชื่อว่าในกรณีของคุณคุณมีการจำแนกที่สมบูรณ์แบบของแท้หรือไม่ ในกรณีนั้นข้อมูลของคุณคือข้อมูลของคุณ ถ้าไม่เช่นนั้นคุณเชื่อว่ามันเป็นเพียงความแปรปรวนในตัวอย่างที่ทำให้จำนวนผู้ชมเป็น 100% เมื่อคุณสรุปได้ว่าเป็นกรณีนี้คุณจะต้องพิจารณาวิธีการที่เหมาะสมเพื่อสร้างการประเมินสิ่งที่คุณเชื่อว่าเป็น ดังนั้นคุณต้องถามตัวเองว่ามันคืออะไร

วิธีที่ง่ายที่สุดในการพิจารณาว่าควรจะดูข้อมูลอื่นในสภาพเดียวกัน คุณอาจประมาณได้ว่าความถูกต้องของผู้เข้าร่วมรายนี้ครึ่งทางระหว่างค่าที่ดีที่สุดถัดไปที่คุณมีกับ 100% (ซึ่งอาจกลายเป็นค่าเดียวกับค่าที่คุณพบ) หรืออาจเป็นจำนวนน้อยกว่ามาก หรืออาจเท่ากับค่าที่ดีที่สุด คุณต้องเลือกสิ่งที่คุณเชื่อว่าเป็นคำตอบที่ดีที่สุดจากข้อมูลของคุณ คำถามที่เจาะจงมากขึ้นที่โพสต์อาจช่วยคุณได้ที่นี่

คุณควรพยายามประกันว่าคุณได้รับผลกระทบเพียงเล็กน้อยต่อเกณฑ์เท่าที่จะทำได้ ในกรณีของคุณการปรับค่าความนิยมและ FAs จะทำให้เกณฑ์ไม่เปลี่ยนเลย อย่างไรก็ตามหากคุณปรับการเข้าชมเมื่อพูด FAs = 0.2 คุณต้องระมัดระวังเกี่ยวกับการปรับที่จะส่งผลต่อการตีความเกณฑ์ คุณมีภาระผูกพันในกรณีนั้นเพื่อให้แน่ใจว่าการเข้าชมนั้นสูงมาก


ขอบคุณสำหรับมุมมองและเหตุผลของคุณจอห์น นั่นช่วยได้จริงๆ ฉันควรจะเพิ่มจำนวนที่เพิ่มขึ้นของ N เป็นวิธีแก้ปัญหาที่ดี แต่งานของเราทำในเครื่องสแกน fMRI และเราถูก จำกัด ด้วยจำนวนการทดลองที่เราสามารถทำให้วิชาทำได้ก่อนที่พวกเขาจะหงุดหงิดและทำลายข้อมูลด้วยการเคลื่อนไหว
A.Rainer

"คุณอาจประมาณว่าความแม่นยำของผู้เข้าร่วมคนนี้เป็นครึ่งทางระหว่างค่าที่ดีที่สุดถัดไปที่คุณมีกับ 100% (ซึ่งอาจกลายเป็นค่าเดียวกับค่าที่คุณพบ)" เป็นคำแนะนำที่ดี สิ่งนี้จะรักษาลำดับของการจัดอันดับของหัวเรื่อง
A.Rainer
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.