ทดสอบสัดส่วนและตัวจําแนกไบนารี


10

ฉันมีเครื่องผลิตชิ้นส่วนต้นแบบ

ในการทดสอบครั้งแรกเครื่องผลิตชิ้นส่วนและลักษณนามไบนารีบอกฉันว่าd 1ส่วนมีข้อบกพร่อง ( d 1 < N 1มักจะวันที่1 / N 1 < 0.01และN 110 4 ) และN 1 - d 1ชิ้นส่วนเป็นสิ่งที่ดีN1d1d1<N1d1/N1<0.01N1104N1d1

จากนั้นช่างเทคนิคจะทำการเปลี่ยนแปลงบางอย่างในเครื่องเพื่อลดจำนวนชิ้นส่วนที่บกพร่อง

ในการทดสอบที่สองและต่อไปนี้การปรับเปลี่ยนเครื่องผลิตชิ้นส่วนและลักษณนามไบนารีเดียวกัน (แตะต้อง) บอกผมว่าd 2ส่วนมีข้อบกพร่องอยู่แล้ววันที่2 / N 2ค่อนข้างคล้ายกับd 1 / N 1N2d2d2/N2d1/N1

ช่างต้องการทราบว่าการเปลี่ยนแปลงของเขามีประสิทธิภาพหรือไม่

สมมติว่าตัวแยกประเภทสมบูรณ์แบบ (ความไวของมันคือ 100% และความเฉพาะเจาะจงของมันคือ 100%) ฉันสามารถทำการทดสอบสัดส่วน (ด้วย R ฉันเพิ่งพิมพ์prop.test(c(d1,d2),c(N1,N2)))

แต่ลักษณนามไม่สมบูรณ์ดังนั้นฉันจะคำนึงถึงความไวและความเฉพาะเจาะจงของลักษณนามทั้งที่ไม่รู้จักเพื่อที่จะตอบช่างเทคนิคได้อย่างไร?


คุณสามารถยืนยันอัตราความแม่นยำของลักษณนามได้หรือไม่?
มิเชล

@ มิเชลฉันรู้โดยไม่มีข้อผิดพลาดและd 2แต่ฉันไม่ทราบว่าชิ้นส่วนที่ชำรุดมีจำนวนเท่าใดที่ไม่ดีเท่าที่ควร d1d2
Alessandro Jacopson

สวัสดีอีกครั้ง. คุณสามารถสุ่มตัวอย่างชิ้นส่วนที่ดีจาก N1 และ N2 แยกกันเพื่อประมาณอัตราการบวกผิด ๆ ได้หรือไม่?
มิเชล

1
ด้วยข้อมูลนี้คุณสามารถใช้วิธีนี้เพื่อเปรียบเทียบการเปลี่ยนแปลงได้หรือไม่ onlinelibrary.wiley.com/doi/10.1002/sim.906/abstractยังดูที่นี่ncbi.nlm.nih.gov/pubmed/18224558และความคิดอื่น ๆ ที่นี่ข้อความแบบเต็ม: stat.colostate.edu/~bradb/papers/lrgraphfinal pdf
Michelle

2
(+1) นี่เป็นคำถามที่ยอดเยี่ยม!
steffen

คำตอบ:


4

ดังนั้นฉันได้รับสิ่งนี้จากหลักการแรกและดังนั้นจึงไม่แน่ใจว่ามันถูกต้อง นี่คือความคิดของฉัน:

แก้ไข: นี่ไม่ถูกต้องมาก่อน ฉันได้ทำการอัพเดทแล้ว

  1. ขอให้แสดงถึงความแตกต่างระหว่างคาดว่าจำนวนจริงบวกจริงวันที่1และการส่งออกจำนวนโดยลักษณนามไบนารีซึ่งเราจะเรียก^ d 1 คุณสามารถวัดสิ่งนี้ด้วยการเรียกใช้ตัวจําแนกของคุณในชุดที่มีป้ายชื่อที่รู้จัก ลบจำนวนบวกที่เกิดขึ้นจริงจากจำนวนบวกที่ผลิตโดยลักษณนามแล้วหารด้วยNที่จะได้รับααd1d1^Nα

  2. ดังนั้นการประมาณจุดสำหรับอัตราส่วนที่แท้จริงของชิ้นส่วนที่บกพร่องจะได้รับจาก: d1N1^=d1+αN1N1

  3. d2N2^=d2+αN2N2

  4. p=p1N1+p2N2N1+N2d1N1^d2N2^p=d1+d2+α(N1+N2)N1+N2

  5. p(1p)(1N1+1N2)

  6. z=d1N1d2N2se

ความคิดบางอย่างเกี่ยวกับการตีความ:

  • p<0

  • อีกวิธีที่จะคิดเกี่ยวกับเรื่องนี้คือถ้าจำนวนของชิ้นส่วนที่บกพร่องอยู่ในระยะขอบของข้อผิดพลาดสำหรับตัวจําแนกแน่นอนว่าเราไม่สามารถบอกได้ว่ามีความแตกต่าง: เราไม่สามารถบอกได้ว่าชิ้นส่วนใด ๆ

α

  • αα

h

  • h2ααh2lowl,lowr)(highl,highr)α(highl,lowr) (ซึ่งมีช่วงเวลาทั้งสองก่อนหน้านี้) ควรเป็น (1-h) * 100% CI สำหรับความแตกต่างของสัดส่วน ... ฉันคิดว่า ...

α


+1 ขอบคุณ ใน 6 คุณเขียนว่า "static" คุณหมายถึง "statistic" หรือไม่?
Alessandro Jacopson

p<00<p<10<p<1

0.01(N1d1)100β=7100ββprop.test(7,100)

@uvts_cvs ใช่นั่นควรจะเป็น "สถิติ" ฉันจะแก้ไขในอีกสักครู่ นอกจากนี้ยังมีการพิมพ์ผิดในการคำนวณข้อผิดพลาดมาตรฐานซึ่งควรเป็น p * (1-p) แทน P ควรเป็น <1 เสมอยกเว้นบางทีหากตัวจําแนกของคุณไม่ดีและ d มีขนาดใหญ่ สำหรับความคิดเห็นที่สามใช่นั่นคือความคิด ฉันไม่แน่ใจว่าจะรวมการประมาณนั้นไว้ในโมเดลได้อย่างไร บางทีคนอื่นที่นี่รู้
John Doucette

αβ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.