Benjamini & Hochberg กำหนดอัตราการค้นพบที่ผิดพลาดในแบบเดียวกับที่ฉันทำเพราะส่วนของการทดสอบในเชิงบวกที่เป็นบวกปลอม ดังนั้นถ้าคุณใช้โพรซีเดอร์สำหรับการเปรียบเทียบหลาย ๆ ครั้งคุณจะควบคุม FDR ได้อย่างถูกต้อง แม้ว่าจะเป็นเรื่องน่าสังเกตว่ามีหลายวิธีในวิธี BH งานสัมมนาของ Benjamini ที่ Berkeley อยู่ใน Youtube และควรค่าแก่การชม:
ฉันไม่แน่ใจว่าทำไม @amoeba กล่าวว่า "นี่เป็นสูตรที่รุนแรงเกินไปและอาจทำให้เข้าใจผิด" ฉันสนใจที่จะรู้ว่าทำไมเขา / เธอจึงคิดเช่นนั้น อาร์กิวเมนต์ที่โน้มน้าวใจมากที่สุดมาจากการทดสอบแบบจำลอง t (ส่วนที่ 6) สิ่งนั้นเลียนแบบสิ่งที่เกือบทุกคนปฏิบัติและแสดงให้เห็นว่าถ้าคุณสังเกต P ใกล้เคียงกับ 0.047 และอ้างว่าได้ค้นพบคุณจะผิดอย่างน้อย 26% ของเวลา มีอะไรผิดพลาด?
แน่นอนฉันไม่ควรอธิบายเรื่องนี้เป็นอย่างน้อย มันคือสิ่งที่คุณจะได้รับถ้าคุณคิดว่ามีโอกาส 50% ที่จะมีผลกระทบที่แท้จริง แน่นอนถ้าคุณสมมติว่าสมมติฐานส่วนใหญ่ของคุณถูกต้องล่วงหน้าคุณจะได้รับ FDR ต่ำกว่า 26% แต่คุณสามารถจินตนาการถึงความฮือฮาที่จะกล่าวอ้างว่าคุณได้ทำการค้นพบบนพื้นฐานของสมมติฐาน คุณแน่ใจแล้ว 90% ล่วงหน้าว่าข้อสรุปของคุณจะเป็นจริง 26% เป็น FDR ขั้นต่ำที่ระบุว่าไม่ใช่พื้นฐานที่สมเหตุสมผลสำหรับการอนุมานที่จะถือว่าความน่าจะเป็นก่อนหน้านี้ที่มากกว่า 0.5
เนื่องจากลางสังหรณ์ไม่บ่อยนักเมื่อทำการทดสอบอาจเป็นไปได้ว่ามีโอกาสเพียง 10% ของสมมติฐานเฉพาะใด ๆ ที่เป็นจริงและในกรณีนั้น FDR จะเป็นความหายนะ 76%
มันเป็นความจริงที่ทั้งหมดนี้เกิดขึ้นกับสมมติฐานว่างว่ามันมีความแตกต่างเป็นศูนย์ (ที่เรียกว่าจุดว่าง) ตัวเลือกอื่นสามารถให้ผลลัพธ์ที่แตกต่าง แต่ประเด็นก็คือสิ่งที่เกือบทุกคนใช้ในชีวิตจริง (แม้ว่าอาจจะไม่ได้ตระหนักถึงมัน) นอกจากนี้ประเด็นที่น่าจะเป็นสิ่งที่ฉันต้องการใช้อย่างสมบูรณ์ บางครั้งก็คัดค้านว่าความแตกต่างที่แท้จริงไม่เคยเป็นศูนย์แน่นอน ฉันไม่เห็นด้วย. เราต้องการบอกว่าผลลัพธ์ของเราไม่ใช่ความแตกต่างจากกรณีที่ทั้งสองกลุ่มได้รับการรักษาเหมือนกันดังนั้นความแตกต่างที่แท้จริงจึงเป็นศูนย์ หากเราตัดสินใจว่าข้อมูลที่ออกมานั้นไม่เข้ากันกับมุมมองนั้นเราจะทำการประมาณขนาดเอฟเฟกต์ และ ณ จุดนั้นเราทำการแยกการตัดสินใจว่าผลกระทบจริงหรือไม่นั้นใหญ่พอที่จะมีความสำคัญในการปฏิบัติบล็อกของเดโบราห์เมโย
@ amoeba ขอบคุณสำหรับการตอบสนองของคุณ
สิ่งที่การอภิปรายเกี่ยวกับบล็อกของ Mayo แสดงให้เห็นว่าส่วนใหญ่มาโยไม่เห็นด้วยกับฉันแม้ว่าเธอจะไม่ได้อธิบายอย่างชัดเจนว่าทำไม สตีเฟ่นเซนน์ชี้ให้เห็นอย่างถูกต้องว่าคุณจะได้รับคำตอบที่แตกต่างออกไปถ้าคุณอ้างถึงการแจกแจงก่อนหน้าที่แตกต่างกัน ที่ดูเหมือนว่าฉันจะน่าสนใจเฉพาะกับ Bayesians ส่วนตัว
แน่นอนว่ามันไม่เกี่ยวข้องกับการฝึกฝนในชีวิตประจำวันซึ่งถือว่าเป็นจุดว่างเสมอ และอย่างที่ฉันอธิบายนั่นดูเหมือนว่าฉันจะเป็นสิ่งที่เหมาะสมที่จะทำ
นักสถิติอาชีพจำนวนมากสรุปเช่นเดียวกับฉัน ลอง Sellke & Berger และ Valen Johnson (อ้างอิงในเอกสารของฉัน) ไม่มีข้อโต้แย้งใด ๆ (หรือต้นฉบับมาก) เกี่ยวกับการเรียกร้องของฉัน
ประเด็นอื่น ๆ ของคุณเกี่ยวกับการคาดการณ์ก่อนหน้านี้ 0.5 ดูเหมือนว่าฉันจะไม่ได้รับการคาดเดาเลย ดังที่ฉันได้อธิบายไว้ข้างต้นสิ่งที่สูงกว่า 0.5 woold นั้นไม่สามารถยอมรับได้ในทางปฏิบัติ และอะไรก็ตามที่ต่ำกว่า 0.5 จะทำให้อัตราการค้นพบที่ผิดพลาดยิ่งสูงขึ้น (เช่น 76% ถ้าก่อนหน้านี้คือ 0.1) ดังนั้นจึงมีเหตุผลอย่างสมบูรณ์ที่จะบอกว่า 26% เป็นอัตราการค้นพบที่ผิดพลาดขั้นต่ำที่คุณสามารถคาดหวังได้หากคุณสังเกต P = 0.047 ในการทดสอบเดียว
ฉันคิดถึงคำถามนี้มากขึ้น คำจำกัดความของ FDR ของฉันเหมือนกับการทดสอบเชิงบวกของ Benjamini ที่เป็นเท็จ แต่มันถูกนำไปใช้กับปัญหาที่แตกต่างกันมากการตีความการทดสอบเดี่ยว ด้วยการเข้าใจถึงปัญหาหลังเหตุการณ์มันอาจจะดีกว่านี้ถ้าฉันเลือกคำอื่น
ในกรณีของการทดสอบเดี่ยว B&H จะไม่เปลี่ยนแปลงค่า P ดังนั้นจึงไม่ได้พูดอะไรเกี่ยวกับอัตราการค้นพบที่ผิดพลาดในแง่ที่ว่าฉันใช้คำนั้น
แน่นอนว่าคุณพูดถูก Benjamini & Hochberg และคนอื่น ๆ ที่ทำงานเกี่ยวกับการเปรียบเทียบหลายจุดมุ่งหมายเพื่อแก้ไขอัตราความผิดพลาดประเภท 1 เท่านั้น ดังนั้นพวกเขาจึงลงท้ายด้วยค่า P ที่ "ถูกต้อง" มันอาจมีปัญหาเช่นเดียวกับค่า P อื่น ๆ ในบทความล่าสุดของฉันฉันเปลี่ยนชื่อจาก FDR เป็น False Positive Risk (FPR) เพื่อพยายามหลีกเลี่ยงความเข้าใจผิดนี้
นอกจากนี้เรายังได้เขียนแอปพลิเคชันเว็บเพื่อทำการคำนวณบางอย่าง (หลังจากสังเกตว่ามีเพียงไม่กี่คนที่ดาวน์โหลดสคริปต์ R ที่เรามีให้) มันอยู่ที่https://davidcolquhoun.shinyapps.io/3-calcs-final/ความคิดเห็นทั้งหมดเกี่ยวกับ itare welcome (โปรดอ่านแท็บ Notes ก่อน)
ป.ล. เครื่องคิดเลขทางเว็บตอนนี้มีใหม่ (ถาวรฉันหวังว่า) ที่http://fpr-calc.ucl.ac.uk/
Shiny.io ใช้งานง่าย แต่มีราคาแพงมากถ้าใครใช้แอปจริง :-(
ฉันกลับไปที่การสนทนาตอนนี้เอกสารฉบับที่สองของฉันในหัวข้อกำลังจะปรากฏใน Science Open Society อยู่ที่https://www.biorxiv.org/content/early/2017/08/07/144337
ฉันตระหนักว่าข้อผิดพลาดที่ยิ่งใหญ่ที่สุดที่ฉันทำไว้ในบทความแรกคือการใช้คำว่า "อัตราการค้นพบที่ผิด (FDR)" ในบทความใหม่ฉันทำให้ชัดเจนยิ่งขึ้นว่าฉันไม่ได้พูดอะไรเกี่ยวกับปัญหาการเปรียบเทียบหลายอย่าง ฉันจัดการเฉพาะกับคำถามว่าจะตีความค่า P ที่สังเกตได้ในการทดสอบที่ไม่เอนเอียงเพียงใด
ในเวอร์ชั่นล่าสุดฉันอ้างถึงความน่าจะเป็นที่ผลลัพธ์นั้นเป็นความเสี่ยงเชิงบวกที่ผิดพลาด (FPR) มากกว่า FDR โดยหวังว่าจะลดความสับสน ฉันยังสนับสนุนวิธีการแบบเบย์แบบย้อนกลับ - ระบุความน่าจะเป็นก่อนหน้านี้ที่จะต้องมีเพื่อให้แน่ใจว่ามี FPR เป็น 5% ถ้าคุณสังเกต P = 0.05 นั่นเท่ากับ 0.87 กล่าวอีกนัยหนึ่งคุณต้องเกือบ (87%) ตรวจสอบให้แน่ใจว่ามีผลจริงก่อนทำการทดสอบเพื่อให้ได้ FPR 5% (ซึ่งเป็นสิ่งที่คนส่วนใหญ่ยังเชื่อว่าผิดพลาด p = 0.05)