สูตรสำหรับ Benjamini-Hochberg ปรับค่า p เป็นอย่างไร


14

ฉันเข้าใจขั้นตอนและสิ่งที่ควบคุม ดังนั้นสูตรสำหรับค่า p ที่ปรับในขั้นตอน BH สำหรับการเปรียบเทียบหลายรายการคืออะไร


เพียงแค่ตอนนี้ฉันรู้เดิม BH ไม่ได้ผลิตปรับ P-ค่าปรับเท่านั้น (ไม่ใช่) เงื่อนไขการปฏิเสธ: https://www.jstor.org/stable/2346101 Gordon Smyth ได้แนะนำค่า p BH ที่ปรับปรุงใหม่ในปี 2002 อย่างไรก็ตามคำถามยังคงมีอยู่ มันนำมาใช้ในการวิจัยเป็นด้วยวิธีการp.adjustBH

คำตอบ:


6

กระดาษBenjamini & Hochberg (1995) seminal ที่มีชื่อเสียงได้อธิบายขั้นตอนในการยอมรับ / ปฏิเสธสมมติฐานตามการปรับระดับอัลฟ่า ขั้นตอนนี้มีการปฏิรูปที่เทียบเท่ากันอย่างตรงไปตรงมาในแง่ของการปรับค่าแต่ก็ไม่ได้กล่าวถึงในเอกสารต้นฉบับ ตามที่กอร์ดอนเบิร์นเขาแนะนำปรับ -values ในปี 2002 เมื่อการดำเนินการในอาร์ แต่น่าเสียดายที่ไม่มีการอ้างอิงที่สอดคล้องกันจึงได้เสมอไม่ชัดเจนให้ฉันสิ่งหนึ่งที่ควรกล่าวถึงถ้าใครใช้ BH-ปรับ -valuespพีพีpp.adjustp

กลับกลายเป็นว่ามีการอธิบายขั้นตอนในBenjamini, Heller, Yekutieli (2009) :

อีกทางเลือกหนึ่งในการนำเสนอผลลัพธ์ของขั้นตอนนี้คือการนำเสนอค่าปรับค่าแล้ว ปรับค่า BH ถูกกำหนดเป็นpp

p(i)BH=min{minji{mp(j)j},1}.

สูตรนี้ดูซับซ้อนกว่าที่เป็นจริง มันบอกว่า:

  1. ก่อนอื่นสั่งทั้งหมดตั้งแต่เล็กไปหาใหญ่ จากนั้นคูณค่าแต่ละค่าด้วยจำนวนการทดสอบทั้งหมดและหารด้วยลำดับการจัดอันดับppm
  2. ประการที่สองตรวจสอบให้แน่ใจว่าลำดับผลลัพธ์ไม่ได้ลดลง: ถ้ามันเริ่มลดลงให้ก่อนเท่ากับลำดับถัดไป (ซ้ำ ๆ จนกระทั่งลำดับทั้งหมดไม่ลดลง)p
  3. หากค่า -val ใด ๆ มีค่ามากกว่า 1 ให้ทำเท่ากับ 1p

นี่คือการปฏิรูปขั้นตอนการ BH ดั้งเดิมจากปี 1995 ที่ตรงไปตรงมาอาจมีบทความก่อนหน้านี้ที่นำแนวคิดของ BH ที่ปรับค่าใช้อย่างชัดเจนแต่ฉันไม่ทราบเลยp


ปรับปรุง @ Zenit พบว่าYekutieli & Benjamini (1999)อธิบายสิ่งเดียวกันแล้วในปี 1999:

ป้อนคำอธิบายรูปภาพที่นี่


นั่นคือคำตอบที่ฉันคาดหวัง +1 ฉันจำได้ว่าการอ่านเกี่ยวกับการใช้ Gordon Smyth ของค่าp ที่ปรับแล้วเช่นกันและไม่รู้ว่าใครจะพูดอะไรเจ๋งมากที่เห็นว่ามี "แคนนอน" อ้างอิงถึงเรื่องนี้
Firebug

1
ฉันเชื่อว่ามีการอ้างอิงก่อนหน้านี้อยู่: Yekutieli และ Benjamini (1999) (รุ่น pdf มีให้ที่นี่ ) คำจำกัดความ 2.4 อธิบายถึงวิธีการใช้กระบวนการ FDR ดั้งเดิมของ 1995 ในรูปของค่า p ที่ปรับใหม่ เพิ่มเครดิตให้กับโพสต์บล็อกนี้ที่ฉันพบเกี่ยวกับเรื่องนี้
เซนิต

@ Zenit โอ้ว้าว! เยี่ยมมาก! ฉันควรปรับปรุงคำตอบของฉัน
อะมีบาพูดว่า Reinstate Monica

ขอบคุณสำหรับแหล่ง @Zenit! มันแปลกเล็กน้อยว่าวิธีการทางสถิติที่แพร่หลายนั้นไม่มีการอ้างอิงที่รู้จักกันดี
Firebug

8

ก่อนอื่นให้ตอบคำถาม พิจารณาว่าคือค่า (การทดสอบเดี่ยว)เชื่อมโยงกับค่าของสถิติการทดสอบ Benjamini-Hochberg FDR คำนวณได้ในสองขั้นตอน ( = # pvalues , = # pvalues):p0pz0N0 p0N

  • FDR (p0)=p0N0N

  • FDR (pi)=min(FDR(pi),FDR(pi+1))


ทีนี้มาทำความเข้าใจกัน แนวคิดพื้นฐาน (Bayesian) คือการสังเกตมาจากการผสมผสานของการแจกแจงสองแบบ:

  • π0Nการสังเกตจากความหนาแน่นของf0(z)
  • (1π0)Nข้อสังเกตจากความหนาแน่นของทางเลือก(z)f1(z)

สิ่งที่สังเกตได้คือส่วนผสมของสองสิ่งนี้:

  • f(z)=π0f0(z)+(1π0)f1(z)

ป้อนคำอธิบายรูปภาพที่นี่

คำจำกัดความ (Bayesian) คือ:

  • Fdr=π0(1F0(z0))(1F(z)) (เศษของพื้นที่หาง)
  • fdr=π0f0(z0)f(z) (เศษเสี้ยวของความหนาแน่นหาง)

ดังที่แสดงด้านล่าง Fdr เทียบเท่ากับ Benjamini hocherg FDR เมื่อ (ซึ่งเป็นกรณีของการศึกษาชีวสารสนเทศส่วนใหญ่)π01

ป้อนคำอธิบายรูปภาพที่นี่

(อิงจากการอนุมานทางสถิติของ Efron & Tibshirani ของคอมพิวเตอร์อายุ )

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.