พลังงานในโปรตีน?


9

แกรนต์มักต้องการการวิเคราะห์พลังงานเพื่อสนับสนุนขนาดตัวอย่างที่เสนอ ในโปรตีโอมิกส์ (และส่วนใหญ่ -omics) มีคุณลักษณะ / ตัวแปร 100 ถึง 1,000 รายการที่วัดจาก 10 ตัวอย่าง (อาจเป็น 100 แต่ไม่น่าเป็นไปได้) นอกจากนี้เป็นที่ทราบกันว่าหน่วยการวัดเหล่านี้บางส่วน (เช่นจำนวนสเปกตรัมของโปรตีน) ไม่ได้มีการแจกจ่ายตามปกติดังนั้นเราจะใช้การทดสอบแบบไม่มีพารามิเตอร์เพื่อการวิเคราะห์ ฉันเห็นพลังของขนาดตัวอย่างที่กำหนดไว้โดยใช้การวัดเดี่ยวและสมมติว่าเป็นการทดสอบ t แต่ฉันไม่คิดว่าสิ่งนี้จะถูกต้องทั้งหมด ปัญหาอีกประการหนึ่งเกี่ยวกับการนับสเปคตรัมโดยเฉพาะคือแต่ละคุณสมบัติ 100 อยู่ในระดับที่แตกต่างกันมากที่มีข้อผิดพลาดแตกต่างกันอย่างมาก (ค่าที่มากขึ้นมีข้อผิดพลาดน้อยกว่า) [ปัญหานี้ได้รับการอธิบายไว้เป็นอย่างดีในโมเดลการเปลี่ยนแปลงการ จำกัด การพับMutch และคณะ, 2002 ]

อะไรจะเป็นวิธีที่เหมาะสมในการกำหนดพลังของขนาดตัวอย่างที่เสนอเนื่องจากสมมติฐานบางอย่างของ FDR และการเปลี่ยนแปลงแบบพับได้ที่ยอมรับได้ การใช้เครื่องมือที่นี่ฉันสามารถระบุได้ดังนี้:

  • 300 ยีน
  • 3 บวกเท็จ
  • 1.4 ความแตกต่างของการพับ
  • 0.8 กำลังที่ต้องการ
  • 0.7 stdev

ต้องการขนาดตัวอย่างต่อกลุ่ม 49

สิ่งนี้มีประโยชน์ตั้งแต่ฉันเสนอการออกแบบ 50v50 รู้ว่า 1.4 การเปลี่ยนแปลงแบบพับได้รับการยอมรับได้สวย 1% FDR นั้นใช้ได้และฉันอาจจะวัดโปรตีน 300 ตัวในการทดลองนี้ ปัญหาของการใช้พลังงานหรือการคำนวณขนาดตัวอย่างจะยังคงเกิดขึ้นดังนั้นจึงเป็นการดีที่จะมีวิธีการอ้างอิงในสถานที่

แก้ไข: ฉันอ่านที่เพื่อนร่วมงานเสนอให้นับจำนวนสเปกตรัมจากการแจกแจงทวินามลบโดยใช้ฟังก์ชันความน่าจะเป็นตามด้วยการทดสอบ Wald โดยทั่วไปใช้ข้อมูลเบื้องต้นเพื่อรับการประมาณค่าความแปรปรวนของโปรตีนจากนั้นคำนวณการเปลี่ยนแปลงรอยพับที่ตรวจพบระหว่างกลุ่มสำหรับแต่ละควอไทล์ นอกจากนี้ยังมีอินพุต FDR (อัลฟา) ดังนั้นด้วยกำลังไฟ> 80% และกำหนดขนาดตัวอย่างพวกมันสามารถตรวจสอบการเปลี่ยนแปลงแบบพับได้ที่ตรวจพบได้สำหรับความแปรปรวนต่ำสุด 25% ความแปรปรวนน้อยลง 50% และความแปรปรวนสูงสุด 25% ปัญหาคือฉันไม่รู้ว่าพวกเขาทำสิ่งนี้อย่างไร ไม่แน่ใจว่าการแบ่งปันวิธีนี้จะช่วยให้ทุกคนได้รับคำตอบหรือไม่


แหล่งข้อมูลอื่นที่ฉันได้พบในหัวข้อนี้: Levin 2011 Dicker et al., 2010
Ben

1
เครื่องคิดเลข MD Anderson นั้นมองในแง่ดีเกินไปสำหรับฉัน มีการเปรียบเทียบกี่รายการ (ฉันมีสนิมมากเกินไปใน microarrays: 300 ยีนในการออกแบบ 50v50 หมายความว่าคุณทำการเปรียบเทียบกี่ครั้ง ??) เมื่อคุณตั้งค่าเครื่องคิดเลข FDR เป็น 3 ผลบวกปลอมคุณกำลังบอกว่าคุณกำลังตั้งข้อผิดพลาดเชิงบวกผิดดังนั้น 3 คาดว่าจะเป็นผลบวกปลอมภายใต้ null? นั่นเข้มงวดเกินไปสำหรับการเปรียบเทียบมากกว่า 60 รายการ
AdamO

1
ฉันสามารถแสดงให้คุณเห็นว่าจะทำอย่างไรใน R แต่ฉันต้องการภูมิหลังทางชีววิทยา
AdamO

คำตอบ:


1

ในแอพพลิเคชั่น (โดยเฉพาะอย่างยิ่งแอพพลิเคชั่นทางจริยธรรมที่คุณต้องทำการศึกษาเกี่ยวกับพลังงาน) ฉันชอบใช้การอ้างอิงนี้ [Wang and Chen 2004] เพราะมันอธิบายแนวคิดที่อยู่เบื้องหลังการคำนวณกำลังไฟสำหรับข้อมูลความเร็วสูงได้อย่างดี .

ในสาระสำคัญนอกเหนือจากพารามิเตอร์ปกติ (α, β, N, ขนาดเอฟเฟกต์) คุณใช้พารามิเตอร์เพิ่มเติมสองตัวคือλและη ส่วนหลัง, η, เป็นหมายเลขที่สันนิษฐานว่าเป็นยีนที่มีการเปลี่ยนแปลงอย่างแท้จริงและλเป็นส่วนของยีนที่เปลี่ยนแปลงอย่างแท้จริงที่คุณต้องการตรวจจับได้ ค่อนข้างตรงไปตรงมาที่จะขยายการคำนวณพลังงานใด ๆ ที่รู้จักกันเป็นข้อมูลความเร็วสูงโดยใช้วิธีการนี้

วัง, ซู - เจน, และเจมส์เจเฉิน "ขนาดตัวอย่างสำหรับการระบุยีนที่แสดงออกแตกต่างกันในการทดลองแบบ microarray" วารสารชีววิทยาการคำนวณ 11.4 (2004): 714-726

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.