การปรับค่า p สำหรับสถิติ Local Moran I (LISA)


10

ฉันทำงานกับการวิเคราะห์เชิงพื้นที่เชิงสำรวจใน R โดยใช้แพ็คเกจ spdep

ฉันเจอตัวเลือกในการปรับค่าpของตัวบ่งชี้ท้องถิ่นของการเชื่อมโยงเชิงพื้นที่ (LISA) ที่คำนวณโดยใช้localmoranฟังก์ชัน ตามเอกสารนั้นมีวัตถุประสงค์เพื่อ:

... การปรับค่าความน่าจะเป็นสำหรับการทดสอบหลายครั้ง

เพิ่มเติมในเอกสารของp.adjustSPฉันอ่านว่าตัวเลือกที่ใช้ได้คือ:

วิธีการปรับรวมถึงการแก้ไข Bonferroni ('"bonferroni"') ซึ่งค่า p ถูกคูณด้วยจำนวนการเปรียบเทียบ การแก้ไขจารีตน้อยกว่าสี่ประการรวมอยู่ใน Holm (1979) ('' holm ''), Hochberg (1988) ('"hochberg"'), Hommel (1988) ('hommel "') และ Benjamini & Hochberg (1995) ('"fdr"') ตามลำดับ ตัวเลือก pass-through ('"none"') รวมอยู่ด้วย

สี่วิธีแรกถูกออกแบบมาเพื่อให้สามารถควบคุมอัตราความผิดพลาดที่เหมาะสำหรับครอบครัวได้ ดูเหมือนว่าไม่มีเหตุผลที่จะใช้การแก้ไข Bonferroni ที่ไม่ได้แก้ไขเพราะมันถูกครอบงำโดยวิธีการของ Holm ซึ่งก็ใช้ได้ภายใต้สมมติฐานโดยพลการ

วิธีการของ Hochberg และ Hommel นั้นใช้ได้เมื่อการทดสอบสมมติฐานเป็นอิสระหรือเมื่อไม่มีความสัมพันธ์เชิงลบ (Sarkar, 1998; Sarkar and Chang, 1997) วิธีการของ Hommel นั้นทรงพลังกว่าของ Hochberg แต่ความแตกต่างมักจะมีขนาดเล็กและค่า p ของ Hochberg นั้นเร็วกว่าในการคำนวณ

"BH" (aka "fdr") และวิธี "BY" ของ Benjamini, Hochberg และ Yekutieli ควบคุมอัตราการค้นพบที่ผิดซึ่งเป็นสัดส่วนการค้นพบที่ผิดพลาดในสมมติฐานที่ถูกปฏิเสธ อัตราการค้นพบที่ผิดเป็นเงื่อนไขที่เข้มงวดน้อยกว่าอัตราข้อผิดพลาดที่เหมาะกับครอบครัวดังนั้นวิธีการเหล่านี้จึงมีประสิทธิภาพมากกว่าวิธีอื่น

คู่ของคำถามที่ปรากฏ:

  1. กล่าวอย่างชัดเจน - จุดประสงค์ของการปรับตัวนี้คืออะไร
  2. จำเป็นต้องใช้การแก้ไขดังกล่าวหรือไม่?
  3. ถ้าใช่ - วิธีการเลือกจากตัวเลือกที่มีอยู่?

1
ฉันย้ายข้อมูลคำถามนี้ไปแล้วเพราะมีคนจำนวนมากที่พูดถึง CV นี้ ดูสิ่งที่คุณสามารถเรียนรู้จากการค้นหาเช่น
whuber

@whuber ความคิดที่ดี ฉันไม่ได้คิดถึง CV แต่ดูเหมือนว่าจะเป็นบ้านที่ดีกว่าสำหรับมัน ขอบคุณ
radek

คำตอบ:


1

สั้น ๆ ปัญหาที่คุณกำลังเผชิญเรียกว่าการทดสอบสมมติฐานหลาย มันเกิดขึ้นเมื่อคุณกำลังทดสอบตามชื่อบ่งบอกถึงสมมติฐานจำนวนมากในเวลาเดียวกัน

สมมติว่าคุณมีความน่าจะเป็นที่จะปฏิเสธสมมุติฐานว่าง (บวกที่ผิด) สำหรับการทดสอบสมมติว่า 5% เมื่อคุณเพิ่มจำนวนของชุดข้อมูลที่คุณกำลังทดสอบ (ในกรณีนี้แต่ละชุดที่คุณใช้สถิติ Moran ท้องถิ่น) ความน่าจะเป็นที่จะสังเกตในชุดข้อมูลใด ๆ จะมีค่าบวกผิดพลาดเพิ่มขึ้นโดยอิสระจากความน่าจะเป็นที่สังเกต false positive สำหรับชุดข้อมูลเดียวจะเหมือนกัน

มี "การแก้ไข" ที่เป็นไปได้มากมายซึ่งเป็นสิ่งที่คุณพบเพื่อแก้ไขปัญหานี้ หากคุณต้องการสถิติท้องถิ่นคุณไม่สามารถหลบมันได้ มิฉะนั้นคุณสามารถใช้สถิติโลกเป็นสมมติฐานเดียว

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.