ทดสอบการกระจาย bimodal


30

ฉันสงสัยว่ามีการทดสอบทางสถิติเพื่อ "ทดสอบ" ความสำคัญของการกระจาย bimodal หรือไม่ ฉันหมายความว่าข้อมูลของฉันตรงกับการกระจาย bimodal มากแค่ไหน? ถ้าเป็นเช่นนั้นมีการทดสอบในโปรแกรม R หรือไม่?


3
คุณไม่พบคำตอบจากการค้นหาเว็บไซต์ของเรา ? ถ้าไม่ได้มีอะไรขาด
whuber

7
มีการทดสอบสำหรับ bimodality หรือ multimodality แต่พวกเขามักจะเป็นด้านเดียว นั่นคือคุณสามารถสรุปสิ่งต่าง ๆ เช่น "มีโหมดมากกว่าหนึ่งโหมด" แต่คุณไม่สามารถพูดว่า "มีโหมดน้อยกว่าสามโหมด" - คุณสามารถรับขอบเขตที่ต่ำกว่าในจำนวนโหมด แต่คุณไม่สามารถรับขอบเขตที่สูงกว่าเพราะ การกระจายแบบ multimodal ที่มีจำนวนโหมดใด ๆ สามารถพบได้โดยพลการใกล้กับการกระจายแบบมีโหมดจำนวนน้อยกว่า ฉันจะดูว่าฉันสามารถขุดการทดสอบหรือการอ้างอิงที่ชัดเจนได้ไหม
Glen_b -Reinstate Monica

4
หน้าวิกิพีเดียเกี่ยวกับการกระจาย bimodal แสดงการทดสอบแปดรูปแบบสำหรับการใช้งานต่อเนื่องหลายรูปแบบที่มีต่อ unimodalityและการอ้างอิงอุปกรณ์สำหรับเจ็ดรายการ ฉันไม่แน่ใจว่ามีอยู่ในอาร์ฉันจะดู
Glen_b -Reinstate Monica

คำตอบ:


17

แนวทางที่เป็นไปได้อีกวิธีหนึ่งสำหรับปัญหานี้คือการคิดถึงสิ่งที่อาจเกิดขึ้นเบื้องหลังที่สร้างข้อมูลที่คุณเห็น นั่นคือคุณสามารถคิดในแง่ของรูปแบบผสมตัวอย่างเช่นรูปแบบผสมของเกาส์เซียน ตัวอย่างเช่นคุณอาจเชื่อว่าข้อมูลของคุณถูกดึงมาจากประชากรกลุ่มเดียวหรือจากการรวมตัวของการแจกแจงสองแบบปกติ แน่นอนคุณไม่ต้องเชื่อว่ามีเพียงหนึ่งหรือสองและคุณไม่ต้องเชื่อว่าประชากรที่ดึงข้อมูลจะต้องเป็นปกติ

มีแพ็คเกจ R สองชุด (อย่างน้อย) ที่ให้คุณประมาณโมเดลผสม แพคเกจหนึ่งคือflexmixและอีกอย่างก็คือmclust หลังจากที่มีผู้สมัครประมาณสองแบบผมเชื่อว่าเป็นไปได้ที่จะทำการทดสอบอัตราส่วนความน่าจะเป็น อีกวิธีหนึ่งคุณสามารถใช้วิธีการปรับพารามิเตอร์ bootstrap cross-fitting ( pdf )


สวัสดี @gung สำหรับ parametric bootstrap cross-fitting method คุณจะกำหนดเกณฑ์ที่ดีที่สุดสำหรับการกระจาย bimodal อย่างไร อาจมีกรณีที่การแจกแจงการแข่งขันสองรายการข้ามกันที่จุดสองจุด สิ่งที่ควรทำในกรณีเช่นนี้?
akashrajkn

32

ดังที่ได้กล่าวไว้ในความคิดเห็นหน้าวิกิพีเดียใน 'การแจกจ่าย Bimodal' นั้นมีการทดสอบแปดรายการสำหรับการทำสิ่งต่อเนื่องหลายรูปแบบที่มีต่อความผิดพลาดทางเดียวและให้การอ้างอิงสำหรับเจ็ดรายการ

อย่างน้อยก็มีบางอย่างในอาร์ตัวอย่างเช่น:

  1. แพคเกจdiptestใช้การทดสอบการจุ่มของ Hartigan

  2. stampข้อมูลในbootstrapแพคเกจที่ใช้ใน Efron และ Tibshirani ของรู้เบื้องต้นเกี่ยวกับเงินทุน (หนังสือที่แพคเกจจะ based) จะทำตัวอย่างที่เกี่ยวข้องกับการ bootstrapping กับจำนวนของโหมด; หากคุณมีสิทธิ์เข้าถึงหนังสือคุณอาจใช้วิธีการนั้นได้

    Efron, บีและ Tibshirani อาร์ (1993) กล่าวถึงเงินทุน
    แชปแมนและฮอลล์นิวยอร์กลอนดอน

-

มีคำถามเกี่ยวกับ CV ที่พูดถึงการระบุ (เช่นการประมาณค่ามากกว่าการทดสอบ) จำนวนโหมดที่การค้นหาของ @ whuber ปรากฏขึ้น มันคุ้มค่าที่จะอ่านคำตอบที่นั่น หนึ่งในคำตอบที่นั่น (ของฉันเกิดขึ้น) มีลิงก์ไปยังการค้นหาโดย Google ซึ่งเปิดบทความนี้โดย David Donoho ในการสร้าง CIs ด้านเดียวสำหรับจำนวนโหมดซึ่งแน่นอนว่าสามารถใช้เป็นแบบทดสอบ (เช่น หากช่วงเวลาด้านเดียวไม่รวมกรณี unimodal คุณสามารถปฏิเสธ unimodality) ที่ดีที่สุดของความรู้ของฉันที่ไม่ได้เป็นหนึ่งในการทดสอบที่ Wikipedia กล่าวถึง ฉันไม่คิดว่าจะมีการนำไปใช้ R ในช่วงเวลานั้น แต่ (แม้ว่าข้อเท็จจริงที่ว่า Donoho มีแนวโน้มที่จะใช้เครื่องมือที่ค่อนข้างซับซ้อนในการอภิปรายของเขา) มันเป็นความคิดที่ค่อนข้างง่าย แนวคิดนั้นเกี่ยวข้องโดยตรงกับแนวคิดในการใช้การประมาณความหนาแน่นของเคอร์เนล


นั่นเป็นงานที่มีค่า
rolando2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.