ฉันสงสัยว่ามีการทดสอบทางสถิติเพื่อ "ทดสอบ" ความสำคัญของการกระจาย bimodal หรือไม่ ฉันหมายความว่าข้อมูลของฉันตรงกับการกระจาย bimodal มากแค่ไหน? ถ้าเป็นเช่นนั้นมีการทดสอบในโปรแกรม R หรือไม่?
ฉันสงสัยว่ามีการทดสอบทางสถิติเพื่อ "ทดสอบ" ความสำคัญของการกระจาย bimodal หรือไม่ ฉันหมายความว่าข้อมูลของฉันตรงกับการกระจาย bimodal มากแค่ไหน? ถ้าเป็นเช่นนั้นมีการทดสอบในโปรแกรม R หรือไม่?
คำตอบ:
แนวทางที่เป็นไปได้อีกวิธีหนึ่งสำหรับปัญหานี้คือการคิดถึงสิ่งที่อาจเกิดขึ้นเบื้องหลังที่สร้างข้อมูลที่คุณเห็น นั่นคือคุณสามารถคิดในแง่ของรูปแบบผสมตัวอย่างเช่นรูปแบบผสมของเกาส์เซียน ตัวอย่างเช่นคุณอาจเชื่อว่าข้อมูลของคุณถูกดึงมาจากประชากรกลุ่มเดียวหรือจากการรวมตัวของการแจกแจงสองแบบปกติ แน่นอนคุณไม่ต้องเชื่อว่ามีเพียงหนึ่งหรือสองและคุณไม่ต้องเชื่อว่าประชากรที่ดึงข้อมูลจะต้องเป็นปกติ
มีแพ็คเกจ R สองชุด (อย่างน้อย) ที่ให้คุณประมาณโมเดลผสม แพคเกจหนึ่งคือflexmixและอีกอย่างก็คือmclust หลังจากที่มีผู้สมัครประมาณสองแบบผมเชื่อว่าเป็นไปได้ที่จะทำการทดสอบอัตราส่วนความน่าจะเป็น อีกวิธีหนึ่งคุณสามารถใช้วิธีการปรับพารามิเตอร์ bootstrap cross-fitting ( pdf )
ดังที่ได้กล่าวไว้ในความคิดเห็นหน้าวิกิพีเดียใน 'การแจกจ่าย Bimodal' นั้นมีการทดสอบแปดรายการสำหรับการทำสิ่งต่อเนื่องหลายรูปแบบที่มีต่อความผิดพลาดทางเดียวและให้การอ้างอิงสำหรับเจ็ดรายการ
อย่างน้อยก็มีบางอย่างในอาร์ตัวอย่างเช่น:
แพคเกจdiptest
ใช้การทดสอบการจุ่มของ Hartigan
stamp
ข้อมูลในbootstrap
แพคเกจที่ใช้ใน Efron และ Tibshirani ของรู้เบื้องต้นเกี่ยวกับเงินทุน (หนังสือที่แพคเกจจะ based) จะทำตัวอย่างที่เกี่ยวข้องกับการ bootstrapping กับจำนวนของโหมด; หากคุณมีสิทธิ์เข้าถึงหนังสือคุณอาจใช้วิธีการนั้นได้
Efron, บีและ Tibshirani อาร์ (1993) กล่าวถึงเงินทุน
แชปแมนและฮอลล์นิวยอร์กลอนดอน
-
มีคำถามเกี่ยวกับ CV ที่พูดถึงการระบุ (เช่นการประมาณค่ามากกว่าการทดสอบ) จำนวนโหมดที่การค้นหาของ @ whuber ปรากฏขึ้น มันคุ้มค่าที่จะอ่านคำตอบที่นั่น หนึ่งในคำตอบที่นั่น (ของฉันเกิดขึ้น) มีลิงก์ไปยังการค้นหาโดย Google ซึ่งเปิดบทความนี้โดย David Donoho ในการสร้าง CIs ด้านเดียวสำหรับจำนวนโหมดซึ่งแน่นอนว่าสามารถใช้เป็นแบบทดสอบ (เช่น หากช่วงเวลาด้านเดียวไม่รวมกรณี unimodal คุณสามารถปฏิเสธ unimodality) ที่ดีที่สุดของความรู้ของฉันที่ไม่ได้เป็นหนึ่งในการทดสอบที่ Wikipedia กล่าวถึง ฉันไม่คิดว่าจะมีการนำไปใช้ R ในช่วงเวลานั้น แต่ (แม้ว่าข้อเท็จจริงที่ว่า Donoho มีแนวโน้มที่จะใช้เครื่องมือที่ค่อนข้างซับซ้อนในการอภิปรายของเขา) มันเป็นความคิดที่ค่อนข้างง่าย แนวคิดนั้นเกี่ยวข้องโดยตรงกับแนวคิดในการใช้การประมาณความหนาแน่นของเคอร์เนล