ให้บอกว่าฉันมีประชากรตัวอย่างสองตัวหรือมากกว่าของเวกเตอร์ที่มีมูลค่าต่อเนื่องแบบมิติ n มีวิธีที่ไม่ใช้พารามิเตอร์เพื่อทดสอบว่าตัวอย่างเหล่านี้มาจากการแจกแจงแบบเดียวกันหรือไม่? ถ้าเป็นเช่นนั้นจะมีฟังก์ชั่นใน R หรือหลามนี้หรือไม่?
ให้บอกว่าฉันมีประชากรตัวอย่างสองตัวหรือมากกว่าของเวกเตอร์ที่มีมูลค่าต่อเนื่องแบบมิติ n มีวิธีที่ไม่ใช้พารามิเตอร์เพื่อทดสอบว่าตัวอย่างเหล่านี้มาจากการแจกแจงแบบเดียวกันหรือไม่? ถ้าเป็นเช่นนั้นจะมีฟังก์ชั่นใน R หรือหลามนี้หรือไม่?
คำตอบ:
ฉันเพิ่งทำการวิจัยหลายอย่างเกี่ยวกับการทดสอบตัวอย่างหลายตัวแปรสองครั้งเมื่อฉันรู้ว่าการทดสอบ Kolmogorov-Smirnov ไม่ใช่หลายตัวแปร ดังนั้นฉันมองไปที่การทดสอบ Chi, Hotelling ของ T ^ 2, Anderson-Darling, เกณฑ์ Cramer-von Mises, Shapiro-Wilk ฯลฯ คุณต้องระวังเพราะการทดสอบเหล่านี้บางตัวอาศัยเวกเตอร์ที่เปรียบเทียบกับสิ่งเดียวกัน ความยาว. อื่น ๆ ใช้เพื่อปฏิเสธข้อสันนิษฐานของภาวะปกติไม่ใช่เพื่อเปรียบเทียบการแจกแจงตัวอย่างสองแบบ
โซลูชันชั้นนำดูเหมือนจะเปรียบเทียบฟังก์ชั่นการแจกแจงสะสมสองตัวอย่างกับการเรียงลำดับที่เป็นไปได้ทั้งหมดซึ่งในขณะที่คุณอาจสงสัยว่ามีความเข้มข้นในการคำนวณมากตามลำดับนาทีสำหรับการเรียกใช้ตัวอย่างเดี่ยวที่มีเร็กคอร์ดสองสามพันรายการ
https://cran.r-project.org/web/packages/Peacock.test/Peacock.test.pdf
ในฐานะที่เป็นเอกสารประกอบของ Xiao การทดสอบ Fasano และ Franceschini เป็นตัวแปรของการทดสอบ Peacock:
http://adsabs.harvard.edu/abs/1987MNRAS.225..155F
การทดสอบ Fasano และ Franceschini นั้นมีจุดประสงค์เฉพาะเพื่อให้ใช้งานกับการคำนวณน้อยลง แต่ฉันไม่พบการใช้งานของพวกเขาใน R
สำหรับผู้ที่ต้องการสำรวจแง่มุมการคำนวณของการทดสอบ Peacock กับ Fasano และ Franceschini ลองดูอัลกอริทึมที่มีประสิทธิภาพเชิงคำนวณสำหรับการทดสอบ Kolmogorov – Smirnov สองมิติ
R package np (ไม่ใช่พารามิเตอร์) มีการทดสอบความเท่าเทียมกันของความหนาแน่นของข้อมูลอย่างต่อเนื่องและเด็ดขาดโดยใช้ความหนาแน่นกำลังสองรวม Li, Maasoumi และ Racine (2009)
เช่นเดียวกับรูปแบบไฟล์ PDF NP เงื่อนไขในมาตรา 6
ใช่มีวิธีการทดสอบที่ไม่ใช่พารามิเตอร์หากตัวอย่างหลายตัวแปรสองตัวอย่างมาจากการกระจายข้อต่อเดียวกัน ผมจะพูดถึงรายละเอียดไม่รวมคนที่กล่าวถึงโดยL Fischman ปัญหาพื้นฐานที่คุณถามอาจเรียกว่า 'สองตัวอย่าง - ปัญหา' และมีการวิจัยจำนวนมากที่เกิดขึ้นในวารสารเช่นวารสารการเรียนรู้ของการเรียนรู้ด้วยเครื่องจักรและบันทึกสถิติและอื่น ๆ ด้วยความรู้เล็กน้อยของฉันเกี่ยวกับปัญหานี้ฉันสามารถกำหนดทิศทางได้ดังนี้
หากสนใจของคุณคือการเปรียบเทียบชุดจุดต่างๆ (ชุดตัวอย่าง) กับชุดจุดอ้างอิงเพื่อดูว่าพวกเขาอย่างใกล้ชิดใกล้เคียงกับชุดจุดอ้างอิงคุณสามารถใช้F-แตกต่าง
อาจมีวิธีอื่นในการเข้าหาคำตอบนี้ไม่มีทางที่จะรักษาคำถามของคุณได้อย่างสมบูรณ์;)