CDF สองตัวอย่างของและจากการทดสอบ Kolmogorov-Smirnov ด้านเดียวคืออะไร


9

ฉันพยายามที่จะเข้าใจวิธีการรับค่าสำหรับการทดสอบ Kolmogorov-Smirnov ด้านเดียวและฉันพยายามหา CDF สำหรับและในกรณีตัวอย่างสองตัวอย่าง ด้านล่างนี้ถูกอ้างถึงในบางแห่งเนื่องจาก CDF สำหรับในกรณีตัวอย่างเดียว:pDn1,n2+Dn1,n2Dn+

pn+(x)=P(Dn+x|H0)=xj=0n(1x)(nj)(jn+x)j1(1xjn)nj

นอกจากนี้ whuber sez มีสูตรที่แตกต่างกันเล็กน้อยของ CDF ตัวอย่างหนึ่งนี้ (ฉันแทนxสำหรับtในเครื่องหมายคำพูดของเขาเพื่อความสอดคล้องกับสัญกรณ์ของฉันที่นี่):

การใช้การแปลงค่าความน่าจะเป็นแบบครบวงจร, Donald Knuth ได้มาจากการแจกแจง (ร่วมกัน) บน p 57 และออกกำลังกาย 17 ของTAoCPเล่ม 2 ฉันพูด:

(Dn+xn)=xnnckx(nk)(kx)k(x+nk)nk1

สิ่งนี้จะนำไปใช้กับสมมติฐานด้านเดียวในกรณีตัวอย่างหนึ่งตัวอย่างเช่น: H 0F(x)F00โดยที่F(x)คือ CDF เชิงประจักษ์ ของxและF0เป็น CDF บางส่วน

ฉันคิดว่าxในกรณีนี้คือค่าของDn+ในกลุ่มตัวอย่างหนึ่งของและที่n(1x)เป็นเลขที่ใหญ่ที่สุดในN-NXnnx(นั่นถูกต้องใช่ไหม?)

แต่ CDF สำหรับ (หรือ ) เมื่อมีสองตัวอย่าง? ตัวอย่างเช่นเมื่อ Hสำหรับ CDFs เชิงประจักษ์ของและ ? วิธีการขอรับ ?Dn1,n2+Dn1,n20FA(x)FB(x)0ABpn1,n2+


1
เช่นเดียวกับตัวชี้สำหรับทุกคนที่มองหาการตอบคำถามนี้ - คำตอบของคำถามก่อนหน้าของ Alexis (ซึ่งเชื่อมโยงในคำถามข้างต้น) มีลิงก์ไปยังการอ้างอิงหลายรายการพร้อมการอภิปรายเกี่ยวกับประวัติศาสตร์แต่ละรายการมีการอ้างอิงที่เกี่ยวข้องจำนวนหนึ่ง คุณอาจต้องการตรวจสอบเอกสารเหล่านั้นและรายการอ้างอิงของพวกเขา
Glen_b -Reinstate Monica

@Glen_b ขอบคุณ! ฉันขอขอบคุณคำตอบที่ยอดเยี่ยมของคุณสำหรับคำถามอื่น ๆ ของฉันและทำตามแหล่งข้อมูลที่อ้างถึง แต่ฉันไม่มีแรงฉุด CDF สำหรับนั่นและแทนที่จะกำจัดความคิดเห็นที่ฉันคิดว่าฉันจะเปิดแบบสอบถามใหม่ . ยินดีต้อนรับการอ้างอิงเพิ่มเติมหากคุณรู้ว่าสิ่งใดจะทำงานได้ D+
Alexis

Alexis: คำวิจารณ์ของฉันไม่ได้มีไว้สำหรับความคิดเห็นของฉัน คุณเลือกที่จะเปิดคำถามใหม่นั้นถูกต้อง (ในความคิดของฉัน) ฉันแค่อยากจะช่วยคนทำงานเล็ก ๆ น้อย ๆ ในการติดตามข้อมูลอ้างอิงที่เกี่ยวข้องบางอย่างฉันคิดว่ามันอาจไม่เกิดขึ้นกับทุกคนที่จะติดตามลิงก์ของคุณไปยังคำถามอื่นและอาจไม่เกิดขึ้นกับคนที่ทำลิงก์ใน คำตอบมีการอ้างอิงบางอย่างที่พวกเขาอาจต้องการทราบ
Glen_b -Reinstate Monica

คำตอบ:


6

ตกลงฉันจะไปแทงที่นี่ ยินดีต้อนรับข้อมูลเชิงลึกที่สำคัญ

บนหน้า 192 ชะนีและ Chakraborti (1992) อ้างฮอดจ์ 1958 เริ่มต้นที่มีขนาดเล็กตัวอย่าง (แน่นอน?) CDF สำหรับการทดสอบสองด้าน (ฉันกำลังแลกเปลี่ยนของพวกเขาและสัญกรณ์สำหรับและตามลำดับ):m,ndn1,n2x

P(Dn1,n2x)=1P(Dn1,n2x)=1A(n1,n2)(n1+n2n1)

ที่ถูกสร้างผ่านการแจกแจงเส้นทาง (เพิ่มความซ้ำซากในและ ) จากจุดเริ่มต้นไปยังจุดผ่านกราฟด้วย - การแทนที่สำหรับ - ค่าของx -axis และy -axis คือและขวา) เส้นทางต้องปฏิบัติตามข้อ จำกัด ของการอยู่ในขอบเขต (โดยที่คือค่าของสถิติทดสอบ Kolmogorov-Smirnov):A(n1,n2)n1n2(n1,n2)Sm(x)Fn1(x)n1F1(x)n2F2(x)x

n2n1±(n1+n2)x(n1+n2n1)

ด้านล่างเป็นรูปที่ 3.2แสดงตัวอย่างสำหรับโดยมี 12 เส้นทางดังกล่าว:A(3,4)

รูปที่ 3.2 จากหน้า 193 ของ Gibbons และ Chakraborti (1992) การอนุมานเชิงสถิติแบบไม่อิงพารามิเตอร์

ชะนีและ Chakaborti กล่าวต่อไปว่าค่าด้านเดียว นั้นใช้วิธีกราฟิกแบบเดียวกัน แต่มีขอบเขตล่างสำหรับและเฉพาะ ด้านบนสำหรับ{2}}pDn1,n2+Dn1,n2

ตัวอย่างเล็ก ๆ น้อย ๆ เหล่านี้นำมาซึ่งขั้นตอนวิธีการแจงนับเส้นทางและ / หรือความสัมพันธ์ที่เกิดซ้ำซึ่งไม่ต้องสงสัยทำให้การคำนวณซีมโทติคที่น่าสงสัย ชะนีและ Chakraborti ยังบันทึกการ จำกัด CDFs เป็นและวิธีอนันต์ของ :n1n2Dn1,n2

limn1,n2P(n1n2n1+n2Dn1,n2x)=12i=1(1)i1e2i2x2

และให้ CDF ที่ จำกัด ของ (หรือ ) เป็น:Dn1,n2+Dn1,n2

limn1,n2P(n1n2n1+n2Dn1,n2+x)=1e2x2

เนื่องจากและเป็นแบบไม่ลบอย่างเคร่งครัด CDF จึงสามารถรับค่าที่ไม่ใช่ศูนย์เหนือ :D+D[0,)

CDF ของ $ D ^ {+} $ (หรือ $ D ^ {-} $)


การอ้างอิง
Gibbons, JD และ Chakraborti, S. (1992) nonparametric สถิติอนุมาน Marcel Decker, Inc. , รุ่นที่ 3, ฉบับปรับปรุงและขยาย

Hodges, JL (1958) ความน่าจะเป็นที่มีนัยสำคัญของการทดสอบสองตัวอย่างของ Smirnov Arkiv för matematik 3 (5): 469--486


1
มี cdf จริงอยู่ทุกที่ แต่สำหรับ cdf จะเป็นศูนย์ แบบฟอร์มการทำงานที่คุณให้ใช้กับ (นี่คือการแก้ปัญหาแบบง่ายๆเหตุผลคืออะไร ?(,0)x0P(D+<0)
Glen_b
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.