เหตุใดยอดสูงสุดของสะพานบราวเนียนจึงมีการกระจาย Kolmogorov – Smirnov?


16

การกระจาย Kolmogorov-Smirnov เป็นที่รู้จักจากการทดสอบ Kolmogorov-Smirnov อย่างไรก็ตามมันยังเป็นการกระจายของยอดสูงสุดของสะพานบราวเนียน

เนื่องจากสิ่งนี้ไม่ชัดเจน (สำหรับฉัน) ฉันจึงขอให้คุณอธิบายอย่างง่าย ๆ เกี่ยวกับความบังเอิญนี้ ยินดีต้อนรับการอ้างอิงยัง


@GaBorgulya: คุณเปลี่ยนอะไร
Rasmus

ดูที่นี่และที่นี่
พระคาร์ดินัล

คำตอบ:


13

nsupx|FnF|=supx|1ni=1nZi(x)|

โดยที่Zi(x)=1XixE[1Xix]

โดย CLT คุณมี Gn=1ni=1nZi(x)N(0,F(x)(1F(x)))

นี่คือสัญชาตญาณ ...

สะพาน Brownianมีความแปรปรวนตัน (1-t) http://en.wikipedia.org/wiki/Brownian_bridgeเปลี่ยนเสื้อจากf (x) นี่สำหรับหนึ่งx ...t ( 1 - t )B(t)t(1t) F ( x ) xtF(x)x

คุณต้องตรวจสอบความแปรปรวนร่วมด้วยดังนั้นจึงเป็นเรื่องง่ายที่จะแสดง (CLT) สำหรับ ( ) โดยที่คือด้วย ,(x_j) ( G n ( x 1 ) , ... , G n ( x k ) ) ( B 1 , ... , B k ) ( B 1 , ... , B k ) N ( 0 , Σ ) Σ = ( σ i j ) σ i j = นาทีx1,,xk(Gn(x1),,Gn(xk))(B1,,Bk)(B1,,Bk)N(0,Σ)Σ=(σij)σij=min(F(xi),F(xj))F(xi)F(xj)

ส่วนที่ยากคือการแสดงให้เห็นว่าการกระจายตัวของข้อ จำกัด นั้นเป็นขั้นสูงสุดของการกระจายตัวของขีด จำกัด ... การเข้าใจว่าทำไมสิ่งนี้เกิดขึ้นต้องใช้ทฤษฎีกระบวนการเชิงประจักษ์บางอย่างการอ่านหนังสือเช่น van der Waart และ Welner (ไม่ใช่เรื่องง่าย) . ชื่อของ Theorem คือ Donsker Theorem http://en.wikipedia.org/wiki/Donsker%27s_theorem ...


เราไม่ควรใช้ CLT กับการกระจายขอบเขต จำกัด ทุกมิติ?
Rasmus

คุณขอคำตอบที่ใช้งานง่าย :) และฉันเลือกที่จะไม่รบกวนคุณด้วยส่วนทางคณิตศาสตร์ที่ยุ่งยากซึ่งแสดงให้เห็นว่าการบรรจบกันของทุกคนหมายถึงการบรรจบกัน (ในกฎหมาย) ของ supremum ... คุณต้องการให้ฉันทำ ตอบไหม
robin girard

เรียนโรบินกีร์ดฉันคิดว่าคำตอบของคุณนั้นดี ขอขอบคุณ!
Rasmus

1
ส่วนที่ยากจริงๆแล้วคือการแสดงการบรรจบที่อ่อนแอ การรวมกันของซูพรีมนั้นตามมาโดยตรงจากทฤษฎีการทำแผนที่แบบต่อเนื่อง ผลลัพธ์นี้สามารถพบได้ใน "Convergence of Probability Measures" ของ Billingsley Van der Vaart และ Wellner ให้ผลลัพธ์ที่
ทั่วถึงกว่าเดิม

@robingirard ฉันเองชอบที่จะเห็น "คำตอบที่สมบูรณ์" กับ "ส่วนทางคณิตศาสตร์ที่ยุ่งยากทั้งหมด"
StatsPlease

6

สำหรับ Kolmogorov-Smirnov ให้พิจารณาสมมติฐานว่าง มันบอกว่าตัวอย่างนั้นมาจากการแจกแจงแบบเจาะจง ดังนั้นถ้าคุณสร้างฟังก์ชันการแจกแจงเชิงประจักษ์สำหรับตัวอย่างในขีด จำกัด ของข้อมูลที่ไม่มีที่สิ้นสุด มาบรรจบกับการแจกแจงพื้นฐานnf(x)=1niχ(,Xi](x)

สำหรับข้อมูล จำกัด มันจะถูกปิด หากหนึ่งในการวัดคือดังนั้นเมื่อฟังก์ชันการแจกแจงเชิงประจักษ์จะเพิ่มขึ้น เราสามารถมองว่าเป็นการเดินแบบสุ่มซึ่งถูก จำกัด ให้เริ่มต้นและสิ้นสุดในฟังก์ชั่นการแจกแจงที่แท้จริง เมื่อคุณรู้ว่าคุณไปค้นวรรณกรรมสำหรับข้อมูลจำนวนมากที่รู้จักกันเกี่ยวกับการเดินแบบสุ่มเพื่อค้นหาว่าการเบี่ยงเบนที่ใหญ่ที่สุดของการเดินนั้นคืออะไรqx=q

คุณสามารถทำแบบเดียวกันกับ norm ใด ๆของความแตกต่างระหว่างฟังก์ชันการแจกแจงเชิงประจักษ์และต้นแบบ สำหรับเรียกว่าการทดสอบ Cramer-von Mises ฉันไม่ทราบชุดของการทดสอบดังกล่าวทั้งหมดสำหรับความเป็นจริงที่เป็นบวกและรูปแบบคลาสที่สมบูรณ์ของทุกชนิด แต่อาจเป็นสิ่งที่น่าสนใจที่จะดูpp=2p

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.