คำถามติดแท็ก ecdf

7
การทดสอบสมมติฐานการกระจาย - มีจุดประสงค์อะไรถ้าคุณไม่สามารถ“ ยอมรับ” สมมติฐานว่างของคุณได้?
การทดสอบสมมติฐานต่าง ๆ เช่นการทดสอบ GOF, Kolmogorov-Smirnov, Anderson-Darling ฯลฯ ตามรูปแบบพื้นฐานนี้:χ2χ2\chi^{2} H0H0H_0 : ข้อมูลเป็นไปตามการแจกแจงที่กำหนด H1H1H_1 : ข้อมูลไม่เป็นไปตามการแจกแจงที่กำหนด โดยทั่วไปคนหนึ่งประเมินการอ้างสิทธิ์ว่าข้อมูลที่ให้มาบางส่วนมีการแจกแจงที่ให้มาบางส่วนและหากมีใครปฏิเสธข้อมูลนั้นไม่เหมาะสมสำหรับการแจกแจงที่กำหนดในระดับ αH0H0H_0αα\alpha แต่ถ้าเราไม่ปฏิเสธล่ะ ฉันได้รับเสมอสอนว่าหนึ่งไม่สามารถ "ยอมรับ"ดังนั้นโดยทั่วไปเราไม่ได้มีหลักฐานที่จะปฏิเสธH_0นั่นคือไม่มีหลักฐานว่าเราปฏิเสธว่าข้อมูลเป็นไปตามการกระจายที่กำหนดH 0 H 0H0H0H_0H0H0H_0H0H0H_0 ดังนั้นคำถามของฉันคืออะไรคือจุดของการทดสอบดังกล่าวถ้าเราไม่สามารถสรุปได้ว่าข้อมูลตามการกระจายที่กำหนดหรือไม่

5
ประจักษ์ CDF vs CDF
ฉันกำลังเรียนรู้เกี่ยวกับฟังก์ชั่นการกระจายการสะสม Empirical แต่ฉันก็ยังไม่เข้าใจ เหตุใดจึงเรียกว่า 'Empirical' Empirical CDF และ CDF ต่างกันหรือไม่?

1
ทำไม ecdf ใช้ฟังก์ชั่นขั้นตอนและไม่ใช่การแก้ไขเชิงเส้น?
ฟังก์ชั่น CDF เชิงประจักษ์มักจะประมาณโดยฟังก์ชั่นขั้นตอน มีเหตุผลที่ทำเช่นนี้และไม่ใช้การแก้ไขเชิงเส้นหรือไม่ ฟังก์ชันขั้นตอนมีคุณสมบัติทางทฤษฎีที่น่าสนใจซึ่งทำให้เราชอบหรือไม่ นี่คือตัวอย่างของทั้งสอง: ecdf2 <- function (x) { x <- sort(x) n <- length(x) if (n < 1) stop("'x' must have 1 or more non-missing values") vals <- unique(x) rval <- approxfun(vals, cumsum(tabulate(match(x, vals)))/n, method = "linear", yleft = 0, yright = 1, f = 0, ties …
13 r  distributions  ecdf 

1
การบูรณาการ CDF เชิงประจักษ์
ฉันมีการกระจายเชิงประจักษ์ ) ฉันคำนวณมันดังนี้G ( x )G(x)G(x) x <- seq(0, 1000, 0.1) g <- ecdf(var1) G <- g(x) ฉันแสดงว่าคือhคือ pdf ในขณะที่Gคือ cdfh ( x ) = dG / dxh(x)=dG/dxh(x) = dG/dxชั่วโมงhhGGG ตอนนี้ฉันต้องการแก้สมการสำหรับการรวมสูงสุด (พูด, ), ดังนั้นค่าคาดหวังของxคือkบางอันaaaxxxkkk นั่นคือการบูรณาการจากไปขผมควรจะมี∫ x H ( x ) d x = k ฉันต้องการที่จะแก้ปัญหาสำหรับข000bbb∫xh(x)dx=k∫xh(x)dx=k\int xh(x)dx = kbbb เมื่อรวมส่วนต่าง ๆ …
13 r  integral  ecdf 

2
ทางเลือกการกระจายเชิงประจักษ์
เงินรางวัล: เงินรางวัลเต็มจำนวนจะมอบให้กับผู้ที่ให้การอ้างอิงถึงเอกสารเผยแพร่ใด ๆ ที่ใช้หรือกล่าวถึงตัวประมาณF~F~\tilde{F}ด้านล่าง แรงจูงใจ: ส่วนนี้อาจไม่สำคัญสำหรับคุณและฉันสงสัยว่ามันจะไม่ช่วยให้คุณได้รับรางวัล แต่เนื่องจากมีคนถามเกี่ยวกับแรงจูงใจนี่คือสิ่งที่ฉันกำลังทำอยู่ ฉันกำลังทำงานกับปัญหาทฤษฎีกราฟเชิงสถิติ มาตรฐานวัตถุหนาแน่นกราฟ จำกัดW:[0,1]2→[0,1]W:[0,1]2→[0,1]W : [0,1]^2 \to [0,1]เป็นฟังก์ชันสมมาตรในแง่ที่ว่าW(u,v)=W(v,u)W(u,v)=W(v,u)W(u,v) = W(v,u) ) การสุ่มตัวอย่างกราฟบนnnnจุดยอดสามารถคิดได้ว่าเป็นการสุ่มตัวอย่างnnnค่าเครื่องแบบในช่วงหน่วย ( UiUiU_iสำหรับi=1,…,ni=1,…,ni = 1, \dots, n) แล้วน่าจะเป็นของขอบนั้น(i,j)(i,j)(i,j)เป็นW(Ui,Uj)W(Ui,Uj)W(U_i, U_j) ) ให้ถ้อยคำเมทริกซ์ที่เกิดจะเรียกว่าAAA WWW∬ W > 0 f A f f f ∑ A Wf=W/∬Wf=W/∬Wf = W / \iint W∬W>0∬W>0\iint W > 0fffAAAfffffffff∑A∑A\sum AWWW แต่น่าเสียดายที่วิธีการที่ผมพบว่าการแสดงความสอดคล้องเมื่อเราได้ลิ้มลองจากการจัดจำหน่ายที่มีความหนาแน่นฉวิธีสร้างนั้นต้องการให้ฉันสุ่มตารางคะแนน …

1
เหตุใดจึงไม่สามารถสรุปการทดสอบ Kolmogorov-Smirnov เป็น 2 มิติหรือมากกว่าได้
คำถามบอกว่ามันทั้งหมด ฉันได้อ่านทั้งสองอย่างที่ไม่สามารถสรุป KS ให้มีขนาดเท่ากันหรือใหญ่กว่าสองเท่าได้และการใช้งานที่มีชื่อเสียงเช่นนั้นในNumerical Recipesนั้นผิดปกติ คุณช่วยอธิบายได้ว่าทำไมถึงเป็นเช่นนั้น?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.