คำอธิบายในหน้าอ้างอิงคือ
ภายใต้สมมติฐานว่างความน่าจะเป็นคือเมื่อทั้งการสุ่มข้อมูลและการสุ่มในการจำลองถูกนำมาพิจารณาPr(P≤k/nsim)k/nsim
เพื่อให้เข้าใจสิ่งนี้เราต้องดูรหัสซึ่งมีบรรทัดสำคัญ (ตัวย่อที่ค่อนข้างมาก)
fred <- function(x) {ks.test(...)$statistic} # Apply a statistical test to an array
d.hat <- fred(x) # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
2, fred) # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value
ปัญหาสำคัญคือรหัสไม่ตรงกับใบเสนอราคา เราจะตกลงกันได้อย่างไร หนึ่งความพยายามเริ่มต้นด้วยครึ่งสุดท้ายของใบเสนอราคา เราอาจตีความขั้นตอนดังกล่าวเป็นขั้นตอนต่อไปนี้:
เก็บเป็นอิสระและกันกระจายข้อมูลตามกฎหมายน่าจะเป็นบางGใช้ขั้นตอนการทดสอบ (ดำเนินการในรหัสเป็น) ในการผลิตจำนวนX_n) G t T 0 = t ( X 1 , … , X n )X1,X2,…,XnGtfred
T0=t(X1,…,Xn)
สร้างผ่านคอมพิวเตอร์ชุดข้อมูลเปรียบเทียบแต่ละขนาดตามสมมติฐานกฎหมายว่าด้วยความน่าจะเป็นเรนไฮน์สมัครแต่ละชุดข้อมูลดังกล่าวในการผลิตตัวเลขT_1, n F t N T 1 , T 2 , … , T NN=nsimnFtNT1,T2,…,TN
คำนวณ
P=(∑i=1NI(Ti>T0)+1)/(N+1).
(" " เป็นฟังก์ชันตัวบ่งชี้ที่นำมาใช้โดยการเปรียบเทียบค่าเวกเตอร์ในรหัส) ด้านขวามือถูกเข้าใจว่าสุ่มโดยอาศัยการสุ่มพร้อมกันของ (สถิติการทดสอบจริง) และการสุ่มของ ( สถิติการทดสอบแบบจำลอง) T 0 T ฉันId.star > d.hat
T0Ti
ที่จะบอกว่าข้อมูลที่สอดคล้องกับสมมติฐานคือการยืนยันว่า G เลือกขนาดทดสอบ ,1 คูณทั้งสองข้างด้วยและลบแสดงให้เห็นว่าโอกาสที่ตัวเลขใด ๆเป็นโอกาสที่ไม่เกินของเกินT_0 สิ่งนี้บอกเพียงว่าอยู่ในส่วนบนของชุดการเรียงลำดับของสถิติการทดสอบทั้งหมด ตั้งแต่ (โดยการก่อสร้าง)F=Gα0<α<1N+11P≤αα(N+1)α−1TiT0T0(N+1)αN+1T0เป็นอิสระจากทั้งหมดเมื่อเป็นการกระจายอย่างต่อเนื่องโอกาสนี้จะเป็นเศษส่วนของยอดรวมที่แสดงโดยส่วนจำนวนเต็ม ; นั่นคือและมันจะเท่ากับที่ให้ไว้อย่างแน่นอนเป็นจำนวนเต็ม ; นั่นคือเมื่อ1)TiF⌊(N+1)α⌋(N+1)αkα=k/(N+1)
Pr(P≤α)=⌊(N+1)α⌋N+1≈α
(N+1)αkα=k/(N+1)
นี้อย่างแน่นอนเป็นหนึ่งในสิ่งที่เราต้องการที่จะเป็นจริงของปริมาณใดที่สมควรจะถูกเรียกว่าเป็น "p-value" มันควรจะมีการกระจายชุดบน[0,1]หากมีขนาดค่อนข้างใหญ่ดังนั้นใด ๆ ที่อยู่ใกล้กับเศษส่วนบางส่วนของแบบฟอร์มนี้จะใกล้เคียงกับเครื่องแบบ การกระจาย (หากต้องการเรียนรู้เกี่ยวกับเงื่อนไขเพิ่มเติมที่จำเป็นสำหรับค่า p โปรดอ่านกล่องโต้ตอบที่โพสต์ในหัวข้อค่า p )N + 1 α k / ( N + 1 ) = k / ( n ซิม + 1 ) P[0,1]N+1αk/(N+1)=k/(nsim+1)P
เห็นได้ชัดว่าใบเสนอราคาควรใช้ " " แทน " " ทุกที่ที่ปรากฏn simnsim+1nsim