คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

2
การทดสอบหลังการทดสอบสำหรับการทดสอบความดีแบบไคสแควร์
ฉันทำการทดสอบความดีของพอดี (GOF) ของไคสแควร์ด้วยสามประเภทและต้องการทดสอบโมฆะโดยเฉพาะว่าสัดส่วนประชากรในแต่ละหมวดหมู่เท่ากัน (กล่าวคือสัดส่วน 1/3 ในแต่ละกลุ่ม): กลุ่ม ข้อมูล OBSERVED 1 กลุ่ม 2 กลุ่ม 3 รวม 686 928 1012 2626 ดังนั้นสำหรับการทดสอบ GOF นี้การนับที่คาดหวังคือ 2626 (1/3) = 875.333 และการทดสอบให้ค่าp - value ที่สำคัญมากที่<0.0001 ตอนนี้มันชัดเจนว่ากลุ่ม 1 แตกต่างอย่างมากจาก 2 และ 3 และไม่น่าเป็นไปได้ที่ 2 และ 3 จะแตกต่างกันอย่างมีนัยสำคัญ อย่างไรก็ตามถ้าฉันต้องการทดสอบทั้งหมดอย่างเป็นทางการและสามารถให้ค่าpสำหรับแต่ละกรณีวิธีการที่เหมาะสมจะเป็นอย่างไร ฉันค้นหาทั่วออนไลน์และดูเหมือนว่ามีความคิดเห็นที่แตกต่างกัน แต่ไม่มีเอกสารที่เป็นทางการ ฉันสงสัยว่ามีข้อความหรือเอกสารที่ผ่านการตรวจสอบโดยเพื่อนที่ระบุสิ่งนี้ สิ่งที่สมเหตุสมผลสำหรับฉันคือการทดสอบโดยรวมที่สำคัญเพื่อทดสอบzสำหรับความแตกต่างในแต่ละคู่ของสัดส่วนอาจมีการแก้ไขค่า (อาจ Bonferroni เช่น)αα\alpha

2
ทดสอบการสุ่มตัวอย่าง IID
คุณจะทดสอบหรือตรวจสอบว่าการสุ่มตัวอย่างเป็น IID (เป็นอิสระและกระจายตัวเหมือนกัน) โปรดทราบว่าฉันไม่ได้หมายถึง Gaussian และการกระจายแบบเหมือนจริงเพียง IID และความคิดที่อยู่ในใจของฉันคือการแบ่งตัวอย่างซ้ำ ๆ เป็นสองตัวอย่างย่อยที่มีขนาดเท่ากันทำการทดสอบ Kolmogorov-Smirnov และตรวจสอบว่าการกระจายตัวของค่า p มีค่าเท่ากันหรือไม่ ความคิดเห็นใด ๆ เกี่ยวกับวิธีการนั้นและข้อเสนอแนะใด ๆ ยินดีต้อนรับ ความชัดเจนหลังจากเริ่มรับรางวัล: ฉันกำลังมองหาการทดสอบทั่วไปที่สามารถนำไปใช้กับข้อมูลอนุกรมที่ไม่ใช่เวลา

1
การทดสอบสมมติฐานตามลำดับในวิทยาศาสตร์ขั้นพื้นฐาน
ฉันเป็นเภสัชกรและจากประสบการณ์ของฉันเอกสารเกือบทั้งหมดในการวิจัยทางชีวการแพทย์ขั้นพื้นฐานใช้การทดสอบ t ของนักเรียน (เพื่อสนับสนุนการอนุมานหรือเพื่อให้สอดคล้องกับความคาดหวัง ... ) สองสามปีที่ผ่านมาฉันสังเกตเห็นว่าการทดสอบ t ของนักเรียนไม่ใช่การทดสอบที่มีประสิทธิภาพที่สุดที่อาจใช้: การทดสอบตามลำดับให้พลังงานที่มากขึ้นสำหรับขนาดตัวอย่างใด ๆ หรือขนาดตัวอย่างที่เล็กกว่าโดยเฉลี่ยสำหรับพลังงานที่เท่ากัน ขั้นตอนต่อเนื่องของความซับซ้อนที่แตกต่างกันนั้นใช้ในการวิจัยทางคลินิก แต่ฉันไม่เคยทำเห็นวิธีที่ใช้ในงานวิจัยทางชีวการแพทย์ขั้นพื้นฐาน ฉันทราบว่าพวกเขาขาดเรียนจากหนังสือสถิติระดับเบื้องต้นที่ล้วนเป็นสิ่งที่นักวิทยาศาสตร์พื้นฐานส่วนใหญ่น่าจะเห็น คำถามของฉันคือสามเท่า: ด้วยข้อได้เปรียบด้านประสิทธิภาพอย่างมากของการทดสอบตามลำดับเหตุใดจึงไม่ใช้กันอย่างแพร่หลายมากขึ้น มีข้อเสียเปรียบที่เกี่ยวข้องกับการใช้วิธีการตามลำดับซึ่งหมายความว่าการใช้งานโดยผู้ที่ไม่ใช่นักสถิติจะต้องหมดกำลังใจหรือไม่? นักเรียนสถิติสอนเกี่ยวกับขั้นตอนการทดสอบตามลำดับหรือไม่

2
เหตุใดยอดสูงสุดของสะพานบราวเนียนจึงมีการกระจาย Kolmogorov – Smirnov?
การกระจาย Kolmogorov-Smirnov เป็นที่รู้จักจากการทดสอบ Kolmogorov-Smirnov อย่างไรก็ตามมันยังเป็นการกระจายของยอดสูงสุดของสะพานบราวเนียน เนื่องจากสิ่งนี้ไม่ชัดเจน (สำหรับฉัน) ฉันจึงขอให้คุณอธิบายอย่างง่าย ๆ เกี่ยวกับความบังเอิญนี้ ยินดีต้อนรับการอ้างอิงยัง

1
วิธีการเปรียบเทียบแบบใดที่จะใช้สำหรับโมเดล lmer: lsmeans หรือ glht
ฉันกำลังวิเคราะห์ชุดข้อมูลโดยใช้โมเดลเอฟเฟกต์ผสมกับเอฟเฟ็กต์คงที่หนึ่งรายการ (เงื่อนไข) และเอฟเฟกต์แบบสุ่มสองรายการ (ผู้เข้าร่วมเนื่องจากการออกแบบภายในและคู่ของเรื่อง) รูปแบบที่ถูกสร้างขึ้นด้วยแพคเกจ:lme4exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp) ต่อไปฉันทำการทดสอบอัตราส่วนความน่าจะเป็นของโมเดลนี้เทียบกับโมเดลโดยไม่มีผลกระทบคงที่ (เงื่อนไข) และมีความแตกต่างอย่างมีนัยสำคัญ ชุดข้อมูลของฉันมี 3 เงื่อนไขดังนั้นฉันจึงต้องการเปรียบเทียบหลายรายการ แต่ฉันไม่แน่ใจว่าจะใช้วิธีใด ฉันพบคำถามที่คล้ายกันจำนวนหนึ่งใน CrossValidated และฟอรัมอื่น ๆ แต่ฉันยังสับสนอยู่ จากสิ่งที่ฉันเห็นผู้คนแนะนำให้ใช้ 1.lsmeansแพคเกจ - lsmeans(exp.model,pairwise~condition)ซึ่งทำให้ผมส่งออกต่อไปนี้: condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts …

2
การใช้ตัวเลขสุ่มในการคำนวณทางสถิติมีความสำคัญอะไรบ้าง?
เครื่องกำเนิดเลขสุ่ม (RNG) มีความสำคัญอย่างไรในสถิติการคำนวณ ฉันเข้าใจว่าการสุ่มนั้นมีความสำคัญเมื่อเลือกตัวอย่างสำหรับการทดสอบทางสถิติจำนวนมากเพื่อหลีกเลี่ยงอคติต่อสมมติฐานใด ๆ แต่มีพื้นที่อื่น ๆ ของสถิติการคำนวณที่เครื่องกำเนิดเลขสุ่มมีความสำคัญหรือไม่

3
ใช้ glm () แทนการทดสอบไคสแควร์อย่างง่าย
ฉันสนใจที่จะเปลี่ยนสมมติฐานว่างที่ใช้glm()ใน R ตัวอย่างเช่น: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) การทดสอบสมมติฐานที่ว่า0.5 ถ้าฉันต้องการเปลี่ยนค่า null เป็น = ค่าที่กำหนดเองภายในจะทำอย่างไร p=0.5p=0.5p = 0.5pppglm() ฉันรู้ว่าสิ่งนี้สามารถทำได้ด้วยprop.test()และchisq.test()แต่ฉันต้องการสำรวจความคิดของการใช้glm()เพื่อทดสอบสมมติฐานทั้งหมดที่เกี่ยวข้องกับข้อมูลเด็ดขาด

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

3
การทดสอบสมมติฐานแบบเบส์หมายความว่าอย่างไรในกรอบการอนุมานและทฤษฎีการตัดสินใจ
พื้นหลังของฉันส่วนใหญ่อยู่ในการเรียนรู้ของเครื่องและฉันพยายามที่จะเรียนรู้ว่าการทดสอบสมมติฐานแบบเบย์หมายถึงอะไร ฉันโอเคกับการตีความความน่าจะเป็นแบบเบย์และฉันคุ้นเคยกับมันในบริบทของตัวแบบกราฟิกที่น่าจะเป็น อย่างไรก็ตามสิ่งที่ทำให้ฉันสับสนคือความหมายของคำว่า "สมมติฐาน" ในบริบทของการอนุมานเชิงสถิติ ฉันคิดว่าฉันส่วนใหญ่สับสนเกี่ยวกับคำศัพท์ที่ฉันคุ้นเคยกับการเรียนรู้ของเครื่องเทียบกับสิ่งที่ใช้ในสถิติและการอนุมาน ในบริบทของการเรียนรู้ภายใต้การดูแลผมตามปกติคิดว่าสมมติฐานที่เป็นฟังก์ชั่นการคาดการณ์ที่แมตัวอย่างป้ายชื่อของมันคือ{Y} อย่างไรก็ตามสำหรับฉันแล้วคำว่าสมมติฐานในการอ่านที่ฉันทำไม่มีความหมายเหมือนกัน ให้ฉันวางแยกอ่านที่ฉันกำลังอ่าน:ชั่วโมง : X→ Yชั่วโมง:X→Yh:\mathcal{X} \rightarrow \mathcal{Y} ถ้าคุณอ่านอย่างระมัดระวังมันก็บอกว่า: มีรูปแบบที่แตกต่างกันสำหรับข้อมูลที่สังเกตได้ ... พวกเขาใช้คำว่า model สำหรับฉันรูปแบบคำทำให้ฉันคิดว่าชุดของฟังก์ชั่นคือเราเลือกฟังก์ชั่นการทำนายที่เฉพาะเจาะจง เช่นคลาสสมมุติฐานของฟังก์ชัน ตัวอย่างเช่นอาจเป็นคลาสสมมุติฐานของฟังก์ชันกำลังสอง (พหุนามของระดับ 2) อย่างไรก็ตามสำหรับฉันแล้วพวกเขาใช้แบบจำลองคำและสมมติฐานเป็นคำพ้องในสารสกัดนี้ (สำหรับฉันพวกเขาเป็นคำที่แตกต่างอย่างสิ้นเชิง)Hd2Hd2\mathcal{H_{d2}} จากนั้นจะกล่าวถึงว่าเราสามารถทำให้นักบวชเป็นสมมติฐาน (สิ่งที่สมเหตุสมผลอย่างสมบูรณ์ในการตั้งค่าแบบเบย์): พีH( Hม.) , ม. = { 0 , 1 , . . , M- 1 }พีH(Hม.), ม.={0,1,...,M-1}p_H(H_m), \ \ \ \ \ …

1
ฉันควรใช้ t-test กับข้อมูลที่มีการบิดเบือนสูงหรือไม่ ขอหลักฐานทางวิทยาศาสตร์
ฉันมีตัวอย่างจากชุดข้อมูลที่มีการบิดเบือนสูง (ดูคล้ายการแจกแจงแบบเอ็กซ์โปเนนเชียล) เกี่ยวกับการมีส่วนร่วมของผู้ใช้ (เช่น: จำนวนโพสต์) ที่มีขนาดต่างกัน (แต่ไม่น้อยกว่า 200) และฉันต้องการเปรียบเทียบค่าเฉลี่ย สำหรับสิ่งนั้นฉันใช้การทดสอบ t สองแบบที่ไม่มีการจับคู่ (และการทดสอบ t กับปัจจัยของ Welch เมื่อตัวอย่างมีความแปรปรวนต่างกัน) อย่างที่ฉันได้ยินมาว่าสำหรับกลุ่มตัวอย่างที่มีขนาดใหญ่จริง ๆ มันไม่สำคัญว่ากลุ่มตัวอย่างจะไม่แจกแจงแบบปกติ มีคนกำลังตรวจสอบสิ่งที่ฉันทำบอกว่าการทดสอบที่ฉันใช้ไม่เหมาะกับข้อมูลของฉัน พวกเขาแนะนำให้บันทึกการแปลงตัวอย่างของฉันก่อนใช้การทดสอบ t ฉันเป็นผู้เริ่มต้นดังนั้นฉันจึงสับสนในการตอบคำถามการวิจัยของฉันด้วย "บันทึกการเข้าร่วมการวัด" พวกเขาผิดหรือเปล่า? ฉันผิดหรือเปล่า? หากพวกเขาคิดผิดมีหนังสือหรือเอกสารทางวิทยาศาสตร์ที่ฉันสามารถอ้างอิง / แสดงได้หรือไม่? หากฉันผิดฉันควรใช้การทดสอบแบบใด

1
มันสมเหตุสมผลหรือไม่ที่จะทำการทดสอบ Kolmogorov-Smirnov แบบ one-tailed?
มันมีความหมายและเป็นไปได้หรือไม่ที่จะทำการทดสอบ KS แบบทางเดียว? สมมติฐานว่างของการทดสอบดังกล่าวจะเป็นอย่างไร หรือการทดสอบ KS นั้นเป็นการทดสอบแบบสองทางโดยเนื้อแท้ ฉันจะได้รับประโยชน์จากคำตอบที่ช่วยให้ฉันเข้าใจการกระจายของD (ฉันกำลังทำงานผ่านกระดาษของ Massey ในปี 1951 และค้นหาคำอธิบายที่ท้าทายตัวอย่างเช่นและD - supremum และ infinite ของความแตกต่างของค่าไม่แน่นอน ของความแตกต่างใน CDF เชิงประจักษ์?)D+D+D^{+}D−D-D^{-} คำถามติดตามผล: value เป็นอย่างไรสำหรับD +และD -ได้มาอย่างไร จำนวนมากดังนั้นของสิ่งพิมพ์ฉันกำลังเผชิญหน้ากับกำลังนำเสนอค่าขึ้นบัญชีดำมากกว่า CDF ของD n , D +และD -pพีpD+D+D^{+}D−D-D^{-}DnDnD_{n}D+D+D^{+}D−D−D^{-} อัปเดต:ฉันเพิ่งค้นพบคำถามที่เกี่ยวข้องอะไรคือสมมติฐานว่างในการทดสอบ Kolmogorov-Smirnov ด้านเดียว? ซึ่งฉันพลาดการสแกนครั้งแรกก่อนที่จะเขียนอันนี้

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

3
บทสรุปของ Neyman-Pearson สามารถนำไปใช้กับกรณีที่โมฆะอย่างง่ายและทางเลือกไม่ได้อยู่ในตระกูลเดียวกันของการแจกแจงหรือไม่?
บทแทรกของ Neyman-Pearson สามารถนำไปใช้กับกรณีที่เป็นโมฆะง่ายและทางเลือกง่าย ๆ ไม่ได้เป็นของครอบครัวเดียวกันของการแจกแจง? จากการพิสูจน์ฉันไม่เห็นว่าทำไมถึงทำไม่ได้ ตัวอย่างเช่นเมื่อ Simple Null เป็นการแจกแจงแบบปกติและทางเลือกง่าย ๆ คือการแจกแจงแบบเอ็กซ์โพเนนเชียล คือการทดสอบอัตราส่วนความน่าจะเป็นวิธีที่ดีในการทดสอบ null คอมโพสิตกับทางเลือกคอมโพสิตเมื่อทั้งสองเป็นของครอบครัวที่แตกต่างกันของการกระจาย? ขอบคุณและขอแสดงความนับถือ!

1
ความแตกต่างระหว่างการทดสอบการสุ่มและการทดสอบการเปลี่ยนแปลง
ในวรรณคดีคำว่า Randomization and Permutation นั้นใช้แทนกันได้ ด้วยผู้เขียนหลายคนระบุว่าการทดสอบ "การเปลี่ยนแปลง (การสุ่ม) หรือ" ในทางกลับกัน อย่างดีที่สุดฉันเชื่อว่าความแตกต่างนั้นบอบบางและอยู่ในสมมติฐานของพวกเขาเกี่ยวกับข้อมูลและข้อสรุปที่อาจเกิดขึ้นซึ่งสามารถวาดได้ ฉันแค่ต้องตรวจสอบว่าความเข้าใจของฉันนั้นถูกต้องหรือว่ามีความแตกต่างที่ลึกซึ้งกว่าที่ฉันขาดหายไป การทดสอบการเปลี่ยนรูปสันนิษฐานว่าข้อมูลถูกสุ่มตัวอย่างจากการแจกแจงประชากรพื้นฐาน (แบบจำลองประชากร) ซึ่งหมายความว่าข้อสรุปที่ได้จากการทดสอบการเปลี่ยนรูปมักใช้กับข้อมูลอื่นจากประชากร [3] การทดสอบการสุ่ม (แบบจำลองการสุ่ม) "อนุญาตให้เราทิ้งสมมติฐานที่ไม่น่าเชื่อของการวิจัยทางจิตวิทยาทั่วไป --- การสุ่มตัวอย่างจากการแจกแจงที่ระบุ" [2] อย่างไรก็ตามนั่นหมายความว่าข้อสรุปที่ดึงมาใช้ได้เฉพาะกับตัวอย่างที่ใช้ในการทดสอบ [3] แน่นอนแม้ว่าความแตกต่างเป็นเพียงในแง่ของความหมายของประชากร หากเรากำหนดประชากรให้เป็น 'ผู้ป่วยทุกรายที่มีอาการป่วยและมีความเหมาะสมสำหรับการรักษา' การทดสอบการเปลี่ยนรูปนั้นมีผลต่อประชากร แต่เนื่องจากเราได้ จำกัด ประชากรให้เหมาะกับการรักษาจึงเป็นการทดสอบแบบสุ่ม การอ้างอิง: [1] การทดสอบการเปลี่ยนรูปของฟิลิปที่ดี: คู่มือปฏิบัติเพื่อทดสอบวิธีการทดสอบสมมติฐานอีกครั้ง [2] Eugene Edgington และ Patric Onghena การทดสอบการสุ่ม [3] Michael Ernst, วิธีการเรียงสับเปลี่ยน: พื้นฐานสำหรับการอนุมานที่แน่นอน

4
ทดสอบความแตกต่างอย่างมีนัยสำคัญทางสถิติในอนุกรมเวลาหรือไม่
ฉันมีอนุกรมเวลาของราคาของหลักทรัพย์สองหลักทรัพย์คือ A และ B ในช่วงเวลาเดียวกันและเก็บตัวอย่างที่ความถี่เดียวกัน ฉันต้องการทดสอบว่ามีความแตกต่างอย่างมีนัยสำคัญทางสถิติในช่วงเวลาระหว่างราคาทั้งสองหรือไม่ (สมมติฐานว่างของฉันคือความแตกต่างนั้นเป็นโมฆะ) โดยเฉพาะฉันใช้ความแตกต่างของราคาเป็นตัวแทนเพื่อประสิทธิภาพของตลาด ลองนึกภาพ A และ B เป็นระบบรักษาความปลอดภัยและการสังเคราะห์ที่เทียบเท่ากัน (นั่นคือทั้งสองอ้างว่ากระแสเงินสดเท่ากันทั้งหมด) หากตลาดมีประสิทธิภาพทั้งคู่ควรมีราคาเท่ากัน (ยกเว้นค่าใช้จ่ายการทำธุรกรรมที่แตกต่างกัน ฯลฯ ) หรือผลต่างราคาเป็นศูนย์ นี่คือสิ่งที่ฉันต้องการทดสอบ วิธีที่ดีที่สุดที่จะทำคืออะไร? ฉันอาจใช้การทดสอบ t-test แบบสองด้านกับอนุกรมเวลา "ความแตกต่าง" เช่นในอนุกรมเวลา AB และทดสอบสำหรับ = 0 อย่างไรก็ตามฉันมีข้อสงสัยว่าอาจมีการทดสอบที่มีประสิทธิภาพมากกว่าซึ่งคำนึงถึงสิ่งต่าง ๆ เช่นข้อผิดพลาด homoskedastic ที่อาจเกิดขึ้นหรือการปรากฏตัวของค่าผิดปกติ โดยทั่วไปมีสิ่งที่ต้องระวังเมื่อทำงานกับราคาหลักทรัพย์หรือไม่μ0μ0\mu_0

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.