คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

2
ทำไม่ต้องใช้บริการกับ Bonferroni บน Holm-Bonferroni?
ฉันเห็นได้ว่าทำไมคุณไม่ใช้วิธีที่มีประสิทธิภาพมากกว่าเช่นวิธี Hochberg เหนือการแก้ไข Bonferroni เนื่องจากอาจมีการตั้งสมมติฐานเพิ่มเติมเช่นความเป็นอิสระของสมมติฐานในกรณีนี้ แต่ฉันไม่เข้าใจว่าทำไมคุณถึง เคยใช้การแก้ไข Bonferroni เหนือการดัดแปลงการปฏิเสธตามลำดับของโฮล์มเนื่องจากหลังนั้นมีประสิทธิภาพมากกว่าและไม่มีสมมติฐานมากกว่า Bonferroni ฉันพลาดอะไรไปหรือเปล่า

2
วิธีเปรียบเทียบค่าเฉลี่ยของสองตัวอย่างที่มีข้อมูลตรงกับการแจกแจงแบบเอ็กซ์โพเนนเชียล
ฉันมีสองตัวอย่างของข้อมูลตัวอย่างพื้นฐานและตัวอย่างการรักษา สมมติฐานคือตัวอย่างการรักษามีค่าเฉลี่ยสูงกว่าตัวอย่างพื้นฐาน ตัวอย่างทั้งสองมีรูปแบบเลขชี้กำลัง เนื่องจากข้อมูลมีขนาดค่อนข้างใหญ่ฉันจึงมีเพียงค่าเฉลี่ยและจำนวนองค์ประกอบสำหรับแต่ละตัวอย่าง ณ เวลาที่ฉันจะทำการทดสอบ ฉันจะทดสอบสมมติฐานนั้นได้อย่างไร ฉันเดาว่ามันง่ายสุด ๆ และฉันได้พบการอ้างอิงหลายอย่างเกี่ยวกับการใช้การทดสอบ F แต่ฉันไม่แน่ใจว่าพารามิเตอร์แมป

4
ผลกระทบของการอภิปรายในปัจจุบันที่มีนัยสำคัญทางสถิติ
ในช่วงไม่กี่ปีที่ผ่านมานักวิชาการหลายคนได้ยกปัญหาอันตรายของการทดสอบสมมติฐานทางวิทยาศาสตร์ขนานนามว่า "ระดับความเป็นอิสระของนักวิจัย" ซึ่งหมายความว่านักวิทยาศาสตร์มีทางเลือกมากมายให้ทำในระหว่างการวิเคราะห์ที่มีอคติต่อการค้นหาด้วย p-value <5% ทางเลือกที่คลุมเครือเหล่านี้จะยกตัวอย่างเช่นกรณีที่จะรวมซึ่งในกรณีนี้จะถูกจัดประเภทเป็นค่าผิดปกติวิ่งข้อกำหนดรูปแบบต่าง ๆ นานาจนบางสิ่งบางอย่างที่แสดงให้เห็นขึ้นไม่ได้เผยแพร่ผล null ฯลฯ (กระดาษที่จุดประกายการอภิปรายครั้งนี้ในด้านจิตวิทยาเป็นที่นี่ , ดูบทความ Slate ยอดนิยมและการติดตามการอภิปรายโดย Andrew Gelman ที่นี่และนิตยสาร Time ยังได้สัมผัสกับหัวข้อนี้ที่นี่ ) ก่อนหนึ่งคำถามเพื่อความกระจ่าง: นิตยสารThe Timeเขียน "พลัง 0.8 หมายถึงว่ามีการทดสอบสมมติฐานจริงสิบข้อมีเพียงสองข้อเท่านั้นที่จะถูกตัดออกเพราะผลกระทบของข้อมูลเหล่านั้นจะไม่ถูกหยิบขึ้นมาในข้อมูล" ผมไม่แน่ใจว่าวิธีการที่เหมาะกับนี้ในความหมายของอำนาจหน้าที่ที่ผมพบในตำราเรียนซึ่งเป็นน่าจะเป็นของการปฏิเสธโมฆะเป็นหน้าที่ของพารามิเตอร์\ด้วยต่างกันเรามีพลังที่แตกต่างกันดังนั้นฉันจึงไม่เข้าใจคำพูดที่กล่าวมาข้างต้นθθθ\thetaθθ\theta ประการที่สองความหมายของการวิจัย: ในสาขารัฐศาสตร์ / เศรษฐศาสตร์ของฉันนักวิชาการใช้ข้อมูลทั้งหมดของประเทศในปีเดียว ดังนั้นเราไม่ควรกังวลกับตัวอย่างที่เล่นซอนี่? ปัญหาของการรันการทดสอบหลายครั้ง แต่การรายงานเพียงแบบเดียวสามารถแก้ไขได้โดยข้อเท็จจริงที่ว่าคนอื่นในสาขาวิชาจะทดสอบกระดาษของคุณอีกครั้งและทำให้คุณผิดหวังทันทีที่ไม่ได้ผลลัพธ์ที่ดี? การคาดการณ์นี้นักวิชาการในสาขาของฉันมีแนวโน้มที่จะรวมrobustness checkส่วนที่พวกเขาแสดงให้เห็นว่าสเปคหลายรุ่นไม่ได้เปลี่ยนผล เพียงพอหรือไม่ Andrew Gelman และคนอื่น ๆ ยกประเด็นที่ไม่ว่าข้อมูลจะเป็นไปได้เสมอในการค้นหาและเผยแพร่ "รูปแบบ" บางอย่างที่ไม่ได้มีอยู่จริง แต่สิ่งนี้ไม่ควรกังวลเนื่องจากข้อเท็จจริงที่ว่า "รูปแบบ" เชิงประจักษ์จะต้องได้รับการสนับสนุนจากทฤษฎีและทฤษฎีการแข่งขันภายในวินัยจะมีส่วนร่วมในการอภิปราย / การแข่งขันเพื่อค้นหาว่าค่ายใดสามารถหา …

1
ฉันควรใช้ระดับความอิสระโดยประมาณของ Welch (1947) หรือ Satterthwaite's (1946) หรือไม่
ฉันสับสนเกี่ยวกับสูตรที่ถูกต้องสำหรับองศาอิสระโดยประมาณที่ใช้สำหรับการทดสอบ t ของ Welch สูตรของ Satterthwaite (1946) เป็นสูตรที่ถูกอ้างถึงมากที่สุด แต่ Welch ให้ทางเลือกในปี 1947 ฉันไม่แน่ใจว่าควรใช้สูตรไหน (หรือใช้โดยซอฟต์แวร์ทางสถิติส่วนใหญ่) สูตรของ Satterthwaite: ( s2x/ nx+ s2Y/ nY)2( s2x/nx)2/ ( nx- 1 ) + ( s2Y/nY)2/ ( nY- 1 )(sx2/nx+sY2/nY)2(sx2/nx)2/(nx-1)+(sY2/nY)2/(nY-1)\frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x-1)+(s_y^2/n_y )^2/(n_y-1)} สูตรของ Welch: - 2 + ( s2x/ nx+ s2Y/ nY)2( s2x/ nx)2/ ( nx+ …

2
มันสมเหตุสมผลหรือไม่ที่จะคำนวณช่วงความมั่นใจและเพื่อทดสอบสมมติฐานเมื่อมีข้อมูลจากประชากรทั้งหมด
มันสมเหตุสมผลหรือไม่ที่จะคำนวณช่วงความมั่นใจและเพื่อทดสอบสมมติฐานเมื่อมีข้อมูลจากประชากรทั้งหมด ในความคิดของฉันคำตอบคือไม่เนื่องจากเราสามารถคำนวณค่าที่แท้จริงของพารามิเตอร์ได้อย่างถูกต้อง แต่แล้วสัดส่วนสูงสุดของข้อมูลจากประชากรดั้งเดิมที่อนุญาตให้เราใช้เทคนิคดังกล่าวคืออะไร?

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
มีคำจำกัดความทั่วไปของขนาดเอฟเฟกต์หรือไม่?
effect-sizeแท็กไม่มีวิกิพีเดีย หน้าวิกิพีเดียเกี่ยวกับขนาดผลที่ไม่ได้ให้ความหมายทั่วไปที่แม่นยำ และฉันไม่เคยเห็นคำจำกัดความทั่วไปของขนาดเอฟเฟกต์ อย่างไรก็ตามเมื่อมีการอ่านการอภิปรายบางอย่างเช่นนี้ผมรู้สึกว่าคนที่มีในใจความคิดทั่วไปของขนาดผลในบริบทของการทดสอบทางสถิติ ฉันได้เห็นแล้วว่ามาตรฐานเฉลี่ยจะเรียกว่าเป็นขนาดของผลสำหรับรุ่นปกติN ( μ , σ 2 )เช่นเดียวกับความแตกต่างของค่าเฉลี่ยมาตรฐานθ = (θ = μ / σθ=μ/σ\theta=\mu/\sigmaยังไม่มีข้อความ(μ,σ2)N(μ,σ2){\cal N}(\mu,\sigma^2)สำหรับโมเดล "Gaussian หมายถึง" แต่แล้วนิยามทั่วไปล่ะ? คุณสมบัติที่น่าสนใจที่ใช้ร่วมกันโดยทั้งสองตัวอย่างข้างต้นคือเท่าที่ฉันสามารถมองเห็น พลังงานขึ้นอยู่กับพารามิเตอร์เฉพาะผ่าน θและเป็นฟังก์ชั่นที่เพิ่มขึ้นของ | θ | เมื่อเราพิจารณาการทดสอบตามปกติสำหรับ H 0 : { μ = 0 }ในกรณีแรกและ H 0 : { μ 1 = μ 2 }ในกรณีที่สอง θ=(μ1−μ2)/σθ=(μ1−μ2)/σ\theta=(\mu_1-\mu_2)/\sigmaθθ\theta| θ ||θ||\theta|H0: { …

1
ข้อเสนอแนะการทดสอบทางสถิติ
ฉันต้องการค้นหาการทดสอบทางสถิติที่เหมาะสม (การทดสอบอัตราส่วนความน่าจะเป็น, การทดสอบที) และอื่น ๆ ต่อไปนี้: ขอเป็นตัวอย่าง IID ของเวกเตอร์สุ่ม( X ; Y )และสมมติว่า( Y X ) ~ N [ ( μ 1 μ 2 ) , ( 1 0.5 0.5 1 ) ] สมมติฐานคือ: H 0 = μ 1 + μ{ Xผม; Yผม}ni = 1{Xผม;Yผม}ผม=1n\{X_i;Y_i\}^n_{i=1}( X; Y)(X;Y)(X;Y)( YX)(YX)\bigl( \begin{smallmatrix} Y\\ …

3
การวิเคราะห์พลังงานสำหรับข้อมูลทวินามเมื่อสมมติฐานว่างคือ
ฉันต้องการทำการวิเคราะห์พลังงานสำหรับตัวอย่างเดียวจากข้อมูลทวินามด้วย , กับโดยที่คือสัดส่วนของความสำเร็จในประชากร ถ้าฉันสามารถใช้การประมาณแบบปกติกับทวินามหรือทดสอบ แต่ด้วยทั้งคู่จะล้มเหลว ฉันชอบที่จะรู้ว่าหากมีวิธีการวิเคราะห์นี้ ฉันขอขอบคุณข้อเสนอแนะความคิดเห็นหรือการอ้างอิงใด ๆ ขอบคุณมาก!H 1 : p = 0.001 p 0 &lt; p &lt; 1 χ 2 p = 0H0:p=0H0:p=0H_0: p = 0H1:p=0.001H1:p=0.001H_1: p = 0.001ppp0&lt;p&lt;10&lt;p&lt;10 < p <1χ2χ2\chi^2p=0p=0p =0

2
Wilcoxon-Mann-Whitney ค่าวิกฤตใน R
ฉันสังเกตว่าเมื่อฉันพยายามค้นหาค่าวิกฤตสำหรับ Mann-Whitney U โดยใช้ R ค่าจะเป็น 1 + ค่าวิกฤตเสมอ ตัวอย่างเช่นสำหรับ , ค่าวิกฤต (สองหาง) คือ 8 ในขณะที่สำหรับ , (สองหาง ) ค่าวิกฤตคือ 22 (ตรวจสอบตาราง ) แต่:α = .05 , n = 12 , m = 8α=.05,n=10,m=5α=.05,n=10,m=5\alpha=.05, n = 10, m = 5α = .05 , n = 12 , m = 8α=.05,n=12,m=8\alpha=.05, …

2
การตรวจจับกลุ่มของรหัสที่มา "คล้ายกัน"
สมมติว่าฉันมีนักเรียน 400 คน (ที่อยู่ในมหาวิทยาลัยใหญ่) ที่ต้องทำโครงงานวิทยาศาสตร์คอมพิวเตอร์และพวกเขาต้องทำงานคนเดียว (ไม่มีกลุ่มนักเรียน) ตัวอย่างของโครงการอาจให้ "ใช้การแปลงฟูริเยร์ที่รวดเร็วใน Fortran" (ฉันรู้ว่ามันไม่ฟังดูเซ็กซี่ แต่นั่นทำให้คำถามของฉันง่ายขึ้น) ฉันเป็นคนที่ถูกต้องและฉันต้องการส่งกิจวัตรเพื่อตรวจสอบว่ามีกลุ่มนักเรียนที่เสนอการใช้งานที่ "คล้ายกันมากเกินไปที่จะเขียนอย่างอิสระอย่างแท้จริง" นี่คือการค้นหากลุ่มที่ไม่มีการดูแล ฉันคิดว่าคำถามนี้เกี่ยวกับคุณลักษณะที่จะใช้มากกว่าอัลกอริทึมการจัดกลุ่มที่จะใช้ สิ่งแรกที่ฉันจะทำคือจดหมายโดยฮิสโทแกรมจดหมาย โดยหลักการแล้วเนื่องจากคนขี้โกงฉลาดกว่านั้นในที่สุดฉันก็ลองเลือกการเรียงสับเปลี่ยนแบบสุ่มเพื่อดูว่ามีฮิสโตแกรมของตัวอักษร (ที่มีการเรียงสับเปลี่ยน) อยู่หรือไม่ ยิ่งไปกว่านั้นผู้ที่ไม่สำรวจโครงสร้างของรหัสเฉพาะการกระจายตัวอักษรเพียงเล็กน้อย ... คุณมีทางออกอะไร มีซอฟต์แวร์หรือแพ็คเกจที่มีอยู่เฉพาะสำหรับปัญหานั้นหรือไม่ (อันที่จริงในสมัยก่อนครูวิทยาศาสตร์คอมพิวเตอร์อ้างว่าพวกเขามีเครื่องมือประเภทนั้น แต่ตอนนี้ฉันสงสัยว่าพวกเขามีอะไรที่ง่ายมาก) ฉันเดาว่าทนายความจากการพัฒนาซอฟต์แวร์มีปัญหาประเภทนั้นด้วย (ไม่ใช่กับนักเรียน 1,000 คน แต่ด้วยรหัสขนาดใหญ่ 2 รหัส ... ซึ่งทำให้สิ่งต่าง ๆ ยากขึ้น)?

1
ความถี่อัลลีลที่สังเกตเห็นมีค่าน้อยกว่าที่คาดการณ์ไว้หรือไม่
คำถาม : ฉันจะสร้างการทดสอบเพื่อตรวจสอบได้อย่างไรว่า "ภูเขา" - ความถี่ทั้งหมด (รูปที่ 1) ที่สังเกตได้นั้นลดลงอย่างมีนัยสำคัญในภูเขากลางถึงภาคใต้มากกว่าที่ทำนายไว้ (รูปที่ 2) โดยรูปแบบการเลือกเชิงนิเวศ ( ดูรายละเอียดด้านล่าง ) ปัญหา : ความคิดเริ่มต้นของฉันคือการถดถอยส่วนที่เหลือของแบบจำลองกับละติจูด: ลองจิจูดและระดับความสูง (ซึ่งส่งผลเฉพาะการทำงานร่วมกันระหว่างละติจูดและลองจิจูดเป็นสำคัญ) ปัญหาคือสิ่งที่เหลืออยู่ (รูปที่ 3) อาจสะท้อนถึงการเปลี่ยนแปลงที่ไม่ได้อธิบายโดยแบบจำลองและ / หรือว่าเป็นสิ่งที่เกิดขึ้นทางชีวภาพเช่นอัลลีลไม่มีเวลาที่จะแพร่กระจายไปทางทิศใต้ถึงศักยภาพหรือมีอุปสรรคบางอย่างต่อการไหลของยีน หากคุณเปรียบเทียบความถี่ที่สังเกตได้ (รูปที่ 1) กับที่คาดหวัง (รูปที่ 2) มีความแตกต่างอย่างชัดเจนโดยเฉพาะอย่างยิ่งในภาคกลางถึงภูเขาทางตอนใต้ของสวีเดนและนอร์เวย์ ฉันยอมรับว่าตัวแบบอาจไม่สามารถอธิบายการเปลี่ยนแปลงทั้งหมดได้ แต่ฉันสามารถทดสอบแบบมีเหตุผลเพื่อสำรวจความคิดที่ว่าอัลลีลภูเขาไม่ถึงศักยภาพในใจกลางภูเขาทางตอนใต้หรือไม่ พื้นหลัง: ฉันมีเครื่องหมาย AFLP bi-allelic ซึ่งการกระจายความถี่ดูเหมือนว่าเกี่ยวข้องกับภูเขา (และละติจูด: ลองจิจูด) เมื่อเทียบกับที่อยู่อาศัยระดับต่ำบนคาบสมุทรสแกนดิเนเวีย (รูปที่ 1) "ภูเขา" - อัลลีลเกือบคงที่ในภาคเหนือซึ่งเป็นภูเขา มันเกือบจะหายไปหรือคงที่สำหรับ "ที่ราบลุ่ม" …

1
การทดสอบสมมติฐานเกี่ยวกับเมทริกซ์ความแปรปรวนร่วมแบบผกผัน
สมมติว่าฉันสังเกตIID และความปรารถนาในการทดสอบเอช0 :เวช( Σ - 1 ) =สำหรับเมทริกซ์คล้อยตามและเวกเตอร์ มีงานที่รู้จักกับปัญหานี้หรือไม่?xผม∼ N( μ , Σ )xi∼N(μ,Σ)x_i \sim \mathcal{N}\left(\mu,\Sigma\right)H0: A H0:A H_0: A\ ( Σ- 1) =a(Σ−1)=a\left(\Sigma^{-1}\right) = aAAAaaa ความพยายามที่ชัดเจน (กับฉัน) จะผ่านการทดสอบอัตราส่วนความน่าจะเป็น แต่ดูเหมือนว่าการเพิ่มความเป็นไปได้สูงสุดภายใต้ข้อ จำกัด ของจะต้องใช้ตัวแก้ SDPและอาจมีขนดกสวยH0H0H_0

1
ทดสอบสัดส่วนและตัวจําแนกไบนารี
ฉันมีเครื่องผลิตชิ้นส่วนต้นแบบ ในการทดสอบครั้งแรกเครื่องผลิตชิ้นส่วนและลักษณนามไบนารีบอกฉันว่าd 1ส่วนมีข้อบกพร่อง ( d 1 &lt; N 1มักจะวันที่1 / N 1 &lt; 0.01และN 1 ≈ 10 4 ) และN 1 - d 1ชิ้นส่วนเป็นสิ่งที่ดียังไม่มีข้อความ1N1N_1d1d1d_1d1&lt; N1d1&lt;N1d_1 < N_1d1/ N1&lt; 0.01d1/N1&lt;0.01d_1/N_1<0.01ยังไม่มีข้อความ1≈ 104N1≈104N_1\approx10^4ยังไม่มีข้อความ1- d1N1−d1N_1-d_1 จากนั้นช่างเทคนิคจะทำการเปลี่ยนแปลงบางอย่างในเครื่องเพื่อลดจำนวนชิ้นส่วนที่บกพร่อง ในการทดสอบที่สองและต่อไปนี้การปรับเปลี่ยนเครื่องผลิตชิ้นส่วนและลักษณนามไบนารีเดียวกัน (แตะต้อง) บอกผมว่าd 2ส่วนมีข้อบกพร่องอยู่แล้ววันที่2 / N 2ค่อนข้างคล้ายกับd 1 / N 1ยังไม่มีข้อความ2N2N_2d2d2d_2d2/ N2d2/N2d_2/N_2d1/ N1d1/N1d_1/N_1 ช่างต้องการทราบว่าการเปลี่ยนแปลงของเขามีประสิทธิภาพหรือไม่ สมมติว่าตัวแยกประเภทสมบูรณ์แบบ (ความไวของมันคือ 100% และความเฉพาะเจาะจงของมันคือ …

2
การทดสอบสมมติฐานและระยะทางรวมทั้งหมดกับ Kullback-Leibler divergence
ในการวิจัยของฉันฉันพบปัญหาทั่วไปต่อไปนี้: ฉันมีการแจกแจงและครั้งในโดเมนเดียวกันและมีตัวอย่างจำนวนมาก (แต่ จำกัด ) จากการแจกแจงเหล่านั้น ตัวอย่างมีการกระจายอย่างเป็นอิสระและเหมือนกันจากหนึ่งในสองการแจกแจง (แม้ว่าการแจกแจงอาจเกี่ยวข้อง: ตัวอย่างเช่นQอาจเป็นส่วนผสมของPและการกระจายอื่น ๆ ) สมมติฐานว่างเปล่าคือตัวอย่างมาจากPสมมุติฐานสำรองคือ ตัวอย่างมาจากQPPPQQQQQQPPPPPPQQQ ฉันพยายามที่จะอธิบายลักษณะ Type I และ Type II ข้อผิดพลาดในการทดสอบตัวอย่างที่รู้กระจายPPPและQQQQโดยเฉพาะอย่างยิ่งผมสนใจในขอบเขตหนึ่งข้อผิดพลาดที่กำหนดอื่น ๆ นอกเหนือไปจากความรู้ของPPPและQQQQ ฉันได้ถามคำถามทางคณิตศาสตร์เกี่ยวกับความสัมพันธ์ของระยะทางรวมการเปลี่ยนแปลงระหว่างPPPและQQQกับการทดสอบสมมติฐานและได้รับคำตอบที่ฉันยอมรับ คำตอบนั้นสมเหตุสมผล แต่ฉันยังไม่สามารถสรุปความหมายที่ลึกกว่าความสัมพันธ์ของระยะทางรวมของการเปลี่ยนแปลงและการทดสอบสมมติฐานที่เกี่ยวข้องกับปัญหาของฉัน ดังนั้นฉันตัดสินใจที่จะเปิดฟอรั่มนี้ คำถามแรกของฉันคือ: ความผันแปรทั้งหมดนั้นรวมกับผลรวมของความน่าจะเป็นของข้อผิดพลาด Type I และ Type II ที่เป็นอิสระจากวิธีการทดสอบสมมติฐานที่มีอยู่หรือไม่ ในสาระสำคัญตราบใดที่มีความน่าจะเป็นที่ไม่ใช่ศูนย์ที่ตัวอย่างอาจถูกสร้างขึ้นโดยการแจกแจงอย่างใดอย่างหนึ่งความน่าจะเป็นที่มีข้อผิดพลาดอย่างน้อยหนึ่งข้อต้องไม่เป็นศูนย์ โดยพื้นฐานแล้วคุณไม่สามารถหลบหนีความเป็นไปได้ที่ผู้ทดสอบสมมติฐานของคุณจะทำผิดพลาดไม่ว่าคุณจะประมวลผลสัญญาณมากแค่ไหน และขอบเขตความแปรปรวนโดยรวมที่เป็นไปได้แน่นอน ความเข้าใจของฉันถูกต้องหรือไม่ นอกจากนี้ยังมีความสัมพันธ์ระหว่าง Type I และข้อผิดพลาดครั้งที่สองและพื้นฐานแจกแจงความน่าจะอีกและคือKL แตกต่าง ดังนั้นคำถามที่สองของฉันคือ: KL-divergence ผูกมัดใช้ได้กับวิธีการทดสอบสมมติฐานเฉพาะวิธีเดียวเท่านั้น (ดูเหมือนว่าจะเกิดขึ้นรอบ ๆ วิธีอัตราส่วนความน่าจะเป็นในการเข้าสู่ระบบมาก) หรือหนึ่งสามารถใช้ได้กับวิธีการทดสอบสมมติฐานทั้งหมด …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.