คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

1
วิธีทดสอบค่ามัธยฐานของประชากรได้อย่างไร
ฉันมีตัวอย่าง 250 หน่วย การกระจายไม่สมมาตร ฉันต้องการทดสอบสมมุติฐานว่าค่ามัธยฐานของประชากรแตกต่างจาก 3.5 ดังนั้นฉันคิดว่าการทดสอบตัวอย่างหนึ่งรายการจะเหมาะสม ฉันรู้ว่าการทดสอบยศวิลคอกซันนั้นไม่เหมาะสมเพราะการแจกแจงนั้นไม่สมมาตร การทดสอบเครื่องหมายเหมาะสมที่จะใช้หรือไม่? หากไม่มีใครสามารถแนะนำการทดสอบอื่น ๆ ได้?

1
การทดสอบการเปลี่ยนรูป: เกณฑ์การเลือกสถิติการทดสอบ
ฉันใช้การทดสอบการเปลี่ยนแปลงอย่างสม่ำเสมอและชอบความเรียบง่ายของมัน ฉันได้เรียนรู้มากที่สุดจากหนังสือ "วิธีการ Resampling" โดย Good ซึ่งผู้แต่งดูเหมือนว่าจะมีความคิดสร้างสรรค์ในการเลือกสถิติการทดสอบของเขาตลอดตัวอย่าง นอกจากนี้โพสต์นี้ให้ความประทับใจว่ามีอิสระอย่างมากในการเลือกสถิติทดสอบ ฉันทำไม่น่าแปลกใจหากมีความต้องการทฤษฎีสถิติทดสอบควรปฏิบัติตาม หรือเราสามารถใช้สถิติใดก็ได้ตราบใดที่มันสมเหตุสมผลและมีอัตราความผิดพลาด Type I / II ที่ดี? ตัวอย่างเช่นเมื่อมีการใช้การทดสอบการเปลี่ยนรูปแทน t-test เนื่องจากประชากรที่ไม่ปกติฉันได้เห็นหลายครั้งที่การทดสอบการเปลี่ยนแปลงทาง p-value ยังคงได้รับจากสถิติ t แม้ว่าไม่จำเป็นต้องผิด แต่ดูเหมือนเป็นทางเลือกแปลก ๆ ที่ให้กำเนิดการกระจายตัวของนักเรียน

3
ทดสอบเพื่อแยกความแตกต่างเป็นระยะจากข้อมูลเกือบเป็นระยะ
สมมติว่าฉันมีบางฟังก์ชั่นที่ไม่รู้จักโดเมนℝซึ่งผมทราบว่าจะปฏิบัติตามเงื่อนไขที่เหมาะสมบางอย่างเช่นความต่อเนื่อง ฉันรู้ค่าที่แน่นอนของf (เพราะข้อมูลมาจากการจำลอง) ที่จุดสุ่มตัวอย่างบางระยะเท่ากันt_i = t_0 + iΔtด้วยi∈ \ {1, …, n \}ซึ่งฉันคิดว่าเพียงพอที่จะจับภาพทั้งหมด ด้านที่เกี่ยวข้องของfเช่นฉันสามารถสรุปได้ว่ามี extremum ท้องถิ่นมากที่สุดหนึ่งแห่งfในระหว่างจุดสุ่มสองจุด ฉันกำลังมองหาการทดสอบที่บอกฉันว่าข้อมูลของฉันสอดคล้องกับfเป็นระยะอย่างแน่นอนหรือไม่นั่นคือ∃τ: f (t + τ) = f (t) \, ∀ \, tfffRℝℝfffti=t0+iΔtti=t0+iΔtt_i=t_0 + iΔti∈{1,…,n}i∈{1,…,n}i∈\{1,…,n\}fffffffff∃τ:f(t+τ)=f(t)∀t∃τ:f(t+τ)=f(t)∀t∃τ: f(t+τ)=f(t) \,∀\,tด้วยความยาวของช่วงเวลาที่สามารถสะท้อนกลับได้เช่นΔt&lt;τ&lt;n⋅ΔtΔt&lt;τ&lt;n·ΔtΔt < τ < n·Δt (แต่เป็นไปได้ว่าฉันสามารถสร้างข้อ จำกัด ที่แข็งแกร่งกว่านี้ได้ถ้าจำเป็น) จากมุมมองอื่นผมมีข้อมูลx0,…,xnx0,…,xn{x_0, …, x_n}และกำลังมองหาการทดสอบที่ตอบคำถามไม่ว่าจะเป็นฟังก์ชั่นเป็นระยะfff (เงื่อนไขดังกล่าวตอบสนอง) อยู่เช่นว่าf(ti)=xi∀if(ti)=xi∀if(t_i)=x_i ∀ i∀ฉัน จุดสำคัญคืออย่างน้อยfffใกล้เคียงกับช่วงเวลาอย่างมาก (อาจเป็นเช่นf(t):=sin(g(t)⋅t)f(t):=sin⁡(g(t)·t)f(t) := \sin(g(t)·t)หรือf(t):=g(t)⋅sin(t)f(t):=g(t)·sin⁡(t)f(t) …

4
สามารถใช้การทดสอบ Mann-Whitney สำหรับการเปรียบเทียบหลังเหตุการณ์หลังจาก Kruskal-Wallis ได้หรือไม่?
ฉันมีแบบจำลองที่สัตว์ถูกวางไว้ในสภาพแวดล้อมที่เป็นมิตรและหมดเวลาเพื่อดูว่ามันสามารถอยู่รอดได้นานแค่ไหนโดยใช้วิธีการบางอย่างเพื่อความอยู่รอด มีสามวิธีที่สามารถใช้เพื่อความอยู่รอด ฉันวิ่งสัตว์จำลอง 300 ตัวโดยใช้วิธีการเอาชีวิตรอดในแต่ละครั้ง การจำลองทั้งหมดเกิดขึ้นในสภาพแวดล้อมเดียวกัน แต่มีการสุ่มดังนั้นจึงแตกต่างกันในแต่ละครั้ง ฉันใช้เวลากี่วินาทีที่สัตว์มีชีวิตรอดในการจำลองแต่ละครั้ง ชีวิตที่ยืนยาวนั้นดีกว่า ข้อมูลของฉันมีลักษณะเช่นนี้: Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these ฉันไม่แน่ใจในทุกสิ่งที่ฉันทำหลังจากจุดนี้ดังนั้นให้ฉันรู้ว่าฉันกำลังทำอะไรที่โง่และผิด ฉันพยายามที่จะหาว่ามีความแตกต่างทางสถิติเกี่ยวกับอายุขัยโดยใช้วิธีการเฉพาะ ฉันรันการทดสอบ Shapiro ของแต่ละตัวอย่างและพวกเขากลับมาพร้อมค่า p เล็ก ๆ ดังนั้นฉันจึงเชื่อว่าข้อมูลไม่ได้เป็นมาตรฐาน ข้อมูลในแถวไม่มีความสัมพันธ์ซึ่งกันและกัน การสุ่มเมล็ดที่ใช้ในการจำลองแต่ละครั้งนั้นแตกต่างกัน ด้วยเหตุนี้ฉันจึงเชื่อว่าไม่มีการจับคู่ข้อมูล เนื่องจากข้อมูลไม่ได้ถูกทำให้เป็นมาตรฐาน, ไม่ได้จับคู่และมีตัวอย่างมากกว่าสองตัวอย่างฉันจึงทำการทดสอบ Kruskal Wallis ซึ่งกลับมาด้วยค่า p เท่ากับ 0.048 จากนั้นฉันย้ายไปที่โพสต์เฉพาะกิจโดยเลือก Mann Whitney ในไม่แน่ใจว่า Mann Whitney …

2
ช่วงความมั่นใจแคบ ๆ เกี่ยวกับผลกระทบที่ไม่สำคัญสามารถแสดงหลักฐานว่าเป็นโมฆะ
เห็นได้ชัดว่าผิดพลาดที่จะคิดว่าความล้มเหลวในการปฏิเสธโมฆะก็หมายความว่าเป็นโมฆะ แต่ในกรณีที่เป็นโมฆะไม่ได้ปฏิเสธและช่วงความเชื่อมั่นที่สอดคล้องกัน (CI) เป็นที่แคบและแน่นิ่ง 0 นี้ไม่ได้ให้หลักฐานสำหรับโมฆะ? ฉันเป็นคนหนึ่งในใจสองคน: ใช่ในทางปฏิบัติสิ่งนี้จะแสดงหลักฐานว่าผลกระทบมีมากหรือน้อยกว่า 0 อย่างไรก็ตามในกรอบการทดสอบสมมุติฐานที่เข้มงวด ดังนั้นความหมายของ CI คืออะไรเมื่อการประเมินจุดของมันไม่สำคัญ? มันยังใช้ไม่ได้สำหรับการอนุมานหรือสามารถนำมาใช้ในตัวอย่างก่อนหน้านี้เพื่อหาปริมาณหลักฐานสำหรับโมฆะ? สนับสนุนคำตอบที่มีการอ้างอิงเชิงวิชาการ

2
ทำไม 0.05 <p <0.95 ผลลัพธ์จึงเรียกว่าผลบวกผิด?
แก้ไข:พื้นฐานของคำถามของฉันมีข้อบกพร่องและฉันจำเป็นต้องใช้เวลาในการพิจารณาว่าจะสามารถทำให้เข้าใจได้หรือไม่ แก้ไข 2:ชี้แจงว่าฉันรับรู้ว่า p-value ไม่ใช่การวัดโดยตรงของความน่าจะเป็นของสมมติฐานว่าง แต่ฉันสมมติว่ายิ่งค่า p-value ใกล้ถึง 1 ยิ่งมีโอกาสมากขึ้นที่สมมติฐานจะมี ถูกเลือกสำหรับการทดสอบทดลองที่มีสมมติฐานว่างตรงกันเป็นจริงในขณะที่ค่า p-value ใกล้เคียงกับ 0 ยิ่งมีโอกาสมากขึ้นที่จะมีการเลือกสมมติฐานสำหรับการทดสอบทดลองที่มีสมมติฐานว่างเป็นเท็จ ฉันไม่สามารถเห็นได้ว่านี่เป็นความผิดอย่างไรเว้นแต่ชุดของสมมติฐานทั้งหมด (หรือสมมติฐานทั้งหมดที่เลือกสำหรับการทดลอง) เป็นพยาธิสภาพ แก้ไข 3:ฉันคิดว่าฉันยังไม่ได้ใช้คำศัพท์ที่ชัดเจนเพื่อถามคำถามของฉัน เมื่อตัวเลขลอตเตอรีถูกอ่านออกมาและคุณจับคู่กับตั๋วของคุณทีละรายการการเปลี่ยนแปลงบางอย่าง ความน่าจะเป็นที่คุณชนะไม่เปลี่ยนแปลง แต่ความน่าจะเป็นที่คุณสามารถปิดวิทยุได้ มีการเปลี่ยนแปลงที่คล้ายกันซึ่งเกิดขึ้นเมื่อทำการทดลอง แต่ฉันมีความรู้สึกว่าคำศัพท์ที่ฉันใช้ - "ค่า p เปลี่ยนโอกาสในการเลือกสมมติฐานที่แท้จริง" - ไม่ใช่คำศัพท์ที่ถูกต้อง แก้ไข 4:ฉันได้รับคำตอบอย่างละเอียดและให้ข้อมูลที่น่าอัศจรรย์สองอย่างที่มีข้อมูลมากมายให้ฉันทำงาน ฉันจะโหวตให้พวกเขาทั้งคู่แล้วและกลับมาตอบรับเมื่อฉันได้เรียนรู้มากพอจากคำตอบทั้งสองเพื่อที่จะรู้ว่าพวกเขาตอบหรือทำให้คำถามของฉันไม่ถูกต้อง คำถามนี้เปิดเวิร์มกระป๋องที่ใหญ่กว่าที่ฉันคาดไว้กินมาก ในเอกสารที่ฉันอ่านฉันได้เห็นผลลัพธ์ด้วย p&gt; 0.05 หลังจากการตรวจสอบความถูกต้องที่เรียกว่า "ผลบวกปลอม" อย่างไรก็ตามมันก็ยังไม่น่าเป็นไปได้มากกว่าที่ฉันได้เลือกสมมติฐานเพื่อทดสอบด้วยสมมติฐานว่างที่สอดคล้องกันเท็จเมื่อข้อมูลการทดลองมี ap &lt;0.50ซึ่งต่ำ แต่&gt; 0.05 และไม่ใช่ทั้งสมมติฐานว่างและ สมมติฐานการวิจัยมีความไม่แน่นอน / ไม่มีนัยสำคัญทางสถิติ (จากการตัดนัยสำคัญทางสถิติแบบธรรมดา) …

1
ทดสอบว่าตัวอย่างของการแจกแจงทวินามสองตัวอย่างเป็นไปตาม p เดียวกันหรือไม่
สมมติว่าฉันได้ทำ: n1n1n_1 การทดลองอิสระด้วยอัตราความสำเร็จที่ไม่รู้จัก p1p1p_1 และสังเกต k1k1k_1 ประสบความสำเร็จ n2n2n_2 การทดลองอิสระด้วยอัตราความสำเร็จที่ไม่รู้จัก p2p2p_2 และสังเกต k2k2k_2 ประสบความสำเร็จ ถ้าตอนนี้ p1=p2=:pp1=p2=:pp_1 = p_2 =: p แต่ยังไม่ทราบความน่าจะเป็น p(k2)p(k2)p(k_2) สังเกต k2k2k_2 สำหรับที่กำหนด k1k1k_1(หรือกลับกัน) เป็นสัดส่วนกับดังนั้นถ้าฉันต้องการทดสอบp_1 \ neq p_2ฉันแค่ต้องการดูว่า ผลคูณของการแจกแจงที่สอดคล้องกันการสังเกตของฉันคือ∫10B(n1,p,k1)B(n2,p,k2)dp=1n1+n2+1(n1k1)(n2k2)(n1+n2k1+k2)−1∫01B(n1,p,k1)B(n2,p,k2)dp=1n1+n2+1(n1k1)(n2k2)(n1+n2k1+k2)−1\int_0^1 B(n_1,p,k_1) B(n_2, p, k_2) \text{d}p = \frac{1}{n_1+n_2+1}\binom{n_1}{k_1}\binom{n_2}{k_2}\binom{n_1+n_2}{k_1+k_2}^{-1}p1≠p2p1≠p2p_1 \neq p_2 จนถึงตอนนี้สำหรับการปรับแต่งล้อ ตอนนี้ปัญหาของฉันคือฉันไม่พบสิ่งนี้ในวรรณคดีและฉันอยากรู้: คำศัพท์ทางเทคนิคสำหรับการทดสอบนี้หรืออะไรที่คล้ายกันคืออะไร

1
การทดสอบสมมติฐานเพื่อความเท่าเทียมกันของสัดส่วนกับ 3 ตัวอย่าง
ฉันมีชุดข้อมูลของข้อมูลลูกค้าโทรศัพท์มือถือพร้อมทวีต คอลัมน์แรกมีหมวดหมู่บางอย่างที่บัญชีอยู่ (ทั้ง A, B หรือ C) และคอลัมน์ที่สองมีค่าไบนารีว่าบัญชีนั้นได้ยกเลิกหรือไม่ เช่น A | cancelled C | active B | active A | cancelled สิ่งที่ฉันต้องการทำคือการทดสอบสมมติฐานบางอย่างเพื่อทดสอบว่าอัตราส่วนของบัญชีประเภท A, B และ C นั้นแตกต่างกันสำหรับบัญชีที่ใช้งานกับบัญชีที่ถูกยกเลิกหรือไม่ - สมมุติฐานว่าง ๆ นั้นเป็นสิ่งเดียวกัน มันเหมือนกับการทดสอบสมมุติฐานสำหรับสัดส่วนยกเว้นฉันไม่รู้ว่าจะทำอย่างไรกับ 3 ค่า

3
การทดสอบทางสถิติเพื่อดูว่าความสัมพันธ์เป็นแบบเชิงเส้นหรือไม่เชิงเส้น
ฉันมีชุดข้อมูลตัวอย่างดังนี้: Volume &lt;- seq(1,20,0.1) var1 &lt;- 100 x2 &lt;- 1000000 x3 &lt;- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power &lt;- jitter(Power, factor = 1, amount = 0.1) plot(Volume,Power) จากรูปสามารถบอกได้ว่าระหว่างความสัมพันธ์ 'ปริมาตร' และ 'พลัง' บางช่วงนั้นเป็นเส้นตรงจากนั้นเมื่อ 'ปริมาณ' ค่อนข้างน้อยความสัมพันธ์จะกลายเป็นไม่เป็นเชิงเส้น …

4
หากฉันมีผลลัพธ์ในเชิงบวกและไม่มีนัยสำคัญจำนวนมากฉันสามารถทดสอบ“ อย่างน้อย
สมมติว่าฉันใช้การถดถอยแบบเดียวกันสำหรับคนละ 100 คน สัมประสิทธิ์ความสนใจของฉันเป็นค่าบวก (และค่อนข้างแตกต่างจากกัน) แต่ไม่มีนัยสำคัญทางสถิติในผลลัพธ์ทั้งหมด 100 (สมมติว่า p-value = 0.11 ทุกค่า) มีวิธีรวมค่า p เหล่านี้เพื่อสรุป "อย่างน้อย 80 ของผลลัพธ์เหล่านี้เป็นค่าบวก" มีความสำคัญมากกว่า p = 0.11 หรือไม่ การค้นหาออนไลน์ของฉันแสดงให้ฉันเห็นเพียงวิธีการพูดว่า "อย่างน้อย 1 ผลลัพธ์เหล่านี้เป็นค่าบวก" ผ่านการทดสอบแบบฟิชเชอร์หรือที่คล้ายกัน แต่ฉันไม่สามารถสรุปผลลัพธ์นั้นได้ ฉันต้องการทดสอบ "H0 = เอฟเฟกต์ทั้งหมด 100 ค่าจะเหมือนกันที่ 0" กับ "HA = เอฟเฟกต์อย่างน้อย 80 ค่าเป็นบวก" เป้าหมายของฉันคือไม่ได้บอกว่ามีค่าสัมประสิทธิ์เป็นบวกโดยเฉลี่ยและไม่วัดค่าสัมประสิทธิ์โดยเฉพาะ เป้าหมายของฉันคือการแสดงให้เห็นอย่างมีนัยสำคัญว่าอย่างน้อย 80 คนต้องเผชิญกับผลกระทบเชิงบวกบางอย่างโดยไม่คำนึงถึงสิ่งที่ 80 และโดยไม่คำนึงถึงขนาดของผลกระทบความรู้สึกของแต่ละบุคคล

3
สถิติการทดสอบในการทดสอบที่แน่นอนของฟิชเชอร์คืออะไร?
สำหรับตารางฉุกเฉินแบบ 2 คูณ 2 บางคนกล่าวว่าการทดสอบที่แน่นอนของ Fisherใช้การนับX1 , 1X1,1X_{1,1} ในเซลล์ (1,1) ในตารางเป็นสถิติการทดสอบและภายใต้สมมติฐานว่าง X1 , 1X1,1X_{1,1} จะมีการแจกแจง hypergeometric บางคนบอกว่าสถิติการทดสอบของมันคือ |X1 , 1- μ ||X1,1−μ| |X_{1,1} - \mu| ที่ไหน μμ\muคือค่าเฉลี่ยของการแจกแจงไฮเพอร์เมตริกซ์ (ดังที่ได้กล่าวไว้แล้ว) ภายใต้ null นอกจากนี้ยังกล่าวว่าค่า p ถูกกำหนดโดยยึดตามตารางของการแจกแจงแบบไฮเปอร์เมตริกซ์ ฉันสงสัยว่ามีเหตุผลบางอย่างที่จะลบค่าเฉลี่ยแล้วก็ใช้ค่าสัมบูรณ์หรือไม่?|X1 , 1- μ ||X1,1−μ||X_{1,1} - \mu| ไม่มีการแจกแจงไฮเปอร์มิติมิติภายใต้ค่าว่าง

2
Mann-Whitney สมมติฐานว่างภายใต้ความแปรปรวนไม่เท่ากัน
ฉันแค่อยากรู้เกี่ยวกับสมมติฐานว่างของการทดสอบ Mann-Whitney U ฉันมักจะเห็นว่ามันระบุว่าสมมติฐานว่างคือว่าประชากรสองคนมีการแจกแจงเท่ากัน แต่ฉันกำลังคิดว่า - ถ้าฉันมีประชากรปกติสองคนที่มีค่าเฉลี่ยเท่ากัน แต่มีความแปรปรวนไม่เท่ากันการทดสอบ Mann-Whitney คงไม่สามารถตรวจจับความแตกต่างนี้ได้ ฉันได้เห็นด้วยเช่นกันว่าด้วยสมมติฐานว่างของการทดสอบแมนน์ - วิทนีย์คือหรือความน่าจะเป็นที่จะสังเกตจากประชากรหนึ่ง ( X ) เกินกว่าการสังเกตจากประชากรที่สอง ( Y ) การยกเว้นความสัมพันธ์) เท่ากับ 0.5 สิ่งนี้ดูเหมือนจะสมเหตุสมผลมากกว่า แต่ก็ไม่เทียบเท่ากับสมมติฐานว่างแรกที่ฉันกล่าวไว้Pr(X&gt;Y)=0.5Pr(X&gt;Y)=0.5\Pr(X>Y)=0.5XXXYYY ฉันหวังว่าจะได้รับความช่วยเหลือเล็กน้อยจากการแก้ปัญหานี้ ขอบคุณ!

3
การทดสอบความเท่าเทียมกันสำหรับข้อมูลที่ไม่ปกติ?
ฉันมีข้อมูลบางอย่างที่ไม่สามารถสันนิษฐานได้ว่ามาจากการแจกแจงแบบปกติและฉันต้องการทำการทดสอบความเท่าเทียมกันระหว่างกลุ่ม สำหรับข้อมูลปกติมีเทคนิคเช่น TOST (การทดสอบสองด้านเดียว) TOST มีข้อมูลใดที่คล้ายคลึงกับข้อมูลปกติหรือไม่

1
การคำนวณค่า p ที่ไม่รู้จัก
ฉันเพิ่งแก้ไขจุดบกพร่องสคริปต์ R และพบสิ่งแปลกประหลาดมากผู้เขียนกำหนดฟังก์ชั่นค่า p ของตัวเอง pval &lt;- function(x, y){ if (x+y&lt;20) { # x + y is small, requires R.basic p1&lt;- nChooseK(x+y,x) * 2^-(x+y+1); p2&lt;- nChooseK(x+y,y) * 2^-(x+y+1); pvalue = max(p1, p2) } else { # if x+y is large, use approximation log_p1 &lt;- (x+y)*log(x+y) - x*log(x) - y*log(y) - …

3
วิธีการทดสอบว่ากลุ่มย่อยหมายถึงแตกต่างจากกลุ่มโดยรวมที่มีกลุ่มย่อยหรือไม่
ฉันจะทดสอบได้อย่างไรว่าค่าเฉลี่ย (เช่นความดันโลหิต) ของกลุ่มย่อย (เช่นผู้ที่เสียชีวิต) แตกต่างจากกลุ่มทั้งหมด (เช่นทุกคนที่เป็นโรครวมถึงผู้ที่เสียชีวิต)? เห็นได้ชัดว่ากลุ่มแรกเป็นกลุ่มย่อยของกลุ่มที่สอง ฉันควรใช้การทดสอบสมมติฐานแบบใด

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.