คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

1
มีข้อแตกต่างระหว่างคำว่า“ paired t-test” และ“ pairwise t-test” หรือไม่?
การทดสอบจับคู่แบบคู่คืออะไรและภายใต้สถานการณ์ใดที่ฉันควรใช้การทดสอบแบบจับคู่ มีความแตกต่างระหว่าง paired t-test และ pairwise t-test หรือไม่

3
เหตุใดสมมติฐานของ ANOVA (ความเท่าเทียมกันของความแปรปรวน, ความปกติของเศษวัสดุ) จึงมีความสำคัญ?
เมื่อเรียกใช้ ANOVA เราจะได้รับการบอกกล่าวว่าสมมติฐานบางข้อของการทดสอบจะต้องมีอยู่เพื่อให้สามารถใช้กับข้อมูลได้ ฉันไม่เคยเข้าใจเหตุผลว่าทำไมจึงจำเป็นต้องใช้สมมติฐานต่อไปนี้ในการทดสอบการทำงาน: ความแปรปรวนของตัวแปรตาม (ส่วนที่เหลือ) ของคุณควรจะเท่ากันในแต่ละเซลล์ของการออกแบบ ตัวแปร (ส่วนที่เหลือ) ของคุณควรกระจายตามปกติสำหรับแต่ละเซลล์ของการออกแบบ ฉันเข้าใจว่ามีบางส่วนของพื้นที่สีเทาที่จะต้องพบกับสมมติฐานเหล่านี้ แต่เพื่อประโยชน์ของการโต้แย้งหากสมมติฐานเหล่านี้ไม่ได้พบกันอย่างเต็มที่ในชุดข้อมูลที่กำหนดสิ่งที่จะเป็นปัญหากับการใช้ ANOVA ?

2
คำอธิบายสำหรับองศาอิสระที่ไม่ใช่จำนวนเต็มในการทดสอบ t กับผลต่างที่ไม่เท่ากัน
ขั้นตอนการทดสอบ SPSS รายงานการวิเคราะห์ 2 เมื่อเปรียบเทียบวิธีอิสระ 2 วิธีการวิเคราะห์หนึ่งที่มีความแปรปรวนเท่ากันและหนึ่งที่มีผลต่างไม่เท่ากัน องศาอิสระ (df) เมื่อถือว่าผลต่างเท่ากันนั้นถือเป็นค่าจำนวนเต็มเสมอ (และเท่ากับ n-2) df เมื่อความแปรปรวนที่เท่ากันจะไม่ถือว่าไม่ใช่จำนวนเต็ม (เช่น 11.467) และไม่มีที่ไหนใกล้ n-2 ฉันกำลังหาคำอธิบายเกี่ยวกับตรรกะและวิธีการที่ใช้ในการคำนวณ df ที่ไม่ใช่จำนวนเต็มเหล่านี้

4
วิธีเก็บรักษาตัวแปรที่คงที่ของเวลาในรูปแบบเอฟเฟกต์คงที่
ฉันมีข้อมูลเกี่ยวกับพนักงานของ บริษัท ขนาดใหญ่ของอิตาลีในช่วงสิบปีที่ผ่านมาและฉันต้องการดูว่าช่องว่างทางเพศในรายได้ของเพศชายและเพศหญิงมีการเปลี่ยนแปลงตลอดเวลาอย่างไร เพื่อจุดประสงค์นี้ฉันใช้ pooled OLS: โดยที่คือรายได้จากการบันทึกต่อปีรวม covariates ที่แตกต่างกันไปตามแต่ละบุคคลและเวลาคือ dummies ปีและ{\ rm male} _iเท่ากับหนึ่งถ้าคนงานเป็นผู้ชายและไม่มีศูนย์yit=X′itβ+δmalei+∑t=110γtdt+εityit=Xit′β+δmalei+∑t=110γtdt+εit y_{it} = X'_{it}\beta + \delta {\rm male}_i + \sum^{10}_{t=1}\gamma_t d_t + \varepsilon_{it} yyyXitXitX_{it}dtdtd_tmaleimalei{\rm male}_i ตอนนี้ฉันมีความกังวลว่าเพื่อนร่วมพันธุ์บางคนอาจมีความสัมพันธ์กับเอฟเฟกต์คงที่ที่ไม่ได้สังเกต แต่เมื่อฉันใช้เอฟเฟ็กต์คงที่ (ภายใน) ตัวประมาณหรือความแตกต่างครั้งแรกฉันเสียโมเดลเพศเพราะตัวแปรนี้ไม่เปลี่ยนแปลงตลอดเวลา ฉันไม่ต้องการใช้ตัวประมาณเอฟเฟกต์แบบสุ่มเพราะฉันมักจะได้ยินคนพูดว่ามันทำให้สมมติฐานที่ไม่สมจริงมากและไม่น่าจะถือได้ มีวิธีใดบ้างที่จะรักษาความหลอกทางเพศและควบคุมเอฟเฟกต์คงที่ในเวลาเดียวกันได้หรือไม่? หากมีวิธีฉันต้องจัดกลุ่มหรือดูแลปัญหาอื่น ๆ ด้วยข้อผิดพลาดสำหรับการทดสอบสมมติฐานเกี่ยวกับตัวแปรเพศหรือไม่?

5
การถดถอยโลจิสติกเป็นการทดสอบแบบไม่อิงพารามิเตอร์หรือไม่?
ฉันเพิ่งได้รับคำถามต่อไปนี้ทางอีเมล ฉันจะโพสต์คำตอบด้านล่าง แต่ฉันสนใจที่จะฟังสิ่งที่คนอื่นคิด คุณจะเรียกการถดถอยโลจิสติกว่าเป็นการทดสอบแบบไม่อิงพารามิเตอร์หรือไม่? ความเข้าใจของฉันคือการติดฉลากการทดสอบที่ไม่ใช่พารามิเตอร์เนื่องจากข้อมูลของมันไม่ได้กระจายตามปกติไม่เพียงพอ มันจะทำอย่างไรกับการขาดสมมติฐาน การถดถอยโลจิสติกมีสมมติฐาน

2
การถดถอยเชิงเส้นหลายครั้งสำหรับการทดสอบสมมติฐาน
ฉันคุ้นเคยกับการใช้การถดถอยเชิงเส้นหลายครั้งเพื่อสร้างแบบจำลองของตัวแปรต่าง ๆ อย่างไรก็ตามฉันสงสัยว่าการทดสอบการถดถอยจะใช้ในการทำการทดสอบสมมติฐานพื้นฐานประเภทใด ถ้าเป็นเช่นนั้นสถานการณ์ / สมมติฐานเหล่านั้นจะเป็นอย่างไร?

4
จะระบุสมมติฐานว่างในการทดสอบสมมติฐานได้อย่างไร
อะไรคือกฎที่ดีสำหรับการเลือกคำถามสำหรับสมมติฐานว่าง ตัวอย่างเช่นถ้าฉันต้องการตรวจสอบว่าสมมติฐาน B เป็นจริงฉันควรใช้ B เป็นโมฆะ, B เป็นสมมติฐานทางเลือกหรือไม่เป็น B เปล่า? ฉันหวังว่าคำถามจะชัดเจน ฉันรู้ว่ามันมีบางอย่างเกี่ยวกับข้อผิดพลาดที่ฉันต้องการย่อเล็กสุด (Type I?) แต่ฉันก็ลืมไปว่ามันไปอย่างไรเพราะฉันไม่มีสัญชาตญาณที่ชัดเจนสำหรับมัน ขอบคุณ

4
การยอมรับสมมติฐานว่าง
นี่คือคำถามการอภิปรายเกี่ยวกับจุดตัดของสถิติและวิทยาศาสตร์อื่น ๆ ฉันมักเผชิญปัญหาเดียวกัน: นักวิจัยในสาขาของฉันมักจะบอกว่าไม่มีผลเมื่อค่า p ไม่น้อยกว่าระดับนัยสำคัญ ในตอนแรกฉันมักจะตอบว่านี่ไม่ใช่วิธีการทดสอบสมมติฐาน เมื่อคำถามนี้เกิดขึ้นบ่อยครั้งฉันต้องการจะหารือเกี่ยวกับปัญหานี้กับนักสถิติที่มีประสบการณ์มากกว่า ให้เราพิจารณาบทความล่าสุดในวารสารวิทยาศาสตร์จาก "กลุ่มสำนักพิมพ์ที่ดีที่สุด" Nature Communications Biology (มีหลายตัวอย่าง แต่ให้มุ่งเน้นไปที่หนึ่ง) นักวิจัยตีความผลลัพธ์ที่ไม่มีนัยสำคัญทางสถิติด้วยวิธีต่อไปนี้: ดังนั้นเรื้อรังข้อ จำกัด แคลอรี่ในระดับปานกลางสามารถยืดอายุการใช้งานและเสริมสร้างสุขภาพของเจ้าคณะ แต่มันมีผลต่อสมองสมบูรณ์เรื่องสีเทาโดยไม่มีผลต่อการแสดงความรู้ความเข้าใจ พิสูจน์: อย่างไรก็ตามการแสดงในงานเขาวงกต Barnes นั้นไม่แตกต่างกันระหว่างสัตว์ควบคุมและสัตว์ที่ จำกัด แคลอรี (LME: F = 0.05, p = 0.82; รูปที่ 2a) ในทำนองเดียวกันงานการสลับที่เกิดขึ้นเองไม่ได้เปิดเผยความแตกต่างระหว่างสัตว์ที่ควบคุมและสัตว์ที่ จำกัด แคลอรี่ (LME: F = 1.63, p = 0.22; รูปที่ 2b) ผู้เขียนยังแนะนำให้อธิบายถึงการขาดผลกระทบ - แต่ประเด็นสำคัญไม่ใช่คำอธิบาย …

5
ฉันจะคำนวณได้อย่างไรว่าการถดถอยเชิงเส้นของฉันมีความแตกต่างอย่างมีนัยสำคัญทางสถิติจากเส้นทฤษฎีที่รู้จักหรือไม่?
ฉันมีข้อมูลบางอย่างที่พอดีกับเส้นตรง ๆ : เมื่อฉันทำการถดถอยเชิงเส้นของค่าเหล่านี้ฉันจะได้สมการเชิงเส้น: y=0.997x−0.0136y=0.997x−0.0136y = 0.997x-0.0136 ในโลกที่เหมาะสมการควรจะมีxy=xy=xy = x เห็นได้ชัดว่าค่าเชิงเส้นของฉันใกล้เคียงกับอุดมคตินั้น แต่ไม่แน่นอน คำถามของฉันคือฉันจะทราบได้อย่างไรว่าผลลัพธ์นี้มีนัยสำคัญทางสถิติหรือไม่ ค่า 0.997 แตกต่างอย่างมีนัยสำคัญจาก 1 หรือไม่? -0.01 แตกต่างอย่างมีนัยสำคัญจาก 0 หรือไม่ หรือว่าเป็นสถิติเดียวกันและฉันสามารถสรุปได้ว่าด้วยระดับความเชื่อมั่นที่สมเหตุสมผลหรือไม่?y=xy=xy=x การทดสอบทางสถิติที่ดีที่ฉันสามารถใช้ได้คืออะไร ขอบคุณ

4
ความน่าจะเป็นที่สมมติฐานของ Null นั้นเป็นจริง
ดังนั้นนี่อาจเป็นคำถามทั่วไป แต่ฉันไม่เคยพบคำตอบที่น่าพอใจ คุณจะตัดสินความน่าจะเป็นที่สมมติฐานว่างเป็นจริงได้อย่างไร (หรือเท็จ) สมมติว่าคุณให้นักเรียนทดสอบสองรุ่นที่แตกต่างกันและต้องการดูว่ารุ่นนั้นเทียบเท่ากันหรือไม่ คุณทำการทดสอบ t และให้ค่า p เป็น. 02 ช่างเป็นสิ่งที่คุ้มค่า! นั่นต้องหมายความว่าไม่น่าเป็นไปได้ที่การทดสอบจะเทียบเท่ากันใช่มั้ย ไม่น่าเสียดายที่ปรากฏว่า P (ผลลัพธ์ | null) ไม่ได้บอกคุณ P (null | ผลลัพธ์) สิ่งปกติที่ต้องทำคือการปฏิเสธสมมติฐานว่างเมื่อเราพบ p-value ต่ำ แต่เราจะรู้ได้อย่างไรว่าเราไม่ปฏิเสธสมมติฐานว่างที่น่าจะเป็นจริง? เพื่อยกตัวอย่างที่โง่ฉันสามารถออกแบบการทดสอบสำหรับอีโบลาด้วยอัตราบวกที่ผิดพลาดที่. 02: ใส่ 50 ลูกลงในถังและเขียน“ อีโบลา” ในที่เดียว ถ้าฉันทดสอบบางคนด้วยสิ่งนี้และพวกเขาเลือกลูกบอล "อีโบลา" ค่า p (P (เลือกลูก | พวกเขาไม่มีอีโบลา)) คือ. 02 สิ่งที่ฉันได้พิจารณาแล้ว: สมมติว่า P (null | ผลลัพธ์) …

5
ขนาดของเอฟเฟกต์ดีกว่าค่า p จริง ๆ หรือไม่
การเน้นจำนวนมากนั้นขึ้นอยู่กับการพึ่งพาและการรายงานขนาดผลกระทบมากกว่าค่า pในการวิจัยประยุกต์ แต่ไม่ใช่ในกรณีที่ขนาดของเอฟเฟกต์เหมือนกับค่าpเป็นตัวแปรสุ่มและเช่นนั้นอาจแตกต่างกันไปตามตัวอย่างเมื่อทำการทดลองเดียวกันซ้ำ ฉันกำลังถามว่าคุณลักษณะทางสถิติใด (เช่นขนาดของเอฟเฟกต์เป็นตัวแปรน้อยกว่าจากตัวอย่างไปยังตัวอย่างกว่าค่า p) ทำให้ขนาดของเอฟเฟกต์ดีกว่าดัชนีการวัดที่เป็นหลักฐานได้ดีกว่าค่า p อย่างไรก็ตามฉันควรพูดถึงข้อเท็จจริงสำคัญที่แยก p-value ออกจากขนาดเอฟเฟกต์ นั่นคือขนาดของเอฟเฟกต์เป็นสิ่งที่ต้องประมาณเนื่องจากมีพารามิเตอร์ประชากร แต่ค่าp จะไม่มีค่าใด ๆ ที่จะถูกประเมินเนื่องจากมันไม่มีพารามิเตอร์ประชากร สำหรับฉันขนาดของเอฟเฟกต์เป็นเพียงตัวชี้วัดที่ในบางพื้นที่ของการวิจัย (เช่นการวิจัยของมนุษย์) ช่วยเปลี่ยนการค้นพบเชิงประจักษ์ที่มาจากเครื่องมือการวัดที่นักวิจัยพัฒนาขึ้นมาเป็นเครื่องมือวัดทั่วไป ชมรมวิจัยเชิงปริมาณ. บางทีถ้าเราใช้สัดส่วนที่เรียบง่ายเป็นขนาดเอฟเฟกต์สิ่งต่อไปนี้ (ใน R) คืออะไรที่แสดงให้เห็นถึงขนาดที่ใหญ่ที่สุดของเอฟเฟกต์มากกว่าค่า p (การเปลี่ยนแปลงค่า p แต่ขนาดผลไม่ได้) binom.test(55, 100, .5) ## p-value = 0.3682 ## proportion of success 55% binom.test(550, 1000, .5) ## p-value = 0.001731 ## proportion of …

2
การอนุมานเชิงสถิติภายใต้การสะกดผิด
การรักษาแบบดั้งเดิมของการอนุมานทางสถิติอาศัยสมมติฐานที่ว่ามีการใช้สถิติที่ระบุอย่างถูกต้อง นั่นคือการกระจายP∗(Y)P∗(Y)\mathbb{P}^*(Y)ที่สร้างข้อมูลที่สังเกตได้เป็นส่วนหนึ่งของแบบจำลองทางสถิติ : อย่างไรก็ตามในสถานการณ์ส่วนใหญ่เราไม่สามารถสรุปได้ว่านี่เป็นเรื่องจริง ฉันสงสัยว่าจะเกิดอะไรขึ้นกับขั้นตอนการอนุมานเชิงสถิติหากเราทิ้งสมมติฐานที่ระบุไว้อย่างถูกต้องyyyMM\mathcal{M}P∗(Y)∈M={Pθ(Y):θ∈Θ}P∗(Y)∈M={Pθ(Y):θ∈Θ}\mathbb{P}^*(Y) \in \mathcal{M}=\{\mathbb{P}_\theta(Y) :\theta \in \Theta\} ฉันได้พบงานบางอย่างของWhite 1982ในการประมาณ ML ภายใต้การสะกดผิด มันเป็นที่ถกเถียงกันอยู่ว่ามีความเป็นไปได้มากที่สุดคือการประเมินที่สอดคล้องกันสำหรับการแจกแจง ที่ช่วยลด KL-แตกต่างจากการกระจายทั้งหมดภายในแบบจำลองทางสถิติและการจัดจำหน่ายจริง\ mathbb {P} ^ *Pθ1=argminPθ∈MKL(P∗,Pθ)Pθ1=arg⁡minPθ∈MKL(P∗,Pθ)\mathbb{P}_{\theta_1}=\arg \min_{\mathbb{P}_\theta \in \mathcal{M}} KL(\mathbb{P}^*,\mathbb{P}_\theta)P∗P∗\mathbb{P}^* เกิดอะไรขึ้นกับตัวประมาณค่าความเชื่อมั่น ให้สรุปความเชื่อมั่นชุดประเมิน Let δ:ΩY→2Θδ:ΩY→2Θ\delta:\Omega_Y \rightarrow 2^\Thetaเป็นประมาณการที่ตั้งไว้ที่ΩYΩY\Omega_Yเป็นพื้นที่ตัวอย่างและ2Θ2Θ2^\Thetaชุดไฟมากกว่าพื้นที่พารามิเตอร์\ΘΘ\Thetaสิ่งที่เราอยากรู้คือความน่าจะเป็นของเหตุการณ์ที่ชุดที่สร้างโดยδδ\deltaรวมการแจกแจงที่แท้จริงP∗P∗\mathbb{P}^*นั่นคือP∗(P∗∈{Pθ:θ∈δ(Y)}):=A.P∗(P∗∈{Pθ:θ∈δ(Y)}):=A.\mathbb{P}^*(\mathbb{P}^* \in \{P_\theta : \theta \in \delta(Y)\}):=A. อย่างไรก็ตามเราแน่นอนไม่ทราบความจริงการกระจาย * สมมติฐานที่กำหนดไว้อย่างถูกต้องบอกเราว่า{M} อย่างไรก็ตามเรายังไม่ทราบว่าเป็นรุ่นใด แต่เป็นผูกพันที่ต่ำกว่าสำหรับความน่าจะเป็น Equationคือการ จำกัด คลาสสิกของระดับความเชื่อมั่นสำหรับตัวประมาณค่าชุดความเชื่อมั่นP∗P∗\mathbb{P}^*P∗∈MP∗∈M\mathbb{P}^* \in \mathcal{M}infθ∈ΘPθ(θ∈δ(Y)):=Binfθ∈ΘPθ(θ∈δ(Y)):=B\inf_{\theta \in \Theta} \mathbb{P}_\theta(\theta …

2
ขนาดตัวอย่างที่ไม่เท่ากัน: เมื่อใดที่จะเรียกมันจะหยุดทำงาน
ฉันกำลังตรวจสอบบทความวารสารวิชาการและผู้เขียนได้เขียนสิ่งต่อไปนี้เป็นเหตุผลสำหรับการไม่รายงานสถิติเชิงอนุมาน (ฉันระบุลักษณะของทั้งสองกลุ่ม): รวม 25 แห่ง 2,349 (1.1%) ผู้ตอบแบบสอบถามรายงานX เรางดเว้นอย่างเหมาะสมจากการนำเสนอการวิเคราะห์ที่เปรียบเทียบกลุ่มXกับกลุ่มY (ผู้เข้าร่วมอื่น 2,324 คน) เนื่องจากผลลัพธ์เหล่านั้นอาจได้รับแรงผลักดันอย่างมากจากโอกาสด้วยผลลัพธ์ที่หายากนี้ คำถามของฉันคือผู้เขียนของการศึกษานี้เป็นธรรมในการขว้างปาในผ้าขนหนูที่เกี่ยวกับการเปรียบเทียบกลุ่ม? ถ้าไม่ฉันจะแนะนำอะไรให้พวกเขาบ้าง

3
p = 5.0% สำคัญหรือไม่
วันนี้ฉันถูกถามว่า p-value 0.05 (ตรง) ถือว่ามีนัยสำคัญ (ให้ alpha = 5%) หรือไม่ ฉันไม่ทราบคำตอบและ Google เปิดทั้งสองคำตอบ: (a) ผลลัพธ์มีความสำคัญถ้า p น้อยกว่า 5% และ (b) ถ้า p น้อยกว่า 5% หรือเท่ากับ 5% แน่นอนว่าไม่มีเว็บไซต์ใดที่อ้างถึงใครเลย ทำไมหนึ่ง - มันเป็นความรู้ทั่วไปและ 5% เป็นสิ่งที่ไม่มีเหตุผล แต่นั่นไม่ได้ช่วยให้ฉันบอกนักเรียนถึงสิ่งที่ต้องจำ ดังนั้นนี่คือคำถามที่หมดหวังของฉันในการทดสอบสมมติฐาน: ถ้าค่า p เป็นค่าอัลฟา - ฉันจะพิจารณาผลลัพธ์ที่มีนัยสำคัญหรือไม่? และการอ้างอิงเชิงอำนาจในกรณีนี้คืออะไร? ขอบคุณมาก

3
วิธีการทดสอบความเท่าเทียมกันพร้อมกันของสัมประสิทธิ์เลือกใน logit หรือ probit model?
วิธีการทดสอบความเท่าเทียมกันพร้อมกันของสัมประสิทธิ์เลือกใน logit หรือ probit model? วิธีมาตรฐานคืออะไรและสถานะของศิลปะคืออะไร?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.