คำถามติดแท็ก statistical-significance

นัยสำคัญทางสถิติหมายถึงความน่าจะเป็นที่ถ้าในประชากรที่ตัวอย่างนี้ถูกดึงออกมาผลที่แท้จริงคือ 0 (หรือค่าที่ตั้งสมมติฐานไว้บางส่วน) สถิติทดสอบที่มากหรือสุดขั้วเกินกว่าที่จะเกิดขึ้นในกลุ่มตัวอย่าง

2
จะเลือกระดับนัยสำคัญสำหรับชุดข้อมูลขนาดใหญ่ได้อย่างไร
ฉันทำงานกับชุดข้อมูลโดยมี N ประมาณ 200,000 ในการถดถอยฉันเห็นค่านัยสำคัญน้อยมาก << 0.001 ที่เกี่ยวข้องกับขนาดเอฟเฟกต์ที่เล็กมากเช่น r = 0.028 สิ่งที่ฉันอยากรู้คือมีวิธีหลักการในการตัดสินใจเลือกขีด จำกัด นัยสำคัญที่เหมาะสมเมื่อเทียบกับขนาดตัวอย่างหรือไม่ มีข้อควรพิจารณาอื่น ๆ ที่สำคัญเกี่ยวกับการตีความขนาดของเอฟเฟกต์กับตัวอย่างขนาดใหญ่เช่นนี้หรือไม่?

1
ความสำคัญของความแตกต่างระหว่างการนับสองครั้ง
มีวิธีการตรวจสอบหรือไม่ว่าความแตกต่างระหว่างการนับอุบัติเหตุทางถนน ณ เวลา 1 นั้นแตกต่างจากการนับครั้งที่ 2 หรือไม่? ฉันได้พบวิธีการที่แตกต่างกันในการกำหนดความแตกต่างระหว่างกลุ่มการสังเกตในเวลาที่ต่างกัน (เช่นการเปรียบเทียบปัวซองหมายถึง) แต่ไม่ใช่สำหรับการเปรียบเทียบการนับเพียงสองครั้ง หรือจะลองใช้ไม่ได้? คำแนะนำหรือทิศทางใด ๆ ที่จะได้รับการชื่นชม ฉันมีความสุขที่จะนำไปสู่การติดตามตัวเอง

4
สถิติ Ljung-Box สำหรับ ARIMA ที่เหลือใน R: ผลการทดสอบที่สับสน
ฉันมีอนุกรมเวลาที่ฉันพยายามคาดการณ์ซึ่งฉันใช้ ARIMA ตามฤดูกาล (0,0,0) (0,1,0) [12] โมเดล (= fit2) มันแตกต่างจากสิ่งที่ R แนะนำกับ auto.arima (R คำนวณ ARIMA (0,1,1) (0,1,0) [12] น่าจะเหมาะกว่าฉันตั้งชื่อมันว่า fit1) อย่างไรก็ตามในช่วง 12 เดือนสุดท้ายของซีรีส์เวลาของฉันโมเดลของฉัน (พอดี 2) ดูเหมือนจะดีกว่าเมื่อปรับแล้ว (มันมีอคติเรื้อรังฉันได้เพิ่มค่าเฉลี่ยที่เหลือ นี่คือตัวอย่างของ 12 เดือนล่าสุดและ MAPE สำหรับ 12 เดือนล่าสุดสำหรับทั้งสองพอดี: อนุกรมเวลามีลักษณะดังนี้: จนถึงตอนนี้ดีมาก ฉันทำการวิเคราะห์ที่เหลือสำหรับทั้งสองรุ่นและนี่คือความสับสน acf (ส่วนที่เหลือ (พอดี 1)) ดูดีมากเสียงดังมาก: อย่างไรก็ตามการทดสอบ Ljung-Box นั้นดูไม่ดีเช่น 20 lags: Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1) ฉันได้รับผลลัพธ์ต่อไปนี้: …

3
ทดสอบความแตกต่างที่สำคัญระหว่างค่าความชันสองค่า
ข้อมูลที่ฉันมีคือค่าความชันถดถอยของเวลา y ~, ข้อผิดพลาดมาตรฐาน, ค่า n และค่า ap, สำหรับสปีชีส์ที่เฉพาะเจาะจงในสองพื้นที่ที่แตกต่างกัน ฉันต้องการตรวจสอบว่าความชันถดถอยสำหรับหนึ่งพื้นที่นั้นแตกต่างจากความชันถดถอยสำหรับพื้นที่อื่น - เป็นไปได้ไหมที่มีข้อมูลเช่นนี้ ไม่มีใครมีข้อเสนอแนะใด ๆ ที่ฉันจะไปเกี่ยวกับเรื่องนี้? ฉันไม่สามารถเข้าถึงข้อมูลดิบได้อย่างน่าเสียดาย ... ขออภัยที่เป็นคำถามง่าย ๆ เช่นนี้!

5
ฉันจะคำนวณได้อย่างไรว่าการถดถอยเชิงเส้นของฉันมีความแตกต่างอย่างมีนัยสำคัญทางสถิติจากเส้นทฤษฎีที่รู้จักหรือไม่?
ฉันมีข้อมูลบางอย่างที่พอดีกับเส้นตรง ๆ : เมื่อฉันทำการถดถอยเชิงเส้นของค่าเหล่านี้ฉันจะได้สมการเชิงเส้น: y=0.997x−0.0136y=0.997x−0.0136y = 0.997x-0.0136 ในโลกที่เหมาะสมการควรจะมีxy=xy=xy = x เห็นได้ชัดว่าค่าเชิงเส้นของฉันใกล้เคียงกับอุดมคตินั้น แต่ไม่แน่นอน คำถามของฉันคือฉันจะทราบได้อย่างไรว่าผลลัพธ์นี้มีนัยสำคัญทางสถิติหรือไม่ ค่า 0.997 แตกต่างอย่างมีนัยสำคัญจาก 1 หรือไม่? -0.01 แตกต่างอย่างมีนัยสำคัญจาก 0 หรือไม่ หรือว่าเป็นสถิติเดียวกันและฉันสามารถสรุปได้ว่าด้วยระดับความเชื่อมั่นที่สมเหตุสมผลหรือไม่?y=xy=xy=x การทดสอบทางสถิติที่ดีที่ฉันสามารถใช้ได้คืออะไร ขอบคุณ

2
การทดสอบทางสถิติที่แข็งแกร่งคืออะไร การทดสอบทางสถิติที่มีประสิทธิภาพคืออะไร
การทดสอบทางสถิติบางอย่างมีประสิทธิภาพและบางการทดสอบนั้นไม่ ความทนทานหมายถึงอะไรกันแน่? น่าแปลกที่ฉันไม่พบคำถามดังกล่าวในเว็บไซต์นี้ นอกจากนี้บางครั้งความแข็งแรงและพลังของการทดสอบจะถูกกล่าวถึงด้วยกัน และอย่างสังหรณ์ใจฉันไม่สามารถแยกความแตกต่างระหว่างสองแนวคิด การทดสอบที่ทรงพลังคืออะไร? มันแตกต่างจากการทดสอบทางสถิติที่มีประสิทธิภาพอย่างไร

4
มีอคติในการเลือกคณะลูกขุน?
เพื่อนเป็นตัวแทนของลูกค้าเกี่ยวกับการอุทธรณ์หลังจากการพิจารณาคดีทางอาญาซึ่งปรากฏว่าการคัดเลือกคณะลูกขุนมีความลำเอียงทางเชื้อชาติ คณะลูกขุนประกอบด้วย 30 คนในกลุ่มเชื้อชาติ 4 กลุ่ม การฟ้องร้องใช้ความท้าทายแบบไม่ต้องลงแรงเพื่อกำจัดคนเหล่านี้ 10 คนออกจากกลุ่ม จำนวนคนและจำนวนความท้าทายที่เกิดขึ้นจริงในแต่ละกลุ่มเชื้อชาติตามลำดับ: A: 10, 1 B: 10, 4 C: 6, 4 D: 4, 1 total: 30 in pool, 10 challenges จำเลยก็มาจากเชื้อชาติกลุ่มซีและผู้ที่ตกเป็นเหยื่อจากกลุ่มเชื้อชาติและ D เพื่อความกังวลเบื้องต้นไม่ว่าจะเป็นกลุ่ม C มีมากกว่าที่ท้าทายและกลุ่ม A และ D ภายใต้การท้าทาย ถูกต้องตามกฎหมาย (IIUC; IANAL) การป้องกันไม่จำเป็นต้องพิสูจน์ความลำเอียงทางเชื้อชาติ แต่เพียงเพื่อแสดงให้เห็นว่าข้อมูลดูเหมือนจะบ่งบอกถึงความลำเอียงซึ่งทำให้ภาระในการฟ้องร้องอธิบายความท้าทายที่ไม่ใช่เชื้อชาติ การวิเคราะห์ต่อไปนี้ถูกต้องในแนวทางของมันหรือไม่? (ฉันคิดว่าการคำนวณนั้นใช้ได้): มี nCr (30,10) = 30,045,015 ชุดที่แตกต่างกันของสมาชิกพูล …

3
p = 5.0% สำคัญหรือไม่
วันนี้ฉันถูกถามว่า p-value 0.05 (ตรง) ถือว่ามีนัยสำคัญ (ให้ alpha = 5%) หรือไม่ ฉันไม่ทราบคำตอบและ Google เปิดทั้งสองคำตอบ: (a) ผลลัพธ์มีความสำคัญถ้า p น้อยกว่า 5% และ (b) ถ้า p น้อยกว่า 5% หรือเท่ากับ 5% แน่นอนว่าไม่มีเว็บไซต์ใดที่อ้างถึงใครเลย ทำไมหนึ่ง - มันเป็นความรู้ทั่วไปและ 5% เป็นสิ่งที่ไม่มีเหตุผล แต่นั่นไม่ได้ช่วยให้ฉันบอกนักเรียนถึงสิ่งที่ต้องจำ ดังนั้นนี่คือคำถามที่หมดหวังของฉันในการทดสอบสมมติฐาน: ถ้าค่า p เป็นค่าอัลฟา - ฉันจะพิจารณาผลลัพธ์ที่มีนัยสำคัญหรือไม่? และการอ้างอิงเชิงอำนาจในกรณีนี้คืออะไร? ขอบคุณมาก

2
ตรวจสอบจุดสูงสุดที่มีนัยสำคัญทางสถิติ
ฉันมีชุดของข้อมูลที่เป็นและxฉันต้องการทดสอบสมมติฐานต่อไปนี้: มีจุดสูงสุดใน ; นั่นคือเมื่อเพิ่มขึ้นเพิ่มขึ้นก่อนแล้วจึงลดลงYYyxxxYYyxxxYYy ความคิดแรกของฉันคือการติดตั้งและใน SLR นั่นคือถ้าฉันพบว่าสัมประสิทธิ์ก่อนเป็นบวกอย่างมีนัยสำคัญและสัมประสิทธิ์ก่อนเป็นลบอย่างมีนัยสำคัญฉันก็สนับสนุนสมมติฐาน อย่างไรก็ตามสิ่งนี้จะตรวจสอบความสัมพันธ์ประเภทเดียวเท่านั้น (สมการกำลังสอง) และอาจไม่จำเป็นต้องมีอยู่ของจุดสูงสุดxxxx2x2x^2xxxx2x2x^2 จากนั้นฉันก็คิดว่าจะหาเช่นภูมิภาค (ค่าเรียงลำดับ)นั่นคืออยู่ระหว่างและสองส่วนอื่น ๆ ของที่มีคะแนนอย่างน้อยที่สุดเท่ากับและ และอย่างมีนัยสำคัญ หากสมมติฐานที่เป็นความจริงที่เราควรคาดหวังว่าภูมิภาคดังกล่าวจำนวนมากขดังนั้นหากจำนวนมีขนาดใหญ่พอสมควรก็ควรมีการสนับสนุนสมมติฐานขขbxxxขขbaaaคคcxxxขขbYข¯> ya¯Yข¯>Ya¯\bar{y_b}>\bar{y_a}Yข¯> yค¯Yข¯>Yค¯\bar{y_b}>\bar{y_c}ขขbขขb คุณคิดว่าฉันอยู่ในเส้นทางที่ถูกต้องเพื่อหาแบบทดสอบที่เหมาะสมสำหรับสมมติฐานของฉันหรือไม่? หรือฉันจะประดิษฐ์วงล้อและมีวิธีการที่กำหนดไว้สำหรับปัญหานี้หรือไม่? ฉันจะซาบซึ้งในความคิดเห็นของคุณ UPDATE ขึ้นอยู่กับตัวแปรของฉันคือนับ (จำนวนเต็มไม่เป็นลบ)YYy

3
เหตุใดข้อความที่ตัดตอนมานี้บอกว่าการประมาณค่าเบี่ยงเบนมาตรฐานโดยปกติจะไม่เกี่ยวข้องกัน
ฉันอ่านเกี่ยวกับการคำนวณการประมาณค่าเบี่ยงเบนมาตรฐานและแหล่งข้อมูลที่ฉันอ่านระบุไว้ (... ) ยกเว้นในบางสถานการณ์ที่สำคัญงานมีความเกี่ยวข้องเพียงเล็กน้อยกับการใช้งานสถิติเนื่องจากความต้องการของมันถูกหลีกเลี่ยงโดยขั้นตอนมาตรฐานเช่นการใช้การทดสอบที่สำคัญและช่วงความเชื่อมั่นหรือโดยใช้การวิเคราะห์แบบเบย์ ฉันสงสัยว่าถ้าใครสามารถอธิบายเหตุผลของข้อความนี้ได้ตัวอย่างเช่นช่วงความมั่นใจไม่ได้ใช้ค่าเบี่ยงเบนมาตรฐานเป็นส่วนหนึ่งของการคำนวณหรือไม่ ดังนั้นช่วงความเชื่อมั่นจะไม่ได้รับผลกระทบจากค่าเบี่ยงเบนมาตรฐานแบบเอนเอียงหรือไม่? แก้ไข: ขอบคุณสำหรับคำตอบจนถึงตอนนี้ แต่ฉันไม่แน่ใจว่าฉันทำตามเหตุผลบางอย่างของพวกเขาดังนั้นฉันจะเพิ่มตัวอย่างง่าย ๆ ประเด็นก็คือว่าถ้าแหล่งข้อมูลนั้นถูกต้องแล้วก็มีบางอย่างผิดปกติจากการสรุปตัวอย่างและฉันอยากให้ใครสักคนชี้ให้เห็นว่าค่า p ไม่ได้ขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานอย่างไร สมมติว่านักวิจัยต้องการทดสอบว่าคะแนนเฉลี่ยของนักเรียนระดับประถมห้าในการทดสอบในเมืองของเขาหรือเธอแตกต่างจากค่าเฉลี่ยของชาติที่ 76 ด้วยระดับนัยสำคัญ 0.05 หรือไม่ ผู้วิจัยสุ่มตัวอย่างนักเรียน 20 คน ค่าเฉลี่ยตัวอย่างเท่ากับ 80.85 ค่าเบี่ยงเบนมาตรฐานตัวอย่างเท่ากับ 8.87 ซึ่งหมายความว่า: t = (80.85-76) / (8.87 / sqrt (20)) = 2.44 จากนั้นใช้ตาราง t เพื่อคำนวณว่าค่าความน่าจะเป็นแบบสองด้านที่เท่ากับ 2.44 กับ 19 df เท่ากับ 0.025 นี่ต่ำกว่าระดับนัยสำคัญ 0.05 เราจึงปฏิเสธสมมติฐานว่าง ดังนั้นในตัวอย่างนี้ค่า p …

2
คุณปฏิเสธสมมติฐานว่างเมื่อหรือหรือไม่
นี่เป็นเพียงคำจำกัดความหรือการประชุมอย่างชัดเจนและแทบไม่มีความสำคัญในทางปฏิบัติ หากถูกตั้งค่าเป็นค่าดั้งเดิมที่ 0.05 จะมีค่าเป็น0.0500000000000 ... ถือว่ามีนัยสำคัญทางสถิติหรือไม่? กฎในการกำหนดนัยสำคัญทางสถิติมักถือว่าเป็นหรือไม่αα\alphapppp&lt;αp&lt;αp < \alphap≤αp≤αp \leq \alpha

3
ฟิชเชอร์หมายถึงอะไรโดยอ้างนี้?
ฉันเห็นข้อความที่โด่งดังนี้ทุกที่ แต่ไม่เข้าใจส่วนที่ถูกเน้นทุกครั้ง คนที่ 'ปฏิเสธ' สมมติฐานเป็นการชั่วคราวเป็นเรื่องของการฝึกฝนเป็นนิสัยเมื่อความสำคัญอยู่ที่ระดับ 1% หรือสูงกว่าจะถูกเข้าใจผิดในการตัดสินใจเช่นนั้นไม่เกิน 1% เพราะเมื่อสมมติฐานถูกต้องเขาจะถูกเข้าใจผิดในเพียง 1% ของกรณีเหล่านี้และเมื่อมันไม่ถูกต้องเขาจะไม่ผิดในการปฏิเสธ [... ] อย่างไรก็ตามการคำนวณนั้นเป็นเรื่องไร้สาระทางวิชาการเพราะในความเป็นจริงไม่มีนักวิทยาศาสตร์คนใดมีระดับความสำคัญคงที่ซึ่งปีต่อปีและในทุกสถานการณ์เขาปฏิเสธสมมติฐาน; เขาค่อนข้างจะทำให้จิตใจของเขากับแต่ละกรณีโดยเฉพาะในแง่ของหลักฐานและความคิดของเขาไม่ควรลืมว่ากรณีที่เลือกใช้การทดสอบนั้นเป็นชุดที่เลือกอย่างชัดเจนและไม่สามารถระบุเงื่อนไขการเลือกแม้สำหรับผู้ปฏิบัติงานคนเดียว และในการโต้แย้งที่ใช้มันจะผิดกฎหมายอย่างชัดเจนสำหรับคนที่จะเลือกระดับความสำคัญที่แท้จริงที่ระบุโดยการทดลองโดยเฉพาะราวกับว่ามันเป็นนิสัยตลอดชีวิตของเขาที่จะใช้เพียงแค่ระดับนี้ (วิธีการทางสถิติและการอนุมานทางวิทยาศาสตร์, 1956, p. 42-45) โดยเฉพาะอย่างยิ่งฉันไม่เข้าใจ เหตุใดจึงถูกเลือกให้ทำการทดสอบ "เลือกอย่างสูง"? สมมติว่าคุณสงสัยว่าความสูงเฉลี่ยของคนในพื้นที่นั้นน้อยกว่า 165 ซม. หรือไม่และตัดสินใจทำการทดสอบ ขั้นตอนมาตรฐานเท่าที่ฉันรู้คือการสุ่มตัวอย่างจากพื้นที่และวัดความสูง วิธีนี้จะถูกเลือกอย่างมาก? สมมติว่าคดีได้รับการคัดสรรมาอย่างดี แต่สิ่งนี้เกี่ยวข้องกับการเลือกระดับนัยสำคัญอย่างไร ลองพิจารณาตัวอย่างข้างต้นอีกครั้งถ้าวิธีการสุ่มตัวอย่างของคุณ (สิ่งที่ฉันคิดว่าฟิชเชอร์หมายถึงเงื่อนไขการเลือก ) จะเบ้และคนที่มีความสูงก็ช่วยให้งานวิจัยทั้งหมดพังลงและการกำหนดระดับนัยสำคัญ พีพีp

1
“ ความรุนแรง” ของ Deborah Mayo คืออะไร?
ทุกคนสามารถให้คำอธิบายโดยละเอียด (และชัดเจน) ว่า "ความรุนแรง" ของเธอหมายถึงอะไร (ไม่ใช่แค่ฟังก์ชั่นพลังงานที่ประเมินจากความคลาดเคลื่อนที่แตกต่างกันตามสมมติฐานว่างเปล่า?) และมันเหมาะกับวรรณกรรมทดสอบทางสถิติโดยทั่วไปหรือไม่?

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training &lt;- twoClassSim(50, linearVars = 2) set.seed(849) testing &lt;- twoClassSim(500, linearVars = 2) trainX &lt;- training[, -ncol(training)] testX &lt;- testing[, -ncol(testing)] trainY &lt;- training$Class # Using glmnet to …

4
ตรวจสอบว่าการปรับปรุงความแม่นยำมีความสำคัญหรือไม่
สมมติว่าฉันมีอัลกอริทึมที่แบ่งสิ่งออกเป็นสองประเภท ฉันสามารถวัดความแม่นยำของอัลกอริทึมในการทดสอบ 1,000 รายการ - สมมติว่า 80% ของสิ่งต่าง ๆ ได้รับการจัดประเภทอย่างถูกต้อง สมมติว่าฉันปรับเปลี่ยนอัลกอริทึมอย่างใดเพื่อให้ 81% ของสิ่งต่าง ๆ ถูกจัดประเภทอย่างถูกต้อง สถิติสามารถบอกอะไรฉันได้หรือไม่ว่าการปรับปรุงอัลกอริทึมของฉันมีนัยสำคัญทางสถิติหรือไม่ แนวคิดเรื่องนัยสำคัญทางสถิติเกี่ยวข้องกันในสถานการณ์นี้หรือไม่? กรุณาชี้ให้ฉันไปในทิศทางของทรัพยากรบางอย่างที่อาจเกี่ยวข้อง ขอบคุณมาก.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.