เราสามารถยอมรับค่าว่างในการทดสอบที่ไม่ได้มาหรือไม่?


11

ในวิธีทดสอบ t-test ปกติโดยใช้วิธีการทดสอบสมมติฐานตามปกติเราอาจปฏิเสธโมฆะหรือไม่สามารถปฏิเสธโมฆะ แต่เราไม่เคยยอมรับโมฆะ เหตุผลหนึ่งสำหรับเรื่องนี้คือถ้าเราได้รับหลักฐานมากขึ้นขนาดของเอฟเฟกต์เดียวกันจะกลายเป็นสิ่งสำคัญ

แต่จะเกิดอะไรขึ้นในการทดสอบความไม่ได้ตัวตน?

นั่นคือ:

H0:μ1μ0x

เมื่อเทียบกับ

H1:μ1μ0>x

โดยที่คือจำนวนเงินที่เราพิจารณาว่าเป็นสิ่งเดียวกัน ดังนั้นถ้าเราปฏิเสธโมฆะเราบอกว่ามีค่ามากกว่าอย่างน้อยxเราไม่สามารถปฏิเสธโมฆะหากมีหลักฐานไม่เพียงพอ xμ1μ0x

หากขนาดของเอฟเฟกต์เป็นหรือมากกว่านั้นจะมีความคล้ายคลึงกับการทดสอบแบบปกติ แต่ถ้าขนาดเอฟเฟกต์น้อยกว่าในตัวอย่างที่เรามี จากนั้นหากเราเพิ่มขนาดตัวอย่างและคงระดับเดิมไว้ ในกรณีนี้เราสามารถยอมรับค่าว่างได้หรือไม่?xx


1
สมมติฐานของคุณปะปนกันไหม? โดยปกติสำหรับการทดสอบ NI ข้อสมมติฐานว่างคือความแตกต่างมากกว่า x ในขณะที่ทางเลือกคือมันเป็นไฟล์หรือเท่ากับ x ฉันเดาว่ามันขึ้นอยู่กับลำดับความแตกต่างของคุณ
Björn

สวัสดี @ Björnมันจะขึ้นอยู่กับว่าสูงกว่าแย่กว่าหรือสูงกว่าดีกว่า
Peter Flom

1
มันเหมือนกับถามว่าใครสามารถยอมรับโมฆะในการทดสอบด้านเดียว? มีการอภิปรายของมันในความคิดเห็นบางส่วนเป็นstats.stackexchange.com/a/85914
อะมีบา

2
@ amoeba ฉันคิดว่าปีเตอร์นำเสนอข้อโต้แย้งที่น่าสนใจ (+1) อาจคล้ายกับความขัดแย้ง คำอธิบายธรรมดาหนึ่งคำว่าทำไมเราไม่ "ยอมรับ H0" บางครั้งได้ยินว่า "ถ้าเรามีหลักฐานเพิ่มเติมขนาดของเอฟเฟกต์เดียวกันจะกลายเป็นสิ่งสำคัญ" แต่การทำตามตรรกะดังที่ Peter ทำเราก็มาถึงข้อสรุปว่าในบางสถานการณ์เราควร "ยอมรับ H0" หรือถ้าเราไม่ทำเช่นนั้น "เหตุผล" นั้นผิดจริงและไม่ใช่สาเหตุที่เราทำเลย ฉันเชื่อว่าคุณถูกต้อง - อาร์กิวเมนต์ของเขาจะใช้กับการทดสอบด้านเดียวด้วยเนื่องจากขนาดของเอฟเฟกต์เชิงลบยังคงไม่สำคัญเมื่อเพิ่ม n
Silverfish

1
ใช่ฉันเห็นด้วย: คำตอบที่เชื่อมโยงไม่ตอบคำถามของคุณ ฉันให้ลิงก์เท่านั้นเนื่องจากมีการอภิปรายที่เกี่ยวข้องในความคิดเห็นที่นั่น
อะมีบา

คำตอบ:


7

ตรรกะของคุณนำไปใช้ในทางเดียวกันกับการทดสอบด้านเดียวที่ดี (เช่นเดียวกับ x=0) ที่อาจคุ้นเคยกับผู้อ่านมากกว่า สำหรับรูปธรรมลองจินตนาการว่าเรากำลังทดสอบค่า NullH0:μ0 กับทางเลือกที่ μเป็นบวก ถ้าเป็นจริงμ เป็นลบการเพิ่มขนาดตัวอย่างจะไม่ให้ผลลัพธ์ที่มีนัยสำคัญกล่าวคือการใช้คำพูดของคุณมันไม่เป็นความจริงเลยว่า "ถ้าเรามีหลักฐานมากขึ้น

ถ้าเราทดสอบ H0:μ0เราสามารถมีผลลัพธ์ที่เป็นไปได้สามประการ:

  1. ครั้งแรก (1α)100%ช่วงความมั่นใจสามารถอยู่เหนือศูนย์ได้ทั้งหมด จากนั้นเราปฏิเสธโมฆะและยอมรับทางเลือกอื่น (นั่นμ เป็นบวก)

  2. ประการที่สองช่วงความมั่นใจอาจต่ำกว่าศูนย์ทั้งหมด ในกรณีนี้เราจะไม่ปฏิเสธค่าว่าง อย่างไรก็ตามในกรณีนี้ฉันคิดว่าเป็นการดีที่จะบอกว่าเรา "ยอมรับโมฆะ" เพราะเราสามารถพิจารณาได้H1 เป็นโมฆะอื่นและปฏิเสธอันนั้น

  3. ประการที่สามช่วงความมั่นใจอาจมีศูนย์ ถ้าอย่างนั้นเราก็ปฏิเสธไม่ได้H0 และเราไม่สามารถปฏิเสธได้ H1 อย่างใดอย่างหนึ่งดังนั้นจึงไม่มีอะไรที่จะยอมรับ

ดังนั้นฉันจะบอกว่าในสถานการณ์ด้านเดียวเราสามารถยอมรับโมฆะใช่ แต่เราไม่สามารถยอมรับได้เพียงเพราะเราไม่สามารถปฏิเสธได้ มีสามความเป็นไปได้ไม่ใช่สอง

(เช่นเดียวกันกับการทดสอบความเท่าเทียมกัน aka "การทดสอบสองด้าน" (TOST) การทดสอบที่ไม่ด้อยคุณภาพ ฯลฯ สามารถปฏิเสธการยอมรับยอมรับ null หรือรับผลสรุปไม่ได้)

ในทางตรงกันข้ามเมื่อ H0 เป็นจุดว่างเช่น H0:μ=0เราไม่สามารถยอมรับได้เพราะ H1:μ0 ไม่ถือเป็นสมมติฐานว่างที่ถูกต้อง

(เว้นแต่ μสามารถมีได้เฉพาะค่าที่ไม่ต่อเนื่องเช่นต้องเป็นจำนวนเต็ม ดูเหมือนว่าเราจะยอมรับได้H0:μ=0 เพราะ H1:μZ,μ0ตอนนี้มีสมมติฐานว่างที่ถูกต้อง นี่เป็นกรณีพิเศษเล็กน้อย)


ปัญหานี้ได้รับการพูดคุยกันเมื่อไม่นานมานี้ในความคิดเห็นภายใต้คำตอบของ @ gung ที่นี่: เหตุใดนักสถิติจึงบอกว่าผลลัพธ์ที่ไม่สำคัญแปลว่า "คุณไม่สามารถปฏิเสธโมฆะ" เมื่อเทียบกับการยอมรับสมมติฐานว่าง

ดูหัวข้อที่น่าสนใจ (และลงคะแนนต่ำกว่า) ความล้มเหลวในการปฏิเสธ null ในวิธี Neyman-Pearson หมายความว่าควร "ยอมรับ" หรือไม่ ที่ @Scortchi อธิบายว่าในกรอบ Neyman-Pearson ผู้เขียนบางคนไม่มีปัญหาในการพูดถึง "การยอมรับค่า Null" นั่นคือความหมายของ @Alexis ในวรรคสุดท้ายของคำตอบของเธอที่นี่


หากว่า (1α) ช่วงความมั่นใจสูงกว่าศูนย์ทั้งหมดจากนั้นปฏิเสธโมฆะนั้น μ0: เป็นการทดสอบที่มีขนาดตัวพิมพ์ที่แย่ที่สุด α2. หากว่า(1α) ช่วงความเชื่อมั่นต่ำกว่าศูนย์ทั้งหมดแล้วปฏิเสธโมฆะนั้น μ>0: เป็นการทดสอบที่มีขนาดตัวพิมพ์ที่แย่ที่สุด α2. ด้วยการรวมการทดสอบสองแบบเข้าด้วยกันทำให้คุณสามารถรักษาขนาดตัวพิมพ์ที่แย่ที่สุดได้α2เพราะค่า Null สองค่านั้นไม่เกิดร่วมกัน ดังนั้นผลลัพธ์ทั้งสามสามารถอธิบายได้ในแง่ของการยอมรับทางเลือกหนึ่งทางเลือกหรือทางเลือกอื่นหรือปฏิเสธไม่เป็นโมฆะ
Scortchi - Reinstate Monica

การทดสอบแบบสองด้านสามารถคิดแบบเดียวกับการทดสอบสองด้านเดียว แต่ทางเลือกไม่ได้มีความพิเศษร่วมกัน & ขนาดตัวพิมพ์ที่แย่ที่สุดคือα (เมื่อไหร่ μ=0)
Scortchi - Reinstate Monica

ขอบคุณ @Scortchi ยังไงก็เถอะฉันไม่แน่ใจว่าถ้าคุณเห็นด้วยหรือไม่เห็นด้วยกับคำตอบของฉัน
อะมีบา

เช่น μ0ไม่ยอมรับqua เป็นโมฆะในการทดสอบหนึ่ง แต่อีกทางเลือกหนึ่งในquaฉันรู้สึกว่า "การยอมรับค่า null" นั้นทำให้เกิดความสับสนโดยไม่จำเป็น อย่างไรก็ตามขั้นตอนของคุณควรตอบสนองผู้ที่มีความต้องการ สิ่งที่อาจสมควรได้รับการเน้นย้ำในคำตอบของคุณคือความแตกต่างระหว่างการรวมการทดสอบสำหรับการไม่ด้อยกว่าและการด้อยกว่าและในทางกลับกันและการทดสอบเพื่อความเหนือกว่าเทียบกับการไม่เหนือกว่า .
Scortchi - Reinstate Monica

@Scortchi ไวยากรณ์ของประโยคสุดท้ายของคุณค่อนข้างซับซ้อน: อะไรที่สามารถรวมกัน (หรือไม่สามารถ) และสิ่งที่แตกต่างกันคืออะไร? ฉันไม่แน่ใจว่าฉันเข้าใจคุณถูกต้องขอโทษ
อะมีบา

6

เราไม่เคย "ยอมรับสมมติฐานว่าง" (โดยไม่คำนึงถึงอำนาจและขนาดผลกระทบขั้นต่ำที่เกี่ยวข้อง) ด้วยการทดสอบสมมติฐานเพียงครั้งเดียวทำให้เรามีสภาวะของธรรมชาติH0จากนั้นจึงตอบคำถามที่แตกต่างกันบางคำถาม "เราจะสังเกตได้อย่างไรว่าข้อมูลพื้นฐานการทดสอบของเรามีสมมติฐานน้อยเพียงใด H0 (และสมมติฐานการกระจายของเรา) เป็นจริงหรือไม่ "เราจะปฏิเสธหรือไม่ปฏิเสธเรา H0 ขึ้นอยู่กับอัตราความผิดพลาด Type I ที่ต้องการและวาดข้อสรุปที่มักเกี่ยวกับ HA... นั่นคือเราพบหลักฐานที่จะสรุป HAหรือเราไม่พบหลักฐานที่จะสรุป HA. เราไม่ยอมรับH0เพราะเราไม่ได้หาหลักฐาน การไม่มีหลักฐาน (เช่นมีความแตกต่าง) ไม่เหมือนกับหลักฐานการขาด (เช่นมีความแตกต่าง) .

นี่เป็นเรื่องจริงสำหรับการทดสอบด้านเดียวเช่นเดียวกับการทดสอบแบบสองด้าน: เราแค่มองหาหลักฐานที่เป็นประโยชน์HA และหามันหรือไม่พบมัน

ถ้าเราทำท่าเดียวH0(โดยไม่ให้ความสนใจอย่างจริงจังกับขนาดผลกระทบขั้นต่ำที่เกี่ยวข้องและกำลังทางสถิติ) เรากำลังทำการยืนยันก่อนถึงอคติยืนยันอย่างมีประสิทธิภาพเพราะเราไม่ได้มองหาหลักฐานสำหรับH0มีเพียงหลักฐานของ HA. แน่นอนว่าเราสามารถ (และกล้าพูดได้ว่าควร ) ตั้งสมมติฐานว่างสำหรับและเทียบกับตำแหน่ง ( การทดสอบที่เกี่ยวข้องที่รวมการทดสอบความแตกต่าง ()H0+) ด้วยการทดสอบเพื่อความเท่าเทียมกัน (H0) ทำแค่นี้)

สำหรับฉันแล้วดูเหมือนว่าไม่มีเหตุผลใดที่คุณไม่สามารถรวมการอนุมานจากการทดสอบด้านเดียวกับความด้อยกว่าเข้ากับการทดสอบด้านเดียวสำหรับผู้ที่ไม่ด้อยกว่าเพื่อให้หลักฐาน (หรือขาดหลักฐาน) ทั้งสองทิศทางพร้อมกัน

แน่นอนถ้ามีใครกำลังพิจารณาขนาดกำลังไฟและเอฟเฟกต์และอีกอันหนึ่งก็ไม่สามารถปฏิเสธได้H0แต่รู้ว่ามี (a) ขนาดเอฟเฟกต์ที่เกี่ยวข้องขั้นต่ำบางอย่าง δและ (b) ข้อมูลของพวกเขามีพลังมากพอที่จะตรวจจับได้สำหรับการทดสอบที่กำหนดจากนั้นเราสามารถตีความได้ว่าเป็นหลักฐาน H0.


1
คำถามของปีเตอร์มีประเด็นที่น่าสนใจเป็นอย่างยิ่งที่คำตอบนี้ดูเหมือนจะวนเวียนอยู่: คำอธิบายทั่วไปที่ได้รับจากคำศัพท์มาตรฐาน "ล้มเหลวในการปฏิเสธ H0" คือคำศัพท์เช่นในการทดสอบทีถ้าเรามีหลักฐานมากขึ้น ขนาดจะกลายเป็นสิ่งสำคัญ แต่ถ้านี่เป็นเหตุผล "จริง" ที่เรา "ล้มเหลวในการปฏิเสธ" การโต้เถียงของเขาที่เราสามารถ "ยอมรับ H0" ในสถานการณ์ที่เขาสรุปดูเหมือนว่า (อย่างน้อยฉัน) จะแข็งแกร่ง แต่ฉันไม่แน่ใจว่าฉัน เห็นว่ามันทำอย่างอื่นมากกว่าตั้งใจเป็นสถิติสแลงแทนที่จะมีสติและจงใจ
Silverfish

1
คำตอบนี้จะย้ำถึงตำแหน่งเดิมของ "การยอมรับ H0" ในทางที่ดีชัดเจนรวบรัด แต่ดูเหมือนจะไม่ได้กล่าวถึงการโต้แย้งโดยตรง (หรืออาจจะเป็นความขัดแย้ง) ที่เป็นหัวใจของคำถามของปีเตอร์ คุณคิดอย่างไรกับ "เราไม่สามารถรับ H0 ได้เพราะถ้าเรามีหลักฐานเพิ่มเติมขนาดของเอฟเฟกต์แบบเดียวกันจะกลายเป็นเรื่องสำคัญ" สำหรับคำศัพท์ทั่วไป - มีข้อบกพร่องในการนำเสนอหรือการขยายของปีเตอร์หรือเป็นตรรกะ ของอาร์กิวเมนต์ดั้งเดิมไม่ถูกต้องตั้งแต่แรก?
Silverfish

1
@Silverfish ตามลิงค์ในคำตอบของฉันไปที่ "การทดสอบที่เกี่ยวข้อง" สำหรับการขยายความละเอียดที่สำคัญของฉันในการแก้ไขปัญหาของ "เราไม่สามารถรับ H0 เพราะถ้าเรามีหลักฐานเพิ่มเติมขนาดผลเดียวกันจะกลายเป็นสำคัญ"
Alexis

1
@ Alexis ฉันต้องเห็นด้วยกับ Silverfish ฉันซาบซึ้งในคำตอบของคุณ แต่ไม่ได้พูดถึงจุดศูนย์กลางของฉันเพราะเหตุผลที่ Silverfish แจ้งให้ทราบ ถ้าเรามี N = 1,000,000 แล้วความแตกต่างก็จะมีความสำคัญในการตั้งค่ามาตรฐาน แต่ในกรณีที่ไม่ด้อยกว่านั่นก็ไม่เป็นเช่นนั้น และแม้แต่ใน TOST สองด้านมันก็ไม่เป็นเช่นนั้น หากความแตกต่างน้อยกว่าจำนวนที่เราเห็นว่าสำคัญแล้ว N จะไม่ทำให้เกิดความผิดพลาด
Peter Flom

1
ขอโทษ - ความคิดเห็นที่ 1 ของฉันมีจุดประสงค์เพียงแค่นำไปสู่ข้อ 2 (หรือมากกว่านั้นอย่างถูกต้องส่วนที่ 2 คือการล้นของลำดับที่ 1!) และไม่ได้ตั้งใจจะยกระดับจุดอิสระของตนเอง ลิงค์นั้นมีประโยชน์ขอบคุณ จุดศูนย์กลางของคุณ (ซึ่งคุณใส่ไว้อย่างดีทั้งในคำตอบและการกล่าวซ้ำของคุณ) อธิบายอย่างชัดเจนว่าทำไมคุณถึงไม่เห็นด้วยกับบทสรุปของปีเตอร์ แต่ผมก็อยากรู้อยากเห็นที่คุณรู้สึกว่าข้อบกพร่องของเขาอยู่ในตรรกะ - หรืออาจจะของสถานที่ตั้ง นี่เป็นความรู้สึกที่ฉันไม่ได้รับการจัดการโดยตรง
Silverfish
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.