t-test ที่แข็งแกร่งสำหรับค่าเฉลี่ย


17

ฉันกำลังพยายามทดสอบ nullเทียบกับทางเลือกทางเลือกสำหรับตัวแปรสุ่มซึ่งมีระดับความเบ้เล็กน้อยถึงปานกลางและความผิดปกติของตัวแปรสุ่ม ตามคำแนะนำของวิลคอกซ์ใน 'การแนะนำเบื้องต้นเกี่ยวกับการประมาณค่าที่ทนทานและการทดสอบสมมติฐาน' ฉันได้ดูการทดสอบตามค่าเฉลี่ยที่ถูกตัดค่ามัธยฐานและค่าประมาณ M ของสถานที่ตั้ง (ขั้นตอนเดียว "วิลค็อกซ์") การทดสอบที่มีประสิทธิภาพเหล่านี้มีประสิทธิภาพเหนือกว่ามาตรฐาน t-test ในแง่ของพลังเมื่อทดสอบกับการกระจายที่ไม่เบ้E[X]=0E[X]>0X

อย่างไรก็ตามเมื่อทำการทดสอบด้วยการแจกแจงแบบเบ้การทดสอบด้านเดียวเหล่านี้มีความเสรีมากเกินไปหรือมากเกินไปที่จะอนุรักษ์ภายใต้สมมติฐานว่างขึ้นอยู่กับว่าการแจกแจงนั้นเอียงไปทางซ้ายหรือขวาเอียงตามลำดับ ตัวอย่างเช่นเมื่อมีการสังเกต 1,000 ครั้งการทดสอบตามค่ามัธยฐานจะปฏิเสธจริง ~ 40% ของเวลาที่ระดับ 5% เล็กน้อย เหตุผลนี้ชัดเจนสำหรับการแจกแจงแบบเบ้ค่ามัธยฐานและค่าเฉลี่ยต่างกัน อย่างไรก็ตามในใบสมัครของฉันฉันต้องทดสอบค่าเฉลี่ยไม่ใช่ค่ามัธยฐานไม่ใช่ค่าเฉลี่ยที่ถูกตัดทอน

t-test เวอร์ชันที่แข็งแกร่งกว่านี้จริง ๆ แล้วทำการทดสอบหาค่าเฉลี่ยหรือไม่

โดยหลักการแล้วกระบวนการนี้จะทำงานได้ดีในกรณีที่ไม่มีการเอียงและมีความรุนแรงสูงเช่นกัน การทดสอบ 'ขั้นตอนเดียว' เกือบจะดีพอโดยที่พารามิเตอร์ 'bend' ตั้งค่าค่อนข้างสูง แต่มีประสิทธิภาพน้อยกว่าการทดสอบค่าเฉลี่ยที่ถูกตัดเมื่อไม่มีความลาดเอียงและมีปัญหาบางอย่างในการรักษาระดับการปฏิเสธภายใต้ความเบ้ .

พื้นหลัง:เหตุผลที่ฉันสนใจค่าเฉลี่ยและไม่ใช่ค่ามัธยฐานคือการทดสอบจะถูกใช้ในการสมัครทางการเงิน ตัวอย่างเช่นหากคุณต้องการทดสอบว่าพอร์ตโฟลิโอมีผลตอบแทนที่คาดหวังในเชิงบวกหรือไม่ค่าเฉลี่ยนั้นเหมาะสมจริง ๆ เพราะถ้าคุณลงทุนในพอร์ตโฟลิโอคุณจะได้รับผลตอบแทนทั้งหมด (ซึ่งเป็นค่าเฉลี่ยคูณด้วยจำนวนตัวอย่าง) แทนซ้ำกันของค่ามัธยฐาน นั่นคือผมสนใจเกี่ยวกับผลรวมของดึงจาก RV XnnX


มีเหตุผลที่ห้ามใช้ Welch t-test หรือไม่ ลองดูที่คำตอบของฉันสำหรับคำถามนี้ ( stats.stackexchange.com/questions/305/ … ) ซึ่งฉันอ้างถึงเอกสารที่สนับสนุนการใช้ Welch ในกรณีที่ไม่เป็นไปตามปกติและมีความแตกต่างกัน
Henrik

1
ปัญหาก็คือฉันต้องการการทดสอบ 1 ตัวอย่างไม่ใช่การทดสอบ 2 ตัวอย่าง! ฉันกำลังทดสอบ null และไม่E [ X 1 ] = E [ X 2 ] ฉันจะค้นหา Kubinger และ อัล. กระดาษ (Ich kann schlecht Deutsche) E[X]=μE[X1]=E[X2]
shabbychef

ขอบคุณสำหรับการชี้แจง ในกรณีนี้กระดาษ Kubinger จะไม่เป็นประโยชน์กับคุณ ฉันขอโทษ.
Henrik

คำตอบ:


5

เหตุใดคุณจึงดูการทดสอบที่ไม่ใช่พารามิเตอร์ สมมติฐานของการทดสอบ t ถูกละเมิดหรือไม่ ข้อมูลที่เป็นอันดับหรือไม่ปกติและความแปรปรวนไม่แน่นอนใช่ไหม แน่นอนถ้าตัวอย่างของคุณมีขนาดใหญ่พอคุณสามารถพิสูจน์ความถูกต้องของพารามิเตอร์การทดสอบด้วยพลังที่ยิ่งใหญ่ของมันได้แม้ว่าจะไม่ได้มาตรฐานในตัวอย่างก็ตาม ในทำนองเดียวกันหากความกังวลของคุณเป็นความแปรปรวนไม่เท่ากันจะมีการแก้ไขการทดสอบพารามิเตอร์ที่ให้ค่า p ที่แม่นยำ (การแก้ไข Welch)

มิฉะนั้นการเปรียบเทียบผลลัพธ์ของคุณกับ t-test ไม่ใช่วิธีที่ดีในการทำเช่นนี้เนื่องจากผลลัพธ์ของการทดสอบ t จะมีอคติเมื่อไม่ตรงตามสมมติฐาน Mann-Whitney U เป็นทางเลือกที่ไม่ใช่พารามิเตอร์ที่เหมาะสมหากเป็นสิ่งที่คุณต้องการจริงๆ คุณสูญเสียพลังงานหากคุณใช้การทดสอบแบบไม่อิงพารามิเตอร์เมื่อคุณสามารถใช้การทดสอบ t-test ได้อย่างสมเหตุสมผล (เพราะเป็นไปตามสมมติฐาน)

และสำหรับพื้นหลังเพิ่มเติมไปที่นี่ ...

http://www.jerrydallal.com/LHSP/STUDENT.HTM


ข้อมูลไม่แน่นอนที่สุด เคิร์ตซีเกินนั้นอยู่ที่ 10-20, ความเบ้อยู่ที่ -0.2 ถึง 0.2 ฉันทำแบบทดสอบ 1 ตัวอย่างดังนั้นฉันไม่แน่ใจว่าฉันจะติดตามคุณเกี่ยวกับ 'ความแปรปรวนที่ไม่เท่ากัน' หรือการทดสอบ U
shabbychef

ฉันยอมรับคำแนะนำ 'ใช้การทดสอบแบบพารามิเตอร์' มันไม่ได้แก้คำถามของฉันอย่างแน่นอน แต่คำถามของฉันอาจจะเปิดกว้างเกินไป
shabbychef

12

ฉันยอมรับว่าถ้าคุณต้องการทดสอบว่ากลุ่มหมายความว่าแตกต่างกัน (ตรงข้ามกับการทดสอบความแตกต่างระหว่างกลุ่มค่ามัธยฐานหรือค่าเฉลี่ยที่ตัดทอน ฯลฯ ) จากนั้นคุณไม่ต้องการใช้การทดสอบแบบไม่มีพารามิเตอร์ที่ทดสอบสมมติฐานอื่น

  1. โดยทั่วไปค่า p- จากการทดสอบ t มีแนวโน้มที่จะมีความถูกต้องอย่างเป็นธรรมเนื่องจากการออกกลางในระดับปานกลางของข้อสันนิษฐานของภาวะปกติของส่วนที่เหลือ ลองใช้แอปเพล็ตนี้เพื่อรับปรีชาความแข็งแกร่งนี้: http://onlinestatbook.com/stat_sim/robustness/index.html

  2. หากคุณกำลังกังวลเกี่ยวกับการละเมิดยังคงสมมติฐานปกติที่คุณอาจต้องการที่จะบูต เช่นhttp://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. นอกจากนี้คุณยังสามารถเปลี่ยนตัวแปรที่ขึ้นอยู่กับความเบ้เพื่อแก้ไขปัญหาเรื่องขาออกจากภาวะปกติ


2
+1 คำตอบที่ดีและชัดเจน เจอโรมฉันจะถามคำถามเกี่ยวกับประเด็นที่ 3 ได้ไหม? ฉันเข้าใจเหตุผลที่อยู่เบื้องหลังการเปลี่ยนแปลงข้อมูล แต่มีบางสิ่งที่รบกวนฉันเสมอเกี่ยวกับการทำเช่นนั้น ความถูกต้องของการรายงานผลลัพธ์ของการทดสอบ t บนข้อมูลที่ถูกแปลงเป็นข้อมูลที่ไม่ถูกแปลงเป็นอย่างไร (ที่คุณไม่ได้รับอนุญาตให้ทำการทดสอบแบบ t) กล่าวอีกนัยหนึ่งว่าถ้าทั้งสองกลุ่มมีความแตกต่างกันเช่นเมื่อมีการแปลงข้อมูลบันทึกบนฐานใดที่คุณสามารถพูดได้ว่าข้อมูลดิบนั้นแตกต่างกันเช่นกัน เปลือยในใจฉันไม่ได้สถิติดังนั้นบางทีผมแค่พูดอะไรโง่ ๆ อย่างแน่นอน :)
นิโก้

2
@nico ฉันไม่แน่ใจเกี่ยวกับวิธีการรายงานหรือคิดเกี่ยวกับผลลัพธ์ แต่ถ้าสิ่งที่คุณต้องการแสดงคือสำหรับ X และ Y บางตัว, mu_X! = mu_Y มันควรจะเป็นจริงสำหรับ X_i <X_j ทั้งหมด, บันทึก ( X_i) <log (X_j) และสำหรับ X_i ทั้งหมด> X_j, log (X_i)> log (X_j) นั่นเป็นเหตุผลสำหรับการทดสอบแบบไม่อิงพารามิเตอร์ซึ่งทำงานกับอันดับการแปลงข้อมูลไม่ส่งผลต่อผลลัพธ์ ฉันคิดจากสิ่งนี้คุณสามารถสันนิษฐานได้ว่าหากการทดสอบบางอย่างแสดงให้เห็นว่า mu_log (X)! = mu_log (Y) ดังนั้น mu_X! = mu_Y
JoFrhwld

ขอบคุณสำหรับคำตอบ จริง ๆ แล้วการทดสอบ t-test ดูเหมือนว่าจะรักษาอัตราประเภทที่ 1 เล็กน้อยภายใต้อินพุต / kurtotic ที่เบ้อย่างเบามือ อย่างไรก็ตามฉันหวังว่าจะมีบางสิ่งที่มีพลังมากขึ้น Re: 2 ฉันใช้วิลค็อกซ์trimpbแล้วและtrimcibtพวกเขาค่อนข้างช้าเกินไปที่จะทำการทดสอบพลังของฉันอย่างน้อยก็เพื่อรสนิยมของฉัน Re: 3 ฉันคิดวิธีนี้ แต่ฉันสนใจในความหมายของข้อมูลที่ไม่ถูกแปลง (เช่นฉันไม่ได้เปรียบเทียบ 2 RVs กับ t-test ในกรณีนี้การแปลงแบบ monotonic จะดีสำหรับ การเปรียบเทียบตามระดับตามที่ระบุไว้โดย @JoFrhwld.)
shabbychef

2
@nico หากการกระจายตัวของจำนวนประชากรที่เหลือเหมือนกันในสองกลุ่มจากนั้นฉันจินตนาการว่าเมื่อใดก็ตามที่มีความแตกต่างในกลุ่มประชากรดิบหมายความว่าจะมีความแตกต่างในวิธีการของกลุ่มที่มีการเปลี่ยนแปลง ที่กล่าวว่าค่า p และช่วงความเชื่อมั่นมีแนวโน้มที่จะเปลี่ยนแปลงเล็กน้อยขึ้นอยู่กับว่าคุณกำลังใช้ข้อมูลดิบหรือข้อมูลที่ถูกแปลง โดยทั่วไปฉันต้องการใช้การแปลงเมื่อพวกเขาดูเหมือนตัวชี้วัดที่มีความหมายสำหรับการทำความเข้าใจตัวแปร (เช่นมาตราริกเตอร์เดซิเบลบันทึกการนับ ฯลฯ )
Jeromy Anglim

3

t

'ล่าสุดและยิ่งใหญ่ที่สุด' มีสาเหตุมาจากOgaswaraโดยมีการอ้างอิงถึง Hall และอื่น ๆ


0

ฉันไม่มีชื่อเสียงเพียงพอสำหรับความคิดเห็นดังนั้นจึงเป็นคำตอบ: ดูที่การคำนวณนี้ ฉันคิดว่านี่เป็นคำตอบที่ยอดเยี่ยม โดยย่อ:

ประสิทธิภาพการทำงานของ asymptotic นั้นไวต่อการเบี่ยงเบนจากปกติในรูปแบบของความเบ้มากกว่าในรูปแบบของ kurtosis ... ดังนั้นการทดสอบ t-test ของนักเรียนจึงไวต่อความเบ้ แต่ค่อนข้างแข็งแกร่งเทียบกับหางที่หนักและมันสมเหตุสมผลที่จะใช้การทดสอบสำหรับ ปกติที่นำไปสู่ทางเลือกที่เอียงก่อนที่จะใช้การทดสอบ t

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.