ทำไมสถิติแบบพารามิเตอร์จะได้รับความนิยมมากกว่าแบบ nonparametric


60

ใครสามารถอธิบายให้ฉันฟังได้ว่าทำไมทุกคนจะเลือกพาราเมทริกสำหรับวิธีการทดสอบสมมติฐานหรือการวิเคราะห์การถดถอย

ในใจของฉันมันเหมือนกับการไปล่องแพและเลือกนาฬิกาที่ไม่กันน้ำเพราะคุณอาจไม่เปียก ทำไมไม่ใช้เครื่องมือที่ใช้ได้กับทุกโอกาส?


21
มันคือการแนะนำอคติเหนี่ยวนำเข้าสู่กระบวนการของการอนุมานทางสถิติ นั่นเป็นวิธีแฟนซีในการพูดว่า: ถ้าคุณรู้บางอย่างให้มันเป็นคำใบ้ คำแนะนำนี้อาจใช้รูปแบบเช่นการจัดทำรูปแบบการทำงานของโอกาสหรือการกระจายก่อนหน้านี้ในพารามิเตอร์ หากคำใบ้ของคุณดีผลที่ได้ก็จะดีกว่าโดยไม่มีการบอกใบ้และถ้ามันไม่ดี
Cagdas Ozgenc

6
ไม่จำเป็น. โดยทั่วไปคุณกำลังค้นหาบางอย่างบนของหวานที่มีขนาดใหญ่มาก หากใครบางคนบอกคุณว่าสิ่งที่คุณกำลังมองหาถูกกักขังอยู่ในดินแดนที่แน่นอนโอกาสในการค้นพบสิ่งนั้นจะดีขึ้น แต่ถ้าพวกเขาทำให้คุณเข้าใจผิดด้วยข้อมูลที่ผิดไม่ว่าคุณจะค้นหาดินแดนนั้นมากแค่ไหนคุณก็จะไม่พบมัน
Cagdas Ozgenc

17
ในฐานะช่างไม้ฉันชอบความคล้ายคลึงในตอนท้าย บ้านและเฟอร์นิเจอร์ที่สร้างขึ้นอย่างดีและสุดท้ายถูกสร้างขึ้นโดยใช้เครื่องมือพิเศษ เครื่องมือที่ใช้งานทั่วไปนั้นยอดเยี่ยมสำหรับเจ้าของบ้านและสำหรับมืออาชีพที่ต้องการทำงานให้เสร็จเร็วหรือเมื่อใช้เครื่องมือที่หยาบหรือไม่เหมาะสมจะไม่สร้างความแตกต่างด้านคุณภาพที่ทุกคนใส่ใจ แม้ว่าช่างฝีมือจะได้ผลลัพธ์ที่ดีที่สุดโดยใช้เครื่องมือที่เหมาะสมสำหรับงานและแน่นอนว่าบางสิ่งก็ไม่สามารถทำได้หากไม่มีมัน ยกตัวอย่างเช่นไม่มีใครทำประกบกันอย่างดีกับแฮนด์แฮนด์อเนกประสงค์
whuber

3
ไม่ว่าคุณจะขุดคูด้วยจอบหรือช้อนชาคุณก็จะลงเอยด้วยคู เป็นเพียงว่าถ้าคุณใช้ช้อนชาคุณก็แก่กว่า
ผัน

5
ที่เกี่ยวข้อง (แม้ว่าอาจไม่ชัดเจนดังนั้น): ถ้าหมายถึงละเอียดอ่อนทำไมใช้มันตั้งแต่แรก?
gung - Reinstate Monica

คำตอบ:


25

แทบจะไม่เคยมีการทดสอบพาราเมตริกและการทดสอบที่ไม่ใช่พารามิเตอร์จริงมีค่าเป็นโมฆะเดียวกัน พารามิเตอร์ -test กำลังทดสอบค่าเฉลี่ยของการแจกแจงโดยสมมติว่ามีสองช่วงเวลาแรก การทดสอบยศรวมของ Wilcoxon ไม่ได้ใช้เวลาสักครู่และทดสอบความเสมอภาคของการแจกแจงแทน พารามิเตอร์โดยนัยของมันคือฟังก์ชั่นแปลก ๆ ของการแจกแจงความน่าจะเป็นที่การสังเกตจากตัวอย่างหนึ่งต่ำกว่าการสังเกตจากอีกตัวอย่างหนึ่ง คุณสามารถพูดคุยเกี่ยวกับการเปรียบเทียบระหว่างการทดสอบทั้งสองภายใต้โมฆะที่ระบุอย่างสมบูรณ์ของการแจกแจงที่เหมือนกัน ... แต่คุณต้องยอมรับว่าการทดสอบทั้งสองนั้นกำลังทดสอบสมมติฐานที่แตกต่างกันt

ข้อมูลที่การทดสอบพารามิเตอร์นำมาพร้อมกับข้อสันนิษฐานช่วยปรับปรุงพลังของการทดสอบ แน่นอนว่าข้อมูลที่ถูกต้องดีขึ้น แต่มีน้อยถ้าโดเมนของความรู้ของมนุษย์วันนี้ที่ไม่มีข้อมูลเบื้องต้นดังกล่าว ข้อยกเว้นที่น่าสนใจที่กล่าวอย่างชัดเจนว่า "ฉันไม่ต้องการที่จะคิดอะไร" เป็นห้องพิจารณาคดีที่วิธีการที่ไม่ใช่เชิงพารามิเตอร์ยังคงได้รับความนิยมอย่างกว้างขวาง อาจมีเหตุผลที่ดีเล่นสำนวนเจตนาที่ประพันธ์หนังสือที่ดีทั้งฟิลลิปดีสถิติที่ไม่ใช่ตัวแปรและสถิติในห้องพิจารณาคดี

นอกจากนี้ยังมีสถานการณ์การทดสอบที่คุณไม่สามารถเข้าถึง microdata ที่จำเป็นสำหรับการทดสอบแบบไม่พารามิเตอร์ สมมติว่าคุณถูกขอให้เปรียบเทียบคนสองกลุ่มเพื่อวัดว่าเป็นคนอ้วนมากกว่าคนอื่นหรือไม่ ในโลกอุดมคติคุณจะมีการวัดส่วนสูงและน้ำหนักสำหรับทุกคนและคุณสามารถสร้างแบบทดสอบการเรียงสับเปลี่ยนโดยความสูง ในโลกอุดมคติน้อยกว่า (เช่นของจริง) คุณอาจมีความสูงเฉลี่ยและน้ำหนักเฉลี่ยในแต่ละกลุ่ม (หรืออาจเป็นช่วงหรือความแปรปรวนของลักษณะเหล่านี้ที่ด้านบนของค่าเฉลี่ยตัวอย่าง) ทางออกที่ดีที่สุดของคุณคือการคำนวณค่า BMI เฉลี่ยสำหรับแต่ละกลุ่มและเปรียบเทียบถ้าคุณมีค่าเฉลี่ย หรือสมมติว่าค่าความแปรปรวนปกติสำหรับความสูงและน้ำหนักหากคุณมีความหมายและความแปรปรวน (คุณอาจต้องใช้ความสัมพันธ์จากข้อมูลภายนอกบางอย่างถ้ามันไม่ได้มาพร้อมกับตัวอย่างของคุณ)


3
ฉันเข้าใจว่าในกรณีของการทดสอบคุณไม่มีโมฆะเหมือนกัน แต่ฉันไม่แน่ใจว่ามันสมเหตุสมผลหรือไม่ที่จะบอกว่าโมฆะนั้นดีกว่าโมฆะตัวอื่น แต่สิ่งที่เกี่ยวกับกรณีของการทำนาย? เรื่องราวที่แตกต่างอย่างสิ้นเชิงยังคงขัดแย้งกับภาวะที่กลืนไม่เข้าคายไม่ออก
en1

22

ตามที่คนอื่น ๆ เขียนไว้: หากมีเงื่อนไขตามที่กำหนดการทดสอบตามพารามิเตอร์ของคุณจะมีประสิทธิภาพมากกว่าการทดสอบแบบไม่มีพารามิเตอร์

ในการเปรียบเทียบนาฬิกาของคุณตัวที่ไม่กันน้ำนั้นจะมีความแม่นยำมากขึ้นเว้นแต่ว่ามันจะเปียก ตัวอย่างเช่นนาฬิกากันน้ำของคุณอาจปิดหนึ่งชั่วโมงด้วยวิธีใดวิธีหนึ่งในขณะที่นาฬิกาที่ไม่กันน้ำจะแม่นยำ ... และคุณต้องขึ้นรถบัสหลังจากการล่องแพ ในกรณีเช่นนี้คุณอาจต้องใช้นาฬิกาที่ไม่กันน้ำพร้อมกับคุณและตรวจสอบให้แน่ใจว่าไม่เปียกน้ำ


จุดโบนัส:วิธีการที่ไม่ใช่พารามิเตอร์นั้นไม่ใช่เรื่องง่ายเสมอไป ใช่ทางเลือกในการทดสอบการเปลี่ยนรูปแบบเป็นแบบง่าย nlme()แต่เป็นทางเลือกที่ไม่อิงพารามิเตอร์เป็นรูปแบบเชิงเส้นผสมกับปฏิสัมพันธ์หลายแบบสองทางและผลกระทบแบบสุ่มซ้อนกันค่อนข้างเป็นบิตยากที่จะตั้งขึ้นกว่าเรียกง่ายๆไป ฉันได้ทำเช่นนั้นโดยใช้การทดสอบการเปลี่ยนรูปและจากประสบการณ์ของฉันค่า p ของการทดสอบแบบพาราเมตริกและการเปลี่ยนรูปนั้นค่อนข้างใกล้เคียงกันแม้ว่าค่าที่เหลือจากแบบจำลองพารามิเตอร์ค่อนข้างไม่ปกติ การทดสอบพารามิเตอร์มักจะมีความยืดหยุ่นอย่างน่าประหลาดใจต่อการออกเดินทางจากเงื่อนไขเบื้องต้น


ดูเหมือนว่ามุมมองที่แพร่หลายว่าวิธีการแบบพารามิเตอร์มีประสิทธิภาพมากกว่าเมื่อตรงตามสมมติฐาน แต่ถ้าเป็นเช่นนั้นเราจะมีค่า p ในการประเมินผลลัพธ์จากทั้งสองวิธีได้อย่างไร ฉันหมายความว่าหากการทดสอบพารามิเตอร์ปฏิเสธสมมติฐานว่างที่มีความน่าจะเป็นอย่างน้อย 99% จะดีกว่าจากการทดสอบที่ไม่ใช่พารามิเตอร์ปฏิเสธสมมติฐานว่างด้วยความน่าจะเป็น 99% ได้อย่างไร ความน่าจะเป็น 0.99 นั้นแตกต่างกันในแต่ละกรณีหรือไม่? นั่นคงไม่สมเหตุสมผล
en1

1
สมมติฐานว่างจะแตกต่างกันระหว่างการทดสอบแบบพารามิเตอร์และแบบไม่อิงพารามิเตอร์ โดยเฉพาะสมมติฐานว่างสำหรับการทดสอบพารามิเตอร์มีสมมติฐานเฉพาะเกี่ยวกับการกระจายตัวของสถิติการทดสอบ (ซึ่งมักจะคำนวณในรูปแบบที่แตกต่างกันสำหรับการทดสอบสองครั้ง) - นั่นคือเหตุผลที่มันเรียกว่า "พาราเมตริก" หลังจากทั้งหมด! ดังนั้นค่า p สองจึงมีชื่อเหมือนกัน แต่ถูกคำนวณตามสถิติการทดสอบที่แตกต่างกันซึ่งมีการแจกแจงที่แตกต่างกันภายใต้สมมติฐานว่างที่แตกต่างกัน
S. Kolassa - Reinstate Monica

... และ@StasK แสดงมันทั้งหมดดีกว่าที่ฉันทำ
S. Kolassa - Reinstate Monica

3
@StephanKolassa ที่จริงผมเริ่มเขียนความคิดเห็นที่คำตอบของคุณและได้ดำเนินการไป :)
StasK

12

ในขณะที่ฉันยอมรับว่าในหลาย ๆ กรณีเทคนิคที่ไม่ใช่พารามิเตอร์มีประโยชน์ แต่ก็มีสถานการณ์ที่วิธีการพารามิเตอร์มีประโยชน์มากกว่า

เรามาดูการอภิปราย "การทดสอบ t-test สองตัวอย่างกับการทดสอบผลรวมยศของ Wilcoxon" (ไม่เช่นนั้นเราต้องเขียนหนังสือทั้งเล่ม)

  1. ด้วยขนาดกลุ่มเล็ก ๆ ของ 2-3 การทดสอบแบบ t เท่านั้นที่สามารถทำได้ในทางทฤษฎีค่า p ต่ำกว่า 5% ในวิชาชีววิทยาและเคมีขนาดกลุ่มเช่นนี้ไม่ใช่เรื่องแปลก แน่นอนว่ามันเป็นเรื่องละเอียดอ่อนที่จะใช้การทดสอบแบบทีในการตั้งค่าดังกล่าว แต่อาจจะดีกว่าไม่มีอะไร (ประเด็นนี้เชื่อมโยงกับปัญหาที่ว่าในสถานการณ์ที่สมบูรณ์แบบ t-test มีพลังมากกว่าการทดสอบ Wilcoxon)
  2. ด้วยขนาดของกลุ่มขนาดใหญ่การทดสอบด้วย t สามารถดูได้ว่าไม่ใช่แบบพารามิเตอร์ด้วยทฤษฎีลิมิตกลาง
  3. ผลลัพธ์ของการทดสอบ t-line นั้นสอดคล้องกับช่วงความมั่นใจของนักเรียนสำหรับความแตกต่างของค่าเฉลี่ย
  4. ถ้าความแปรปรวนแตกต่างกันไปในแต่ละกลุ่มอย่างมาก t-test เวอร์ชันของ Welch พยายามพิจารณาสิ่งนี้ในขณะที่การทดสอบผลรวมลำดับของ Wilcoxon อาจล้มเหลวได้ไม่ดีถ้าเปรียบเทียบวิธี (เช่นความน่าจะเป็นข้อผิดพลาดของชนิดแรกแตกต่างจากระดับเล็กน้อยมาก )

2
ฉันไม่เห็นด้วยกับ 1. เพียงแค่ใช้ขั้นตอนเพราะจะทำให้คุณตัดสินใจไม่ได้จริงๆเป็นเหตุผลที่ดีโดยเฉพาะอย่างยิ่งเมื่อคุณไม่มีเหตุผลที่จะคาดหวังว่าขั้นตอนนั้นจะถูกต้อง หากคุณมีข้อมูลน้อยหรือไม่มีเลยเพียงแค่ตัดสินและอย่าแสร้งว่ามันขึ้นอยู่กับความแม่นยำ
dsaxton

5
ฉันเห็นด้วยกับคุณ. เป็นเหตุผลหนึ่งที่ชัดเจนว่าทำไมผลลัพธ์มักไม่สามารถทำซ้ำได้แม้ว่าจะตีพิมพ์ในวารสารอันดับสูงสุด แต่คุณมีตัวเลือกอะไรบ้างในฐานะนักวิจัยถ้างบประมาณให้ขนาดตัวอย่างเพียงเล็กน้อย?
Michael M

1
Re 4 และปัญหาการประยุกต์ใช้ Wilcoxon-Mann-Whitney เมื่อมีความแตกต่างระหว่างกลุ่มที่ไม่เท่าเทียมกันมีวิธีการที่ไม่ใช่พารามิเตอร์ที่อนุญาตให้มีความแตกต่าง: ฉันดูเหมือนจะจำการทดสอบคลิฟหรือการทดสอบ Brunner-Munzel (ฉันไม่คิดว่าเรามีข้อมูลมากมายเกี่ยวกับพวกเขาในเว็บไซต์นี้)
Silverfish

@Silverfish: ฉันมักจะใช้วิธีการของ Brunner และฉันคิดว่าคุณพูดถูก แต่ฉันสงสัยว่าพวกเขากำลังเปรียบเทียบจริงๆหมายถึงยกเว้นเมื่อมีการตั้งสมมติฐานการกระจายที่แข็งแกร่ง
Michael M

1
@MichaelM ใช่แน่นอน - นั่นกลับมาจากคำถามเกี่ยวกับวิธีการแบบพารามิเตอร์และแบบไม่ใช่พารามิเตอร์ที่มีสมมติฐานต่างกันฉันเดา
Silverfish

9

ในการทดสอบสมมติฐานการทดสอบที่ไม่ใช่พารามิเตอร์มักจะทดสอบสมมติฐานที่แตกต่างกันซึ่งเป็นหนึ่งในเหตุผลที่ว่าทำไมเราไม่สามารถทดแทนการทดสอบที่ไม่ใช่พารามิเตอร์สำหรับพารามิเตอร์ที่หนึ่ง

yxfff(x)=j=1pβjxj


ใช่แล้วนั่นคือการเพิ่มความลำเอียงแบบจำลอง สิ่งนี้บอกอะไรเกี่ยวกับนักวิจัย p-values ​​ที่รายงาน?
Cagdas Ozgenc

@dsaxton สิ่งที่คุณพูดว่าเป็นจริงเกี่ยวกับการทดสอบสมมติฐานที่แตกต่างกัน แต่ผู้คนยังคงตีความพวกเขาในลักษณะเดียวกัน นอกจากนี้ยังมีการถดถอยด้วยซึ่งข้อมูลเชิงลึกที่คุณได้รับระหว่างการวิเคราะห์แบบไม่มีพารามิเตอร์และการวิเคราะห์พารามิเตอร์นั้นก็เหมือนกัน
en1

@ cagdas-ozgenc มันบอกคุณว่าค่า p มีเงื่อนไขในรูปแบบ แต่มันก็ไม่ชัดเจนว่าสิ่งที่อาจจะเป็นอย่างอื่น ...
conjugateprior

3
+1 สำหรับสังเกตว่าเรามีโอกาสอย่างการประเมินสิ่งที่มีค่าในการถดถอยโดยไม่ต้องไม่มีบางสมมติฐานเกี่ยวกับฟังก์ชั่นการถดถอย
ผัน

9

แบบจำลองกึ่งมีค่ามีข้อดีหลายประการ พวกเขาเสนอการทดสอบเช่นการทดสอบ Wilcoxon เป็นกรณีพิเศษ แต่อนุญาตให้มีการประเมินอัตราส่วนผลกระทบ, ปริมาณ, วิธีการและความน่าจะเป็นที่เกิน พวกเขาขยายไปยังข้อมูลตามยาวและตรวจสอบ พวกเขามีความแข็งแกร่งในพื้นที่ Y และมีการเปลี่ยนแปลงไม่เปลี่ยนแปลงยกเว้นวิธีการประมาณ ดูhttp://biostat.mc.vanderbilt.edu/rmsลิงก์ไปยังเอกสารประกอบคำบรรยายสำหรับตัวอย่าง / กรณีศึกษาโดยละเอียด

tYYXX1X2. ตัวอย่างรวมถึงโมเดลอัตราต่อรองที่ได้สัดส่วน (กรณีพิเศษ: Wilcoxon และ Kruskal-Wallis) และโมเดลอันตรายตามสัดส่วน (กรณีพิเศษ: อันดับของบันทึกและการทดสอบบันทึกลำดับชั้น)

Y


1
ฉันดิ้นรนกับสิ่งนี้เล็กน้อย คุณคิดว่า t-test เป็นแบบกึ่งพาราเมตริกหรือไม่พาราเมตริกหรือไม่? ในมือข้างหนึ่งฉันมักจะสันนิษฐานว่า 'jist' ของ semi-parametrics มีดังต่อไปนี้: ใช้แบบจำลองความน่าจะเป็น "การทำงาน" สำหรับข้อมูลประเมินพารามิเตอร์ในการแจกแจงนั้นโดยไม่คำนึงว่าการแจกแจงนั้นถูกต้องหรือไม่ บัญชีความไม่แน่นอน (ดังนั้นข้อผิดพลาดจากแซนวิชสำหรับการแก้สมการคะแนนเกาส์น่าจะเป็นการทดสอบแบบกึ่งพารามิเตอร์ อย่างไรก็ตามพารามิเตอร์กึ่งส่วนใหญ่มักเกี่ยวข้องกับการทำให้บางส่วน / ปรับสภาพบางอย่างเช่นเดียวกับรุ่น Cox
AdamO

ฉันจะเพิ่มคำอธิบายเพิ่มเติมลงในคำตอบเพื่อจัดการกับสิ่งนั้น
Frank Harrell

6

ในบรรดาโฮสต์ของคำตอบที่มีให้ฉันก็จะเรียกความสนใจไปที่สถิติแบบเบย์ ปัญหาบางอย่างไม่สามารถตอบได้ด้วยความเป็นไปได้เพียงอย่างเดียว นักถกเถียงมักใช้เหตุผลเชิงต่อต้านซึ่ง "ความน่าจะเป็น" หมายถึงเอกภพทางเลือกและกรอบจักรวาลสำรองไม่สมเหตุสมผลเท่าที่อนุมานสถานะของบุคคลเช่นความผิดหรือความไร้เดียงสาของอาชญากรหรือไม่ว่าคอขวดของความถี่ของยีนใน ชนิดสัมผัสกับการเปลี่ยนแปลงสิ่งแวดล้อมขนาดใหญ่นำไปสู่การสูญพันธุ์ ในบริบทของเบย์ความน่าจะเป็นคือ "ความเชื่อ" ไม่ใช่ความถี่ซึ่งสามารถนำไปใช้กับสิ่งที่ได้เกิดการตกตะกอนแล้ว

ตอนนี้วิธีการแบบเบย์ส่วนใหญ่ต้องการการระบุแบบจำลองความน่าจะเป็นแบบเต็มสำหรับผลลัพธ์ก่อนหน้าและผลลัพธ์ และแบบจำลองความน่าจะเป็นเหล่านี้ส่วนใหญ่เป็นพารามิเตอร์ สอดคล้องกับสิ่งที่ผู้อื่นพูดสิ่งเหล่านี้ไม่จำเป็นต้องถูกต้องแม่นยำในการสร้างบทสรุปที่มีความหมายของข้อมูล "ทุกรุ่นผิดรุ่นบางรุ่นมีประโยชน์"

แน่นอนว่ามีวิธีการแบบเบส์แบบไม่มีพารามิเตอร์ สิ่งเหล่านี้มีริ้วรอยทางสถิติจำนวนมากและโดยทั่วไปการพูดนั้นต้องการข้อมูลประชากรที่ครอบคลุมเกือบทั้งหมดเพื่อใช้อย่างมีความหมาย


6

เหตุผลเดียวที่ฉันตอบแม้จะมีคำตอบที่ดีทั้งหมดข้างต้นก็คือไม่มีใครเรียกความสนใจไปที่ # 1 เหตุผลที่เราใช้การทดสอบแบบพารามิเตอร์ (อย่างน้อยในการวิเคราะห์ข้อมูลฟิสิกส์ของอนุภาค) เพราะเรารู้การแปรผันของข้อมูล ดุจ! นั่นเป็นข้อได้เปรียบที่ยิ่งใหญ่ คุณกำลังรวบรวมข้อมูลหลายร้อยหลายพันหรือหลายล้านรายการลงในพารามิเตอร์ที่คุณสนใจและอธิบายการกระจายของคุณ สิ่งเหล่านี้บอกคุณถึงฟิสิกส์พื้นฐาน (หรือวิทยาศาสตร์ใดก็ตามที่ให้ข้อมูลของคุณแก่คุณ)

แน่นอนถ้าคุณไม่มีความคิดเกี่ยวกับความหนาแน่นของความน่าจะเป็นพื้นฐานคุณก็ไม่มีทางเลือก: ใช้การทดสอบแบบไม่มีพารามิเตอร์ การทดสอบแบบไม่อิงพารามิเตอร์นั้นมีข้อดีของการไม่มีอคติที่มีอคติใด ๆ แต่ก็ยากที่จะนำไปใช้ - บางครั้งก็ยากกว่ามาก


5

สถิติที่ไม่ใช่พารามิเตอร์มีปัญหาของตัวเอง! หนึ่งในนั้นคือการเน้นไปที่การทดสอบสมมติฐานบ่อยครั้งที่เราต้องการการประมาณค่าและช่วงความมั่นใจและทำให้พวกมันอยู่ในรูปแบบที่ซับซ้อนด้วย nonparametrics นั้นซับซ้อน --- มีโพสต์บล็อกที่ดีมากเกี่ยวกับเรื่องนี้พร้อมการสนทนาที่http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ การสนทนานำไปสู่การโพสต์อื่น ๆ นี้http: // notstatschat tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-testซึ่งแนะนำสำหรับมุมมองที่แตกต่างกันมากใน Wilcoxon รุ่นสั้นคือ: Wilcoxon (และการทดสอบระดับอื่น ๆ ) สามารถนำไปสู่การไม่ถ่ายทอด


4
ฉันไม่แน่ใจว่าทรานซิสชั่นส์เป็นจุดจบและเป็นทั้งหมด และคุณสามารถคว่ำการทดสอบ Wilcoxon เพื่อให้ได้ช่วงความเชื่อมั่นที่มีประสิทธิภาพและมีประโยชน์มาก
Frank Harrell

2
ความไร้สาระมีจุดในแบบจำลองเชิงสาเหตุ แต่สำหรับการทดสอบความสัมพันธ์สองตัวอย่างง่ายๆฉันไม่คิดว่ามันจะเป็นปัญหา นอกจากนี้ฉันล้มเหลวที่จะเห็นความแตกต่างในการทดสอบสมมติฐาน / ช่วงเวลา / การประเมินความเชื่อมั่นระหว่างวิธีการแบบไม่มีพารามิเตอร์และแบบพารามิเตอร์ บางครั้งด้วยการประเมินที่มีประสิทธิภาพคุณใช้โมเดลความน่าจะเป็นที่ใช้งานได้เพื่อให้การประมาณค่าพารามิเตอร์ที่สอดคล้องกันให้ข้อมูลสรุปที่มีความหมาย (แม้ว่ามันจะไม่ใช่แบบจำลองความน่าจะเป็นที่ถูกต้องต่อกัน) บางทีคุณสามารถขยายคำตอบนี้ได้?
AdamO

2
โดยปกติแล้วจะมีการตั้งสมมติฐานพิเศษเพิ่มเติมสำหรับการทดสอบ Wilcoxon เช่นการสุ่มสุ่มของกลุ่มหนึ่งเหนือกลุ่มอื่นหากว่าการกู้คืนความเป็นจริงอย่างแท้จริง
Scortchi - Reinstate Monica

3

ฉันจะบอกว่าสถิติที่ไม่ใช่พารามิเตอร์นั้นโดยทั่วไปมีผลบังคับใช้มากกว่าในแง่ที่ว่าพวกเขามีสมมติฐานน้อยกว่าสถิติเชิงสถิติ

อย่างไรก็ตามหากมีการใช้สถิติแบบพารามิเตอร์และสมมติฐานพื้นฐานเป็นจริงแล้วสถิติแบบพารามิเตอร์จะมีประสิทธิภาพมากกว่าแบบที่ไม่ใช่แบบพารามิเตอร์


2

สถิติเชิงพารามิเตอร์มักเป็นวิธีการรวมความรู้ [กับข้อมูล] ภายนอก ตัวอย่างเช่นคุณรู้ว่าการกระจายข้อผิดพลาดเป็นเรื่องปกติและความรู้นี้มาจากประสบการณ์ก่อนหน้านี้หรือการพิจารณาอื่น ๆ และไม่ใช่จากชุดข้อมูล ในกรณีนี้สมมติว่ามีการแจกแจงแบบปกติคุณกำลังรวมความรู้ภายนอกนี้เข้ากับการประมาณพารามิเตอร์ของคุณซึ่งจะต้องปรับปรุงการประมาณการของคุณ

ในการเปรียบเทียบนาฬิกาของคุณ ทุกวันนี้นาฬิกาเกือบทุกรุ่นสามารถกันน้ำได้ยกเว้นชิ้นพิเศษที่มีเครื่องประดับหรือวัสดุที่ผิดปกติเช่นไม้ เหตุผลที่สวมใส่พวกเขาคือ: พวกเขาพิเศษ หากคุณหมายถึงน้ำหลักฐานแล้วชุดนาฬิกาจำนวนมากไม่กันน้ำ เหตุผลที่สวมใส่มันเป็นหน้าที่ของพวกเขาอีกครั้ง: คุณจะไม่สวมนาฬิกานักประดาน้ำพร้อมชุดสูทและเน็คไท นอกจากนี้ในปัจจุบันนาฬิกาจำนวนมากได้เปิดกลับมาเพื่อให้คุณสามารถเพลิดเพลินกับการดูการเคลื่อนไหวผ่านคริสตัล ตามธรรมชาติแล้วนาฬิกาเหล่านี้มักจะไม่กันน้ำ


1
ฉันชอบคำอุปมานี้! ฉันจำได้ว่ามีศาสตราจารย์คนหนึ่งบอกเราว่าเราควรลองวิธีการทางสถิติที่แตกต่างกันในสิ่งเดียวกันเพื่อดูว่าเราจะได้ผลลัพธ์เดียวกัน
Deep North

2

นี่ไม่ใช่สถานการณ์จำลองการทดสอบสมมุติฐาน แต่มันอาจเป็นตัวอย่างที่ดีสำหรับการตอบคำถามของคุณ: ลองพิจารณาการวิเคราะห์การจัดกลุ่ม มีวิธีการทำคลัสเตอร์แบบ "ไม่อิงพารามิเตอร์" มากมายเช่นการจัดกลุ่มแบบลำดับชั้น K- หมายถึง ฯลฯ แต่ปัญหาคือวิธีการประเมินว่าโซลูชันการจัดกลุ่มของคุณเป็น "ดีกว่า" มากกว่าโซลูชันที่เป็นไปได้อื่น ๆ หรือไม่ . อัลกอริทึมแต่ละอย่างจะให้สิ่งที่ดีที่สุดที่คุณจะได้รับอย่างไรก็ตามคุณจะรู้ได้อย่างไรว่าไม่มีอะไรดีกว่า .. ขณะนี้ยังมีวิธีการทางพารามิเตอร์ในการทำคลัสเตอร์ซึ่งเรียกว่าการทำคลัสเตอร์แบบจำลองเช่นโมเดล จำกัด การผสม ด้วย FMM คุณสามารถสร้างแบบจำลองทางสถิติที่อธิบายถึงการกระจายข้อมูลของคุณและปรับให้เหมาะกับข้อมูล เมื่อคุณมีแบบจำลองของคุณคุณสามารถประเมินความเป็นไปได้ที่ข้อมูลของคุณจะได้รับจากแบบจำลองนี้คุณสามารถใช้การทดสอบอัตราส่วนความน่าจะเป็นเปรียบเทียบของ AIC และใช้วิธีอื่น ๆ ในการตรวจสอบแบบจำลองและการเปรียบเทียบแบบจำลอง อัลกอริทึมการจัดกลุ่มแบบไม่อิงพารามิเตอร์เพียงจัดกลุ่มข้อมูลโดยใช้เกณฑ์ความคล้ายคลึงกันในขณะที่ใช้ FMM ช่วยให้คุณสามารถอธิบายและพยายามทำความเข้าใจข้อมูลของคุณตรวจสอบว่ามันเหมาะสมอย่างไรพยากรณ์ได้ดี ... ในทางปฏิบัติ นอกกรอบและค่อนข้างดีในขณะที่ FMM อาจเป็นปัญหาได้ แต่ถึงกระนั้นแนวทางแบบจำลองมักจะให้ผลลัพธ์ที่ดียิ่งขึ้นแก่คุณ


2

การคาดการณ์และการคาดการณ์ข้อมูลใหม่มักเป็นเรื่องยากหรือเป็นไปไม่ได้สำหรับโมเดลที่ไม่ใช้พารามิเตอร์ ตัวอย่างเช่นฉันสามารถคาดการณ์จำนวนการเรียกร้องการรับประกันในอีก 10 ปีข้างหน้าโดยใช้แบบจำลองการเอาตัวรอด Weibull หรือ Lognormal อย่างไรก็ตามไม่สามารถใช้รูปแบบ Cox หรือ Kaplan-Meier

แก้ไข: ขอให้ฉันชัดเจนขึ้นอีกหน่อย หาก บริษัท มีผลิตภัณฑ์ที่มีข้อบกพร่องพวกเขามักจะสนใจที่จะคาดการณ์อัตราการเรียกร้องการรับประกันในอนาคตและ CDF ตามการเรียกร้องการรับประกันในปัจจุบันและข้อมูลการขาย สิ่งนี้สามารถช่วยพวกเขาในการตัดสินใจว่าจำเป็นต้องเรียกคืนหรือไม่ ฉันไม่รู้ว่าคุณทำสิ่งนี้ได้อย่างไรโดยใช้ตัวแบบที่ไม่ใช่พารามิเตอร์


7
ฉันขอแตกต่าง คุณสามารถใช้แบบจำลอง Cox เพื่อประเมินควอนไทล์ค่าเฉลี่ย (ถ้าไม่ตรวจสอบค่า Y สูงสุด) และความน่าจะเป็นทุกประเภท การไม่สามารถคาดการณ์ได้เกินขอบเขตของข้อมูลเป็นปัญหา แต่ (ตามที่คุณกล่าวถึง) แต่คุณอาจคาดการณ์ถึงอันตรายได้
Frank Harrell

@ FrankHarrell ใช่จุดดีต้องระวังเสมอเมื่อทำการประมาณ
เกลน

Random Forest, Deep Learning หรือ SVM เป็นอย่างไร พวกเขาชนะมากที่สุดหากไม่ใช่วิธีการเชิงพารามิเตอร์ทั้งหมดสำหรับการทำนาย
en1

2
ยกเว้นลองทำต้นไม้ตัดสินใจเรียนรู้ขอบเขตแนวทแยง
bill_e

1

ฉันเชื่อโดยสุจริตว่าไม่มีคำตอบที่ถูกต้องสำหรับคำถามนี้ ตัดสินจากคำตอบที่ได้รับฉันทามติคือว่าการทดสอบแบบพารามิเตอร์มีประสิทธิภาพมากกว่าการเทียบแบบไม่พารามิเตอร์ ฉันจะไม่คัดค้านมุมมองนี้ แต่ฉันเห็นว่ามันเป็นสมมุติฐานมากกว่ามุมมองที่เป็นข้อเท็จจริงเนื่องจากไม่ใช่สิ่งที่สอนอย่างชัดเจนในโรงเรียนและไม่มีผู้วิจารณ์คนไหนที่จะบอกคุณได้ว่า "เอกสารของคุณถูกปฏิเสธเพราะคุณใช้แบบทดสอบ คำถามนี้เกี่ยวกับสิ่งที่โลกแห่งสถิติไม่สามารถตอบได้อย่างชัดเจน แต่ได้รับอนุญาตแล้ว

ความคิดเห็นส่วนตัวของฉันคือการตั้งค่าของพารามิเตอร์หรือไม่พารามิเตอร์มีส่วนเกี่ยวข้องกับประเพณีมากกว่าสิ่งอื่นใด (สำหรับการขาดระยะที่ดีกว่า) เทคนิคพารามิเตอร์สำหรับการทดสอบและการคาดการณ์อยู่ที่นั่นก่อนและมีประวัติยาวนานดังนั้นจึงไม่ใช่เรื่องง่ายเลยที่จะเพิกเฉย โดยเฉพาะอย่างยิ่งการคาดการณ์มีวิธีแก้ปัญหาแบบไร้พารามิเตอร์ที่น่าประทับใจซึ่งมีการใช้กันอย่างแพร่หลายเป็นเครื่องมือตัวเลือกแรกในปัจจุบัน ฉันคิดว่านี่เป็นหนึ่งในเหตุผลที่เทคนิคการเรียนรู้ของเครื่องเช่นโครงข่ายประสาทและต้นไม้ตัดสินใจซึ่งไม่ได้วัดตามธรรมชาติได้รับความนิยมอย่างกว้างขวางในช่วงไม่กี่ปีที่ผ่านมา


3
3/π95%

'ฉันทามติ' หมายถึง 'ข้อตกลงทั่วไป' ไม่ใช่มุมมองส่วนตัวของฉัน
Digio

2
ผมไม่ได้หมายถึงไม่ว่าจะเป็นคำสั่งที่แสดงมุมมองส่วนตัวของคุณเองหรือภูมิปัญญาของคนอื่น ๆ เพียงแค่ชี้ให้เห็นว่าคำสั่งที่ถูกต้อง แต่ถ้าเงื่อนไขที่จำเป็นสำหรับการทดสอบพาราถือเป็นจริง เมื่อเงื่อนไขไม่คงค้างอาจไม่เป็นเช่นนั้นอีกต่อไปว่า "การทดสอบพารามิเตอร์มีประสิทธิภาพมากกว่าการไม่ใช้พารามิเตอร์" และในความเป็นจริงแล้วการย้อนกลับสามารถเป็นกรณีได้ (บางครั้งมีระยะขอบกว้างมาก)
Silverfish

Touch?! ..... +1
Digio

0

มันเป็นปัญหาของพลังงานสถิติ การทดสอบแบบไม่อิงพารามิเตอร์โดยทั่วไปจะมีกำลังทางสถิติต่ำกว่าแบบคู่พารามิเตอร์


6
การทดสอบตามพารามิเตอร์จะมีอำนาจมากขึ้นเมื่อตรงตามสมมติฐาน เมื่อสมมติฐานของพวกเขาไม่เป็นไปตามที่กำหนดการทดสอบแบบไม่มีพารามิเตอร์จะมีประสิทธิภาพมากกว่า
gung - Reinstate Monica

3
คำตอบนี้สั้นมาก & พลังงานได้รับการกล่าวถึงในคำตอบก่อนหน้า คุณจะพิจารณาขยายมันเล็กน้อยหรือไม่?
Scortchi - Reinstate Monica

4
พลังงานที่เพิ่มขึ้นจากการทดสอบแบบพารามิเตอร์นั้นน้อยเมื่อเปรียบเทียบกับการสูญเสียพลังงานที่พวกเขาต้องทนทุกข์เมื่อไม่ได้พบกับสมมติฐาน
Frank Harrell

แฟรงค์มันขึ้นอยู่กับการทดสอบการทดสอบบางอย่างมีความทนทานต่อการละเมิดสมมติฐานของพวกเขา
Hidden Markov Model

0

คำตอบที่ดีจำนวนมากอยู่แล้ว แต่มีเหตุผลบางอย่างที่ฉันไม่ได้เห็นกล่าวถึง:

  1. ความคุ้นเคย ผลลัพธ์พารามิเตอร์อาจคุ้นเคยมากกว่าแบบไม่อิงพารามิเตอร์แบบคร่าวๆ หากทั้งสองให้ข้อสรุปที่คล้ายกันแล้วความคุ้นเคยเป็นสิ่งที่ดี

  2. ความง่าย บางครั้งการทดสอบพารามิเตอร์นั้นง่ายต่อการปฏิบัติและรายงาน วิธีการแบบไม่มีพารามิเตอร์บางวิธีนั้นใช้คอมพิวเตอร์อย่างเข้มข้น แน่นอนว่าคอมพิวเตอร์ได้เร็วขึ้นมากและอัลกอริธึมก็พัฒนาขึ้นเช่นกัน แต่ .... ข้อมูลนั้นใหญ่ขึ้น

    1. บางครั้งสิ่งที่มักจะมีข้อเสียของการทดสอบแบบพาราเมทริกนั้นเป็นข้อได้เปรียบถึงแม้ว่าจะเป็นข้อทดสอบเฉพาะคู่โดยเฉพาะ ยกตัวอย่างเช่นฉันเป็นแฟนตัวยงของการถดถอยเชิงปริมาณเนื่องจากมันตั้งสมมติฐานน้อยกว่าวิธีการทั่วไป แต่บางครั้งคุณจำเป็นต้องประเมินค่าเฉลี่ยมากกว่าค่ามัธยฐาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.