ใครสามารถอธิบายให้ฉันฟังได้ว่าทำไมทุกคนจะเลือกพาราเมทริกสำหรับวิธีการทดสอบสมมติฐานหรือการวิเคราะห์การถดถอย
ในใจของฉันมันเหมือนกับการไปล่องแพและเลือกนาฬิกาที่ไม่กันน้ำเพราะคุณอาจไม่เปียก ทำไมไม่ใช้เครื่องมือที่ใช้ได้กับทุกโอกาส?
ใครสามารถอธิบายให้ฉันฟังได้ว่าทำไมทุกคนจะเลือกพาราเมทริกสำหรับวิธีการทดสอบสมมติฐานหรือการวิเคราะห์การถดถอย
ในใจของฉันมันเหมือนกับการไปล่องแพและเลือกนาฬิกาที่ไม่กันน้ำเพราะคุณอาจไม่เปียก ทำไมไม่ใช้เครื่องมือที่ใช้ได้กับทุกโอกาส?
คำตอบ:
แทบจะไม่เคยมีการทดสอบพาราเมตริกและการทดสอบที่ไม่ใช่พารามิเตอร์จริงมีค่าเป็นโมฆะเดียวกัน พารามิเตอร์ -test กำลังทดสอบค่าเฉลี่ยของการแจกแจงโดยสมมติว่ามีสองช่วงเวลาแรก การทดสอบยศรวมของ Wilcoxon ไม่ได้ใช้เวลาสักครู่และทดสอบความเสมอภาคของการแจกแจงแทน พารามิเตอร์โดยนัยของมันคือฟังก์ชั่นแปลก ๆ ของการแจกแจงความน่าจะเป็นที่การสังเกตจากตัวอย่างหนึ่งต่ำกว่าการสังเกตจากอีกตัวอย่างหนึ่ง คุณสามารถพูดคุยเกี่ยวกับการเปรียบเทียบระหว่างการทดสอบทั้งสองภายใต้โมฆะที่ระบุอย่างสมบูรณ์ของการแจกแจงที่เหมือนกัน ... แต่คุณต้องยอมรับว่าการทดสอบทั้งสองนั้นกำลังทดสอบสมมติฐานที่แตกต่างกัน
ข้อมูลที่การทดสอบพารามิเตอร์นำมาพร้อมกับข้อสันนิษฐานช่วยปรับปรุงพลังของการทดสอบ แน่นอนว่าข้อมูลที่ถูกต้องดีขึ้น แต่มีน้อยถ้าโดเมนของความรู้ของมนุษย์วันนี้ที่ไม่มีข้อมูลเบื้องต้นดังกล่าว ข้อยกเว้นที่น่าสนใจที่กล่าวอย่างชัดเจนว่า "ฉันไม่ต้องการที่จะคิดอะไร" เป็นห้องพิจารณาคดีที่วิธีการที่ไม่ใช่เชิงพารามิเตอร์ยังคงได้รับความนิยมอย่างกว้างขวาง อาจมีเหตุผลที่ดีเล่นสำนวนเจตนาที่ประพันธ์หนังสือที่ดีทั้งฟิลลิปดีสถิติที่ไม่ใช่ตัวแปรและสถิติในห้องพิจารณาคดี
นอกจากนี้ยังมีสถานการณ์การทดสอบที่คุณไม่สามารถเข้าถึง microdata ที่จำเป็นสำหรับการทดสอบแบบไม่พารามิเตอร์ สมมติว่าคุณถูกขอให้เปรียบเทียบคนสองกลุ่มเพื่อวัดว่าเป็นคนอ้วนมากกว่าคนอื่นหรือไม่ ในโลกอุดมคติคุณจะมีการวัดส่วนสูงและน้ำหนักสำหรับทุกคนและคุณสามารถสร้างแบบทดสอบการเรียงสับเปลี่ยนโดยความสูง ในโลกอุดมคติน้อยกว่า (เช่นของจริง) คุณอาจมีความสูงเฉลี่ยและน้ำหนักเฉลี่ยในแต่ละกลุ่ม (หรืออาจเป็นช่วงหรือความแปรปรวนของลักษณะเหล่านี้ที่ด้านบนของค่าเฉลี่ยตัวอย่าง) ทางออกที่ดีที่สุดของคุณคือการคำนวณค่า BMI เฉลี่ยสำหรับแต่ละกลุ่มและเปรียบเทียบถ้าคุณมีค่าเฉลี่ย หรือสมมติว่าค่าความแปรปรวนปกติสำหรับความสูงและน้ำหนักหากคุณมีความหมายและความแปรปรวน (คุณอาจต้องใช้ความสัมพันธ์จากข้อมูลภายนอกบางอย่างถ้ามันไม่ได้มาพร้อมกับตัวอย่างของคุณ)
ตามที่คนอื่น ๆ เขียนไว้: หากมีเงื่อนไขตามที่กำหนดการทดสอบตามพารามิเตอร์ของคุณจะมีประสิทธิภาพมากกว่าการทดสอบแบบไม่มีพารามิเตอร์
ในการเปรียบเทียบนาฬิกาของคุณตัวที่ไม่กันน้ำนั้นจะมีความแม่นยำมากขึ้นเว้นแต่ว่ามันจะเปียก ตัวอย่างเช่นนาฬิกากันน้ำของคุณอาจปิดหนึ่งชั่วโมงด้วยวิธีใดวิธีหนึ่งในขณะที่นาฬิกาที่ไม่กันน้ำจะแม่นยำ ... และคุณต้องขึ้นรถบัสหลังจากการล่องแพ ในกรณีเช่นนี้คุณอาจต้องใช้นาฬิกาที่ไม่กันน้ำพร้อมกับคุณและตรวจสอบให้แน่ใจว่าไม่เปียกน้ำ
จุดโบนัส:วิธีการที่ไม่ใช่พารามิเตอร์นั้นไม่ใช่เรื่องง่ายเสมอไป ใช่ทางเลือกในการทดสอบการเปลี่ยนรูปแบบเป็นแบบง่าย nlme()
แต่เป็นทางเลือกที่ไม่อิงพารามิเตอร์เป็นรูปแบบเชิงเส้นผสมกับปฏิสัมพันธ์หลายแบบสองทางและผลกระทบแบบสุ่มซ้อนกันค่อนข้างเป็นบิตยากที่จะตั้งขึ้นกว่าเรียกง่ายๆไป ฉันได้ทำเช่นนั้นโดยใช้การทดสอบการเปลี่ยนรูปและจากประสบการณ์ของฉันค่า p ของการทดสอบแบบพาราเมตริกและการเปลี่ยนรูปนั้นค่อนข้างใกล้เคียงกันแม้ว่าค่าที่เหลือจากแบบจำลองพารามิเตอร์ค่อนข้างไม่ปกติ การทดสอบพารามิเตอร์มักจะมีความยืดหยุ่นอย่างน่าประหลาดใจต่อการออกเดินทางจากเงื่อนไขเบื้องต้น
ในขณะที่ฉันยอมรับว่าในหลาย ๆ กรณีเทคนิคที่ไม่ใช่พารามิเตอร์มีประโยชน์ แต่ก็มีสถานการณ์ที่วิธีการพารามิเตอร์มีประโยชน์มากกว่า
เรามาดูการอภิปราย "การทดสอบ t-test สองตัวอย่างกับการทดสอบผลรวมยศของ Wilcoxon" (ไม่เช่นนั้นเราต้องเขียนหนังสือทั้งเล่ม)
ในการทดสอบสมมติฐานการทดสอบที่ไม่ใช่พารามิเตอร์มักจะทดสอบสมมติฐานที่แตกต่างกันซึ่งเป็นหนึ่งในเหตุผลที่ว่าทำไมเราไม่สามารถทดแทนการทดสอบที่ไม่ใช่พารามิเตอร์สำหรับพารามิเตอร์ที่หนึ่ง
แบบจำลองกึ่งมีค่ามีข้อดีหลายประการ พวกเขาเสนอการทดสอบเช่นการทดสอบ Wilcoxon เป็นกรณีพิเศษ แต่อนุญาตให้มีการประเมินอัตราส่วนผลกระทบ, ปริมาณ, วิธีการและความน่าจะเป็นที่เกิน พวกเขาขยายไปยังข้อมูลตามยาวและตรวจสอบ พวกเขามีความแข็งแกร่งในพื้นที่ Y และมีการเปลี่ยนแปลงไม่เปลี่ยนแปลงยกเว้นวิธีการประมาณ ดูhttp://biostat.mc.vanderbilt.edu/rmsลิงก์ไปยังเอกสารประกอบคำบรรยายสำหรับตัวอย่าง / กรณีศึกษาโดยละเอียด
. ตัวอย่างรวมถึงโมเดลอัตราต่อรองที่ได้สัดส่วน (กรณีพิเศษ: Wilcoxon และ Kruskal-Wallis) และโมเดลอันตรายตามสัดส่วน (กรณีพิเศษ: อันดับของบันทึกและการทดสอบบันทึกลำดับชั้น)
ในบรรดาโฮสต์ของคำตอบที่มีให้ฉันก็จะเรียกความสนใจไปที่สถิติแบบเบย์ ปัญหาบางอย่างไม่สามารถตอบได้ด้วยความเป็นไปได้เพียงอย่างเดียว นักถกเถียงมักใช้เหตุผลเชิงต่อต้านซึ่ง "ความน่าจะเป็น" หมายถึงเอกภพทางเลือกและกรอบจักรวาลสำรองไม่สมเหตุสมผลเท่าที่อนุมานสถานะของบุคคลเช่นความผิดหรือความไร้เดียงสาของอาชญากรหรือไม่ว่าคอขวดของความถี่ของยีนใน ชนิดสัมผัสกับการเปลี่ยนแปลงสิ่งแวดล้อมขนาดใหญ่นำไปสู่การสูญพันธุ์ ในบริบทของเบย์ความน่าจะเป็นคือ "ความเชื่อ" ไม่ใช่ความถี่ซึ่งสามารถนำไปใช้กับสิ่งที่ได้เกิดการตกตะกอนแล้ว
ตอนนี้วิธีการแบบเบย์ส่วนใหญ่ต้องการการระบุแบบจำลองความน่าจะเป็นแบบเต็มสำหรับผลลัพธ์ก่อนหน้าและผลลัพธ์ และแบบจำลองความน่าจะเป็นเหล่านี้ส่วนใหญ่เป็นพารามิเตอร์ สอดคล้องกับสิ่งที่ผู้อื่นพูดสิ่งเหล่านี้ไม่จำเป็นต้องถูกต้องแม่นยำในการสร้างบทสรุปที่มีความหมายของข้อมูล "ทุกรุ่นผิดรุ่นบางรุ่นมีประโยชน์"
แน่นอนว่ามีวิธีการแบบเบส์แบบไม่มีพารามิเตอร์ สิ่งเหล่านี้มีริ้วรอยทางสถิติจำนวนมากและโดยทั่วไปการพูดนั้นต้องการข้อมูลประชากรที่ครอบคลุมเกือบทั้งหมดเพื่อใช้อย่างมีความหมาย
เหตุผลเดียวที่ฉันตอบแม้จะมีคำตอบที่ดีทั้งหมดข้างต้นก็คือไม่มีใครเรียกความสนใจไปที่ # 1 เหตุผลที่เราใช้การทดสอบแบบพารามิเตอร์ (อย่างน้อยในการวิเคราะห์ข้อมูลฟิสิกส์ของอนุภาค) เพราะเรารู้การแปรผันของข้อมูล ดุจ! นั่นเป็นข้อได้เปรียบที่ยิ่งใหญ่ คุณกำลังรวบรวมข้อมูลหลายร้อยหลายพันหรือหลายล้านรายการลงในพารามิเตอร์ที่คุณสนใจและอธิบายการกระจายของคุณ สิ่งเหล่านี้บอกคุณถึงฟิสิกส์พื้นฐาน (หรือวิทยาศาสตร์ใดก็ตามที่ให้ข้อมูลของคุณแก่คุณ)
แน่นอนถ้าคุณไม่มีความคิดเกี่ยวกับความหนาแน่นของความน่าจะเป็นพื้นฐานคุณก็ไม่มีทางเลือก: ใช้การทดสอบแบบไม่มีพารามิเตอร์ การทดสอบแบบไม่อิงพารามิเตอร์นั้นมีข้อดีของการไม่มีอคติที่มีอคติใด ๆ แต่ก็ยากที่จะนำไปใช้ - บางครั้งก็ยากกว่ามาก
สถิติที่ไม่ใช่พารามิเตอร์มีปัญหาของตัวเอง! หนึ่งในนั้นคือการเน้นไปที่การทดสอบสมมติฐานบ่อยครั้งที่เราต้องการการประมาณค่าและช่วงความมั่นใจและทำให้พวกมันอยู่ในรูปแบบที่ซับซ้อนด้วย nonparametrics นั้นซับซ้อน --- มีโพสต์บล็อกที่ดีมากเกี่ยวกับเรื่องนี้พร้อมการสนทนาที่http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ การสนทนานำไปสู่การโพสต์อื่น ๆ นี้http: // notstatschat tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-testซึ่งแนะนำสำหรับมุมมองที่แตกต่างกันมากใน Wilcoxon รุ่นสั้นคือ: Wilcoxon (และการทดสอบระดับอื่น ๆ ) สามารถนำไปสู่การไม่ถ่ายทอด
ฉันจะบอกว่าสถิติที่ไม่ใช่พารามิเตอร์นั้นโดยทั่วไปมีผลบังคับใช้มากกว่าในแง่ที่ว่าพวกเขามีสมมติฐานน้อยกว่าสถิติเชิงสถิติ
อย่างไรก็ตามหากมีการใช้สถิติแบบพารามิเตอร์และสมมติฐานพื้นฐานเป็นจริงแล้วสถิติแบบพารามิเตอร์จะมีประสิทธิภาพมากกว่าแบบที่ไม่ใช่แบบพารามิเตอร์
สถิติเชิงพารามิเตอร์มักเป็นวิธีการรวมความรู้ [กับข้อมูล] ภายนอก ตัวอย่างเช่นคุณรู้ว่าการกระจายข้อผิดพลาดเป็นเรื่องปกติและความรู้นี้มาจากประสบการณ์ก่อนหน้านี้หรือการพิจารณาอื่น ๆ และไม่ใช่จากชุดข้อมูล ในกรณีนี้สมมติว่ามีการแจกแจงแบบปกติคุณกำลังรวมความรู้ภายนอกนี้เข้ากับการประมาณพารามิเตอร์ของคุณซึ่งจะต้องปรับปรุงการประมาณการของคุณ
ในการเปรียบเทียบนาฬิกาของคุณ ทุกวันนี้นาฬิกาเกือบทุกรุ่นสามารถกันน้ำได้ยกเว้นชิ้นพิเศษที่มีเครื่องประดับหรือวัสดุที่ผิดปกติเช่นไม้ เหตุผลที่สวมใส่พวกเขาคือ: พวกเขาพิเศษ หากคุณหมายถึงน้ำหลักฐานแล้วชุดนาฬิกาจำนวนมากไม่กันน้ำ เหตุผลที่สวมใส่มันเป็นหน้าที่ของพวกเขาอีกครั้ง: คุณจะไม่สวมนาฬิกานักประดาน้ำพร้อมชุดสูทและเน็คไท นอกจากนี้ในปัจจุบันนาฬิกาจำนวนมากได้เปิดกลับมาเพื่อให้คุณสามารถเพลิดเพลินกับการดูการเคลื่อนไหวผ่านคริสตัล ตามธรรมชาติแล้วนาฬิกาเหล่านี้มักจะไม่กันน้ำ
นี่ไม่ใช่สถานการณ์จำลองการทดสอบสมมุติฐาน แต่มันอาจเป็นตัวอย่างที่ดีสำหรับการตอบคำถามของคุณ: ลองพิจารณาการวิเคราะห์การจัดกลุ่ม มีวิธีการทำคลัสเตอร์แบบ "ไม่อิงพารามิเตอร์" มากมายเช่นการจัดกลุ่มแบบลำดับชั้น K- หมายถึง ฯลฯ แต่ปัญหาคือวิธีการประเมินว่าโซลูชันการจัดกลุ่มของคุณเป็น "ดีกว่า" มากกว่าโซลูชันที่เป็นไปได้อื่น ๆ หรือไม่ . อัลกอริทึมแต่ละอย่างจะให้สิ่งที่ดีที่สุดที่คุณจะได้รับอย่างไรก็ตามคุณจะรู้ได้อย่างไรว่าไม่มีอะไรดีกว่า .. ขณะนี้ยังมีวิธีการทางพารามิเตอร์ในการทำคลัสเตอร์ซึ่งเรียกว่าการทำคลัสเตอร์แบบจำลองเช่นโมเดล จำกัด การผสม ด้วย FMM คุณสามารถสร้างแบบจำลองทางสถิติที่อธิบายถึงการกระจายข้อมูลของคุณและปรับให้เหมาะกับข้อมูล เมื่อคุณมีแบบจำลองของคุณคุณสามารถประเมินความเป็นไปได้ที่ข้อมูลของคุณจะได้รับจากแบบจำลองนี้คุณสามารถใช้การทดสอบอัตราส่วนความน่าจะเป็นเปรียบเทียบของ AIC และใช้วิธีอื่น ๆ ในการตรวจสอบแบบจำลองและการเปรียบเทียบแบบจำลอง อัลกอริทึมการจัดกลุ่มแบบไม่อิงพารามิเตอร์เพียงจัดกลุ่มข้อมูลโดยใช้เกณฑ์ความคล้ายคลึงกันในขณะที่ใช้ FMM ช่วยให้คุณสามารถอธิบายและพยายามทำความเข้าใจข้อมูลของคุณตรวจสอบว่ามันเหมาะสมอย่างไรพยากรณ์ได้ดี ... ในทางปฏิบัติ นอกกรอบและค่อนข้างดีในขณะที่ FMM อาจเป็นปัญหาได้ แต่ถึงกระนั้นแนวทางแบบจำลองมักจะให้ผลลัพธ์ที่ดียิ่งขึ้นแก่คุณ
การคาดการณ์และการคาดการณ์ข้อมูลใหม่มักเป็นเรื่องยากหรือเป็นไปไม่ได้สำหรับโมเดลที่ไม่ใช้พารามิเตอร์ ตัวอย่างเช่นฉันสามารถคาดการณ์จำนวนการเรียกร้องการรับประกันในอีก 10 ปีข้างหน้าโดยใช้แบบจำลองการเอาตัวรอด Weibull หรือ Lognormal อย่างไรก็ตามไม่สามารถใช้รูปแบบ Cox หรือ Kaplan-Meier
แก้ไข: ขอให้ฉันชัดเจนขึ้นอีกหน่อย หาก บริษัท มีผลิตภัณฑ์ที่มีข้อบกพร่องพวกเขามักจะสนใจที่จะคาดการณ์อัตราการเรียกร้องการรับประกันในอนาคตและ CDF ตามการเรียกร้องการรับประกันในปัจจุบันและข้อมูลการขาย สิ่งนี้สามารถช่วยพวกเขาในการตัดสินใจว่าจำเป็นต้องเรียกคืนหรือไม่ ฉันไม่รู้ว่าคุณทำสิ่งนี้ได้อย่างไรโดยใช้ตัวแบบที่ไม่ใช่พารามิเตอร์
ฉันเชื่อโดยสุจริตว่าไม่มีคำตอบที่ถูกต้องสำหรับคำถามนี้ ตัดสินจากคำตอบที่ได้รับฉันทามติคือว่าการทดสอบแบบพารามิเตอร์มีประสิทธิภาพมากกว่าการเทียบแบบไม่พารามิเตอร์ ฉันจะไม่คัดค้านมุมมองนี้ แต่ฉันเห็นว่ามันเป็นสมมุติฐานมากกว่ามุมมองที่เป็นข้อเท็จจริงเนื่องจากไม่ใช่สิ่งที่สอนอย่างชัดเจนในโรงเรียนและไม่มีผู้วิจารณ์คนไหนที่จะบอกคุณได้ว่า "เอกสารของคุณถูกปฏิเสธเพราะคุณใช้แบบทดสอบ คำถามนี้เกี่ยวกับสิ่งที่โลกแห่งสถิติไม่สามารถตอบได้อย่างชัดเจน แต่ได้รับอนุญาตแล้ว
ความคิดเห็นส่วนตัวของฉันคือการตั้งค่าของพารามิเตอร์หรือไม่พารามิเตอร์มีส่วนเกี่ยวข้องกับประเพณีมากกว่าสิ่งอื่นใด (สำหรับการขาดระยะที่ดีกว่า) เทคนิคพารามิเตอร์สำหรับการทดสอบและการคาดการณ์อยู่ที่นั่นก่อนและมีประวัติยาวนานดังนั้นจึงไม่ใช่เรื่องง่ายเลยที่จะเพิกเฉย โดยเฉพาะอย่างยิ่งการคาดการณ์มีวิธีแก้ปัญหาแบบไร้พารามิเตอร์ที่น่าประทับใจซึ่งมีการใช้กันอย่างแพร่หลายเป็นเครื่องมือตัวเลือกแรกในปัจจุบัน ฉันคิดว่านี่เป็นหนึ่งในเหตุผลที่เทคนิคการเรียนรู้ของเครื่องเช่นโครงข่ายประสาทและต้นไม้ตัดสินใจซึ่งไม่ได้วัดตามธรรมชาติได้รับความนิยมอย่างกว้างขวางในช่วงไม่กี่ปีที่ผ่านมา
มันเป็นปัญหาของพลังงานสถิติ การทดสอบแบบไม่อิงพารามิเตอร์โดยทั่วไปจะมีกำลังทางสถิติต่ำกว่าแบบคู่พารามิเตอร์
คำตอบที่ดีจำนวนมากอยู่แล้ว แต่มีเหตุผลบางอย่างที่ฉันไม่ได้เห็นกล่าวถึง:
ความคุ้นเคย ผลลัพธ์พารามิเตอร์อาจคุ้นเคยมากกว่าแบบไม่อิงพารามิเตอร์แบบคร่าวๆ หากทั้งสองให้ข้อสรุปที่คล้ายกันแล้วความคุ้นเคยเป็นสิ่งที่ดี
ความง่าย บางครั้งการทดสอบพารามิเตอร์นั้นง่ายต่อการปฏิบัติและรายงาน วิธีการแบบไม่มีพารามิเตอร์บางวิธีนั้นใช้คอมพิวเตอร์อย่างเข้มข้น แน่นอนว่าคอมพิวเตอร์ได้เร็วขึ้นมากและอัลกอริธึมก็พัฒนาขึ้นเช่นกัน แต่ .... ข้อมูลนั้นใหญ่ขึ้น