คืออะไรสมมติฐานของกระบวนการทางสถิติ?
ฉันไม่ใช่นักสถิติและนี่อาจผิด แต่ฉันคิดว่าคำว่า "สมมติฐาน" มักถูกใช้อย่างไม่เป็นทางการและสามารถอ้างถึงสิ่งต่าง ๆ ได้ สำหรับฉัน "การสันนิษฐาน" คือการพูดอย่างเคร่งครัดสิ่งที่ผลลัพธ์ทางทฤษฎีเท่านั้น (ทฤษฎีบท) สามารถมีได้
เมื่อผู้คนพูดถึงสมมติฐานของการถดถอยเชิงเส้น ( ดูที่นี่สำหรับการสนทนาเชิงลึก) พวกเขามักจะอ้างถึงทฤษฎีของเกาส์ - มาร์คอฟที่บอกว่าภายใต้สมมติฐานของ uncorrelated, เท่ากัน - แปรปรวน, ค่าศูนย์ผิดพลาด, OLS ประมาณน้ำเงิน คือไม่มีอคติและมีความแปรปรวนขั้นต่ำ นอกเหนือจากบริบทของทฤษฎีบทเกาส์ - มาร์กอฟแล้วมันไม่ชัดเจนสำหรับฉันว่า "สมมติฐานการถดถอย" จะหมายถึงอะไร
ในทำนองเดียวกันสมมติฐานของการพูดหนึ่งตัวอย่าง t-test อ้างถึงสมมติฐานที่อยู่ภายใต้ -statistic มีเสื้อ -distributed และด้วยเหตุนี้การอนุมานที่ถูกต้อง มันไม่ได้เรียกว่า "ทฤษฎีบท" แต่มันเป็นผลทางคณิตศาสตร์ที่ชัดเจน: ถ้าnตัวอย่างมีการกระจายตามปกติแล้วเสื้อ -statistic จะปฏิบัติตามของนักเรียนที -distribution กับn - 1องศาอิสระttnttn−1
สมมติฐานของเทคนิคการถดถอยที่ถูกลงโทษ
พิจารณาตอนนี้เทคนิคการถดถอยแบบปกติใด ๆ : การถดถอยของสัน, เชือก, ยางยืด, การถดถอยส่วนประกอบหลัก, การถดถอยกำลังสองน้อยที่สุดบางส่วน ฯลฯ ฯลฯ จุดรวมของวิธีการเหล่านี้คือการประมาณค่าพารามิเตอร์การถดถอยแบบเอนเอียงและหวังว่าจะลดความคาดหวัง การสูญเสียโดยการใช้ประโยชน์จากการแลกเปลี่ยนความแปรปรวนแบบอคติ
วิธีการทั้งหมดเหล่านี้มีพารามิเตอร์การทำให้เป็นมาตรฐานอย่างน้อยหนึ่งตัวและไม่มีวิธีใดที่จะมีกฎที่แน่นอนสำหรับการเลือกค่าของพารามิเตอร์เหล่านี้ ค่าที่ดีที่สุดมักจะพบผ่านขั้นตอนการตรวจสอบความถูกต้องบางประเภท แต่มีวิธีการตรวจสอบความถูกต้องข้ามหลายแบบและสามารถให้ผลลัพธ์ที่แตกต่างกันบ้าง ยิ่งไปกว่านั้นไม่ใช่เรื่องแปลกที่จะเรียกใช้กฎของหัวแม่มือเพิ่มเติมนอกเหนือจากการตรวจสอบข้าม เป็นผลให้ผลที่เกิดขึ้นจริงβของการใดวิธีการถดถอยลงโทษเหล่านี้จะไม่จริงที่กำหนดไว้อย่างเต็มที่โดยวิธี แต่จะขึ้นอยู่กับทางเลือกของนักวิเคราะห์β^
ดังนั้นจึงไม่ชัดเจนกับผมว่าจะมีคำสั่งใด ๆ optimality ทฤษฎีเกี่ยวกับβและอื่น ๆ ผมไม่แน่ใจว่าการพูดคุยเกี่ยวกับ "สมมติฐาน" (มีหรือไม่มีมัน) ของวิธีการลงโทษเช่นการถดถอยสันทำให้ความรู้สึกที่ทุกคนβ^
แต่สิ่งที่เกี่ยวกับผลการคำนวณทางคณิตศาสตร์ที่ริดจ์ถดถอยเสมอ OLS?
λβλ
ผลลัพธ์นี้ไม่จำเป็นต้องใช้สมมติฐานใด ๆ และเป็นจริงเสมอ แต่มันก็แปลกที่จะอ้างว่าการถดถอยของสันไม่มีสมมติฐานใด ๆ
โอเค แต่ฉันจะรู้ได้อย่างไรว่าฉันสามารถใช้การถดถอยแบบสันได้หรือไม่
ฉันจะบอกว่าแม้ว่าเราจะไม่สามารถพูดถึงสมมติฐานได้ แต่เราสามารถพูดคุยเกี่ยวกับกฎง่ายๆได้ เป็นที่ทราบกันดีว่าการถดถอยของสันเขานั้นมีประโยชน์มากที่สุดในกรณีที่การถดถอยหลายครั้งกับตัวทำนายที่สัมพันธ์กัน เป็นที่ทราบกันดีว่ามันมีแนวโน้มที่จะดีกว่า OLS ซึ่งมักจะมีกำไรที่สูง มันจะมีแนวโน้มที่จะดีกว่าแม้ในกรณีที่มีความแตกต่างของความผิดพลาดที่มีความสัมพันธ์หรือสิ่งอื่นใด ดังนั้นกฎง่ายๆระบุว่าถ้าคุณมีข้อมูลหลายระดับหลายปีการถดถอยสันและการตรวจสอบข้ามจึงเป็นความคิดที่ดี
อาจมีกฎที่เป็นประโยชน์อื่น ๆ เกี่ยวกับหัวแม่มือและกลอุบายทางการค้า (เช่นเช่นจะทำอย่างไรกับค่าผิดปกติขั้นต้น) แต่พวกเขาไม่ใช่ข้อสมมติฐาน
pp