คำถามติดแท็ก explanatory-models

4
บนกล่องจอร์จ Galit Shmueli และวิธีการทางวิทยาศาสตร์?
(คำถามนี้ดูเหมือนว่าจะเหมาะกว่าสำหรับปรัชญา SE ฉันหวังว่านักสถิติสามารถอธิบายความเข้าใจที่คลาดเคลื่อนเกี่ยวกับคำแถลงของ Box และ Shmueli ได้ดังนั้นฉันจึงโพสต์ไว้ที่นี่) George Box (จากชื่อเสียงของ ARIMA) กล่าวว่า: "ทุกรุ่นผิด แต่บางรุ่นก็มีประโยชน์" Galit Shmueli ในกระดาษชื่อดังของเธอ"เพื่ออธิบายหรือทำนาย" , (และอ้างอิงคนอื่นที่เห็นด้วยกับเธอ) ระบุว่า: การอธิบายและการทำนายไม่เหมือนกันและบางรุ่นทำหน้าที่อธิบายได้ดีถึงแม้ว่าพวกเขาจะทำงานได้ดีในการทำนาย ฉันรู้สึกว่าหลักการเหล่านี้ขัดแย้งกับสิ่งใด หากแบบจำลองไม่สามารถคาดเดาได้ดีจะเป็นประโยชน์หรือไม่ ที่สำคัญกว่านั้นถ้าแบบจำลองอธิบายได้ดี (แต่ไม่จำเป็นต้องคาดเดาได้ดี) มันจะต้องเป็นจริง (เช่นไม่ผิด) ไม่ทางใดก็ทางหนึ่ง แล้วตาข่ายกับกล่องของ "ทุกรุ่นผิด" อย่างไร ท้ายที่สุดถ้าแบบจำลองอธิบายได้ดี แต่ไม่คาดการณ์ได้ดีมันจะเป็นไปได้อย่างไรทางวิทยาศาสตร์? เกณฑ์การแบ่งเขตทางวิทยาศาสตร์ส่วนใหญ่ (การตรวจสอบยืนยันการปลอมแปลง ฯลฯ ) หมายถึงว่าคำสั่งทางวิทยาศาสตร์จะต้องมีอำนาจการทำนายหรือเรียกขาน: ทฤษฎีหรือรูปแบบที่ถูกต้องเฉพาะถ้ามันสามารถทดสอบเชิงประจักษ์ (หรือเท็จ) ซึ่งหมายความว่ามัน ต้องทำนายผลลัพธ์ในอนาคต คำถามของฉัน: คำแถลงของ Box และความคิดของ Shmueli ขัดแย้งหรือไม่หรือฉันขาดบางสิ่งบางอย่างเช่นแบบจำลองไม่มีพลังการทำนาย แต่ยังคงมีประโยชน์หรือไม่? หากคำแถลงของ …

1
การลดอคติในการสร้างแบบจำลองอธิบายทำไม? (Galit Shmueli“ อธิบายหรือทำนาย”)
นี้อ้างอิงคำถาม Galit Shmueli กระดาษ"ที่จะอธิบายหรือทำนาย" โดยเฉพาะอย่างยิ่งในหัวข้อ 1.5 "การอธิบายและการทำนายต่างกัน" ศาสตราจารย์ Shmueli เขียน: ในการอธิบายแบบจำลองการมุ่งเน้นไปที่การลดอคติเพื่อให้ได้การแสดงที่ถูกต้องที่สุดของทฤษฎีพื้นฐาน นี่ทำให้ฉันงงทุกครั้งที่ฉันอ่านกระดาษ การลดอคติในการประมาณการให้ความหมายที่ถูกต้องที่สุดในการแสดงถึงทฤษฎีพื้นฐานได้อย่างไร? ฉันได้ดูการพูดคุยของศาสตราจารย์ Shmueli ที่นี่ด้วยซึ่งจัดส่งที่ JMP Discovery Summit 2017 และเธอกล่าวว่า: ... สิ่งต่าง ๆ ที่เหมือนกับนางแบบหดตัวตระการตาคุณจะไม่มีวันได้เห็น เนื่องจากรูปแบบเหล่านั้นโดยการออกแบบแนะนำความเอนเอียงเพื่อลดอคติ / ความแปรปรวนโดยรวม นั่นเป็นเหตุผลที่พวกเขาจะไม่อยู่ที่นั่นมันไม่มีเหตุผลใด ๆ ที่จะทำเช่นนั้น ทำไมคุณต้องทำให้แบบจำลองของคุณลำเอียงโดยมีจุดประสงค์ นี่ไม่ใช่คำถามของฉันที่ชัดเจนเพียงแค่ปรับการอ้างสิทธิ์ที่ฉันไม่เข้าใจ หากทฤษฏีมีพารามิเตอร์มากมายและเรามีข้อมูลไม่เพียงพอที่จะประมาณค่าเหล่านั้นข้อผิดพลาดในการประมาณจะถูกควบคุมโดยความแปรปรวน เหตุใดจึงไม่เหมาะสมที่จะใช้ขั้นตอนการประเมินแบบเอนเอียงเช่นการถดถอยสัน (ส่งผลให้การประเมินแบบเอนเอียงของความแปรปรวนต่ำกว่า) ในสถานการณ์นี้

1
LASSO สำหรับรุ่นอธิบาย: พารามิเตอร์ที่หดตัวหรือไม่?
ฉันกำลังทำการวิเคราะห์ที่เป้าหมายหลักคือการเข้าใจข้อมูล ชุดข้อมูลมีขนาดใหญ่พอสำหรับการตรวจสอบข้าม (10k) และตัวทำนายรวมทั้งตัวแปรต่อเนื่องและดัมมี่และผลลัพธ์นั้นต่อเนื่อง เป้าหมายหลักคือการดูว่าเหมาะสมหรือไม่ที่จะใช้ตัวทำนายบางตัวเพื่อให้แบบจำลองตีความได้ง่ายขึ้น คำถาม: คำถามของฉันคือ "ซึ่ง vars อธิบายผลลัพธ์และเป็นส่วน 'แข็งแรงพอ' ของคำอธิบายนั้น" แต่หากต้องการเลือกพารามิเตอร์ lambda สำหรับ lasso คุณต้องใช้การตรวจสอบความถูกต้องข้ามเช่นความถูกต้องเชิงทำนายเป็นเกณฑ์ เมื่อทำการอนุมานความถูกต้องตามการคาดการณ์เป็นพร็อกซีที่ดีพอสำหรับคำถามทั่วไปที่ฉันถามหรือไม่ สมมติว่า LASSO เก็บเครื่องมือทำนาย 3 ตัวจาก 8 ตัว และตอนนี้ฉันถามตัวเองว่า: "สิ่งเหล่านี้มีผลต่อผลลัพธ์อย่างไร" ตัวอย่างเช่นฉันพบความแตกต่างทางเพศ หลังการหดตัวของบ่วงบาศค่าสัมประสิทธิ์บ่งชี้ว่าผู้หญิงให้คะแนนสูงกว่าผู้ชาย 1 คะแนน แต่ไม่มีการหดตัว (เช่นบนชุดข้อมูลจริง) พวกเขาได้คะแนน 2.5 คะแนนสูงขึ้น ฉันจะเลือกอันไหนเป็นเอฟเฟกต์เพศ "ของจริง" ของฉัน ไปโดยความถูกต้องทำนายก็จะเป็นค่าสัมประสิทธิ์หด หรือในบริบทบอกว่าฉันเขียนรายงานสำหรับคนที่ไม่รอบรู้ในสถิติ ฉันจะรายงานค่าสัมประสิทธิ์ใดให้พวกเขาบ้าง
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.