สามารถใช้เทคนิคการทำให้เป็นมาตรฐานในแบบจำลองเอฟเฟกต์แบบสุ่มได้หรือไม่?


11

โดยเทคนิคการทำให้เป็นปกติฉันหมายถึง lasso, ridge regression, elastic net และอื่น ๆ

พิจารณารูปแบบการคาดการณ์เกี่ยวกับข้อมูลการดูแลสุขภาพที่มีข้อมูลด้านประชากรศาสตร์และข้อมูลการวินิจฉัยที่คาดการณ์ระยะเวลาการเข้าพักผู้ป่วยใน สำหรับบุคคลบางคนมีการสังเกต LOS หลายครั้ง (กล่าวคือมากกว่าหนึ่งตอนของ IP) ในช่วงระยะเวลาพื้นฐานที่สัมพันธ์กัน

มันสมเหตุสมผลหรือไม่ที่จะสร้างตัวอย่างเช่นโมเดลการทำนายด้วยเน็ตยืดหยุ่นซึ่งมีคำศัพท์สุ่มดักจับผลกระทบสำหรับแต่ละคน?


คำบรรยายสำหรับบรรทัดแรกของคุณ: "โดยเทคนิคเอฟเฟกต์แบบสุ่ม (เช่นสมมติฐานเกี่ยวกับวิธีการกระจายพารามิเตอร์แบบสุ่ม) ฉันหมายถึง Laplace Priors และ Priors ปกติสำหรับพารามิเตอร์การถดถอย ... และสิ่งที่คล้ายกัน" :-)
conjugateprior

คำตอบ:


7

มีเอกสารไม่กี่ข้อที่จัดการกับคำถามนี้ ฉันจะค้นหาตามลำดับพิเศษ:

  1. Pen.LME: Howard D Bondell, อรุณกฤษณะ, และ Sujit K Ghosh การเลือกตัวแปรร่วมสำหรับการจับยึดแบบคงที่และแบบสุ่มในโมเดลเชิงเส้นผสม ชีวภาพ, 66 (4): 1069-1077, 2010

  2. GLMMLASSO: Jurg Schelldorfer, Peter Buhlmann, Sara van de Geer การประมาณสำหรับโมเดลเชิงเส้นผสมเชิงเส้นมิติสูงโดยใช้การลงโทษ L1 สแกนดิเนเวียนวารสารสถิติ, 38 (2): 197-214, 2011

ซึ่งสามารถพบได้ทั่วไป

ฉันกำลังจะเขียนบทความเกี่ยวกับการประยุกต์ใช้การลงโทษสุทธิแบบยืดหยุ่นกับโมเดลผสม (LMMEN) ในตอนนี้และวางแผนที่จะส่งมันเพื่อตรวจสอบวารสารในเดือนถัดไป

  1. LMMEN: Sidi, Ritov, Unger การทำให้เป็นมาตรฐานและการจำแนกประเภทของตัวแบบผสมเชิงเส้นผ่านการลงโทษสุทธิแบบยืดหยุ่น

เหนือสิ่งอื่นใดหากคุณกำลังสร้างแบบจำลองข้อมูลที่ไม่ปกติหรือไม่มีลิงค์ตัวตนฉันจะไปกับ GLMMLASSO (แต่ระวังว่ามันไม่สามารถจัดการ RE จำนวนมากได้) ไม่เช่นนั้น Pen.LME นั้นดีเพราะคุณไม่มีข้อมูลที่มีความสัมพันธ์สูงไม่ว่าจะเป็นในลักษณะที่คงที่หรือสุ่ม ในกรณีหลังนี้คุณสามารถส่งฉันและฉันยินดีที่จะส่งรหัส / กระดาษ (ฉันจะวางไว้บน cran ในอนาคตอันใกล้)

ผมอัปโหลดไปยัง CRAN วันนี้ - lmmen มันแก้ปัญหาโมเดลเชิงเส้นแบบผสมพร้อมการลงโทษแบบยืดหยุ่นสุทธิบนเอฟเฟกต์แบบคงที่และแบบสุ่มพร้อมกัน

นอกจากนี้ยังมีฟังก์ชั่นแพคเกจ CV สำหรับแพ็คเกจ lmmlassoและglmmLassoด้วย


1
Yonicd แอพพลิเคชั่นของโมเดลตาข่ายแบบยืดหยุ่นเป็นเส้นตรงเป็นสิ่งที่ฉันกำลังมองหา ฉันทำงานกับข้อมูลทางพันธุกรรมที่มีความสัมพันธ์ดังนั้นการเลือกกลุ่มของตาข่ายยืดหยุ่นจะมีประโยชน์มาก ฉันพยายามติดต่อคุณแล้ว แต่ไม่พบวิธีอื่นนอกจากโพสต์คำตอบนี้เนื่องจากไม่สามารถส่งข้อความได้ อย่างไรก็ตามฉันหวังว่าจะอ่านกระดาษของคุณและจะลองใช้รหัสของคุณทันทีที่มี

5

ฉันมักจะมองว่าการถดถอยของสันเขาเป็นเพียงแบบจำลองเอฟเฟกต์เชิงประจักษ์ที่ไม่ จำกัด เฉพาะตัวแปรเด็ดขาดเดียว (และไม่มีเมทริกซ์สหสัมพันธ์แฟนซี) คุณสามารถรับการทำนายแบบเดียวกันได้จากการตรวจสอบความถูกต้องของการข้ามสันเขาและปรับ / ประเมินผลเอฟเฟกต์แบบง่าย ในตัวอย่างของคุณคุณอาจได้รับแฟนซีและมีบทลงโทษแยกจากกันในคุณลักษณะการสาธิต / diag และอีกหนึ่งในตัวชี้วัดผู้ป่วย (ใช้สิ่งที่บรรทัดปัจจัยปรับการลงโทษในglmnet) หรือคุณอาจรวมเอฟเฟกต์แบบสุ่มแฟนซีที่มีเอฟเฟกต์สัมพันธ์โดยบุคคล ความเป็นไปได้เหล่านี้ไม่ถูกหรือผิด แต่ก็มีประโยชน์


2

ฉันกำลังคิดเกี่ยวกับคำถามที่คล้ายกัน ฉันคิดว่าในแอปพลิเคชันคุณสามารถทำได้ถ้าใช้งานได้และคุณเชื่อว่าการใช้สิ่งนี้สมเหตุสมผล หากเป็นการตั้งค่าตามปกติในเอฟเฟกต์แบบสุ่ม (นั่นหมายความว่าคุณมีการวัดซ้ำสำหรับแต่ละกลุ่ม) จากนั้นเป็นเพียงเทคนิคการประมาณซึ่งเป็นการโต้เถียงน้อยกว่า หากคุณไม่ได้มีการวัดซ้ำหลายครั้งสำหรับกลุ่มส่วนใหญ่แล้วมันอาจอยู่ในขอบเขตของรูปแบบเอฟเฟกต์แบบสุ่มปกติและคุณอาจต้องการตรวจสอบความถูกต้องของมันอย่างรอบคอบ (จากมุมมองของระเบียบวิธี) หากคุณต้องการเสนอ วิธี.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.