โมเดลสารเติมแต่งทั่วไป - ใครทำการวิจัยกับพวกเขานอกเหนือจาก Simon Wood


19

ฉันใช้เกมมากขึ้นเรื่อย ๆ เมื่อฉันไปเพื่อให้การอ้างอิงสำหรับส่วนประกอบต่าง ๆ ของพวกเขา (การเลือกพารามิเตอร์ให้เรียบฐาน spline ต่างๆ p-values ​​ของคำศัพท์ที่ราบเรียบ) พวกเขาทั้งหมดมาจากนักวิจัยคนหนึ่ง - Simon Wood ที่ University of Bath ในอังกฤษ

เขายังเป็นผู้ดูแลmgcvใน R ซึ่งใช้ร่างกายของเขาในการทำงาน mgcvมีความซับซ้อนอย่างมาก แต่ทำงานได้ดีอย่างน่าทึ่ง

มีสิ่งที่มีอายุมากกว่าแน่นอน แนวความคิดดั้งเดิมนั้นให้เครดิตกับ Hastie & Tibshirani และตำราเก่าที่ยิ่งใหญ่เขียนโดย Ruppert et al ในปี 2003

ในฐานะที่เป็นคนสมัครฉันไม่ค่อยมีความรู้สึกกับนัก Zeitgeist ในหมู่นักสถิติ งานของเขาได้รับการยกย่องอย่างไร เป็นเรื่องแปลกไหมที่นักวิจัยคนหนึ่งทำได้มากในพื้นที่หนึ่ง? หรือมีงานอื่นที่ไม่ได้สังเกตมากเพราะมันไม่ได้อยู่ข้างในmgcv? ฉันไม่เห็นว่ามีการใช้เกมมากนักแม้ว่าเนื้อหาจะสามารถเข้าถึงได้โดยผู้ใช้ที่มีการฝึกอบรมทางสถิติและซอฟต์แวร์ได้รับการพัฒนาค่อนข้างดี มี "เรื่องย้อนหลัง" มากมายหรือไม่?

คำแนะนำของมุมมองชิ้นและสิ่งที่คล้ายกันอื่น ๆ จากวารสารสถิติจะได้รับการชื่นชม


คำถามนี้ดูเหมือนว่าฉันจะไม่เหมาะกับ CV ดูเหมือนว่าค่อนข้างกว้างคลุมเครือและอาจปิดหัวข้อ คุณช่วยโฟกัสให้มากขึ้นและพยายามทำให้มันชัดเจนยิ่งขึ้นในหัวข้อหรือไม่ (การขอการอ้างอิงสำหรับลักษณะเฉพาะของเกมอย่างแน่นอนจะอยู่ในหัวข้อ)
gung - Reinstate Monica

ฉันรู้ว่ามันค่อนข้างคลุมเครือ มันเป็นคำถามเกี่ยวกับระเบียบวินัยของเมตาดาต้าและฉันไม่แน่ใจว่าจะไปที่ไหน อย่างไรก็ตามฉันขอขอบคุณที่อ้างอิงถึงบทวิจารณ์และมุมมองอย่างไรก็ตามและจะแก้ไขคำถามเพื่อให้ครอบคลุม
user59828

4
Thomas Kneib และ Fabian Scheipl เป็นชื่อสองชื่อที่ฉันคุ้นเคยจากสาขานี้และผู้ที่โปรโมต GAMs และรูปแบบที่เกี่ยวข้องในแบบที่แตกต่างกันบ้าง ฉันได้รับความประทับใจว่ามี "การแข่งขัน" ที่เป็นมิตรระหว่างไซม่อนวู้ดกับคนพวกนี้เพราะฉันเห็นวู้ดพัฒนาความคิดใหม่ ๆ ในเอกสารและคุณลักษณะเป็นmgcvซึ่งเป็น "การตอบสนอง" ต่อการทำงานของ Kneib & Schiepl และอื่น ๆ ยกตัวอย่างเช่น Knieb เป็นหนึ่งในผู้พัฒนาของ BayesX ซึ่งเหมาะกับโมเดลเสริมที่มีโครงสร้างและค่อนข้างแตกต่างจากแนวทางการถดถอยแบบลงโทษของ Wood
Reinstate Monica - G. Simpson

2
ตัวอย่างเช่นดูBayesian Smoothing and Regression สำหรับข้อมูลระยะยาวเชิงพื้นที่และเหตุการณ์โดย Fahrmier & Kneib สำหรับความครอบคลุมที่กว้างขวางของวิธีการแบบจำลองการเติมโครงสร้าง
Reinstate Monica - G. Simpson

6
ฉันคิดว่าคำถามเกี่ยวกับวัฒนธรรมทางสถิตินั้นมีประโยชน์จริงๆ คำตอบนี้ได้ดึงดูดคำตอบที่น่าสนใจแล้วแม้ว่าจะโพสต์เป็นคู่ความคิดเห็น
Flounderer

คำตอบ:


13

มีนักวิจัยหลายคนในเกม: โดยทั่วไปแล้วโมเดลเดียวกัน (GLM พร้อมตัวทำนายแบบเชิงเส้นที่กำหนดโดยผลรวมของฟังก์ชันที่ราบรื่น) จะได้รับชื่อที่แตกต่างกันมากมาย คุณจะพบโมเดลที่คุณอาจอ้างถึงว่าเป็นเกมที่เรียกว่า: โมเดลการถดถอยแบบ semiparametric, การทำให้โมเดล ANOVA ของ spline เป็นไปอย่างราบรื่น, แบบจำลองการถดถอยเชิงโครงสร้างแบบมีโครงสร้าง, แบบจำลองโครงสร้างการเติมเชิงเส้นทั่วไปทั่วไป

นักวิจัยที่ได้รับการคัดเลือกเล็กน้อยในหัวข้อที่เกี่ยวกับ GAM ที่มีมุมการคำนวณคือ:

เรย์แคร์โรลมาเรียเดอร์บันพอล Eilers เทรเวอร์ Hastie ชองกู Sonja Greven โทมัส Kneib สเตฟานหรั่งไบรอันมาร์กซ์บ๊อบริกบีเดวิด Ruppert ฮาร์วาร์ด Rue เฟเบียน Scheipl มิกิส Stasinopoulus .

(และมีผู้คนจำนวนมากที่ทำงานเกี่ยวกับ GAMs ที่ได้รับการปรับปรุงทฤษฎีที่เกี่ยวข้องกับ GAM และวิธีการวิเคราะห์ข้อมูลการทำงานที่เกี่ยวข้องอย่างใกล้ชิด) เอกสารของฉันส่วนใหญ่เกี่ยวกับการพัฒนาวิธีการของ GAM ที่มีประสิทธิภาพและทั่วไปในการคำนวณ แต่นั่นไม่ใช่ทั้งหมดที่จะกล่าวในเรื่องนี้


3
ยินดีต้อนรับสู่ไซม่อนไซมอนและขอขอบคุณสำหรับการสนับสนุนของคุณ!
whuber

1

google scholar ให้ความนิยมอย่างมากนอกเหนือจากการอ้างอิงข้างต้นและในความคิดเห็นบางอย่างที่น่าสนใจก็คือ:

http://www.sciencedirect.com/science/article/pii/S0304380002002041 GAM ในการศึกษาการกระจายสายพันธุ์เผยแพร่ใน "การจำลองเชิงนิเวศน์"

http://aje.oxfordjournals.org/content/156/3/193.short การ ใช้ GAM's ในการศึกษาเกี่ยวกับมลพิษทางอากาศและสุขภาพ

แต่ OP ดูเหมือนว่าจะสนใจทฤษฎีทางสถิติมากกว่าดังนั้น:

http://www.sciencedirect.com/science/article/pii/S0167947398000334 นี่เป็นอัลกอริธึมที่เหมาะสมกว่า

http://onlinelibrary.wiley.com/doi/10.1111/1467-9876.00229/abstract การอนุมานแบบเบย์ตาม MArkov Random Field Priors

http://onlinelibrary.wiley.com/doi/10.1111/1467-9469.00333/abstract?deniedAccessCustomisedMessage=&userIsAuthenticated=false เกี่ยวกับวิธีการประมาณค่าใน GAM's ...

ทั้งหมดนี้มีผู้เขียนที่แตกต่างกันดังนั้นคำตอบสำหรับคำถามเดิมน่าจะเป็นจำนวนมาก


6
นอกจากนี้ฉันได้พบข้อได้เปรียบเล็ก ๆ น้อย ๆ ของ GAM ที่มีมากกว่าตัวแบบการถดถอยเชิงเส้นแบบเพิ่มพารามิเตอร์ซึ่งให้การทดสอบที่เป็นทางการและช่วงความเชื่อมั่นที่ง่ายกว่าและให้สูตรสำหรับการทำนาย
Frank Harrell
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.