เป็นเวลานานที่ฉันสงสัยเกี่ยวกับความเชื่อทั่วไปที่ดูเหมือนว่ามีความแตกต่างพื้นฐานบางอย่างในลักษณะพิเศษแบบคงที่และแบบสุ่มสำหรับโมเดลเอฟเฟกต์ผสม (โดยทั่วไปไม่เป็นเชิงเส้น) ความเชื่อนี้เป็นตัวอย่างที่ระบุโดยเบตส์ในการตอบสนองต่อไปนี้
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html
Bates ระบุไว้อย่างชัดเจนว่าเขาเชื่อว่ามีความแตกต่างพื้นฐานระหว่างเอฟเฟกต์แบบคงที่และแบบสุ่มเพื่อให้ไม่สามารถรวมกันได้ ฉันคิดว่าเขาผิดและฉันหวังว่าจะโน้มน้าวให้ผู้อ่านบางคนถึงมุมมองทางเลือก ฉันใช้วิธีการแบบประจำดังนั้นสิ่งที่ฉันต้องการทำคือการกำหนดแนวคิดของความน่าจะเป็นของโปรไฟล์สำหรับฟังก์ชันของเอฟเฟกต์ทั้งแบบคงที่และแบบสุ่ม เพื่อกระตุ้นการสนทนาสมมติว่าเรามีรูปแบบพารามิเตอร์สองตัวพร้อมพารามิเตอร์ x และ u (ไม่มีอะไรเกี่ยวกับเอฟเฟกต์แบบสุ่ม) ให้
เป็นฟังก์ชั่นความเป็นไปได้ที่เราจะไม่ใช้การอ้างอิงใด ๆ กับข้อมูล ให้เป็นฟังก์ชัน (nice) ใด ๆ ของ x และ u โปรไฟล์ความน่าจะเป็น
สำหรับฟังก์ชันถูกกำหนดโดยg ( x , u ) P g ( t ) gL(x,u)g(x,u)Pg(t)g
Pg(t)=maxx,u{L(x,u) | g(x,u)=t}\eqno(1)
ฉันเชื่อว่าจะไม่มีใครโต้แย้งกับสิ่งนี้ ทีนี้สมมติว่าเรามีการแจกแจงความน่าจะเป็นก่อนสำหรับคุณ จากนั้นฉันจะอ้างว่าโปรไฟล์ความน่าจะเป็นสำหรับยังคงสมเหตุสมผล แต่เราควรแก้ไข (1) โดยรวมถึงก่อนหน้านี้p(u)g
Pg(t)=maxx,u{L(x,u)p(u) | g(x,u)=t}\eqno(2)
โปรดทราบว่าเนื่องจากเป็นพารามิเตอร์ที่มี ก่อนหน้านี้มันเหมือนกับสิ่งที่เรียกว่าเอฟเฟกต์แบบสุ่ม ทำไมหลายคนถึงคิดว่าพารามิเตอร์เอฟเฟกต์แบบสุ่มแตกต่างกัน ความแตกต่างที่ฉันคิดว่ามาจากการปฏิบัติตามปกติของการประมาณค่าพารามิเตอร์สำหรับพวกเขา สิ่งที่สร้างเอฟเฟ็กต์แบบ `` แตกต่าง '' คือมีหลายอย่างในหลายรุ่น ดังนั้นเพื่อให้ได้การประมาณค่าที่มีประโยชน์สำหรับเอฟเฟกต์คงที่ (หรือพารามิเตอร์อื่น ๆ ) จึงจำเป็นต้องใช้เอฟเฟกต์แบบสุ่มด้วยวิธีอื่น สิ่งที่เราทำคือการรวมมันเข้ากับโมเดล ในโมเดลด้านบนเราจะสร้างความน่าจะเป็นโดยที่
ตอนนี้
uF(x)F(x)=∫L(x,u)p(u)du
uไปแล้ว ดังนั้นหากทุกสิ่งที่เรามีคือมันดูเหมือนว่าจะทำให้รู้สึกไม่ที่จะพูดคุยเกี่ยวกับความน่าจะเป็นรายละเอียดบางฟังก์ชั่นU)
F(x)g(x,u)
ดังนั้นเพื่อให้ได้ข้อมูลเกี่ยวกับฟังก์ชั่นเราไม่ควรบูรณาการมากกว่าพารามิเตอร์ยูแต่จะเกิดอะไรขึ้นในกรณีที่มีพารามิเตอร์เอฟเฟกต์แบบสุ่มจำนวนมาก จากนั้นฉันอ้างว่าเราควรรวมเข้ากับ `` ส่วนใหญ่ '' แต่ไม่ใช่ทั้งหมดในแง่ที่ฉันจะทำให้แม่นยำ เพื่อกระตุ้นการก่อสร้างให้มีผลกระทบสุ่ม
u_n) พิจารณากรณีพิเศษที่ฟังก์ชั่นเพียงขึ้นอยู่กับและในความเป็นจริงเป็น imagineable ฟังก์ชั่นที่ง่ายกรัมผสานรวมกับเอฟเฟกต์แบบสุ่มเพื่อรับ
g(x,u)unu=(u1,u2,...,un−1,un)g(x,u)ung(x,u)=unu1,u2,...,un−1
F(x,un)=∫L(x,u1,...,un)p(u1,...,un))du1du2...dun−1\eqno(4)
เหมือนเดิม เราสามารถสร้างโปรไฟล์ความน่าจะเป็น
วิธีการพูดคุยเพื่อที่จะทำให้ความรู้สึกสำหรับฟังก์ชั่นโดยพลU) โปรดสังเกตว่าคำจำกัดความของใน
เหมือนกับ
เพื่อดูบันทึกนี้ว่าสำหรับกรณีธรรมดา ,
เหมือนกับ
Pg(t)=maxx,un{F(x,un)|un=t}\eqno(3)
(3)g(x,u)F(x,un)(4)F(x,s)=limϵ→01ϵ∫{(x,un)|s−ϵ/2<g(x,un)<s+ϵ/2}L(x,u1,...,un)p(u1,...,un))du1du2...dun\eqno(5)
g(x,u)=un(5)F(x,s)=limϵ→01ϵ∫{(x,un)|s−ϵ/2<un<s+ϵ/2}F(x,un)dun\eqno(6)
สำหรับฟังก์ชั่นทั่วไป เราสร้างฟังก์ชัน
กำหนดโดยและคำนวณความน่าจะเป็นของโปรไฟล์
g(x,u)F(x,s)(5)
Pg(s)=maxx,u{F(x,s)|g(x,u)=s}\eqno(3)
ความเป็นไปได้ของโปรไฟล์นี้เป็นแนวคิดที่กำหนดไว้อย่างดีและมีความเป็นส่วนตัว อย่างไรก็ตามเพื่อให้มีประโยชน์ในทางปฏิบัติเราจำเป็นต้องคำนวณค่าของมันอย่างน้อยประมาณ ฉันเชื่อว่าสำหรับหลาย ๆ รุ่นฟังก์ชั่นสามารถประมาณได้ดีพอโดยใช้ตัวแปรของ Laplace Approxation กำหนดโดย
Let H เป็นกระสอบของบันทึกของฟังก์ชั่นที่ที่เกี่ยวกับพารามิเตอร์และUF(x,s)x^(s),u^(s)
x^(s),u^(s)=maxx,u{L(x,u)p(u) | g(x,u)=s}
−L(x,u)p(u)xu
ชุดระดับของมี submanifolds มิติของมิติที่มีถาวรผลกระทบและผลกระทบแบบสุ่ม เราจำเป็นต้องรวม form
เหนือช่องนี้ซึ่งทั้งหมดจะถูกทำให้เป็นเส้นตรงที่
เรื่องนี้เกี่ยวข้องกับเรขาคณิตเชิงอนุพันธ์เบื้องต้น สมมติว่า
โดย reparameterizing เราสามารถ assum ที่และ 0 จากนั้นพิจารณาแผนที่
gm+n−1n+mmnndu1∧du2∧…∧dunx^(s),u^(s)gxn(x^(s),u^(s))≠0x^(s)=0u^(s)=0
(x1,x2,…,xm−1,u1,u2,…,un)→(x1,x2,…,xm−1,−∑m−1i=1gxixi−∑ni=1guiuigxm,u1,u2,…,un)
โดยที่ใช้ แสดงถึงผลสืบเนื่องบางส่วนของเทียบกับ
ประเมินที่จุดสูงสุด นี่คือแผนที่เชิงเส้นของมิติบนพื้นที่สัมผัสของชุดระดับของกรัมเราสามารถใช้มันเพื่อคำนวณอินทิกรัลที่ต้องการ ขั้นแรกการดึงกลับของ 1 รูปแบบเป็นเพียงตัวเอง
gxigxim+n−1gdui
การดึงกลับของ Hessian เป็นรูปแบบสมการกำลังสอง
Ti,j=Hi+m,j+m+guigujgxm2Hm,m\rm for 1<=i,j<=n
ดังนั้นอินทิกรัลสามารถคำนวณ (หรือประมาณ) ผ่านการประมาณ Laplace ซึ่งเป็นสูตรปกติที่เกี่ยวข้องกับลอการิทึมของดีเทอร์มีแนนต์ของซึ่งคำนวณจากการสลายตัวของ Cholesky มูลค่าของ Laplace ที่ประมาณของอินทิกรัลคือ
โดยที่เป็นตัวกำหนด เรายังต้องจัดการกับความกว้างของชุดระดับของเป็น
ในการสั่งซื้อครั้งแรกนี้มีค่า
โดยที่เป็นเวกเตอร์ของอนุพันธ์ย่อยของ
T
L(x^(s),u^(s))|−T|12
|⋅|gϵ→0ϵ/∥∇g(x^(s),u^(s))∥∇g(x^(s),u^(s)))g (gx1,gx2,…,gxm,gu1,gu2,…,gun)
เพื่อให้ค่าความน่าจะเป็นในการตั้งค่าระดับของจะได้รับ โดย
นี่คือการประมาณที่ถูกต้องที่จะใช้สำหรับการคำนวณความน่าจะเป็นของโปรไฟล์
gL(x^(s),u^(s))|−T|12∥∇g(x^(s),u^(s))∥