การสุ่มตัวอย่างตัวอย่างด้วย MLE ที่กำหนด


17

คำถามนี้รอการตรวจสอบถามเกี่ยวกับการเลียนแบบตามเงื่อนไขที่กลุ่มตัวอย่างที่มีผลรวมคงที่ทำให้ผมนึกถึงชุดปัญหาให้ฉันโดยจอร์จ Casella

f(x|θ)(X1,,Xn)θ

θ^(x1,,xn)=argmini=1nlogf(xi|θ)
θ θ (X1,...,Xn)(X1,,Xn)θ^(X1,,Xn)

ตัวอย่างเช่นใช้การแจกแจงด้วยพารามิเตอร์ตำแหน่งซึ่งความหนาแน่นคือถ้าเราจะจำลองเงื่อนไข(X_1, \ ldots, X_n)บน\ hat {\ mu} (X_1, \ ldots, X_n) = \ mu_0 ได้อย่างไร? ในตัวอย่าง\ mathfrak {T} _5นี้การกระจายของ\ hat {\ mu} (X_1, \ ldots, X_n)ไม่มีนิพจน์แบบปิดT5μ (X1,...,Xn) IID ~ F(x|μ)(X1,...,Xn) μ (X1,...,Xn)=μ0 T 5 μ (X1

(x|μ)=Γ(3)Γ(1/2)Γ(5/2)[1+(x-μ)2/5]-3
(X1,...,Xn)~IID(x|μ)
(X1,...,Xn)μ^(X1,...,Xn)=μ0T5μ^(X1,...,Xn)

คำตอบ:


20

ทางเลือกหนึ่งคือการใช้ตัวแปร HMC ที่มีข้อ จำกัด ดังที่อธิบายไว้ในวิธีการ MCMC ตระกูลใน Manifold ที่กำหนดโดยปริยายโดย Brubaker et al (1) นี้ต้องว่าเราสามารถแสดงเงื่อนไขที่ว่าประมาณการโอกาสสูงสุดของพารามิเตอร์สถานที่เท่ากับบางส่วนคงที่เป็นบางส่วนที่กำหนดไว้โดยปริยาย (และอนุพันธ์) holonomic จำกัด0 จากนั้นเราสามารถจำลองพลวัตของแฮมิลตันแบบ จำกัด ภายใต้ข้อ จำกัด นี้และยอมรับ / ปฏิเสธภายในขั้นตอน Metropolis-Hastings เช่นเดียวกับใน HMC มาตรฐาน c ( { x i } N i = 1 ) = 0μ0c({xi}i=1N)=0

ความน่าจะเป็นบันทึกเชิงลบคือ ซึ่งมีอันดับที่หนึ่งและสองลำดับอนุพันธ์ที่เกี่ยวกับ พารามิเตอร์ตำแหน่ง การประมาณค่าความน่าจะเป็นสูงสุดของจะถูกกำหนดโดยปริยายว่าเป็นทางออก μL

L=i=1N[logf(xi|μ)]=3i=1N[log(1+(xiμ)25)]+constant
μ μ0c=Ni=1[2(μ0-xi)
Lμ=3i=1N[2(μxi)5+(μxi)2]และ2Lμ2=6Σผม=1ยังไม่มีข้อความ[5-(μ-xผม)2(5+(μ-xผม)2)2].
μ0
=Σผม=1ยังไม่มีข้อความ[2(μ0-xผม)5+(μ0-xผม)2]=0ภายใต้Σผม=1ยังไม่มีข้อความ[5-(μ0-xผม)2(5+(μ0-xผม)2)2]>0

ฉันไม่แน่ใจว่ามีผลลัพธ์ใด ๆ ที่แนะนำว่าจะมี MLE เฉพาะสำหรับสำหรับ - ความหนาแน่นไม่ได้เป็น log-concave ในดังนั้นจึงดูเหมือนไม่ รับประกันเรื่องนี้เล็กน้อย ถ้ามีวิธีแก้ปัญหาที่ไม่เหมือนใครข้างต้นโดยปริยายกำหนดเชื่อมต่อมิติที่ฝังอยู่ในสอดคล้องกับชุดด้วย MLE สำหรับเท่ากับ ถึง{ x ฉัน} N ฉัน= 1 μ N - 1 R N { x ฉัน} N ฉัน= 1 μ μ 0μ{xผม}ผม=1ยังไม่มีข้อความμยังไม่มีข้อความ-1Rยังไม่มีข้อความ{xผม}ผม=1ยังไม่มีข้อความμμ0. หากมีการแก้ปัญหาหลายอย่างนานาก็อาจประกอบด้วยองค์ประกอบที่ไม่ได้เชื่อมต่อหลายอย่างซึ่งบางส่วนอาจสอดคล้องกับขั้นต่ำในฟังก์ชั่นโอกาส ในกรณีนี้เราจะต้องมีกลไกเพิ่มเติมบางอย่างสำหรับการเคลื่อนย้ายระหว่างส่วนประกอบที่ไม่ได้เชื่อมต่อ (โดยทั่วไปแล้วการจำลองแบบไดนามิกจะยังคงอยู่ในองค์ประกอบเดียว) และตรวจสอบเงื่อนไขลำดับที่สองและปฏิเสธการย้ายหากสอดคล้องกับการย้าย a minima ในโอกาส

ถ้าเราใช้เพื่อแสดงเวกเตอร์และแนะนำสถานะโมเมนตัมคอนจูเกตพร้อมเมทริกซ์จำนวนมากและ Lagrange ตัวคูณสำหรับเซนต์คิตส์และเนวิสจากนั้นก็แก้ปัญหาระบบ ODEs [ x 1x N ] T p M λ c ( x ) d xx[x1...xยังไม่มีข้อความ]TพีMλ(x)

dxdเสื้อ=M-1พี,dพีdเสื้อ=-Lx-λxภายใต้(x)=0และxM-1พี=0
รับสภาพเริ่มต้นกับและ , กำหนดข้อ จำกัด ของแฮมิลโตเนียนไดนามิกซึ่งยังคง จำกัด อยู่ที่ท่อร่วมเป็นเวลาย้อนกลับและอนุรักษ์มิลโตเนียนและองค์ประกอบปริมาณมากมาย ถ้าเราใช้ผู้ออกแบบและติด symplectic สำหรับข้อ จำกัด ระบบมิลเช่น SHAKE (2) หรือสั่น (3) ซึ่งตรงรักษาข้อ จำกัด ในแต่ละ timestep โดยการแก้สำหรับตัวคูณ Lagrange เราสามารถจำลองแบบไดนามิกที่แน่นอนไปข้างหน้าเนื่อง timesteps c ( x 0 ) = 0 cx(0)=x0, p(0)=p0c(x0)=0cx|x0M1p0=0Lδtจากข้อ จำกัด เบื้องต้นที่น่าพอใจและยอมรับสถานะใหม่ที่เสนอคู่ด้วยความน่าจะเป็น ถ้าเราสอดแทรกการเปลี่ยนแปลงพลวัตเหล่านี้ด้วยการ resampling บางส่วน / เต็มโมเมนต์จาก Gaussian marginal ของพวกเขา (จำกัด อยู่ที่ subspace เชิงเส้นที่กำหนดโดยx,px,p
min{1,exp[L(x)L(x)+12pTM1p12pTM1p]}.
cxM1p=0) จากนั้น modulo ความเป็นไปได้ของการมีส่วนประกอบหลายอย่างที่ไม่เชื่อมต่อกันข้อ จำกัด MCMC แบบไดนามิกโดยรวมควรเป็นอัตลักษณ์และสถานะตัวอย่างของการกำหนดค่าจะครอบคลุมในการกระจายความหนาแน่นเป้าหมายที่ จำกัดx

หากต้องการดูว่า HMC มีข้อ จำกัด ในการดำเนินการอย่างไรในกรณีนี้ฉันได้ดำเนินการติดตั้ง HMC ตามข้อ จำกัด ของ geodesic integrator ตามที่อธิบายไว้ใน (4) และที่ Github ที่นี่ (การเปิดเผยอย่างสมบูรณ์: ฉันเป็นผู้เขียน (4) และเจ้าของพื้นที่เก็บข้อมูล Github) ใช้ชุดรูปแบบของตัวรวม 'geodesic-BAOAB' ที่เสนอใน (5) โดยไม่มีขั้นตอน Stnastic Ornstein-Uhlenbeck จากประสบการณ์ของฉันแบบแผนการรวมตัวทางธรณีวิทยานี้มักจะปรับได้ง่ายกว่าแบบแผน RATTLE ที่ใช้ใน (1) เนื่องจากความยืดหยุ่นเป็นพิเศษในการใช้ขั้นตอนภายในที่เล็กกว่าหลายครั้งสำหรับการเคลื่อนไหวทางธรณีวิทยาบนข้อ จำกัด มากมาย โน๊ตบุ๊ค IPython สร้างผลลัพธ์ที่มีอยู่ที่นี่

ผมใช้ ,และ 2 เบื้องต้นสอดคล้องกับ MLE ของถูกค้นพบโดยวิธีการของนิวตัน (ด้วยการตรวจสอบลำดับที่สองเพื่อให้แน่ใจว่าได้พบสูงสุดของโอกาส) ฉันรันข้อ จำกัด แบบไดนามิกด้วย , interleaved พร้อมรีเฟรชโมเมนตัมเต็มรูปแบบสำหรับการอัปเดต 1,000 ครั้ง เนื้อเรื่องด้านล่างแสดงร่องรอยที่เกิดขึ้นบนส่วนประกอบสามตัวN=3μ=1μ0=2xμ0δt=0.5L=5x

ติดตามแปลงสำหรับตัวอย่าง 3 มิติ

และค่าที่สอดคล้องกันของอนุพันธ์ลำดับที่หนึ่งและสองของความน่าจะเป็นบันทึกเชิงลบแสดงอยู่ด้านล่าง

บันทึกการติดตามอนุพันธ์โอกาสบันทึก

จากที่ที่มันจะเห็นได้ว่าเราอยู่ที่สูงสุดของการเข้าสู่ระบบสำหรับทุกโอกาสชิม{x} แม้ว่ามันจะไม่ปรากฏชัดเจนจากแต่ละแปลงแผนการตัวอย่างอยู่บนสองมิติที่ไม่ใช่เชิงเส้นที่ฝังอยู่ใน - ภาพเคลื่อนไหวด้านล่างแสดงตัวอย่างในแบบ 3 มิติxxR3

การสร้างภาพสามมิติของตัวอย่างถูก จำกัด อยู่ที่ท่อร่วมไอดี 2D

ขึ้นอยู่กับการตีความของข้อ จำกัด นั้นอาจจำเป็นต้องปรับความหนาแน่นของเป้าหมายโดยปัจจัยจาโคเบียนบางอย่างตามที่อธิบายไว้ใน (4) โดยเฉพาะอย่างยิ่งถ้าเราต้องการผลลัพธ์ที่สอดคล้องกับขีด จำกัด ของการใช้ ABC เช่นวิธีการประมาณการรักษาข้อ จำกัด โดยนำเสนอการเคลื่อนไหวที่ไม่มีข้อ จำกัด ในและยอมรับถ้าจากนั้นเราจะต้องเพิ่มความหนาแน่นของเป้าหมายโดย{x}}} ในตัวอย่างข้างต้นฉันไม่ได้รวมการปรับนี้ดังนั้นตัวอย่างมาจากความหนาแน่นของเป้าหมายดั้งเดิมที่ จำกัด ไว้ที่ข้อ จำกัดϵ0RN|c(x)|<ϵcxTcx

อ้างอิง

  1. MA Brubaker, M. Salzmann และ R. Urtasun ตระกูลของวิธีการ MCMC บน manifolds ที่กำหนดโดยปริยาย ในการประชุมนานาชาติครั้งที่ 15 เรื่องปัญญาประดิษฐ์และสถิติ , 2012
    http://www.cs.toronto.edu/~mbrubake/projects/AISTATS12.pdf

  2. J.-P. Ryckaert, G. Ciccotti และ HJ Berendsen การรวมเชิงตัวเลขของสมการคาร์ทีเซียนของการเคลื่อนที่ของระบบที่มีข้อ จำกัด : การเปลี่ยนแปลงระดับโมเลกุลของ n-alkanes วารสารฟิสิกส์เชิงคำนวณ , 1977.
    http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.399.6868

  3. HC Andersen RATTLE: อัลกอริทึม SHAKE รุ่น "ความเร็ว" สำหรับการคำนวณเชิงโมเลกุล วารสารฟิสิกส์เชิงคำนวณ , 2526
    http://www.sciencedirect.com/science/article/pii/0021999183900141

  4. MM Graham และ AJ Storkey การอนุมานที่แน่นอนแบบเชิงเส้นตรงในโมเดลที่ไม่มีความน่าจะเป็น arXiv pre-print arXiv: 1605.07826v3 , 2016.
    https://arxiv.org/abs/1605.07826

  5. B. Leimkuhler และ C. Matthews พลวัตของโมเลกุลที่มีประสิทธิภาพโดยใช้การผสมผสานทางภูมิศาสตร์และการแยกตัวทำละลายและตัวทำละลาย พร ร. ก. ฉบับที่ 472 ฉบับที่ 2189. สมาคมแห่งราชอาณาจักรปี 2559
    http://rspa.royalsocietypublishing.org/content/472/2189/20160138.abstract


3
สดใสและเปิดมุมมองใหม่และสดใส! ขอขอบคุณ.
ซีอาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.