ทางเลือกหนึ่งคือการใช้ตัวแปร HMC ที่มีข้อ จำกัด ดังที่อธิบายไว้ในวิธีการ MCMC ตระกูลใน Manifold ที่กำหนดโดยปริยายโดย Brubaker et al (1) นี้ต้องว่าเราสามารถแสดงเงื่อนไขที่ว่าประมาณการโอกาสสูงสุดของพารามิเตอร์สถานที่เท่ากับบางส่วนคงที่เป็นบางส่วนที่กำหนดไว้โดยปริยาย (และอนุพันธ์) holonomic จำกัด0 จากนั้นเราสามารถจำลองพลวัตของแฮมิลตันแบบ จำกัด ภายใต้ข้อ จำกัด นี้และยอมรับ / ปฏิเสธภายในขั้นตอน Metropolis-Hastings เช่นเดียวกับใน HMC มาตรฐาน c ( { x i } N i = 1 ) = 0μ0c({xi}Ni=1)=0
ความน่าจะเป็นบันทึกเชิงลบคือ
ซึ่งมีอันดับที่หนึ่งและสองลำดับอนุพันธ์ที่เกี่ยวกับ พารามิเตอร์ตำแหน่ง
การประมาณค่าความน่าจะเป็นสูงสุดของจะถูกกำหนดโดยปริยายว่าเป็นทางออก
μ∂L
L=−∑i=1N[logf(xi|μ)]=3∑i=1N[log(1+(xi−μ)25)]+constant
μ
μ0c=N∑i=1[2(μ0-xi)∂L∂μ=3∑i=1N[2(μ−xi)5+(μ−xi)2]and∂2L∂μ2=6∑i=1N[5−(μ−xi)2(5+(μ−xi)2)2].
μ0c = ∑i = 1ยังไม่มีข้อความ[ 2 ( μ0- xผม)5 + ( μ0- xผม)2] =0ภายใต้Σi = 1ยังไม่มีข้อความ[ 5 - ( μ0- xผม)2( 5 + ( μ0- xผม)2)2] >0
ฉันไม่แน่ใจว่ามีผลลัพธ์ใด ๆ ที่แนะนำว่าจะมี MLE เฉพาะสำหรับสำหรับ - ความหนาแน่นไม่ได้เป็น log-concave ในดังนั้นจึงดูเหมือนไม่ รับประกันเรื่องนี้เล็กน้อย ถ้ามีวิธีแก้ปัญหาที่ไม่เหมือนใครข้างต้นโดยปริยายกำหนดเชื่อมต่อมิติที่ฝังอยู่ในสอดคล้องกับชุดด้วย MLE สำหรับเท่ากับ ถึง{ x ฉัน} N ฉัน= 1 μ N - 1 R N { x ฉัน} N ฉัน= 1 μ μ 0μ{ xผม}ยังไม่มีข้อความi = 1μยังไม่มีข้อความ- 1Rยังไม่มีข้อความ{ xผม}ยังไม่มีข้อความi = 1μμ0. หากมีการแก้ปัญหาหลายอย่างนานาก็อาจประกอบด้วยองค์ประกอบที่ไม่ได้เชื่อมต่อหลายอย่างซึ่งบางส่วนอาจสอดคล้องกับขั้นต่ำในฟังก์ชั่นโอกาส ในกรณีนี้เราจะต้องมีกลไกเพิ่มเติมบางอย่างสำหรับการเคลื่อนย้ายระหว่างส่วนประกอบที่ไม่ได้เชื่อมต่อ (โดยทั่วไปแล้วการจำลองแบบไดนามิกจะยังคงอยู่ในองค์ประกอบเดียว) และตรวจสอบเงื่อนไขลำดับที่สองและปฏิเสธการย้ายหากสอดคล้องกับการย้าย a minima ในโอกาส
ถ้าเราใช้เพื่อแสดงเวกเตอร์และแนะนำสถานะโมเมนตัมคอนจูเกตพร้อมเมทริกซ์จำนวนมากและ Lagrange ตัวคูณสำหรับเซนต์คิตส์และเนวิสจากนั้นก็แก้ปัญหาระบบ ODEs
[ x 1 … x N ] T p M λ c ( x ) d xx[ x1… xยังไม่มีข้อความ]TพีMλc ( x )
วันที่ xd T= M- 1P ,dพีd T= - ∂L∂x- λ ∂ค∂xภายใต้c ( x ) = 0และ∂ค∂xM- 1p = 0
รับสภาพเริ่มต้นกับและ , กำหนดข้อ จำกัด ของแฮมิลโตเนียนไดนามิกซึ่งยังคง จำกัด อยู่ที่ท่อร่วมเป็นเวลาย้อนกลับและอนุรักษ์มิลโตเนียนและองค์ประกอบปริมาณมากมาย ถ้าเราใช้ผู้ออกแบบและติด symplectic สำหรับข้อ จำกัด ระบบมิลเช่น SHAKE (2) หรือสั่น (3) ซึ่งตรงรักษาข้อ จำกัด ในแต่ละ timestep โดยการแก้สำหรับตัวคูณ Lagrange เราสามารถจำลองแบบไดนามิกที่แน่นอนไปข้างหน้าเนื่อง timesteps
c ( x 0 ) = 0 ∂ cx(0)=x0, p(0)=p0c(x0)=0∂c∂x∣∣x0M−1p0=0Lδtจากข้อ จำกัด เบื้องต้นที่น่าพอใจและยอมรับสถานะใหม่ที่เสนอคู่ด้วยความน่าจะเป็น
ถ้าเราสอดแทรกการเปลี่ยนแปลงพลวัตเหล่านี้ด้วยการ resampling บางส่วน / เต็มโมเมนต์จาก Gaussian marginal ของพวกเขา (จำกัด อยู่ที่ subspace เชิงเส้นที่กำหนดโดย
x,px′,p′min{1,exp[L(x)−L(x′)+12pTM−1p−12p′TM−1p′]}.
∂c∂xM−1p=0) จากนั้น modulo ความเป็นไปได้ของการมีส่วนประกอบหลายอย่างที่ไม่เชื่อมต่อกันข้อ จำกัด MCMC แบบไดนามิกโดยรวมควรเป็นอัตลักษณ์และสถานะตัวอย่างของการกำหนดค่าจะครอบคลุมในการกระจายความหนาแน่นเป้าหมายที่ จำกัด
x
หากต้องการดูว่า HMC มีข้อ จำกัด ในการดำเนินการอย่างไรในกรณีนี้ฉันได้ดำเนินการติดตั้ง HMC ตามข้อ จำกัด ของ geodesic integrator ตามที่อธิบายไว้ใน (4) และที่ Github ที่นี่ (การเปิดเผยอย่างสมบูรณ์: ฉันเป็นผู้เขียน (4) และเจ้าของพื้นที่เก็บข้อมูล Github) ใช้ชุดรูปแบบของตัวรวม 'geodesic-BAOAB' ที่เสนอใน (5) โดยไม่มีขั้นตอน Stnastic Ornstein-Uhlenbeck จากประสบการณ์ของฉันแบบแผนการรวมตัวทางธรณีวิทยานี้มักจะปรับได้ง่ายกว่าแบบแผน RATTLE ที่ใช้ใน (1) เนื่องจากความยืดหยุ่นเป็นพิเศษในการใช้ขั้นตอนภายในที่เล็กกว่าหลายครั้งสำหรับการเคลื่อนไหวทางธรณีวิทยาบนข้อ จำกัด มากมาย โน๊ตบุ๊ค IPython สร้างผลลัพธ์ที่มีอยู่ที่นี่
ผมใช้ ,และ 2 เบื้องต้นสอดคล้องกับ MLE ของถูกค้นพบโดยวิธีการของนิวตัน (ด้วยการตรวจสอบลำดับที่สองเพื่อให้แน่ใจว่าได้พบสูงสุดของโอกาส) ฉันรันข้อ จำกัด แบบไดนามิกด้วย , interleaved พร้อมรีเฟรชโมเมนตัมเต็มรูปแบบสำหรับการอัปเดต 1,000 ครั้ง เนื้อเรื่องด้านล่างแสดงร่องรอยที่เกิดขึ้นบนส่วนประกอบสามตัวN=3μ=1μ0=2xμ0δt=0.5L=5x
และค่าที่สอดคล้องกันของอนุพันธ์ลำดับที่หนึ่งและสองของความน่าจะเป็นบันทึกเชิงลบแสดงอยู่ด้านล่าง
จากที่ที่มันจะเห็นได้ว่าเราอยู่ที่สูงสุดของการเข้าสู่ระบบสำหรับทุกโอกาสชิม{x} แม้ว่ามันจะไม่ปรากฏชัดเจนจากแต่ละแปลงแผนการตัวอย่างอยู่บนสองมิติที่ไม่ใช่เชิงเส้นที่ฝังอยู่ใน - ภาพเคลื่อนไหวด้านล่างแสดงตัวอย่างในแบบ 3 มิติxxR3
ขึ้นอยู่กับการตีความของข้อ จำกัด นั้นอาจจำเป็นต้องปรับความหนาแน่นของเป้าหมายโดยปัจจัยจาโคเบียนบางอย่างตามที่อธิบายไว้ใน (4) โดยเฉพาะอย่างยิ่งถ้าเราต้องการผลลัพธ์ที่สอดคล้องกับขีด จำกัด ของการใช้ ABC เช่นวิธีการประมาณการรักษาข้อ จำกัด โดยนำเสนอการเคลื่อนไหวที่ไม่มีข้อ จำกัด ในและยอมรับถ้าจากนั้นเราจะต้องเพิ่มความหนาแน่นของเป้าหมายโดย{x}}} ในตัวอย่างข้างต้นฉันไม่ได้รวมการปรับนี้ดังนั้นตัวอย่างมาจากความหนาแน่นของเป้าหมายดั้งเดิมที่ จำกัด ไว้ที่ข้อ จำกัดϵ→0RN|c(x)|<ϵ∂c∂xT∂c∂x−−−−−−√
อ้างอิง
MA Brubaker, M. Salzmann และ R. Urtasun ตระกูลของวิธีการ MCMC บน manifolds ที่กำหนดโดยปริยาย ในการประชุมนานาชาติครั้งที่ 15 เรื่องปัญญาประดิษฐ์และสถิติ , 2012
http://www.cs.toronto.edu/~mbrubake/projects/AISTATS12.pdf
J.-P. Ryckaert, G. Ciccotti และ HJ Berendsen การรวมเชิงตัวเลขของสมการคาร์ทีเซียนของการเคลื่อนที่ของระบบที่มีข้อ จำกัด : การเปลี่ยนแปลงระดับโมเลกุลของ n-alkanes วารสารฟิสิกส์เชิงคำนวณ , 1977.
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.399.6868
HC Andersen RATTLE: อัลกอริทึม SHAKE รุ่น "ความเร็ว" สำหรับการคำนวณเชิงโมเลกุล วารสารฟิสิกส์เชิงคำนวณ , 2526
http://www.sciencedirect.com/science/article/pii/0021999183900141
MM Graham และ AJ Storkey การอนุมานที่แน่นอนแบบเชิงเส้นตรงในโมเดลที่ไม่มีความน่าจะเป็น arXiv pre-print arXiv: 1605.07826v3 , 2016.
https://arxiv.org/abs/1605.07826
B. Leimkuhler และ C. Matthews พลวัตของโมเลกุลที่มีประสิทธิภาพโดยใช้การผสมผสานทางภูมิศาสตร์และการแยกตัวทำละลายและตัวทำละลาย พร ร. ก. ฉบับที่ 472 ฉบับที่ 2189. สมาคมแห่งราชอาณาจักรปี 2559
http://rspa.royalsocietypublishing.org/content/472/2189/20160138.abstract