ปัญหาที่น่ากลัวอีกประการหนึ่งในสถิติ คำถามนั้นเก่า แต่ตัวอย่างเบื้องต้นก็ยากที่จะเข้าใจ ดังนั้นให้ฉันลดความซับซ้อนของสองตัวอย่างที่ดีเยี่ยมในกรณีที่มีคนติดตามมาร์คอฟเดินอย่างเด็ดขาดใน PageRankที่ MCMC เต็มไปด้วยความคาดหวังและเต็มไปด้วยความคาดหวังเพื่อง่ายต่อการตอบ มีโอกาสมากแค่ไหน? นั่นอาจเป็นคำถามติดตาม
FIRST EXAMPLE:
ยังไม่มีข้อความ( 0 , 1 )
ปัญหาคือในการตระหนักถึงว่าหลังจากที่จะผ่านทุกขั้นตอนกลที่มีเป็นเพียงหนึ่งในเคล็ดลับที่มีมนต์ขลัง: การตัดสินใจไบนารีของการยอมรับหรือปฏิเสธค่าที่เสนอ
xmean
0sd
1rnorm(10000)
ที่จะง่ายเกินไปเพียงแค่บางสิ่งบางอย่างทำงานตามสายของ
eps
εxผมxผม+ 1runif(1, - eps, eps)
xผม
ทุกค่าที่เสนอจะแตกต่างจากค่าก่อนในแบบสุ่มและภายในขอบเขตของ [- eps,+ eps]
ทุกค่าที่เสนอจึงจะแตกต่างจากมูลค่าก่อนในแฟชั่นแบบสุ่มและภายในขอบเขตของ
ผมฉัน+1
ยังไม่มีข้อความ( 0 , 1 )xฉัน+ 1xผม
min(1, dnorm(candidate_value)/dnorm(x))
1ยังไม่มีข้อความ( 0 , 1 ) พี dฉxฉัน+ 1xผมmin(1, ...)
dnorm
ที่สูงกว่าอัตราต่อรองของมันได้รับการยอมรับ
min(1, dnorm(candidate_value)/dnorm(x))
runif(1)
01(ใกล้ที่สุดเท่าที่จะได้รับการโยนเหรียญสำหรับค่าอย่างต่อเนื่อง) เรายอมรับและปฏิบัติในx[i+1]
การเข้ามาของห่วงโซ่ที่มีค่าที่เสนอ ; มิฉะนั้นเราเติมเต็มด้วยซ้ำที่ค่าก่อนหน้า , x[i]
... ความคิดที่จะเป็นดีกว่าสองของเดียวกันมากกว่าหนึ่งที่อยู่ห่างไกลเกินไปในหาง
เราทำเช่นนี้หลายพันครั้งและเรารวบรวมค่าทั้งหมดเหล่านี้ (เฉพาะค่าที่ยอมรับและซ้ำ ๆ ) และเมื่อเราพล็อตฮิสโตแกรมเราจะได้เส้นโค้งปกติที่มีค่าsd
ใกล้เคียงกับ1และมีศูนย์กลางที่ 0.
จุดสุดท้ายเพียงจุดเดียว: เราจะเริ่มจากตรงไหน? อาจไม่เกี่ยวข้องกัน แต่ในการจำลองเรากรอกค่าแรกเป็น0, x = 0; vec[1] = x
ก่อนที่จะวนลูปผ่านส่วนที่เหลือทั้งหมดของการทำซ้ำและปล่อยให้กระบวนการเป็นไปตามหลักสูตรของ
SECOND EXAMPLE:
นี้เป็นที่น่าตื่นเต้นมากขึ้นและทำให้การอ้างอิงถึงการประมาณค่าพารามิเตอร์ของเส้นโค้งการถดถอยเชิงเส้นโดยการคำนวณโอกาสเกิดบันทึกสำหรับพารามิเตอร์สุ่มรับชุดข้อมูล อย่างไรก็ตามการอธิบายของบรรทัดรหัสถูกสร้างขึ้นในการจำลองแบบย่อที่บันทึกไว้ที่นี่โดยทำตามขั้นตอนที่คล้ายกันมากกับตัวอย่างแรก