คำถามติดแท็ก monte-carlo

การใช้ (pseudo-) ตัวเลขสุ่มและกฎของตัวเลขขนาดใหญ่เพื่อจำลองพฤติกรรมการสุ่มของระบบจริง

2
เราจะทำแบบทดสอบสมมติฐาน MCMC กับแบบจำลองการถดถอยแบบผสมเอฟเฟกต์ด้วยความชันแบบสุ่มได้อย่างไร
ไลบรารี่ languageR จัดเตรียมวิธีการ (pvals.fnc) เพื่อทำการทดสอบ MCMC อย่างมีนัยสำคัญของเอฟเฟกต์คงที่ในรูปแบบการถดถอยเอฟเฟกต์เอฟเฟกต์แบบพอดีโดยใช้ lmer อย่างไรก็ตาม pvals.fnc ให้ข้อผิดพลาดเมื่อโมเดล lmer มีความลาดชันแบบสุ่ม มีวิธีการทำแบบทดสอบสมมติฐาน MCMC ของแบบจำลองดังกล่าวหรือไม่? ถ้าเป็นเช่นนั้นได้อย่างไร (หากได้รับคำตอบคำตอบควรมีตัวอย่างการทำงานใน R) ถ้าไม่มีเหตุผลทางความคิด / การคำนวณว่าทำไมไม่มีทาง? คำถามนี้อาจเกี่ยวข้องกับคำถามนี้แต่ฉันไม่เข้าใจเนื้อหาที่นั่นเพียงพอที่จะแน่ใจ แก้ไข 1 : หลักฐานของแนวคิดที่แสดงว่า pvals.fnc () ยังคงทำ 'บางสิ่งบางอย่าง' กับโมเดล lme4 แต่มันไม่ได้ทำอะไรกับแบบจำลองความชันแบบสุ่ม library(lme4) library(languageR) #the example from pvals.fnc data(primingHeid) # remove extreme outliers primingHeid = primingHeid[primingHeid$RT < 7.1,] …

2
ตัวประมาณค่าเป็นกลางของเลขชี้กำลังของการวัดชุด?
สมมติว่าเรามี (ที่วัดได้และเหมาะสมมีความประพฤติดี) ชุดที่มีขนาดกะทัดรัด นอกจากนี้สมมติว่าเราสามารถวาดตัวอย่างจากการกระจายชุดมากกว่า wrt เกอวัดและที่เรารู้ว่าวัด(B) เช่นบางทีBเป็นกล่อง[ - C , C ] nมีSS⊆B⊂RnS⊆B⊂RnS\subseteq B\subset\mathbb R^nBBBBBBλ(⋅)λ(⋅)\lambda(\cdot)λ(B)λ(B)\lambda(B)BBB[−c,c]n[−c,c]n[-c,c]^nSSS สำหรับการแก้ไขα∈Rα∈R\alpha\in\mathbb Rจะมีวิธีการที่เป็นกลางที่เรียบง่ายในการประมาณการe−αλ(S)e−αλ(S)e^{-\alpha \lambda(S)}โดยสม่ำเสมอสุ่มตัวอย่างในจุดBBBและการตรวจสอบหากพวกเขาเป็นภายในหรือภายนอกของSSS ? เป็นตัวอย่างของบางสิ่งบางอย่างที่ไม่ได้ทำงานค่อนข้างสมมติว่าเราตัวอย่างkkkจุดp1,…,pk∼Uniform(B)p1,…,pk∼Uniform(B)p_1,\ldots,p_k\sim\textrm{Uniform}(B) ) แล้วเราสามารถใช้การประมาณการ Monte Carlo λ(S)≈λ^:=#{pi∈S}kλ(B).λ(S)≈λ^:=#{pi∈S}kλ(B).\lambda(S)\approx \hat\lambda:= \frac{\#\{p_i\in S\}}{k}\lambda(B). แต่ในขณะที่ λเป็นประมาณการที่เป็นกลางของλ(S)ผมไม่คิดว่ามันเป็นกรณีที่อี-อัลฟ่า λเป็นประมาณการที่เป็นกลางของอี-อัลฟ่าλ(S) มีวิธีแก้ไขอัลกอริทึมนี้ไหม?λ^λ^\hat\lambdaλ(S)λ(S)\lambda(S)e−αλ^e−αλ^e^{-\alpha\hat\lambda}e−αλ(S)e−αλ(S)e^{-\alpha\lambda(S)}

2
วิธีสร้างข้อมูลการอยู่รอดของของเล่น (เวลากับเหตุการณ์) ด้วยการเซ็นเซอร์ที่ถูกต้อง
ฉันต้องการสร้างข้อมูลการอยู่รอดของของเล่น (เวลาต่อเหตุการณ์) ซึ่งถูกตรวจสอบอย่างถูกต้องและติดตามการกระจายบางอย่างที่มีสัดส่วนที่เป็นอันตรายและอันตรายพื้นฐานคงที่ ฉันสร้างข้อมูลดังต่อไปนี้ แต่ฉันไม่สามารถรับอัตราส่วนความเป็นอันตรายโดยประมาณที่ใกล้เคียงกับค่าที่แท้จริงหลังจากติดตั้งโมเดลอันตรายตามสัดส่วนของ Cox กับข้อมูลจำลอง ฉันทำผิดอะไร? รหัส R: library(survival) #set parameters set.seed(1234) n = 40000 #sample size #functional relationship lambda=0.000020 #constant baseline hazard 2 per 100000 per 1 unit time b_haz <-function(t) #baseline hazard { lambda #constant hazard wrt time } x = cbind(hba1c=rnorm(n,2,.5)-2,age=rnorm(n,40,5)-40,duration=rnorm(n,10,2)-10) B = c(1.1,1.2,1.3) # …

4
Bootstrap, Monte Carlo
ฉันถูกตั้งคำถามต่อไปนี้เป็นส่วนหนึ่งของการบ้าน: ออกแบบและดำเนินการศึกษาแบบจำลองเพื่อตรวจสอบประสิทธิภาพของ bootstrap เพื่อให้ได้ช่วงความเชื่อมั่น 95% จากค่าเฉลี่ยของตัวอย่างข้อมูลที่ไม่แปรเปลี่ยน การติดตั้งของคุณอาจอยู่ใน R หรือ SAS แง่มุมของประสิทธิภาพที่คุณอาจต้องการดูคือช่วงความมั่นใจช่วงเวลา (เช่นสัดส่วนช่วงเวลาความมั่นใจมีค่าเฉลี่ยจริง) และการเปลี่ยนแปลงของมอนติคาร์โล (กล่าวคือขีด จำกัด ความเชื่อมั่นสูงสุดและล่างแตกต่างกันระหว่างการจำลอง) ไม่มีใครรู้วิธีที่จะไปเกี่ยวกับแง่มุมการเปลี่ยนแปลงของ Monte Carlo นี้? ฉันไม่สามารถแม้แต่จะหาอัลกอริทึมหรืออะไรก็ได้ มันจะทำอย่างไรกับการรวม Monte Carlo? ขอบคุณ!

2
ทำไมเราไม่ใช้ค่าเฉลี่ยถ่วงน้ำหนักแทนค่าเฉลี่ยฮาร์มอนิก
ฉันสงสัยว่าอะไรคือคุณค่าที่แท้จริงของการใช้ค่าเฉลี่ยฮาร์มอนิก (ตัวอย่างเช่นการคำนวณค่า F- มาตรการ) ซึ่งต่างจากค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักในการรวมความแม่นยำและการเรียกคืน? ฉันคิดว่าค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักสามารถเล่นบทบาทของค่าเฉลี่ยฮาร์มอนิกได้หรือฉันขาดอะไรไป?

4
Bootstrap กับ Monte Carlo การประมาณข้อผิดพลาด
ฉันอ่านบทความการเผยแพร่ข้อผิดพลาดโดยวิธีมอนติคาร์โลในการคำนวณทางธรณีวิทยาแอนเดอร์สัน (1976)และมีบางสิ่งที่ฉันไม่เข้าใจ พิจารณาข้อมูลที่วัดได้และโปรแกรมที่ประมวลผลและคืนค่าที่กำหนด ในบทความโปรแกรมนี้ใช้เพื่อให้ได้ค่าที่ดีที่สุดก่อนโดยใช้วิธีการของข้อมูล (เช่น: ){ A , B , C }{ A ± σA, B ± σB, C± σค}{A±σA,B±σB,C±σC}\{A\pm\sigma_A, B\pm\sigma_B, C\pm\sigma_C\}{ A , B , C}{A,B,C}\{A, B, C\} จากนั้นผู้เขียนใช้วิธีมอนติคาร์โลเพื่อกำหนดความไม่แน่นอนให้กับค่าที่ดีที่สุดนี้โดยการเปลี่ยนแปลงพารามิเตอร์อินพุตภายในขอบเขตความไม่แน่นอน (กำหนดโดยการแจกแจงแบบเกาส์ด้วยวิธีการและค่าเบี่ยงเบนมาตรฐาน ) ก่อนป้อนเข้าโปรแกรม นี่คือตัวอย่างในรูปด้านล่าง:{ σ A , σ B , σ C }{ A , B , C}{A,B,C}\{A, B, C\}{ …

1
การสุ่มตัวอย่างจากการแจกแจงร่อแร่โดยใช้การแจกแจงแบบมีเงื่อนไข?
ฉันต้องการตัวอย่างจากความหนาแน่นของ univariate ฉXฉXf_Xแต่ฉันรู้เพียงความสัมพันธ์: ฉX( x ) = ∫ฉX| Y(x | y)fY( y) dY.ฉX(x)=∫ฉX|Y(x|Y)ฉY(Y)dY.f_X(x) = \int f_{X\vert Y}(x\vert y)f_Y(y) dy. ฉันต้องการหลีกเลี่ยงการใช้ MCMC (โดยตรงกับการแทนค่าอินทิกรัล) และเนื่องจากและเป็นตัวอย่างที่ง่ายฉันจึงคิดที่จะใช้ตัวอย่างต่อไปนี้ :f Y ( y )ฉX| Y( x | y)ฉX|Y(x|Y)f_{X\vert Y}(x\vert y)ฉY( y)ฉY(Y)f_Y(y) สำหรับNj = 1 , … , NJ=1,...,ยังไม่มีข้อความj=1,\dots, N ตัวอย่างf_YYJ∼ fYYJ~ฉYy_j \sim f_Y ตัวอย่างy_j)xJ∼ fX| Y( …

2
เมื่อใดที่วิธีการ Monte Carlo เป็นที่นิยมมากกว่าวิธีที่ต่างกันชั่วคราว?
ฉันได้ทำการค้นคว้ามากมายเกี่ยวกับการเสริมแรงการเรียนรู้เมื่อเร็ว ๆ นี้ ฉันติดตามการเรียนรู้การเสริมแรงของ Sutton & Barto : คำแนะนำสำหรับสิ่งส่วนใหญ่ ฉันรู้ว่ากระบวนการตัดสินใจของมาร์คอฟคืออะไรและวิธีการเรียนรู้การเขียนโปรแกรมแบบไดนามิก (DP), มอนติคาร์โลและความแตกต่างของ Temporal (DP) สามารถนำมาใช้แก้ปัญหาได้อย่างไร ปัญหาฉันมีคือว่าผมไม่เห็นเมื่อ Monte Carlo จะเป็นตัวเลือกที่ดีกว่า TD-การเรียนรู้ ความแตกต่างที่สำคัญระหว่างพวกเขาคือการเรียนรู้ด้วยระบบ TD ใช้การบูตสแตรปเพื่อประมาณค่าฟังก์ชั่นการกระทำและ Monte Carlo ใช้ค่าเฉลี่ยเพื่อทำสิ่งนี้ให้สำเร็จ ฉันไม่สามารถคิดถึงสถานการณ์จริง ๆ ได้เมื่อนี่เป็นวิธีที่ดีกว่า ฉันเดาว่ามันอาจมีบางอย่างเกี่ยวกับประสิทธิภาพ แต่ฉันไม่สามารถหาแหล่งที่สามารถพิสูจน์ได้ ฉันขาดอะไรบางอย่างหรือ TD-learning เป็นตัวเลือกที่ดีกว่าหรือไม่?

2
Bayesians ตรวจสอบวิธีการของพวกเขาโดยใช้วิธีการจำลองมอนติคาร์โลได้อย่างไร
ความเป็นมา : ฉันมีปริญญาเอกในด้านจิตวิทยาสังคมซึ่งสถิติและคณิตศาสตร์ในเชิงทฤษฎีแทบจะไม่ครอบคลุมในหลักสูตรเชิงปริมาณของฉัน ผ่านการเรียนในระดับปริญญาตรีและระดับบัณฑิตศึกษาฉันได้รับการสอน (เช่นเดียวกับพวกคุณหลายคนในสังคมศาสตร์ด้วย) ผ่านโครงร่างของนักประพันธ์เพลง "คลาสสิค" ตอนนี้ฉันยังรัก R และใช้วิธีการจำลองเพื่อตรวจสอบว่าวิธีการทำงานเป็นวิธีความรู้สึกของฉันมากกว่าการพิสูจน์ทางคณิตศาสตร์ (อีกครั้ง: ภูมิหลังในเชิงสังคมศาสตร์เชิงปริมาณไม่ใช่สถิติเชิงทฤษฎี) วิธีการของผู้ใช้บ่อยและวิธีการจำลองด้วยกันทำให้ฉันมีเหตุผล เพราะผู้ที่พบเห็นความน่าจะเป็นเป็นอัตราเดิมพันระยะยาว (เช่นถ้าฉันทำสิ่งนี้เป็นจำนวนมากตามอำเภอใจและมันเกิดขึ้น 50% ของเวลาก็มีความน่าจะเป็น 50%) เราสามารถจำลองระยะยาวนี้ได้ด้วยวิธีการมอนติคาร์โล! ภาวะแทรกซ้อน : ตั้งแต่ปริญญาตรีผมได้รับมากตระหนักถึงวิธีการแบบเบย์และมีได้เสมอคนในชีวิตของฉันเรียกฉันไปทางด้านเบส์บอกว่าผลที่ได้ก็ง่ายต่อการตีความที่เราได้รับความน่าจะเป็นสำหรับสมมติฐานแทนของข้อมูล ให้สมมติฐานและอื่น ๆ ฉันเป็นแบบนี้จริง ๆ แล้วเอาชั้นเรียนแบบเบย์อ่านหนังสือและเอกสารแบบเบย์บางอันและตอนนี้ฉันก็ค่อนข้างคุ้นเคยกับสแตนและแพ็คเกจ R ที่เกี่ยวข้อง ใส่มายอ : หลังจากความคิด "แบบเบย์อาจจะเป็นวิธีของอนาคต" ในขณะที่ผมอ่านเดโบราห์เมโยสถิติอนุมานเป็นรุนแรงทดสอบ เธอบอกว่าเธอไม่ได้เลือกข้างในตอนเริ่มต้นของหนังสือ แต่เธอก็รู้ว่า: เธอเป็นคนที่เรียนบ่อยและหนังสือจำนวนมากกำลังปกป้องวิธีการที่ใช้บ่อย ฉันไม่ต้องการพูดคุยเกี่ยวกับว่าเราคิดว่าวิธีที่เธอเห็นหลักฐานนั้นถูกต้องหรือไม่ แต่สิ่งนี้ทำให้ฉันคิดว่า: Bayes เป็นสิ่งที่โฆษณาจริงๆหรือไม่? ฉันหมายความว่าฝูงชนเบย์แตกหักตัวเองจนฉันไม่รู้วิธีที่ถูกต้องในการวิเคราะห์ข้อมูลในกรอบเบย์บ่อยครั้ง ปกติฉันจะใช้rstanarmและการประมาณจุดปัจจุบันและช่วงเวลาที่น่าเชื่อถือ ... ซึ่งมักจะเข้าแถวอย่างใกล้ชิดกับการประมาณการบ่อยครั้งและช่วงความเชื่อมั่น ฉันอาจทำการเปรียบเทียบโมเดล แต่ฉันมักจะกลัวที่จะอธิบายปัจจัย Bayes เป็นการเปรียบเทียบความน่าจะเป็นหลังและอื่น ๆ …

2
สิ่งนี้จะทำให้มีอคติในสิ่งที่ควรเป็นตัวเลขสุ่มหรือไม่
สมมติว่าไฟล์ข้อมูลที่มี 80 ล้านไฟล์และเลขศูนย์ถูกสร้างแบบสุ่ม จากไฟล์นี้เราต้องการสร้างรายการจำนวนเต็มทศนิยมแบบสุ่ม นี่คือแผนที่จะทำการแปลงนี้ แบ่งตัวเลข 80 ล้านหลักเป็นกลุ่ม 4 หลัก แปลงเลขฐานสอง 4 หลักเป็นทศนิยม ยกเลิกค่าทศนิยมทั้งหมดที่มากกว่า 9 สิ่งนี้ควรส่งผลให้เกิดสตริงของจำนวนเต็มแบบสุ่มจาก 0-9 นี่คือความกังวล เลขฐานสอง 24 หลักที่ประกอบด้วยการจัดกลุ่ม 6 ตัวของเลขฐานสอง 4 หลักที่สอดคล้องกับค่า 10 ถึง 15 ประกอบด้วย 17 อันและ 7 ศูนย์เท่านั้น ความไม่สมดุลนี้จะส่งผลกระทบต่อการแจกแจงของเลขจำนวนเต็มคู่กับคี่หรือทำให้การสุ่มของสตริงสุดท้ายของเลขทศนิยมในทางใดทางหนึ่งหรือไม่? อัปเดต: จากคำตอบที่โพสต์ดูเหมือนว่าวิธีการที่ระบุข้างต้นเป็นเสียง ฉันเห็นด้วยกับข้อสรุปนั้น อย่างไรก็ตามฉันยังไม่เข้าใจว่าทำไมการลบมากกว่าสองเท่าของค่าศูนย์จากสตริงเลขฐานสองจึงไม่ทำให้ผลที่ออกมามีเลขคี่น้อยลง ฉันขอคำอธิบาย

1
นโยบายการเปิดตัวในกระดาษของ AlphaGo คืออะไร?
กระดาษเป็นที่นี่ นโยบายการเปิดตัว ... เป็นนโยบาย softmax เชิงเส้นที่ขึ้นอยู่กับคุณลักษณะของรูปแบบโลคัลที่คำนวณเพิ่มขึ้นอย่างรวดเร็ว ... ฉันไม่เข้าใจว่านโยบายการเปิดตัวคืออะไรและเกี่ยวข้องกับเครือข่ายนโยบายในการเลือกย้ายอย่างไร มีคำอธิบายที่ง่ายกว่านี้ไหม?

2
อะไรคือเคล็ดลับในการเพิ่ม 1 ที่นี่
ฉันกำลังดูหน้านี้เกี่ยวกับการใช้งาน Monte Carlo ของการทดสอบ Lillefors ฉันไม่เข้าใจประโยคนี้: มีข้อผิดพลาดแบบสุ่มในการคำนวณนี้จากการจำลอง อย่างไรก็ตามเนื่องจากเคล็ดลับในการเพิ่ม 1 ให้กับตัวเศษและส่วนในการคำนวณค่า P จึงสามารถใช้งานได้โดยตรงโดยไม่คำนึงถึงการสุ่ม พวกเขาหมายถึงอะไรโดยการเพิ่ม 1 ถึงตัวเศษและส่วน? รหัสที่เกี่ยวข้องอยู่ที่นี่: n <- length(x) nsim <- 4999 d.star <- double(nsim) for (i in 1:nsim) { x.star <- rnorm(n) d.star[i] <- fred(x.star) } hist(d.star) abline(v = d.hat, lty = 2) ## simulation-derived P-value pval <- (sum(d.star …

1
การจำลองมอนติคาร์โลในอาร์
ฉันพยายามที่จะแก้ปัญหาการออกกำลังกายต่อไปนี้ แต่จริง ๆ แล้วฉันไม่มีเงื่อนงำเกี่ยวกับวิธีการเริ่มต้นทำเช่นนี้ ฉันพบรหัสบางอย่างในหนังสือของฉันที่ดูเหมือนว่ามัน แต่เป็นการออกกำลังกายที่แตกต่างอย่างสิ้นเชิงและฉันไม่รู้วิธีการเชื่อมโยงพวกเขากับแต่ละคน ฉันจะเริ่มเลียนแบบการมาถึงได้อย่างไรและฉันจะรู้ได้อย่างไรเมื่อพวกเขาเสร็จสิ้นแล้ว ฉันรู้วิธีจัดเก็บและคำนวณ a, b, c, d ตามนั้น แต่ฉันไม่รู้ว่าจริง ๆ แล้วฉันต้องการจำลอง monte carlo Simulation อย่างไร ใครช่วยกรุณาเริ่มต้นได้บ้าง ฉันรู้ว่านี่ไม่ใช่สถานที่สำหรับตอบคำถามของคุณ แต่ได้รับการแก้ไขแทน แต่ปัญหาคือฉันไม่รู้วิธีเริ่มต้น แผนกช่วยเหลือด้านไอทีแสดงถึงระบบเข้าคิวด้วยผู้ช่วยห้าคนที่รับสายจากลูกค้า การโทรเกิดขึ้นตามกระบวนการปัวซงโดยมีอัตราเฉลี่ยของการโทรหนึ่งครั้งทุก 45 วินาที เวลาบริการสำหรับผู้ช่วยที่ 1, 2, 3, 4 และ 5 คือตัวแปรสุ่มเอ็กซ์โพเนนเชียลทั้งหมดที่มีพารามิเตอร์λ1 = 0.1, λ2 = 0.2, λ3 = 0.3, λ4 = 0.4, และλ5 = 0.5 …

1
Rao-Blackwellization ของตัวกรอง Monte Carlo
ในกระดาษน้ำเชื้อ"การกรองอนุภาค Rao - Blackwellised สำหรับเครือข่าย Bayesian แบบไดนามิก"โดย A. Doucet และ อัล ลำดับ Monte Carlo กรอง (กรองอนุภาค) เสนอซึ่งจะทำให้การใช้งานของโครงสร้างเชิงเส้นในกระบวนการมาร์คอฟx k = ( x L k , x N k ) โดย marginalization ของโครงสร้างเชิงเส้นนี้ตัวกรองสามารถแบ่งออกเป็นสองส่วน: ส่วนที่ไม่ใช่เชิงเส้นซึ่งใช้ตัวกรองอนุภาคและส่วนหนึ่งเชิงเส้นซึ่งสามารถจัดการได้โดยตัวกรองคาลมาน (ปรับอากาศบนส่วนที่ไม่ใช่เชิงเส้นx N k )xLkxkLx^L_kxk=(xLk,xNk)xk=(xkL,xkN)x_k = (x^L_k, x^N_k)xNkxkNx^N_k ฉันเข้าใจว่าส่วนชายขอบ (และบางครั้งตัวกรองที่อธิบายไว้ก็เรียกอีกอย่างว่าตัวกรองชายขอบ) สัญชาตญาณของฉันทำไมมันถูกเรียกว่า Rao-Blackwellized Particle Filter (RBPF) ก็คือพารามิเตอร์ Gaussian เป็นสถิติที่เพียงพอสำหรับกระบวนการเชิงเส้นพื้นฐานและจากทฤษฎีบทของ Rao-Blackwell …

3
การศึกษาแบบจำลอง: วิธีการเลือกจำนวนการทำซ้ำ?
ฉันต้องการสร้างข้อมูลด้วย "รุ่น 1" และปรับให้พอดีกับ "รุ่น 2" แนวคิดพื้นฐานคือการตรวจสอบคุณสมบัติความทนทานของ "รุ่น 2" ฉันสนใจเป็นพิเศษในอัตราความครอบคลุมของช่วงความมั่นใจ 95% (ตามการประมาณปกติ) ฉันจะตั้งค่าจำนวนการทำซ้ำได้อย่างไร เป็นความจริงหรือไม่ที่การทำซ้ำที่มีขนาดใหญ่เกินความจำเป็น ถ้าเป็นเช่นนั้นได้อย่างไร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.