คำถามติดแท็ก monte-carlo

การใช้ (pseudo-) ตัวเลขสุ่มและกฎของตัวเลขขนาดใหญ่เพื่อจำลองพฤติกรรมการสุ่มของระบบจริง

2
การสุ่มตัวอย่าง MCMC ของพื้นที่ต้นไม้การตัดสินใจเทียบกับป่าแบบสุ่ม
ป่าสุ่มคือชุดของต้นไม้ตัดสินใจที่เกิดขึ้นจากการสุ่มเลือกคุณสมบัติบางอย่างเท่านั้นที่จะสร้างต้นไม้แต่ละต้นด้วย (และบางครั้งการรวบข้อมูลการฝึกอบรม) เห็นได้ชัดว่าพวกเขาเรียนรู้และพูดคุยได้ดี มีใครทำการสุ่มตัวอย่าง MCMC ของพื้นที่ต้นไม้การตัดสินใจหรือเปรียบเทียบกับป่าสุ่ม? ฉันรู้ว่ามันอาจมีราคาแพงกว่าการคำนวณ MCMC และบันทึกต้นไม้ตัวอย่างทั้งหมด แต่ฉันสนใจคุณสมบัติทางทฤษฎีของรุ่นนี้ไม่ใช่ค่าใช้จ่ายในการคำนวณ สิ่งที่ฉันหมายถึงคือสิ่งนี้: สร้างแผนผังการตัดสินใจแบบสุ่ม (มันอาจจะทำงานได้อย่างน่ากลัว) โอกาส Compute ของต้นไม้กับสิ่งที่ต้องการหรือบางทีอาจจะเพิ่มระยะP P R ฉันo R ( T R อีอี)P( Tr e e | D a t a ) ∝ P( D a t a | Tr e e )P(TRอีอี|Daเสื้อa)αP(Daเสื้อa|TRอีอี)P(Tree|Data) \propto P(Data|Tree)Pp r i o r( …

1
ทำไมการทิ้งส่วนที่เหลือจากรูปแบบเอฟเฟกต์ผสมจึงให้ช่วงความมั่นใจในการต่อต้านอย่างอนุรักษ์นิยม?
ฉันมักจะจัดการกับข้อมูลที่แต่ละคนวัดกันหลายครั้งในแต่ละเงื่อนไขตั้งแต่ 2 ข้อขึ้นไป เมื่อไม่นานมานี้ฉันได้เล่นกับการสร้างแบบผสมเอฟเฟกต์เพื่อประเมินหลักฐานความแตกต่างระหว่างเงื่อนไขการสร้างแบบจำลองindividualเป็นเอฟเฟกต์แบบสุ่ม เพื่อให้เห็นภาพความไม่แน่นอนเกี่ยวกับการคาดการณ์จากแบบจำลองดังกล่าวฉันได้ใช้ bootstrapping ซึ่งในแต่ละการวนซ้ำของ bootstrap ทั้งบุคคลและการสังเกต - ภายใน - เงื่อนไข - ภายใน - บุคคล - ตัวอย่างจะถูกแทนที่ด้วยและแบบจำลองเอฟเฟกต์ใหม่ ได้รับ วิธีนี้ใช้งานได้ดีสำหรับข้อมูลที่ถือว่าข้อผิดพลาด gaussian แต่เมื่อข้อมูลเป็นแบบทวินามการบูตสแตรปอาจใช้เวลานานมากเนื่องจากการวนซ้ำแต่ละครั้งจะต้องคำนวณรูปแบบเอฟเฟกต์ผสมแบบทวินามที่คำนวณได้ค่อนข้างเข้มข้น ความคิดที่ฉันมีคือฉันอาจใช้ส่วนที่เหลือจากแบบจำลองเดิมแล้วใช้ส่วนที่เหลือเหล่านี้แทนข้อมูลดิบใน bootstrapping ซึ่งจะอนุญาตให้ฉันคำนวณรูปแบบเอฟเฟกต์แบบ gaussian ในการวนซ้ำของ bootstrap แต่ละครั้ง การเพิ่มการทำนายดั้งเดิมจากแบบจำลองทวินามของข้อมูลดิบไปยังการคาดการณ์ bootstrapped จากส่วนที่เหลือให้ผลตอบแทน 95% CI สำหรับการคาดการณ์ดั้งเดิม อย่างไรก็ตามฉันเพิ่งเขียนโค้ดการประเมินอย่างง่ายของวิธีการนี้การสร้างแบบจำลองไม่แตกต่างกันระหว่างสองเงื่อนไขและการคำนวณสัดส่วนของช่วงเวลาที่ความมั่นใจ 95% ล้มเหลวในการรวมศูนย์และฉันพบว่าขั้นตอนการบูตสต็อก (ไม่รวมศูนย์มากกว่า 5% ของเวลา) ยิ่งไปกว่านั้นฉันเขียนโค้ด (ลิงค์เดียวกันก่อนหน้านี้) การประเมินที่คล้ายกันของวิธีการนี้ที่นำไปใช้กับข้อมูลที่เป็นเกาส์เดิมและได้รับ CIs ต่อต้านอนุรักษ์นิยมในทำนองเดียวกัน ความคิดใด ๆ ว่าทำไมถึงเป็นเช่นนั้น?

1
ความน่าจะเป็นที่ครอบคลุมของช่วงความมั่นใจบูตพื้นฐาน
ฉันมีคำถามต่อไปนี้สำหรับหลักสูตรที่ฉันกำลังทำอยู่: ดำเนินการศึกษา Monte Carlo เพื่อประเมินความน่าจะเป็นที่ครอบคลุมของช่วงความมั่นใจบูตมาตรฐานและช่วงความเชื่อมั่นเริ่มต้นพื้นฐาน ตัวอย่างจากประชากรปกติและตรวจสอบอัตราความครอบคลุมเชิงประจักษ์สำหรับค่าเฉลี่ยตัวอย่าง ความน่าจะเป็นของการครอบคลุมสำหรับ bootstrap CI มาตรฐานทั่วไปนั้นง่าย: n = 1000; alpha = c(0.025, 0.975); x = rnorm(n, 0, 1); mu = mean(x); sqrt.n = sqrt(n); LNorm = numeric(B); UNorm = numeric(B); for(j in 1:B) { smpl = x[sample(1:n, size = n, replace = TRUE)]; xbar = mean(smpl); …

6
หนึ่งในผู้อนุมัติโครงการออยเลอร์ปัญหา 213 (“ Flea Circus”) ได้อย่างไร?
ฉันต้องการแก้ปัญหาProject Euler 213แต่ไม่รู้ว่าจะเริ่มต้นอย่างไรเพราะฉันเป็นคนธรรมดาในสาขาสถิติสังเกตว่าต้องมีคำตอบที่ถูกต้องดังนั้นวิธี Monte Carlo จะไม่ทำงาน คุณช่วยแนะนำหัวข้อสถิติให้ฉันอ่านได้ไหม? โปรดอย่าโพสต์วิธีแก้ปัญหาที่นี่ หมัดละครสัตว์ สี่เหลี่ยมจัตุรัสขนาด 30 × 30 ประกอบด้วย 900 หมัดหมัดแรกหนึ่งหมัดต่อตาราง เมื่อระฆังดังขึ้นหมัดแต่ละตัวจะกระโดดไปที่สี่เหลี่ยมที่อยู่ติดกันโดยการสุ่ม (โดยปกติจะมีความเป็นไปได้ 4 อย่างยกเว้นหมัดที่อยู่บนขอบของตารางหรือที่มุม) จำนวนที่คาดว่าจะเป็นสี่เหลี่ยมที่ว่างหลังจาก 50 ระฆังคืออะไร? ให้คำตอบของคุณถูกปัดเศษเป็นทศนิยมหกตำแหน่ง

2
จะประมาณความแม่นยำของอินทิกรัลได้อย่างไร?
สถานการณ์ที่พบบ่อยมากในคอมพิวเตอร์กราฟฟิคคือสีของบางพิกเซลเท่ากับส่วนที่สำคัญของฟังก์ชั่นที่มีมูลค่าจริง บ่อยครั้งที่ฟังก์ชั่นนั้นซับซ้อนเกินกว่าที่จะแก้ปัญหาเชิงวิเคราะห์ดังนั้นเราจึงเหลือการประมาณเชิงตัวเลข แต่ฟังก์ชั่นมักจะมีราคาแพงมากในการคำนวณดังนั้นเราจึงถูก จำกัด อย่างมากในจำนวนตัวอย่างที่เราสามารถคำนวณได้ (เช่นคุณไม่สามารถตัดสินใจที่จะรับตัวอย่างหนึ่งล้านตัวอย่างและทิ้งไว้ที่นี่) โดยทั่วไปแล้วสิ่งที่คุณต้องการทำคือประเมินฟังก์ชันที่จุดที่เลือกแบบสุ่มจนกระทั่งอินทิกรัลประมาณกลายเป็น "แม่นยำเพียงพอ" ซึ่งนำมาสู่คำถามจริงของฉัน: คุณประเมิน "ความถูกต้อง" ของอินทิกรัลอย่างไร? โดยเฉพาะอย่างยิ่งเรามีซึ่งดำเนินการโดยอัลกอริทึมคอมพิวเตอร์ที่ซับซ้อนและช้า เราต้องการประเมินf:R→Rf:R→Rf : \mathbb{R} \rightarrow \mathbb{R} k=∫baf(x) dxk=∫abf(x) dxk = \int_a^b f(x) \ dx เราสามารถคำนวณสำหรับเราปรารถนาได้ แต่มันมีราคาแพง ดังนั้นเราต้องการเลือกค่าหลายค่าแบบสุ่มและหยุดเมื่อค่าประมาณของกลายเป็นที่ยอมรับได้อย่างแม่นยำ แน่นอนว่าในการทำเช่นนี้เราจำเป็นต้องทราบว่าการประมาณการในปัจจุบันนั้นแม่นยำเพียงใดx x kf(x)f(x)f(x)xxxxxxkkk ฉันไม่แน่ใจด้วยซ้ำว่าเครื่องมือทางสถิติใดที่เหมาะสำหรับปัญหาประเภทนี้ แต่สำหรับฉันแล้วดูเหมือนว่าถ้าเราไม่รู้อะไรเกี่ยวกับอย่างแน่นอนปัญหาก็แก้ไม่ได้ ตัวอย่างเช่นถ้าคุณคำนวณหนึ่งพันครั้งและมันก็เป็นศูนย์เสมออินทิกรัลที่ประมาณไว้ของคุณจะเป็นศูนย์ แต่ไม่รู้อะไรเลยเกี่ยวกับf ( x ) fffff(x)f(x)f(x)fffมันยังคงเป็นไปได้ที่ทุกที่ยกเว้นจุดที่คุณสุ่มตัวอย่างดังนั้นการประเมินของคุณจึงผิดอย่างมาก!f(x)=1,000,000f(x)=1,000,000f(x) = 1,000,000 บางทีคำถามของฉันควรเริ่มด้วย"เราต้องรู้อะไรเกี่ยวกับเพื่อให้สามารถประเมินความถูกต้องของอินทิกรัลของเราได้fff ?" ตัวอย่างเช่นเรามักรู้ว่าเป็นไปไม่ได้ที่จะเป็นลบซึ่งดูเหมือนจะเป็นข้อเท็จจริงที่เกี่ยวข้อง ...fff แก้ไข:ตกลงดังนั้นสิ่งนี้ดูเหมือนจะสร้างคำตอบมากมายซึ่งเป็นสิ่งที่ดี แทนที่จะตอบกลับเป็นรายบุคคลฉันจะพยายามเติมภูมิหลังเพิ่มเติมที่นี่ เมื่อฉันบอกว่าเรารู้ "ไม่มีอะไร" …

4
เมื่อใดจึงควรใช้ Gradient descent vs Monte Carlo เป็นเทคนิคการหาค่าเหมาะที่สุดเชิงตัวเลข
เมื่อชุดของสมการไม่สามารถแก้ไขได้เชิงวิเคราะห์เราสามารถใช้อัลกอริธึมการไล่ระดับสี แต่ดูเหมือนว่ายังมีวิธีการจำลองมอนติคาร์โลที่สามารถใช้ในการแก้ปัญหาที่ไม่มีวิธีการวิเคราะห์ จะบอกได้อย่างไรว่าจะใช้การไล่ระดับสีแบบไล่ระดับและเมื่อใดที่จะใช้ Monte Carlo หรือฉันแค่สับสนคำว่า 'การจำลอง' กับ 'การเพิ่มประสิทธิภาพ' แบบธรรมดา ขอบคุณมาก!

2
การสุ่มตัวอย่างที่แน่นอนจากส่วนผสมที่ไม่เหมาะสม
สมมติว่าผมต้องการที่จะตัวอย่างจากการกระจายอย่างต่อเนื่อง(x) ถ้าฉันมีการแสดงออกของในรูปแบบหน้าp(x)p(x)p(x)ppp p(x)=∑i=1∞aifi(x)p(x)=∑i=1∞aifi(x)p(x) = \sum_{i=1}^\infty a_i f_i(x) โดยที่และf_iคือการแจกแจงซึ่งสามารถสุ่มตัวอย่างได้ง่ายจากนั้นฉันสามารถสร้างตัวอย่างจากpโดย:ai⩾0,∑iai=1ai⩾0,∑iai=1a_i \geqslant 0, \sum_i a_i= 1fifif_ippp การสุ่มตัวอย่างฉลากiiiด้วยความน่าจะเป็นaiaia_i การสุ่มตัวอย่างX∼fiX∼fiX \sim f_i เป็นไปได้หรือไม่ที่จะทำให้ขั้นตอนนี้เป็นมาตรฐานหากaiaia_iเป็นลบในบางครั้ง? ฉันสงสัยว่าฉันเคยเห็นสิ่งนี้ทำที่ไหนสักแห่ง - อาจจะเป็นในหนังสือบางทีสำหรับการแจกจ่าย Kolmogorov - ดังนั้นฉันยินดีอย่างยิ่งที่จะยอมรับการอ้างอิงเป็นคำตอบ หากตัวอย่างของเล่นคอนกรีตมีประโยชน์สมมติว่าฉันต้องการตัวอย่างจากp(x,y)∝exp(−x−y−αxy−−√)x,y>0p(x,y)∝exp⁡(−x−y−αxy)x,y>0p(x,y) \propto \exp(-x-y-\alpha\sqrt{xy})\qquad x,y > 0ฉันจะ รับα∈(0,2)α∈(0,2)\alpha \in (0, 2)ด้วยเหตุผลทางเทคนิคซึ่งไม่ควรมีความสำคัญมากเกินไปในโครงการที่ยิ่งใหญ่ โดยหลักการแล้วฉันสามารถขยายสิ่งนี้เป็นผลรวมต่อไปนี้: p(x,y)∝∑n=0∞(−1)nαn(n2)!(n2)!n!(xn/2e−x(n2)!)(yn/2e−y(n2)!).p(x,y)∝∑n=0∞(−1)nαn(n2)!(n2)!n!(xn/2e−x(n2)!)(yn/2e−y(n2)!).p(x,y) \propto \sum_{n=0}^\infty \frac{(-1)^n \alpha^n \left( \frac{n}{2} \right)! \left( \frac{n}{2} \right)!}{n!} \left( \frac{x^{n/2} e^{-x}}{\left( \frac{n}{2} …

1
มีการใช้งานตัวอย่างมอนติคาร์โล / MCMC ซึ่งสามารถจัดการกับการกระจายของภาพหลังหรือไม่?
ขณะนี้ฉันใช้วิธีแบบเบย์เพื่อประเมินพารามิเตอร์สำหรับโมเดลที่ประกอบด้วย ODE หลายตัว เนื่องจากฉันมีพารามิเตอร์ 15 ตัวที่จะประมาณพื้นที่การสุ่มตัวอย่างของฉันคือ 15 มิติและการค้นหาการกระจายหลังดูเหมือนว่าจะมีค่าสูงสุดในพื้นที่ซึ่งแยกได้ตามภูมิภาคขนาดใหญ่ที่มีความน่าจะเป็นต่ำมาก สิ่งนี้นำไปสู่ปัญหาการผสมของโซ่ Monte Carlo ของฉันเนื่องจากมันไม่น่าเป็นไปได้มากที่โซ่หนึ่ง "กระโดด" จากจำนวนสูงสุดในท้องถิ่นเดียวและบังเอิญโดนหนึ่งในยอดเขาอื่น ๆ โดยไม่ตั้งใจ ดูเหมือนว่าจะมีงานวิจัยจำนวนมากในพื้นที่นี้เนื่องจากเป็นเรื่องง่ายที่จะหาเอกสารที่เกี่ยวข้องกับปัญหานี้ (ดูด้านล่าง) แต่การค้นหาการใช้งานจริงนั้นยาก ฉันพบแพ็คเกจที่เกี่ยวข้องกับการเปลี่ยนแปลงของโมเลกุล แต่ไม่ใช่การอนุมานแบบเบย์ มีการใช้งานตัวอย่าง MC (MC) MC ซึ่งสามารถจัดการกับ maxima แบบแยกได้หรือไม่ ฉันถูกบังคับให้ทำงานกับ Matlab เพราะนั่นคือสิ่งที่ฉันเขียนในแบบจำลอง ODE ดังนั้นข้อเสนอเกี่ยวกับ Matlab ยินดีต้อนรับมากที่สุด ;-) อย่างไรก็ตามหากมี "แอพพลิเคชั่นนักฆ่า" ในภาษาอื่น ๆ บางทีฉันสามารถโน้มน้าวให้ PI ของฉันเปลี่ยน ;-) ขณะนี้ฉันกำลังทำงานกับตัวอย่าง Monte Carlo Delayed- Reject / …

1
แสดงค่าประมาณมาเป็นเปอร์เซ็นต์ผ่านสถิติการสั่งซื้อ
ให้เป็นลำดับของตัวแปรสุ่ม iid ที่สุ่มตัวอย่างจากการแจกแจงแบบเสถียรอัลฟ่าโดยมีพารามิเตอร์1.0X1,X2,…,X3nX1,X2,…,X3nX_1, X_2, \ldots, X_{3n}α=1.5,β=0,c=1.0,μ=1.0α=1.5,β=0,c=1.0,μ=1.0\alpha = 1.5, \; \beta = 0, \; c = 1.0, \; \mu = 1.0 พิจารณาลำดับโดยที่ , สำหรับn-1 Y j + 1 = X 3 j + 1 X 3 j + 2 X 3 j + 3 - 1 j = 0 , …

3
G-test เทียบกับการทดสอบ Chi-squared ของ Pearson
ฉันกำลังทดสอบความเป็นอิสระในตารางฉุกเฉินฉันไม่รู้ว่าการทดสอบ G-testหรือการทดสอบไคสแควร์ของ Pearson นั้นดีกว่าหรือไม่ ขนาดตัวอย่างเป็นร้อย แต่มีจำนวนเซลล์ต่ำนับ ตามที่ระบุไว้ในหน้า Wikipediaการประมาณค่าการกระจายไคสแควร์นั้นดีกว่าสำหรับการทดสอบ G-test กว่าสำหรับการทดสอบไคสแควร์ของ Pearson แต่ฉันใช้การจำลอง Monte Carlo เพื่อคำนวณค่า p ดังนั้นจึงมีความแตกต่างระหว่างการทดสอบทั้งสองนี้หรือไม่?ยังไม่มีข้อความ× Mยังไม่มีข้อความ×MN \times M

1
จำนวนของการจำลองที่จำเป็นสำหรับการวิเคราะห์ Monte Carlo
คำถามของฉันเกี่ยวกับการจำลองจำนวนที่ต้องการสำหรับวิธีการวิเคราะห์ Monte Carlo เท่าที่ฉันเห็นจำนวนการจำลองที่ต้องการสำหรับข้อผิดพลาดเปอร์เซ็นต์ที่อนุญาต (เช่น 5) คือ EEEn = { 100 ⋅ zค⋅ std ( x )E⋅ เฉลี่ย( x )}2,n={100⋅Zค⋅มาตรฐาน(x)E⋅ค่าเฉลี่ย(x)}2, n = \left\{\frac{100 \cdot z_c \cdot \text{std}(x)}{E \cdot \text{mean}(x)} \right\}^2 , โดยที่เป็นค่าเบี่ยงเบนมาตรฐานของการสุ่มตัวอย่างที่เกิดขึ้นและคือสัมประสิทธิ์ระดับความเชื่อมั่น (เช่น 95% คือ 1.96) ดังนั้นด้วยวิธีนี้จึงเป็นไปได้ที่จะตรวจสอบว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของการจำลองแสดงถึงค่าเฉลี่ยจริงและค่าเบี่ยงเบนมาตรฐานที่ระดับความเชื่อมั่น 95%มาตรฐาน( x )มาตรฐาน(x)\text{std}(x)ZคZคz_cnnn ในกรณีของฉันฉันใช้ simualtion 7500 ครั้งและคำนวณหาค่าเฉลี่ยเคลื่อนที่และค่าเบี่ยงเบนมาตรฐานสำหรับแต่ละชุด 100 ตัวอย่างจากการจำลอง 7500 จำนวนการจำลองที่ต้องการที่ฉันได้รับน้อยกว่า 100 เสมอ …

5
สร้างค่าหลายตัวแปรสุ่มจากข้อมูลเชิงประจักษ์
ฉันกำลังทำงานกับฟังก์ชั่น Monte Carlo สำหรับการประเมินมูลค่าสินทรัพย์หลายรายการที่มีผลตอบแทนที่สัมพันธ์กันบางส่วน ขณะนี้ฉันเพิ่งสร้างเมทริกซ์ความแปรปรวนร่วมและฟีดไปยังrmvnorm()ฟังก์ชันใน R (สร้างค่าสุ่มที่สัมพันธ์กัน) อย่างไรก็ตามเมื่อพิจารณาการกระจายของผลตอบแทนของสินทรัพย์จะไม่ได้รับการกระจายตามปกติ นี่เป็นคำถามสองส่วนจริง ๆ : 1) ฉันจะประมาณ PDF หรือ CDF บางประเภทได้อย่างไรเมื่อฉันมีข้อมูลโลกแห่งความจริงโดยไม่ต้องมีการแจกแจง 2) ฉันจะสร้างค่าที่สัมพันธ์กันเช่น rmvnorm ได้อย่างไร แต่สำหรับการแจกแจงที่ไม่รู้จัก (และไม่ปกติ) นี้? ขอบคุณ! การแจกแจงนั้นไม่เหมาะสมกับการแจกแจงใด ๆ ฉันคิดว่ามันจะเป็นอันตรายมากที่จะใช้พารามิเตอร์และจากนั้นใช้สำหรับการประเมิน monte carlo ไม่มี bootstrap หรือวิธี "empirical monte carlo" ที่ฉันสามารถดูได้หรือไม่?
10 mcmc  monte-carlo  pdf 

4
วิธีที่ดีที่สุดในการหว่าน N ตัวสร้างตัวเลขสุ่มแบบอิสระจาก 1 ค่า
ในโปรแกรมของฉันฉันต้องรัน N แยกเธรดแต่ละตัวด้วย RNG ของตัวเองซึ่งใช้เพื่อสุ่มตัวอย่างชุดข้อมูลขนาดใหญ่ ฉันต้องสามารถหว่านกระบวนการทั้งหมดนี้ด้วยค่าเดียวดังนั้นฉันจึงสามารถทำซ้ำผลลัพธ์ได้ มันเพียงพอแล้วหรือไม่ที่จะเพิ่มเมล็ดตามลำดับสำหรับแต่ละดัชนี? ขณะนี้ฉันใช้numpyของRandomStateซึ่งใช้ตัวสร้างตัวเลขสุ่มหลอก Mersenne Twister ตัวอย่างโค้ดด้านล่าง: # If a random number generator seed exists if self.random_generator_seed: # Create a new random number generator for this instance based on its # own index self.random_generator_seed += instance_index self.random_number_generator = RandomState(self.random_generator_seed) โดยพื้นฐานแล้วฉันเริ่มต้นด้วยเมล็ดที่ผู้ใช้ป้อน (ถ้ามี) และสำหรับแต่ละอินสแตนซ์ / เธรดฉันตามลำดับเพิ่มดัชนี (0 ถึง …

2
การสุ่มตัวอย่างจากมาร์คอฟคือ "ดีที่สุด" สำหรับการสุ่มตัวอย่าง Monte Carlo หรือไม่ มีรูปแบบทางเลือกอื่น ๆ หรือไม่?
มาร์คอฟเชนมอนติคาร์โลเป็นวิธีการที่อิงตามเชนมาร์คอฟที่ช่วยให้เราได้รับตัวอย่าง (ในการตั้งค่ามอนติคาร์โล) จากการแจกแจงที่ไม่ได้มาตรฐานซึ่งเราไม่สามารถวาดตัวอย่างได้โดยตรง คำถามของฉันคือเหตุผลที่ห่วงโซ่มาร์คอฟเป็น "สุดยอด" สำหรับการสุ่มตัวอย่าง Monte Carlo คำถามอื่นอาจมีวิธีอื่นเช่นโซ่มาร์คอฟที่สามารถใช้สำหรับการสุ่มตัวอย่าง Monte Carlo ได้หรือไม่? ฉันรู้ (อย่างน้อยก็จากการดูวรรณกรรม) ว่า MCMC มีรากฐานทางทฤษฎีที่ลึก (ในแง่ของเงื่อนไขเช่น (a) เป็นระยะ, ความสม่ำเสมอและรายละเอียดที่สมดุล) แต่สงสัยว่ามีรูปแบบ / วิธีการที่น่าจะเป็นสำหรับ Monte การสุ่มตัวอย่าง Carlo คล้ายกับโซ่มาร์คอฟ กรุณาแนะนำฉันถ้าฉันได้สับสนบางส่วนของคำถาม (หรือถ้ามันดูเหมือนสับสนโดยสิ้นเชิง)

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.