คำถามติดแท็ก sampling

การสร้างตัวอย่างจากประชากรที่ระบุอย่างดีโดยใช้วิธีความน่าจะเป็นและ / หรือการสร้างตัวเลขสุ่มจากการแจกแจงที่ระบุ เนื่องจากแท็กนี้ไม่ชัดเจนโปรดพิจารณา [การสำรวจตัวอย่าง] สำหรับอดีตและ [monte-carlo] หรือ [จำลอง] สำหรับหลัง สำหรับคำถามเกี่ยวกับการสร้างตัวอย่างแบบสุ่มจากการแจกแจงที่รู้จักโปรดพิจารณาใช้แท็ก [การสร้างแบบสุ่ม]

2
การสุ่มตัวอย่าง Gibbs กับ MH-MCMC ทั่วไป
ฉันเพิ่งได้อ่านการสุ่มตัวอย่างของกิ๊บส์และอัลกอริทึม Metropolis Hastings และมีคำถามสองสามข้อ อย่างที่ฉันเข้าใจในกรณีของการสุ่มตัวอย่างของกิ๊บส์ถ้าเรามีปัญหาหลายตัวแปรขนาดใหญ่เราจะสุ่มตัวอย่างจากการแจกแจงแบบมีเงื่อนไขนั่นคือตัวอย่างหนึ่งตัวแปรในขณะที่รักษาตัวแปรอื่น ๆ ทั้งหมดไว้ในขณะที่ MH เราสุ่มตัวอย่าง สิ่งหนึ่งที่เอกสารกล่าวคือตัวอย่างที่เสนอนั้นเป็นที่ยอมรับเสมอในการสุ่มตัวอย่างกิ๊บส์นั่นคืออัตราการยอมรับข้อเสนออยู่เสมอ 1 สำหรับฉันแล้วนี่เป็นข้อได้เปรียบที่ยิ่งใหญ่สำหรับปัญหาหลายตัวแปรขนาดใหญ่ดูเหมือนว่าอัตราการปฏิเสธสำหรับอัลกอริธึม MH ค่อนข้างใหญ่ . หากเป็นเช่นนั้นจริง ๆ แล้วอะไรคือสาเหตุที่ไม่ใช้ Gibbs Sampler ตลอดเวลาในการสร้างการกระจายหลัง

2
การจำลองอนุกรมเวลาที่ให้กำลังและความหนาแน่นสเปกตรัมข้าม
ฉันมีปัญหาในการสร้างชุดของชุดสีเวลาคงที่ให้เมทริกซ์ความแปรปรวนร่วมของพวกเขา (ความหนาแน่นสเปกตรัมพลังงานของพวกเขา (PSDs) และความหนาแน่นสเปกตรัมข้ามอำนาจ (CSDs) ฉันรู้ว่าเมื่อได้รับอนุกรมเวลาสองชุดและฉันสามารถประเมินความหนาแน่นเชิงสเปกตรัมกำลัง (PSDs) และความหนาแน่นข้ามสเปกตรัม (CSDs) โดยใช้กิจวัตรที่มีอยู่มากมายเช่นและฟังก์ชั่นใน Matlab เป็นต้น PSDs และ CSD ประกอบขึ้นเป็นเมทริกซ์ความแปรปรวนร่วม: Yผม( t)Yผม(เสื้อ)y_{I}(t)YJ( t )YJ(เสื้อ)y_{J}(t)psd()csd()C ( f) = ( Pผมผม(ฉ)PJผม(ฉ)PผมJ(ฉ)PJJ(ฉ)),ค(ฉ)=(Pผมผม(ฉ)PผมJ(ฉ)PJผม(ฉ)PJJ(ฉ)), \mathbf{C}(f) = \left( \begin{array}{cc} P_{II}(f) & P_{IJ}(f)\\ P_{JI}(f) & P_{JJ}(f) \end{array} \right)\;, ซึ่งอยู่ในฟังก์ชั่นทั่วไปของความถี่ฉ ฉฉf จะเกิดอะไรขึ้นถ้าฉันต้องการย้อนกลับ รับเมทริกซ์ความแปรปรวนร่วมฉันจะสร้างการรับรู้ของและอย่างไรYผม( t )Yผม(เสื้อ)y_{I}(t)YJ( t )YJ(เสื้อ)y_{J}(t) โปรดรวมทฤษฎีพื้นหลังใด ๆ หรือชี้ให้เห็นเครื่องมือที่มีอยู่ใด ๆ ที่ทำสิ่งนี้ …

3
วิธีตัวอย่างจาก ?
ฉันต้องการตัวอย่างตามความหนาแน่น โดยที่และเป็นบวกอย่างเคร่งครัด (แรงจูงใจ: สิ่งนี้อาจเป็นประโยชน์สำหรับการสุ่มตัวอย่างของกิ๊บส์เมื่อพารามิเตอร์รูปร่างของความหนาแน่นแกมมามีรูปแบบเหมือนกันมาก่อน)f(a)∝cada−1Γ(a)1(1,∞)(a)f(a)∝cada−1Γ(a)1(1,∞)(a) f(a) \propto \frac{c^a d^{a-1}}{\Gamma(a)} 1_{(1,\infty)}(a) cccddd ไม่มีใครรู้วิธีการสุ่มตัวอย่างจากความหนาแน่นนี้ได้อย่างง่ายดาย? อาจจะเป็นมาตรฐานและมีบางสิ่งที่ฉันไม่รู้ ฉันคิดว่าอัลกอริธึมการคัดแยกที่โง่ที่จะทำงานได้มากหรือน้อย (หาโหมดของ , ตัวอย่างจากเครื่องแบบในกล่องขนาดใหญ่และปฏิเสธถ้า ) แต่ (i) มันไม่ได้มีประสิทธิภาพเลยและ (ii)จะใหญ่เกินไปสำหรับคอมพิวเตอร์ที่จะจัดการได้อย่างง่ายดายแม้ในระดับปานกลาง ขนาดใหญ่และD (โปรดทราบว่าโหมดสำหรับcขนาดใหญ่และdจะอยู่ที่a = cd )a∗a∗a^*fff(a,u)(a,u)(a,u)[0,10a∗]×[0,f(a∗)][0,10a∗]×[0,f(a∗)][0,10a^*]\times [0,f(a^*)]u>f(a)u>f(a)u>f(a)f(a∗)f(a∗)f(a^*)cccdddcccddda=cda=cda=cd ขอบคุณล่วงหน้าสำหรับความช่วยเหลือใด ๆ !

3
เทคนิคการเพิ่มประสิทธิภาพทำแผนที่กับเทคนิคการสุ่มตัวอย่างหรือไม่?
จากอัลกอริธึมการสุ่มตัวอย่างทั่วไปเราสามารถหาอัลกอริธึมการเพิ่มประสิทธิภาพได้ แท้จริงเพื่อเพิ่มฟังก์ชั่นโดยพลก็พอเพียงที่จะวาดตัวอย่างจากกรัม~ จฉ/ T สำหรับพอขนาดเล็กตัวอย่างเหล่านี้จะตกอยู่ใกล้สูงสุดทั่วโลก (หรือสูงสุดในท้องถิ่นในการปฏิบัติ) ของฟังก์ชันฉf:x→f(x)f:x→f(x)f: \textbf{x} \rightarrow f(\textbf{x})ก.∼ eฉ/ Tก.~อีฉ/Tg \sim e^{f/T}TTTฉฉf โดย "การสุ่มตัวอย่าง" ฉันหมายถึงการวาดภาพตัวอย่างแบบหลอกเทียมจากการแจกแจงให้ฟังก์ชั่นบันทึกความเป็นไปได้ที่รู้จักกันถึงค่าคงที่ ตัวอย่างเช่นการสุ่มตัวอย่าง MCMC การสุ่ม Gibbs การสุ่มตัวอย่าง Beam เป็นต้นโดย "การปรับให้เหมาะสม" ฉันหมายถึงความพยายามในการค้นหาพารามิเตอร์ที่ทำให้ค่าของฟังก์ชั่นที่กำหนดนั้นมีค่าสูงสุด ย้อนกลับเป็นไปได้? จากการวิเคราะห์พฤติกรรมเพื่อหาค่าสูงสุดของฟังก์ชันหรือนิพจน์ combinatorial เราสามารถแยกขั้นตอนการสุ่มตัวอย่างที่มีประสิทธิภาพได้หรือไม่? เช่น HMC ดูเหมือนจะใช้ประโยชน์จากข้อมูลการไล่ระดับสี เราสามารถสร้างขั้นตอนการสุ่มตัวอย่างที่ใช้ประโยชน์จากการประมาณเหมือน BFGS ของ Hessian ได้หรือไม่? (แก้ไข: เห็นได้ชัดว่าใช่: http://papers.nips.cc/paper/4464-quasi-newton-methods-for-markov-chain-monte-carlo.pdf ) เราสามารถใช้ MCTS ในปัญหา combinatorial เราสามารถแปลได้ไหม เข้าสู่ขั้นตอนการสุ่มตัวอย่างหรือไม่ บริบท: ความยากลำบากในการสุ่มตัวอย่างมักจะว่าการกระจายความน่าจะเป็นส่วนใหญ่อยู่ในพื้นที่ขนาดเล็กมาก …

4
วิธีสร้าง Bernoulli ต่อเนื่องไม่สำเร็จเป็นจำนวนเท่าใด?
ได้รับ: เหรียญกับที่ไม่รู้จักอคติppp (หัวหน้า) บวกอย่างเคร่งครัดจริง > 0a>0a>0a > 0 ปัญหา: สร้างตัวแปร Bernoulli สุ่มที่มีอคติpapap^{a} ไม่มีใครรู้วิธีการทำเช่นนี้? ตัวอย่างเช่นเมื่อเป็นจำนวนเต็มบวกแล้วหนึ่งสามารถพลิกเหรียญครั้งและดูว่าผลลัพธ์ทั้งหมดเป็นหัว: ถ้าพวกเขาอยู่แล้วปัญหา '0' มิฉะนั้นปัญหา '1' ความยากลำบากอยู่ในความจริงที่ว่าไม่จำเป็นต้องเป็นจำนวนเต็ม นอกจากนี้ถ้าฉันรู้อคติpฉันก็สามารถสร้างเหรียญอื่นด้วยอคติที่ต้องการ aaaaaaaaappp
18 sampling 

1
รูปแบบการสุ่มตัวอย่างสำหรับข้อมูลแบบหนาแน่น
ฉันกำลังทำงานกับแอปพลิเคชันสำรวจสุขภาพแบบเปิดซึ่งวางแผนจะใช้ในประเทศกำลังพัฒนา แนวความคิดพื้นฐานคือการสัมภาษณ์แบบสำรวจนั้นเป็นเรื่องที่มีคนหนาแน่น - ดำเนินการโดยอาสาสมัครที่ไม่มีการรวบรวมข้อมูลที่ส่งแบบฟอร์มข้อมูลการสัมภาษณ์ที่พวกเขาทำโดยใช้อุปกรณ์พกพาของพวกเขาและการสำรวจแต่ละครั้ง การสำรวจแบบดั้งเดิมที่รวบรวมโดยหน่วยงานของรัฐมักจะใช้รูปแบบการสุ่มตัวอย่างแบบมาตรฐาน สิ่งนี้ต้องการการวางแผนแบบรวมศูนย์จำนวนมากที่ไม่สามารถทำได้ตลอดเวลา (กล่าวถึงสิ่งนี้เพื่อตั้งคำถามของฉันในบริบทที่ถูกต้อง) เราสามารถพูดได้ว่าอาสาสมัครจะใช้การสุ่มตัวอย่างความสะดวกสบายรอบ ๆ พื้นที่ของเขา เขาจะสัมภาษณ์คนที่เขาสามารถเข้าถึงได้โดยไม่ จำกัด จำนวน ปัญหาพื้นฐานคือ: จะเข้าใจและอธิบายรูปแบบการสุ่มตัวอย่างโดยรวมของระบบสำรวจนี้ได้อย่างไร มีวิธีการหรือแบบจำลองที่จะจัดการกับกรณีดังกล่าวหรือไม่?
18 sampling 

5
ทำไมเราไม่ใช้การแจกแจงแบบ t เพื่อสร้างช่วงความมั่นใจสำหรับสัดส่วน?
ในการคำนวณช่วงความเชื่อมั่น (CI) สำหรับค่าเฉลี่ยด้วยค่าเบี่ยงเบนมาตรฐานประชากรที่ไม่รู้จัก (sd) เราประมาณค่าเบี่ยงเบนมาตรฐานประชากรโดยใช้การแจกแจงแบบ t ยวดที่n} แต่เนื่องจากเราไม่ได้ประมาณค่าเบี่ยงเบนมาตรฐานของประชากรเราประเมินผ่านการประมาณโดยที่CI=X¯±Z95%σX¯CI=X¯±Z95%σX¯CI=\bar{X} \pm Z_{95\% }\sigma_{\bar X}σX¯=σn√σX¯=σn\sigma_{\bar X} = \frac{\sigma}{\sqrt n}CI=X¯±t95%(se)CI=X¯±t95%(se)CI=\bar{X} \pm t_{95\% }(se)se=sn√se=snse = \frac{s}{\sqrt n} ในทางตรงกันข้ามสำหรับสัดส่วนประชากรเพื่อคำนวณ CI เราประมาณว่าโดยที่ให้และCI=p^±Z95%(se)CI=p^±Z95%(se)CI = \hat{p} \pm Z_{95\% }(se)se=p^(1−p^)n−−−−−√se=p^(1−p^)nse = \sqrt\frac{\hat{p}(1-\hat{p})}{n}np^≥15np^≥15n \hat{p} \ge 15n(1−p^)≥15n(1−p^)≥15n(1-\hat{p}) \ge 15 คำถามของฉันคือทำไมเราพึงพอใจกับการกระจายมาตรฐานสำหรับสัดส่วนประชากร?

4
คำพ้องความหมาย“ ตัวอย่างสุ่ม” และ“ ตัวแปรสุ่ม iid” หรือไม่
ฉันได้รับความยากลำบากในการทำความเข้าใจความหมายของ "ตัวอย่างแบบสุ่ม" เช่นเดียวกับ "ตัวแปรแบบสุ่มของ iid" ฉันพยายามหาความหมายจากหลาย ๆ แหล่ง แต่สับสนมากขึ้นเรื่อย ๆ ฉันโพสต์ที่นี่สิ่งที่ฉันพยายามและได้รู้: ความน่าจะเป็นและสถิติของ Degroot บอกว่า: ตัวอย่างสุ่ม / IID / ตัวอย่างขนาด: พิจารณากระจายความน่าจะได้รับในบรรทัดจริงที่สามารถแสดงโดยทั้ง PF หรือไฟล์ PDF ฉได้มีการกล่าวกันว่าตัวแปรสุ่มรูปแบบตัวอย่างที่สุ่มจากการกระจายนี้ถ้าตัวแปรสุ่มเหล่านี้มีความเป็นอิสระและ PF ร่อแร่หรือ PDF ของแต่ละของพวกเขาคือฉตัวแปรสุ่มดังกล่าวถูกกล่าวถึงว่ามีความเป็นอิสระและมีการกระจายเหมือนกันโดยย่อ iid เราอ้างถึงหมายเลข n ของตัวแปรสุ่มเป็นขนาดตัวอย่างn X 1 , . . , X n ffffnnnX1,...,XnX1,...,XnX_1 , . . . , X_nfฉf แต่หนึ่งในหนังสือสถิติอื่น ๆ ที่ฉันได้พูดไป: …

1
MCMC ในพื้นที่พารามิเตอร์กระโดด?
ฉันกำลังพยายามใช้ MCMC กับปัญหา แต่นักบวชของฉัน (ในกรณีของฉันพวกเขาคือ )) ถูก จำกัด พื้นที่ ฉันสามารถใช้ MCMC ปกติและไม่สนใจตัวอย่างที่อยู่นอกเขตหวงห้าม (ซึ่งในกรณีของฉันคือ [0,1] ^ 2) นั่นคือฟังก์ชั่นการใช้การเปลี่ยนผ่านใหม่เมื่อการเปลี่ยนแปลงใหม่หลุดออกจากพื้นที่ที่ถูก จำกัดα∈[0,1],β∈[0,1]α∈[0,1],β∈[0,1]\alpha\in[0,1],\beta\in[0,1]

2
การกระจายตัวตัวอย่างจากประชากร Bernoulli สองคนที่เป็นอิสระ
สมมติว่าเรามีตัวอย่างของทั้งสองตัวแปรสุ่มอิสระ Bernoulli, Ber(θ1)Ber(θ1)\mathrm{Ber}(\theta_1)และBer(θ2)Ber(θ2)\mathrm{Ber}(\theta_2) ) เราจะพิสูจน์ได้อย่างไร(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2−−−−−−−−−−−−−−√→dN(0,1)(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2→dN(0,1)\frac{(\bar X_1-\bar X_2)-(\theta_1-\theta_2)}{\sqrt{\frac{\theta_1(1-\theta_1)}{n_1}+\frac{\theta_2(1-\theta_2)}{n_2}}}\xrightarrow{d} \mathcal N(0,1)? สมมติว่าn1≠n2n1≠n2n_1\neq n_2 2

3
สร้างคะแนนอย่างมีประสิทธิภาพระหว่างหน่วยวงกลมและหน่วยสี่เหลี่ยม
ฉันต้องการสร้างตัวอย่างจากขอบเขตสีฟ้าที่กำหนดไว้ที่นี่: โซลูชันไร้เดียงสาคือใช้การสุ่มตัวอย่างการปฏิเสธในหน่วยสี่เหลี่ยมจัตุรัส แต่ให้ประสิทธิภาพเพียง (~ 21.4%)1−π/41−π/41-\pi/4 มีวิธีที่ฉันสามารถตัวอย่างมีประสิทธิภาพมากขึ้น?

2
“ เสื้อยืดสีน้ำเงินทุกคน” เป็นตัวอย่างที่เป็นระบบหรือไม่?
ฉันกำลังสอนชั้นเรียนอินโทรและกำลังตรวจสอบประเภทของการสุ่มตัวอย่างรวมถึงการสุ่มอย่างเป็นระบบที่คุณสุ่มตัวอย่างบุคคล kth หรือวัตถุทุกคน นักเรียนถามว่าการสุ่มตัวอย่างทุกคนที่มีลักษณะเฉพาะจะทำให้สิ่งเดียวกันสำเร็จหรือไม่ ตัวอย่างเช่นการสุ่มตัวอย่างเสื้อยืดสีน้ำเงินทุกคนจะมีการสุ่มอย่างเพียงพอและเพียงพอต่อการเป็นตัวแทนของประชากรทั้งหมดหรือไม่ อย่างน้อยถ้าคุณถามคำถามอื่นนอกเหนือจาก "คุณชอบใส่เสื้อยืดสีอะไร?" ความรู้สึกของฉันไม่ใช่ แต่ฉันสงสัยว่าใครที่นี่มีความคิดเกี่ยวกับเรื่องนี้
17 sampling 

4
กำลังคำนวณขนาดตัวอย่างที่ต้องการความแม่นยำของการประมาณค่าความแปรปรวน?
พื้นหลัง ฉันมีตัวแปรที่มีการแจกแจงที่ไม่รู้จัก ฉันมีตัวอย่าง 500 ตัวอย่าง แต่ฉันต้องการแสดงความแม่นยำที่ฉันสามารถคำนวณความแปรปรวนได้เช่นเพื่อยืนยันว่าขนาดตัวอย่าง 500 เพียงพอ ฉันสนใจยังอยู่ในรู้ขนาดของกลุ่มตัวอย่างขั้นต่ำที่จะต้องประเมินความแปรปรวนที่มีความแม่นยำของ\%X%X%X\% คำถาม ฉันจะคำนวณได้อย่างไร ความแม่นยำของการประมาณค่าความแปรปรวนของฉันมีขนาดตัวอย่างเป็นหรือไม่ ของ ?n=500n=500n=500n=Nn=Nn=N ฉันจะคำนวณจำนวนตัวอย่างขั้นต่ำที่จำเป็นในการประมาณค่าความแปรปรวนด้วยความแม่นยำอย่างไรXXX ตัวอย่าง รูปที่ 1 การประมาณความหนาแน่นของพารามิเตอร์อ้างอิงจาก 500 ตัวอย่าง รูปที่ 2นี่คือพล็อตของขนาดตัวอย่างบนแกน x เทียบกับค่าประมาณความแปรปรวนบนแกน y ที่ฉันคำนวณโดยใช้ชุดย่อยจากตัวอย่าง 500 ความคิดคือการประมาณจะมาบรรจบกับความแปรปรวนจริงเมื่อ n เพิ่มขึ้น . อย่างไรก็ตามการประมาณการไม่ถูกต้องเนื่องจากตัวอย่างที่ใช้ในการประมาณความแปรปรวนสำหรับไม่ได้เป็นอิสระจากกันหรือตัวอย่างที่ใช้ในการคำนวณความแปรปรวนที่n ∈ [ 20 , 40 , 80 ]n∈[10,125,250,500]n∈[10,125,250,500]n \in [10,125,250,500]n∈[20,40,80]n∈[20,40,80]n\in [20,40,80]

3
การประมาณค่ามัธยฐานของค่ามัธยฐาน
สมมติว่าเรามีตัวแปรสุ่มXXXสนับสนุนบน[0,1][0,1][0,1]ซึ่งเราสามารถวาดตัวอย่างได้ เราจะหาค่ามัธยฐานของเป็นกลางได้XXXอย่างไร แน่นอนว่าเราสามารถสร้างกลุ่มตัวอย่างและใช้ค่ามัธยฐานตัวอย่างได้ แต่ฉันเข้าใจว่าสิ่งนี้จะไม่เอนเอียงโดยทั่วไป หมายเหตุ: คำถามนี้เกี่ยวข้อง แต่ไม่เหมือนกันกับคำถามสุดท้ายของฉันซึ่งในกรณีXXXสามารถสุ่มตัวอย่างได้ประมาณเท่านั้น
16 sampling 

1
การสร้างตัวอย่างแบบสุ่มจากการแจกแจงที่กำหนดเอง
ฉันกำลังพยายามสร้างตัวอย่างแบบสุ่มจาก pdf ที่กำหนดเองโดยใช้ R. ไฟล์ของฉันคือ: fX(x)=32(1−x2),0≤x≤1fX(x)=32(1−x2),0≤x≤1f_{X}(x) = \frac{3}{2} (1-x^2), 0 \le x \le 1 ฉันสร้างตัวอย่างที่เหมือนกันแล้วลองแปลงเป็นการแจกแจงแบบกำหนดเองของฉัน ฉันไม่นี้โดยการหา CDF ของการกระจายของฉัน ( FX(x)FX(x)F_{X}(x) ) และการตั้งค่าให้ตัวอย่างเครื่องแบบ ( ยูยูu ) และการแก้สำหรับxxxx FX(x)=Pr[X≤x]=∫x032(1−y2)dy=32(x−x33)FX(x)=Pr[X≤x]=∫0x32(1−y2)dy=32(x−x33) F_{X}(x) = \Pr[X \le x] = \int_{0}^{x} \frac{3}{2} (1-y^2) dy = \frac{3}{2} (x - \frac{x^3}{3}) ในการสร้างตัวอย่างแบบสุ่มที่มีการแจกแจงข้างต้นให้หาตัวอย่างแบบสม่ำเสมอu∈[0,1]u∈[0,1]u \in[0,1]และหาค่าxxxใน32(x−x33)=u32(x−x33)=u\frac{3}{2} (x - \frac{x^3}{3}) = u ฉันใช้งานRและไม่ได้รับการกระจายที่คาดหวัง …
16 r  sampling  uniform 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.