คำถามติดแท็ก simulation

พื้นที่กว้างใหญ่ซึ่งรวมถึงการสร้างผลลัพธ์จากแบบจำลองคอมพิวเตอร์


2
เหตุใดจึงจำเป็นต้องสุ่มตัวอย่างจากการแจกแจงหลังถ้าเรารู้การกระจายตัวหลังแล้ว?
ความเข้าใจของฉันคือเมื่อใช้วิธีการแบบเบย์เพื่อประเมินค่าพารามิเตอร์: การกระจายหลังคือการรวมกันของการกระจายก่อนหน้าและการกระจายโอกาส เราจำลองสิ่งนี้โดยการสร้างตัวอย่างจากการแจกแจงด้านหลัง (เช่นการใช้อัลกอริทึม Metropolis-Hasting เพื่อสร้างค่าและยอมรับถ้าพวกเขาอยู่เหนือขีดจำกัดความน่าจะเป็นที่แน่นอนที่จะเป็นของการแจกแจงหลัง) เมื่อเราสร้างตัวอย่างนี้เราจะใช้มันเพื่อประมาณการกระจายตัวของหลังและสิ่งต่าง ๆ เช่นค่าเฉลี่ย แต่ฉันรู้สึกว่าฉันต้องเข้าใจผิดบางอย่าง ดูเหมือนว่าเรามีการแจกแจงด้านหลังแล้วสุ่มตัวอย่างจากนั้นใช้ตัวอย่างนั้นเป็นค่าประมาณของการแจกแจงหลัง แต่ถ้าเรามีการกระจายด้านหลังเพื่อเริ่มต้นด้วยเหตุใดเราจึงต้องสุ่มตัวอย่างจากมันถึงค่าประมาณ

3
วิธีจำลองข้อมูลให้มีนัยสำคัญทางสถิติได้อย่างไร
ฉันอยู่เกรด 10 และฉันต้องการจำลองข้อมูลสำหรับโครงงานวิทยาศาสตร์การเรียนรู้ของเครื่อง ตัวแบบสุดท้ายจะใช้กับข้อมูลผู้ป่วยและจะทำนายความสัมพันธ์ระหว่างช่วงเวลาของสัปดาห์และผลกระทบที่มีต่อการรับประทานยาอย่างสม่ำเสมอภายในข้อมูลของผู้ป่วยรายเดียว ค่าการยึดมั่นจะเป็นเลขฐานสอง (0 หมายถึงพวกเขาไม่ได้ทานยา 1 หมายถึงพวกเขา) ฉันกำลังมองหาที่จะสร้างรูปแบบการเรียนรู้ของเครื่องซึ่งสามารถเรียนรู้จากความสัมพันธ์ระหว่างเวลาของสัปดาห์และแยกสัปดาห์ออกเป็นช่วงเวลา 21 ช่วงเวลาสามสัปดาห์ในแต่ละวัน (1 คือเช้าวันจันทร์ 2 วันจันทร์เป็นวันจันทร์ ฯลฯ ) ฉันต้องการจำลองข้อมูลผู้ป่วย 1,000 ราย ผู้ป่วยแต่ละรายจะมีข้อมูล 30 สัปดาห์ ฉันต้องการแทรกแนวโน้มบางอย่างที่เกี่ยวข้องกับช่วงเวลาหนึ่งสัปดาห์และยึดมั่น ตัวอย่างเช่น, ในชุดข้อมูลเดียวฉันอาจพูดได้ว่าช่วงเวลา 7 ของสัปดาห์มีความสัมพันธ์อย่างมีนัยสำคัญทางสถิติกับการยึดมั่น เพื่อให้ฉันตัดสินใจได้ว่าความสัมพันธ์นั้นมีนัยสำคัญทางสถิติหรือไม่ฉันต้องทำการทดสอบสองตัวอย่าง t-test เปรียบเทียบหนึ่งช่วงเวลากับแต่ละช่วงเวลาอื่น ๆ และให้แน่ใจว่าค่านัยสำคัญน้อยกว่า 0.05 อย่างไรก็ตามแทนที่จะเลียนแบบข้อมูลของฉันเองและตรวจสอบว่าแนวโน้มที่ฉันแทรกมีความสำคัญหรือไม่ฉันจะทำงานไปข้างหลังและอาจใช้โปรแกรมที่ฉันสามารถขอให้กำหนดช่วงเวลาหนึ่งให้กับแนวโน้มที่สำคัญด้วยการยึดมั่นและจะกลับมา ข้อมูลเลขฐานสองที่บรรจุอยู่ในแนวโน้มที่ฉันขอและยังเป็นข้อมูลไบนารีสำหรับช่วงเวลาอื่น ๆ ที่มีเสียงดังบ้าง แต่ไม่ได้สร้างแนวโน้มที่มีนัยสำคัญทางสถิติ มีโปรแกรมใดบ้างที่สามารถช่วยให้ฉันประสบความสำเร็จเช่นนี้ หรือบางทีโมดูลหลาม? ความช่วยเหลือใด ๆ (แม้ความคิดเห็นทั่วไปในโครงการของฉัน) จะได้รับการชื่นชมอย่างมาก !!

3
Negative-binomial GLM เทียบกับการเปลี่ยนแปลงการบันทึกสำหรับข้อมูลนับ: เพิ่มอัตราความผิดพลาด Type I
คุณบางคนอาจจะอ่านบทความนี้ดี: O'Hara RB, Kotze DJ (2010) อย่าบันทึกข้อมูลการนับการแปลง วิธีการทางนิเวศวิทยาและวิวัฒนาการ 1: 118–122 Klick ในสาขาการวิจัยของฉัน (นิเวศน์วิทยา) เรากำลังจัดการกับการทดลองที่ทำซ้ำแบบไม่ดีและ GLM ไม่ได้ใช้กันอย่างแพร่หลาย ดังนั้นฉันจึงทำการจำลองที่คล้ายกันกับ O'Hara & Kotze (2010) แต่เลียนแบบข้อมูลนิเวศน์วิทยา พลังงานจำลอง : ฉันจำลองข้อมูลจากการออกแบบแบบแฟกทอเรียลด้วยกลุ่มควบคุมหนึ่งกลุ่ม ( ) และกลุ่มการรักษา 5 กลุ่ม ( ) ความอุดมสมบูรณ์ในการรักษา 1 เหมือนกับการควบคุม ( ) ความอุดมสมบูรณ์ในการรักษา 2-5 คือครึ่งหนึ่งของความอุดมสมบูรณ์ในการควบคุม ( \ mu_ {2-5} = 0.5 \ mu_c ) สำหรับแบบจำลองฉันเปลี่ยนขนาดตัวอย่าง …

1
, จำลองสถานการณ์ในช่วงการพยากรณ์
ฉันมีข้อมูลอนุกรมเวลาและฉันใช้เป็นโมเดลเพื่อให้พอดีกับข้อมูล เอ็กซ์ทีเป็นตัวบ่งชี้ตัวแปรสุ่มที่เป็นทั้ง 0 (เมื่อฉันไม่เห็นเหตุการณ์ที่ยาก) หรือ 1 (เมื่อฉันเห็นเหตุการณ์ที่หายาก) จากการสังเกตก่อนหน้านี้ที่ฉันมีสำหรับX tฉันสามารถพัฒนาแบบจำลองสำหรับX tโดยใช้วิธีการแบบ Variable Length Markov Chain สิ่งนี้ทำให้ฉันสามารถจำลองX tตลอดช่วงเวลาการพยากรณ์และให้ลำดับของศูนย์และอัน เนื่องจากนี่เป็นเหตุการณ์ที่หายากฉันจะไม่เห็นARIMA(p,d,q)+XtARIMA(p,d,q)+XtARIMA(p,d,q)+X_tXtXtX_tXtXtX_tXtXtX_tXtXtX_tXt=1Xt=1X_t=1 บ่อยครั้ง ฉันสามารถคาดการณ์และได้รับการคาดการณ์ช่วงเวลาที่อยู่บนพื้นฐานของค่าจำลองสำหรับที XtXtX_t คำถาม: ฉันจะพัฒนาขั้นตอนการจำลองที่มีประสิทธิภาพที่จะคำนึงถึงการเกิดขึ้นของ 1 ในจำลองในช่วงคาดการณ์หรือไม่ ฉันต้องได้รับค่าเฉลี่ยและช่วงการพยากรณ์ XtXtX_t ความน่าจะเป็นของการสังเกต 1 นั้นน้อยเกินไปสำหรับฉันที่จะคิดว่าการจำลองแบบมอนติคาร์โลปกติจะทำงานได้ดีในกรณีนี้ บางทีฉันสามารถใช้“ การสุ่มตัวอย่างที่สำคัญ” แต่ฉันไม่แน่ใจอย่างแน่นอน ขอขอบคุณ.

1
การสุ่มตัวอย่างตัวอย่างด้วย MLE ที่กำหนด
คำถามนี้รอการตรวจสอบถามเกี่ยวกับการเลียนแบบตามเงื่อนไขที่กลุ่มตัวอย่างที่มีผลรวมคงที่ทำให้ผมนึกถึงชุดปัญหาให้ฉันโดยจอร์จ Casella f(x|θ)f(x|θ)f(x|\theta)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θθ\thetaθ^(x1,…,xn)=argmin∑i=1nlogf(xi|θ)θ^(x1,…,xn)=arg⁡min∑i=1nlog⁡f(xi|θ)\hat{\theta}(x_1,\ldots,x_n)=\arg\min \sum_{i=1}^n \log f(x_i|\theta)θθ\theta θ (X1,...,Xn)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θ^(X1,…,Xn)θ^(X1,…,Xn)\hat{\theta}(X_1,\ldots,X_n) ตัวอย่างเช่นใช้การแจกแจงด้วยพารามิเตอร์ตำแหน่งซึ่งความหนาแน่นคือถ้าเราจะจำลองเงื่อนไข(X_1, \ ldots, X_n)บน\ hat {\ mu} (X_1, \ ldots, X_n) = \ mu_0 ได้อย่างไร? ในตัวอย่าง\ mathfrak {T} _5นี้การกระจายของ\ hat {\ mu} (X_1, \ ldots, X_n)ไม่มีนิพจน์แบบปิดT5T5\mathfrak{T}_5μμ\mu (X1,...,Xn) IID ~ F(x|μ)(X1,...,Xn) μ (X1,...,Xn)=μ0 T 5 μ (X1ฉ( x | μ ) = Γ …

2
ความเป็นอิสระของสารตกค้างในการทดสอบ / จำลองทางคอมพิวเตอร์?
ฉันทำการประเมินทางคอมพิวเตอร์โดยใช้วิธีการที่แตกต่างกันของการปรับแบบจำลองที่ใช้ในวิทยาศาสตร์ Palaeo ฉันมีชุดฝึกอบรมแบบ ish ขนาดใหญ่ดังนั้นฉันจึงสุ่ม (ชุดชั้นในแบบสุ่มแบ่งชั้น) แล้ววางชุดทดสอบ ผมติดตั้งวิธีการแตกต่างกันไปตัวอย่างการฝึกอบรมชุดและการใช้ม.ส่งผลให้รูปแบบที่ผมคาดการตอบสนองสำหรับตัวอย่างการทดสอบชุดและคำนวณ RMSEP มากกว่ากลุ่มตัวอย่างที่อยู่ในชุดทดสอบ นี้เป็นหนึ่งในการทำงานม.ม.mม.ม.m ฉันทำกระบวนการนี้ซ้ำหลายครั้งทุกครั้งที่ฉันเลือกชุดฝึกอบรมที่แตกต่างกันโดยการสุ่มตัวอย่างชุดทดสอบใหม่ หลังจากทำสิ่งนี้แล้วฉันต้องการตรวจสอบว่าวิธีใดวิธีมีประสิทธิภาพ RMSEP ที่ดีขึ้นหรือแย่ลง ฉันต้องการเปรียบเทียบวิธีการจับคู่แบบฉลาด ๆม.ม.m วิธีการของฉันได้รับเพื่อให้พอดีกับผลกระทบที่ผสม (LME) รูปแบบเชิงเส้นที่มีผลกระทบสุ่มเดียวสำหรับการเรียกใช้ ฉันใช้lmer()จากแพ็คเกจlme4เพื่อให้พอดีกับรุ่นและฟังก์ชั่นของฉันจากแพ็คเกจmultcompเพื่อทำการเปรียบเทียบหลายอย่าง แบบจำลองของฉันเป็นหลัก lmer(RMSEP ~ method + (1 | Run), data = FOO) ที่methodบ่งชี้วิธีการที่ถูกนำมาใช้ในการสร้างแบบจำลองพยากรณ์สำหรับชุดทดสอบและRunเป็นตัวบ่งชี้สำหรับแต่ละโดยเฉพาะอย่างยิ่งการเรียกของ "ทดลอง" ของฉัน คำถามของฉันเกี่ยวกับส่วนที่เหลือของ LME ให้ผลแบบสุ่มเดียวสำหรับRunฉันสมมติว่าค่า RMSEP สำหรับการทำงานนั้นมีความสัมพันธ์กับระดับหนึ่ง แต่ไม่เกี่ยวข้องระหว่างการวิ่งบนพื้นฐานของความสัมพันธ์ที่ชักนำให้เกิดผลแบบสุ่ม ข้อสันนิษฐานเกี่ยวกับความเป็นอิสระระหว่างการรันนี้มีผลหรือไม่? หากไม่มีวิธีที่จะอธิบายสิ่งนี้ในโมเดล LME หรือฉันควรมองหาการวิเคราะห์ทางสถิติประเภทอื่นเพื่อตอบคำถามของฉัน?

1
การกระจายแบบไม่สม่ำเสมอของค่า p เมื่อจำลองการทดสอบทวินามภายใต้สมมติฐานว่าง
ฉันได้ยินมาว่าภายใต้สมมติฐานว่างการกระจาย p-value ควรเหมือนกัน อย่างไรก็ตามการจำลองการทดสอบแบบทวินามใน MATLAB กลับมีการแจกแจงที่แตกต่างกันมากจากชุดที่มีค่าเฉลี่ยมากกว่า 0.5 (0.518 ในกรณีนี้): coin = [0 1]; success_vec = nan(20000,1); for i = 1:20000 success = 0; for j = 1:200 success = success + coin(randperm(2,1)); end success_vec(i) = success; end p_vec = binocdf(success_vec,200,0.5); hist(p_vec); พยายามเปลี่ยนวิธีการที่ฉันสร้างตัวเลขสุ่มไม่ได้ช่วย ฉันขอขอบคุณคำอธิบายที่นี่จริงๆ

1
การรวมตัวของมหานคร - เฮสติ้งส์ - ทำไมกลยุทธ์ของฉันจึงไม่ทำงาน
สมมติว่าฉันมีฟังก์ชั่นที่ฉันต้องการรวม แน่นอนสมมติว่าไปที่ศูนย์ที่จุดสิ้นสุดไม่มีการระเบิดฟังก์ชันที่ดี วิธีหนึ่งที่ฉันได้รับการเล่นซอกับคือการใช้อัลกอริทึม Metropolis-เฮสติ้งส์เพื่อสร้างรายการของตัวอย่างจากการกระจายสัดส่วนการซึ่งจะหายไปอย่างต่อเนื่องการฟื้นฟู ซึ่งฉันจะเรียกแล้วคำนวณสถิติf (x)บนxเหล่านี้: g(x)g(x)g(x)∫∞−∞g(x)dx.∫−∞∞g(x)dx. \int_{-\infty}^\infty g(x) dx.g(x)g(x)g(x)x1,x2,…,xnx1,x2,…,xnx_1, x_2, \dots, x_ng(x)g(x)g(x)N=∫∞−∞g(x)dxN=∫−∞∞g(x)dxN = \int_{-\infty}^{\infty} g(x)dx p(x)p(x)p(x)f(x)f(x)f(x)xxx1n∑i=0nf(xi)≈∫∞−∞f(x)p(x)dx.1n∑i=0nf(xi)≈∫−∞∞f(x)p(x)dx. \frac{1}{n} \sum_{i=0}^n f(x_i) \approx \int_{-\infty}^\infty f(x)p(x)dx. ตั้งแต่p(x)=g(x)/Np(x)=g(x)/Np(x) = g(x)/Nฉันสามารถแทนที่f(x)=U(x)/g(x)f(x)=U(x)/g(x)f(x) = U(x)/g(x)เพื่อยกเลิกgggจากอินทิกรัลส่งผลให้เกิดการแสดงออกของรูปแบบ 1N∫∞−∞U(x)g(x)g(x)dx=1N∫∞−∞U(x)dx.1N∫−∞∞U(x)g(x)g(x)dx=1N∫−∞∞U(x)dx. \frac{1}{N}\int_{-\infty}^{\infty}\frac{U(x)}{g(x)} g(x) dx = \frac{1}{N}\int_{-\infty}^\infty U(x) dx. ดังนั้นหากU(x)U(x)U(x)รวมกับ111ตามภูมิภาคนั้นฉันควรได้ผลลัพธ์1/N1/N1/Nซึ่งฉันสามารถเอาส่วนกลับซึ่งกันและกันเพื่อได้คำตอบที่ฉันต้องการ ดังนั้นฉันสามารถใช้ช่วงของตัวอย่างของฉัน (เพื่อใช้คะแนนอย่างมีประสิทธิภาพมากที่สุด) r=xmax−xminr=xmax−xminr = x_\max - x_\min และให้U(x)=1/rU(x)=1/rU(x) = 1/rสำหรับแต่ละตัวอย่างที่ฉันวาด ด้วยวิธีนี้U(x)U(x)U(x)หาค่าเป็นศูนย์นอกขอบเขตที่ตัวอย่างของฉันไม่ได้ แต่รวมกับ111ในพื้นที่นั้น ดังนั้นถ้าฉันเอาค่าที่คาดหวังมาฉันควรได้รับ: …

2
อะไรจะเป็นตัวอย่างของแบบจำลองที่เรียบง่ายและมีโอกาสเป็นไปไม่ได้?
ตัวอย่างการคำนวณแบบเบย์เป็นเทคนิคเจ๋งจริงๆสำหรับกระชับพื้นรูปแบบใดสุ่มไว้สำหรับรุ่นที่น่าจะเป็นว่ายาก (พูด, คุณสามารถลิ้มลองจากแบบจำลองถ้าคุณแก้ไขพารามิเตอร์ แต่คุณไม่สามารถตัวเลขอัลกอริทึมหรือการวิเคราะห์คำนวณความเป็นไปได้) เมื่อแนะนำการคำนวณแบบเบย์โดยประมาณ (ABC) ให้กับผู้ชมเป็นเรื่องดีที่จะใช้แบบจำลองตัวอย่างที่เรียบง่าย แต่ก็ยังน่าสนใจอยู่บ้างและมีความเป็นไปได้ยาก อะไรจะเป็นตัวอย่างที่ดีของแบบจำลองง่ายๆที่ยังมีโอกาสที่ดื้อดึง?

1
วิธีการจำลองจากแบบเกาส์เกาส์?
สมมติว่าฉันมีการแจกแจงมาร์จิ้นที่ไม่แปรผันสองค่ากล่าวว่าFFFและGGGซึ่งฉันสามารถจำลองได้ ตอนนี้สร้างร่วมกันจำหน่ายของตนโดยใช้เชื่อม Gaussianชี้แนะC(F,G;Σ)C(F,G;Σ)C(F,G;\Sigma) ) ทราบพารามิเตอร์ทั้งหมด มีวิธีการที่ไม่ใช่ MCMC สำหรับการจำลองจาก copula นี้หรือไม่?

3
มีวิธีการทั่วไปในการจำลองข้อมูลจากสูตรหรือการวิเคราะห์หรือไม่?
การจำลองข้อมูลจากกรอบข้อมูลการออกแบบการทดลอง ด้วยการมุ่งเน้นไปที่ R (แม้ว่าภาษาอื่น ๆ จะดีมาก) ในการออกแบบการทดสอบหรือการสำรวจการจำลองข้อมูลและการวิเคราะห์ข้อมูลจำลองนี้สามารถให้ข้อมูลเชิงลึกที่ยอดเยี่ยมเกี่ยวกับข้อดีและจุดอ่อนของการออกแบบ วิธีการดังกล่าวยังเป็นสิ่งจำเป็นต่อความเข้าใจและการใช้การทดสอบทางสถิติที่เหมาะสม อย่างไรก็ตามกระบวนการนี้มีแนวโน้มที่จะค่อนข้างน่าเบื่อและหลายคนถูกพาข้ามขั้นตอนสำคัญนี้ในการทดสอบหรือสำรวจ แบบจำลองทางสถิติและการทดสอบมีข้อมูลส่วนใหญ่ที่จำเป็นในการจำลองข้อมูล (รวมถึงข้อสันนิษฐานหรือคำสั่งที่ชัดเจนของการกระจาย) ด้วยรูปแบบการวิเคราะห์ (และสมมติฐานที่เกี่ยวข้องเช่นความเป็นปกติและความสมดุล) ระดับของปัจจัยและการวัดความสำคัญ (เช่น p-value) ฉันต้องการได้รับข้อมูลจำลอง (ในอุดมคติที่มีฟังก์ชันทั่วไปคล้าย พิมพ์ (), คาดการณ์ (), จำลอง ()) เป็นกรอบการจำลองแบบทั่วไปที่เป็นไปได้หรือไม่? ถ้าเป็นเช่นนั้นกรอบดังกล่าวสามารถใช้ได้ในปัจจุบัน? ตัวอย่างฉันต้องการฟังก์ชั่นเช่น: sim(aov(response~factor1+factor2*factor3), p.values=list(factor1=0.05, factor2=0.05, factor3=0.50, factor2:factor3=0.05), levels=list(factor1=1:10, factor2=c("A", "B", "C"), factor3=c("A", "B", "C"))) เช่นเวอร์ชันทั่วไปของ: sim.lm<-function(){ library(DoE.base) design<-fac.design(nlevels=c(10,3,3), factor.names=c("factor1", "factor2", "factor3"), replications=3, randomize=F) response<-with(design, as.numeric(factor1)+ …

1
ข้อได้เปรียบของ Box-Muller ผ่านวิธี CDF สำหรับการจำลองการแจกแจงแบบปกติ?
เพื่อจำลองการแจกแจงแบบปกติจากชุดของตัวแปรเครื่องแบบมีหลายเทคนิค: อัลกอริธึม Box-Mullerซึ่งหนึ่งตัวอย่างสองชุดอิสระที่เป็นอิสระแตกต่างกันใน(0,1)(0,1)(0,1)และแปลงพวกเขาเป็นสองแจกแจงปกติมาตรฐานอิสระผ่าน: Z0=−2lnU1−−−−−−√cos(2πU0)Z1=−2lnU1−−−−−−√sin(2πU0)Z0=−2lnU1cos(2πU0)Z1=−2lnU1sin(2πU0) Z_0 = \sqrt{-2\text{ln}U_1}\text{cos}(2\pi U_0)\\ Z_1 = \sqrt{-2\text{ln}U_1}\text{sin}(2\pi U_0) วิธีการ CDFซึ่งหนึ่งสามารถถือเอา cdfให้เท่ากับชุดรูปแบบ: และสืบทอด F ( Z ) = U Z = F - 1 ( U )(F(Z))(F(Z))(F(Z))F(Z)=UF(Z)=U F(Z) = U Z=F−1(U)Z=F−1(U)Z = F^{-1}(U) คำถามของฉันคือ: ซึ่งคำนวณได้มีประสิทธิภาพมากขึ้น? ฉันคิดว่ามันเป็นวิธีหลัง - แต่เอกสารส่วนใหญ่ที่ฉันอ่านใช้ Box-Muller - ทำไม ข้อมูลเพิ่มเติม: การผกผันของ CDF ปกติรู้และได้รับจาก: F−1(Z)=2–√erf−1(2Z−1),Z∈(0,1).F−1(Z)=2erf−1⁡(2Z−1),Z∈(0,1).F^{-1}(Z)\; =\; …

2
จำลองการดึงจากการกระจายแบบสม่ำเสมอโดยใช้การดึงจากการแจกแจงแบบปกติ
ฉันเพิ่งซื้อแหล่งข้อมูลการสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูลซึ่งมีหนึ่งในคำถามที่น่าจะเป็นดังนี้: ที่ได้รับมาจากการแจกแจงปกติพร้อมพารามิเตอร์ที่รู้จักกันคุณจะจำลองการดึงจากการแจกแจงแบบสม่ำเสมอได้อย่างไร? กระบวนการคิดดั้งเดิมของฉันคือว่าสำหรับตัวแปรสุ่มแบบแยกเราสามารถแบ่งการแจกแจงแบบปกติออกเป็นส่วนย่อยที่ไม่ซ้ำกัน K โดยแต่ละส่วนย่อยมีพื้นที่เท่ากันภายใต้เส้นโค้งปกติ จากนั้นเราสามารถกำหนดได้ว่าค่า K ใดที่ตัวแปรใช้โดยการจดจำพื้นที่ของส่วนโค้งปกติที่ตัวแปรนั้นสิ้นสุดลง แต่สิ่งนี้จะใช้ได้เฉพาะกับตัวแปรสุ่มแบบแยกเท่านั้น ฉันได้ทำการวิจัยเกี่ยวกับวิธีที่เราอาจทำแบบเดียวกันกับตัวแปรสุ่มต่อเนื่อง แต่น่าเสียดายที่ฉันสามารถค้นหาเทคนิคเช่นการสุ่มตัวอย่างการแปลงผกผันที่จะใช้เป็นอินพุตตัวแปรสุ่มแบบสม่ำเสมอและสามารถส่งออกตัวแปรสุ่มจากการกระจายอื่น ๆ ฉันคิดว่าบางทีเราสามารถทำกระบวนการนี้ในทางกลับกันเพื่อให้ได้ตัวแปรสุ่มที่เหมือนกัน? ฉันยังคิดว่าอาจใช้ตัวแปรสุ่มแบบปกติเป็นอินพุตในเครื่องกำเนิดไฟฟ้าเชิงเส้นเชิงเส้น แต่ฉันไม่แน่ใจว่าสิ่งนี้จะได้ผลหรือไม่ มีความคิดเกี่ยวกับวิธีที่ฉันอาจเข้าหาคำถามนี้หรือไม่?

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.