คำถามติดแท็ก random-generation

การกระทำของการสร้างลำดับของตัวเลขหรือสัญลักษณ์แบบสุ่มหรือ (เกือบตลอด) หลอกแบบสุ่ม; เช่นไม่มีการคาดการณ์หรือรูปแบบใด ๆ

8
สร้างตัวแปรสุ่มที่มีความสัมพันธ์ที่กำหนดไว้กับตัวแปรที่มีอยู่
สำหรับการศึกษาการจำลองฉันต้องสร้างตัวแปรสุ่มที่แสดง prefined (ประชากร) ความสัมพันธ์กับตัวแปรที่มีอยู่YYYY ฉันดูในRแพ็คเกจcopulaและCDVineสามารถสร้างการแจกแจงหลายตัวแปรแบบสุ่มด้วยโครงสร้างการพึ่งพาที่กำหนด อย่างไรก็ตามเป็นไปไม่ได้ที่จะแก้ไขหนึ่งในตัวแปรที่เป็นผลลัพธ์ของตัวแปรที่มีอยู่ ความคิดและลิงก์ไปยังฟังก์ชั่นที่มีอยู่นั้นได้รับการชื่นชม! สรุป: คำตอบที่ถูกต้องสองคำขึ้นมาพร้อมกับโซลูชันที่แตกต่าง: R สคริปต์โดย Caracal ซึ่งจะคำนวณตัวแปรสุ่มกับที่แน่นอน (ตัวอย่าง) ความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า R ฟังก์ชั่นฉันพบตัวเองซึ่งจะคำนวณตัวแปรสุ่มที่มีการกำหนดประชากรความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า [@ttnphns 'นอกจากนี้: ฉันใช้เสรีภาพในการขยายชื่อคำถามจากกรณีตัวแปรคงที่เดียวเป็นจำนวนคงที่ของตัวแปรคงที่; เช่นวิธีการสร้างตัวแปรที่มีคอร์เรชั่นที่กำหนดไว้ล่วงหน้าพร้อมกับตัวแปรคงที่บางตัวที่มีอยู่]

7
วิธีการสร้างจุดกระจายอย่างสม่ำเสมอบนพื้นผิวของทรงกลม 3 มิติหน่วย?
ฉันสงสัยว่าจะสร้างจุดกระจายอย่างสม่ำเสมอบนพื้นผิวของทรงกลมหน่วย 3 มิติได้อย่างไร? หลังจากสร้างจุดเหล่านี้แล้ววิธีที่ดีที่สุดในการมองเห็นและตรวจสอบว่ามีความสม่ำเสมอบนพื้นผิวx2+ y2+ z2= 1x2+y2+z2=1x^2+y^2+z^2=1หรือไม่

11
เครื่องมือพัฒนาสมอง: จะสร้างจำนวนเต็ม 7 จำนวนด้วยความน่าจะเป็นที่เท่าเทียมกันโดยใช้เหรียญลำเอียงที่มี pr (หัว) = p อย่างไร
นี่เป็นคำถามที่ฉันพบในGlassdoor : เราสร้างจำนวนเต็ม 7 ตัวที่มีความน่าจะเป็นเท่ากันในการใช้เหรียญที่มีอย่างไรP r ( หัวหน้า) = p ∈ ( 0 , 1 )Pr(Head)=p∈(0,1)\mathbb{Pr}(\text{Head}) = p\in(0,1) โดยทั่วไปคุณมีเหรียญที่อาจจะใช่หรือไม่ยุติธรรมและนี่เป็นกระบวนการสร้างเลขสุ่มเพียงตัวเดียวที่คุณมีดังนั้นเกิดขึ้นกับตัวสร้างตัวเลขสุ่มที่แสดงจำนวนเต็มตั้งแต่ 1 ถึง 7 โดยที่ความน่าจะเป็นที่จะได้จำนวนเต็มแต่ละตัว คือ 1/7 ประสิทธิภาพของกระบวนการสร้างข้อมูล

8
วิธีจำลองข้อมูลที่เป็นไปตามข้อ จำกัด เฉพาะเช่นมีค่าเฉลี่ยเฉพาะและค่าเบี่ยงเบนมาตรฐาน
คำถามนี้กระตุ้นโดยคำถามของฉันในการวิเคราะห์อภิมาน แต่ฉันคิดว่ามันจะมีประโยชน์ในการสอนบริบทที่คุณต้องการสร้างชุดข้อมูลที่สะท้อนชุดข้อมูลที่มีอยู่เดิม ฉันรู้วิธีสร้างข้อมูลแบบสุ่มจากการแจกแจงที่กำหนด ตัวอย่างเช่นถ้าฉันอ่านเกี่ยวกับผลลัพธ์ของการศึกษาที่มี: ค่าเฉลี่ย 102 ค่าเบี่ยงเบนมาตรฐานเท่ากับ 5.2 และ ขนาดตัวอย่าง 72 ฉันสามารถสร้างข้อมูลที่คล้ายกันโดยใช้rnormใน R ตัวอย่างเช่น set.seed(1234) x <- rnorm(n=72, mean=102, sd=5.2) แน่นอนค่าเฉลี่ยและ SD จะไม่เท่ากับ 102 และ 5.2 ตามลำดับ: round(c(n=length(x), mean=mean(x), sd=sd(x)), 2) ## n mean sd ## 72.00 100.58 5.25 โดยทั่วไปฉันสนใจที่จะจำลองข้อมูลที่เป็นไปตามข้อ จำกัด ในกรณีข้างต้นค่าคงที่คือขนาดตัวอย่างค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน ในกรณีอื่น ๆ อาจมีข้อ จำกัด เพิ่มเติม ตัวอย่างเช่น, ขั้นต่ำและสูงสุดในข้อมูลหรือตัวแปรพื้นฐานอาจเป็นที่รู้จัก ตัวแปรอาจทราบว่าใช้กับค่าจำนวนเต็มเท่านั้นหรือเฉพาะค่าที่ไม่เป็นลบ …

4
จะสร้างตัวเลขสุ่มที่มีความสัมพันธ์กันอย่างไร (ให้หมายถึงผลต่างและระดับความสัมพันธ์)
ฉันขอโทษถ้ามันดูธรรมดาไปหน่อย แต่ฉันคิดว่าฉันแค่ต้องการยืนยันความเข้าใจที่นี่ ฉันเข้าใจว่าฉันต้องทำสิ่งนี้ในสองขั้นตอนและฉันก็เริ่มพยายามฝึกความสัมพันธ์ แต่ก็เริ่มดูเหมือนจะเกี่ยวข้องจริงๆ ฉันกำลังมองหาคำอธิบายที่กระชับ (นึกคิดด้วยคำแนะนำต่อการแก้ปัญหา pseudocode) ของวิธีที่ดีและรวดเร็วในการสร้างตัวเลขสุ่มที่สัมพันธ์กัน ด้วยความสูงและน้ำหนักของตัวแปรเทียมสองตัวที่มีความหมายและความแปรปรวนที่รู้จักกันและความสัมพันธ์ที่กำหนดฉันคิดว่าฉันพยายามเข้าใจว่าขั้นตอนที่สองนี้ควรเป็นอย่างไร height = gaussianPdf(height.mean, height.variance) weight = gaussianPdf(correlated_mean(height.mean, correlation_coefficient), correlated_variance(height.variance, correlation_coefficient)) ฉันจะคำนวณค่าเฉลี่ยและความแปรปรวนได้อย่างไร แต่ฉันต้องการยืนยันว่านี่เป็นปัญหาที่เกี่ยวข้องจริงๆที่นี่ ฉันจำเป็นต้องใช้วิธีจัดการกับเมทริกซ์หรือไม่? หรือฉันมีสิ่งอื่นที่ผิดปกติมากในแนวทางพื้นฐานของปัญหานี้

5
ตัวเลขสุ่มชุดปลอม: กระจายอย่างเท่าเทียมกันมากกว่าข้อมูลชุดที่แท้จริง
ฉันกำลังมองหาวิธีการสร้างตัวเลขสุ่มที่ปรากฏจะได้รับเครื่องแบบกระจาย - และทุกการทดสอบจะแสดงให้พวกเขาเป็นเครื่องแบบ - ยกเว้นว่าพวกเขาจะกระจายกว่าข้อมูลเครื่องแบบจริงอย่างสม่ำเสมอมากขึ้น ปัญหาที่ฉันมีกับเครื่องแบบ "จริง" คือพวกเขาจะจัดกลุ่มเป็นครั้งคราว เอฟเฟกต์นี้แข็งแกร่งกว่าขนาดตัวอย่างที่ต่ำ Roughly พูดว่า: เมื่อฉันวาด randoms Uniform สองตัวใน U [0; 1] โอกาสอยู่ที่ประมาณ 10% ซึ่งอยู่ในช่วง 0.1 และ 1% ที่อยู่ภายใน 0.01 ดังนั้นฉันกำลังมองหาวิธีที่ดีในการสร้างตัวเลขสุ่มที่มีการกระจายกว่า randoms ใช้ตัวอย่างกรณี: บอกว่าฉันทำเกมคอมพิวเตอร์และฉันต้องการวางสมบัติแบบสุ่มบนแผนที่ (ไม่สนใจสิ่งอื่นใด) ฉันไม่ต้องการให้สมบัติอยู่ในที่เดียวมันควรอยู่ทั่วแผนที่ ถ้าผมใส่พูดว่าแรนดอมเครื่องแบบ 10 ชิ้นโอกาสที่จะไม่ต่ำมากที่มี 5 หรือใกล้เคียงกันมาก นี่อาจทำให้ผู้เล่นคนหนึ่งได้เปรียบกว่าผู้เล่นคนอื่น นึกถึงเรือกวาดทุ่นระเบิดโอกาส (แม้ว่าจะต่ำถ้ามีเหมืองมากพอ) คุณคิดว่าคุณโชคดีมากและชนะด้วยการคลิกเพียงครั้งเดียว แนวทางที่ไร้เดียงสามากสำหรับปัญหาของฉันคือการแบ่งข้อมูลออกเป็นกริด ตราบใดที่จำนวนมีขนาดใหญ่พอ (และมีปัจจัย) ก็สามารถบังคับใช้ความสม่ำเสมอเป็นพิเศษได้ด้วยวิธีนี้ ดังนั้นแทนที่จะวาด 12 ตัวแปรสุ่มจาก U [0; …

8
วิธีสร้างเมทริกซ์สหสัมพันธ์แบบกึ่งบวกแบบกึ่งมีประสิทธิภาพได้อย่างมีประสิทธิภาพได้อย่างไร
ฉันต้องการที่จะสร้างเมทริกซ์สหสัมพันธ์เชิงบวก - semidefinite (PSD) ได้อย่างมีประสิทธิภาพ วิธีการของฉันช้าลงอย่างมากเมื่อฉันเพิ่มขนาดของเมทริกซ์ที่จะสร้าง คุณช่วยแนะนำวิธีแก้ปัญหาที่มีประสิทธิภาพได้ไหม? หากคุณตระหนักถึงตัวอย่างใด ๆ ใน Matlab ฉันจะขอบคุณมาก เมื่อสร้างเมทริกซ์ความสัมพันธ์ PSD คุณจะเลือกพารามิเตอร์เพื่ออธิบายเมทริกซ์ที่จะสร้างได้อย่างไร ค่าเฉลี่ยสหสัมพันธ์ส่วนเบี่ยงเบนมาตรฐานของสหสัมพันธ์ค่าลักษณะเฉพาะ

3
สุ่ม number-Set.seed (N) ใน R [ซ้ำกัน]
คำถามนี้มีคำตอบอยู่ที่นี่แล้ว: อะไรคือเมล็ดพันธุ์ในเครื่องกำเนิดเลขสุ่ม? 3 คำตอบ ฉันรู้ว่ามีคนใช้set.seed()R ในการสร้างตัวเลขสุ่มหลอก ฉันยังตระหนักว่าการใช้หมายเลขเดียวกันเช่นset.seed(123)ประกันคุณสามารถทำซ้ำผลลัพธ์ แต่สิ่งที่ฉันไม่ได้รับคือคุณค่าของตัวเองหมายถึงอะไร ฉันกำลังเล่นกับฟังก์ชั่นหลายและบางส่วนใช้set.seed(1)หรือหรือset.seed(300) set.seed(12345)หมายเลขนั้นหมายถึงอะไร (ถ้ามี) - และฉันควรใช้หมายเลขอื่นเมื่อใด ตัวอย่างในหนังสือที่ฉันใช้งานอยู่พวกเขาใช้set.seed(12345)เมื่อสร้างชุดการฝึกอบรมสำหรับต้นไม้ตัดสินใจ จากนั้นในบทอื่นพวกเขาใช้set.seed(300)สำหรับสร้างป่าสุ่ม แค่อย่ารับเบอร์

11
ทำไมการสร้างบิตสุ่ม 8 ชุดใน (0, 255)
ฉันกำลังสร้างบิตสุ่ม 8 บิต (ทั้ง 0 หรือ 1) และต่อกันเข้าด้วยกันเพื่อสร้างหมายเลข 8 บิต การจำลองแบบหลามอย่างง่ายทำให้ได้การแจกแจงแบบสม่ำเสมอบนชุดแยก [0, 255] ฉันพยายามหาเหตุผลว่าทำไมเรื่องนี้ถึงสมเหตุสมผลในหัวของฉัน ถ้าฉันเปรียบเทียบสิ่งนี้กับการโยนเหรียญ 8 เหรียญค่าที่คาดหวังจะไม่อยู่ที่ประมาณ 4 หัว / 4 ก้อยหรือไม่ ดังนั้นสำหรับฉันแล้วมันก็สมเหตุสมผลแล้วที่ผลลัพธ์ของฉันควรสะท้อนถึงจุดที่อยู่ตรงกลางของช่วง กล่าวอีกนัยหนึ่งเหตุใดลำดับของเลขศูนย์ 8 หรือ 8 อันดูเหมือนจะเท่ากันอย่างน่าจะเป็นลำดับที่ 4 และ 4 หรือ 5 และ 3 เป็นต้น สิ่งที่ฉันหายไปที่นี่?

6
ประมาณ
ฉันได้ดูการจำลอง Monte Carlo เมื่อเร็ว ๆ นี้และได้ใช้มันกับค่าคงที่โดยประมาณเช่นππ\pi (วงกลมภายในสี่เหลี่ยมมุมฉากสัดส่วนตามสัดส่วน) อย่างไรก็ตามฉันไม่สามารถคิดถึงวิธีการที่สอดคล้องกันในการประมาณค่าของeee [หมายเลขของออยเลอร์] โดยใช้การรวม Monte Carlo คุณมีพอยน์เตอร์เกี่ยวกับวิธีการนี้สามารถทำได้หรือไม่?


1
ถ้าฉันสร้างเมทริกซ์สมมาตรแบบสุ่มโอกาสที่จะเป็นบวกแน่นอนคืออะไร
ฉันมีคำถามแปลก ๆ เมื่อฉันทดลองการเพิ่มประสิทธิภาพของนูน คำถามคือ: สมมติว่าฉันสุ่ม (พูดการแจกแจงแบบปกติมาตรฐาน) สร้างเมทริกซ์สมมาตร (ตัวอย่างเช่นฉันสร้างเมทริกซ์สามเหลี่ยมด้านบนและเติมครึ่งล่างเพื่อให้แน่ใจว่ามันสมมาตร) โอกาสที่จะเป็นบวกแน่นอน เมทริกซ์? อย่างไรก็ตามมีการคำนวณความน่าจะเป็นหรือไม่?N×NN×NN \times N

2
ฉันกำลังสร้างอคติโดยใช้เมล็ดสุ่มแบบเดียวกันซ้ำแล้วซ้ำอีกหรือไม่?
ในงานวิเคราะห์เกือบทั้งหมดที่ฉันเคยทำฉันใช้: set.seed(42) มันเป็นการแสดงความเคารพคู่มือโบกรถของกาแล็กซี่ แต่ฉันสงสัยว่าถ้าฉันสร้างอคติโดยใช้เมล็ดพันธุ์เดียวกันซ้ำแล้วซ้ำอีก


1
องศาอิสระเป็นหมายเลขที่ไม่ใช่จำนวนเต็มหรือไม่
เมื่อฉันใช้ GAM มันให้ DF ที่เหลือกับฉันคือ (บรรทัดสุดท้ายในรหัส) นั่นหมายความว่าอย่างไร? นอกเหนือไปจากตัวอย่างของ GAM โดยทั่วไปแล้วจำนวนองศาความเป็นอิสระจะเป็นจำนวนที่ไม่ใช่จำนวนเต็มหรือไม่26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.