คำถามติดแท็ก random-generation

การกระทำของการสร้างลำดับของตัวเลขหรือสัญลักษณ์แบบสุ่มหรือ (เกือบตลอด) หลอกแบบสุ่ม; เช่นไม่มีการคาดการณ์หรือรูปแบบใด ๆ


1
ตัวเลขที่ถูกตัดทอนจากเครื่องกำเนิดตัวเลขสุ่มยังคงเป็น 'สุ่ม' หรือไม่
ต่อไปนี้'การตัดปลาย'หมายถึงการลดความแม่นยำของตัวเลขสุ่มและไม่ตัดทอนชุดตัวเลขสุ่ม ตัวอย่างเช่นถ้าฉันมีตัวเลขสุ่มอย่างแท้จริง (ดึงมาจากการแจกแจงใด ๆ เช่นปกติเครื่องแบบ ฯลฯ ) ด้วยความแม่นยำตามอำเภอใจและฉันจะตัดทอนตัวเลขทั้งหมดเพื่อให้ท้ายที่สุดฉันก็จบด้วยชุดตัวเลขnแต่ละตัวมี 2 หลักหลังจุดทศนิยม ฉันสามารถเรียกหมายเลขสุ่มใหม่นี้ได้หรือไม่nnnnnn ฉันมากับคำถามนี้เมื่อฉันได้อ่านเกี่ยวกับฮาร์ดแวร์ที่สร้างตัวเลขสุ่ม บทความ Wikipedia กล่าวว่าพวกเขาสร้างตัวเลขสุ่มโดยการวัดกระบวนการทางกายภาพ แต่เนื่องจากการวัดนี้มีข้อ จำกัด (ข้อผิดพลาดในการวัดความแม่นยำแน่นอน ฯลฯ ) เราสามารถโทรหาหมายเลขที่สร้างโดยฮาร์ดแวร์เหล่านี้ได้หรือไม่

4
วาดจำนวนเต็มอย่างอิสระและสุ่มจาก 1 ถึงโดยใช้ยุติธรรม d6?
ฉันต้องการวาดจำนวนเต็มจาก 1 ถึงเฉพาะเจาะจงโดยการหมุนลูกเต๋าหกเหลี่ยมที่ยุติธรรมจำนวนหนึ่ง (d6) คำตอบที่ดีจะอธิบายว่าทำไมวิธีการในการสร้างจำนวนเต็มเหมือนกันและเป็นอิสระยังไม่มีข้อความNN ในฐานะที่เป็นตัวอย่างที่เป็นตัวอย่างก็จะเป็นประโยชน์ในการอธิบายถึงวิธีการแก้ปัญหาการทำงานสำหรับกรณีของNN = 150N=150N=150 นอกจากนี้ฉันต้องการให้กระบวนการมีประสิทธิภาพมากที่สุด: หมุนจำนวน d6 โดยเฉลี่ยสำหรับแต่ละหมายเลขที่สร้าง อนุญาตการแปลงจากSenaryเป็นทศนิยม คำถามนี้ได้รับแรงบันดาลใจจาก Meta หัวข้อนี้

3
การทดสอบข้อมูลที่สร้างแบบสุ่มกับการกระจายที่ต้องการ
ฉันได้เขียนโปรแกรมที่สร้างข้อมูลแบบสุ่ม หากโปรแกรมทำงานอย่างถูกต้องข้อมูลนั้นควรเป็นไปตามการแจกแจงความน่าจะเป็นที่ทราบ ฉันต้องการรันโปรแกรมทำการคำนวณผลและคิดค่า p ก่อนใครบอกว่า: ฉันเข้าใจว่าการทดสอบสมมติฐานไม่สามารถตรวจพบเมื่อโปรแกรมทำงานอย่างถูกต้อง สามารถตรวจพบได้เมื่อทำงานไม่ถูกต้องในวิธีเฉพาะ (และถึงตอนนั้นการทดสอบ "ควร" ล้มเหลว X% ของเวลาขึ้นอยู่กับระดับความสำคัญที่คุณเลือก ... ) ดังนั้นฉันพยายามทำความเข้าใจว่าเครื่องมือใดที่เหมาะสม โดยเฉพาะอย่างยิ่ง: ฉันสามารถสร้างข้อมูลสุ่มได้มากเท่าที่ต้องการ สิ่งที่ฉันต้องทำก็คือปล่อยให้โปรแกรมทำงานนานพอ ดังนั้นฉันจึงไม่ จำกัด ขนาดตัวอย่างเฉพาะใด ๆ ฉันสนใจในเทคนิคที่สร้างค่า p ดังนั้นการจ้องมองที่กราฟและพูดว่า "ใช่ที่ดูเหมือนเชิงเส้นเชิงเส้น" ไม่ใช่ตัวเลือกที่น่าสนใจ เว้นแต่จะมีวิธีการใส่ตัวเลขจำนวนมากลงใน "ความไร้ประโยชน์" ของกราฟ ;-) สิ่งที่ฉันรู้จนถึงตอนนี้: ฉันได้เห็นสามประเภทหลักของการทดสอบที่กล่าวถึงซึ่งดูเหมือนว่าพวกเขาจะสามารถใช้งานได้: [เพียร์สัน] การทดสอบไคสแควร์, การทดสอบ Kolmogorov-Smirnov และการทดสอบ Anderson-Darling ปรากฏว่าการทดสอบไคสแควร์เป็นที่เหมาะสมสำหรับต่อเนื่องกระจายในขณะที่อีกสองคนที่มีความเหมาะสมมากขึ้นสำหรับการอย่างต่อเนื่องกระจาย (?) แหล่งข้อมูลหลายแห่งระบุว่าการทดสอบโฆษณานั้น "ดีกว่า" กว่าการทดสอบ KS แต่ไม่สามารถระบุรายละเอียดเพิ่มเติมได้ ในที่สุดการทดสอบทั้งหมดเหล่านี้น่าจะตรวจพบ "วิธีที่แตกต่าง" ของการเบี่ยงเบนจากการแจกแจงโมฆะที่ระบุ แต่ฉันไม่รู้จริง …

3
สร้างคะแนนอย่างมีประสิทธิภาพระหว่างหน่วยวงกลมและหน่วยสี่เหลี่ยม
ฉันต้องการสร้างตัวอย่างจากขอบเขตสีฟ้าที่กำหนดไว้ที่นี่: โซลูชันไร้เดียงสาคือใช้การสุ่มตัวอย่างการปฏิเสธในหน่วยสี่เหลี่ยมจัตุรัส แต่ให้ประสิทธิภาพเพียง (~ 21.4%)1−π/41−π/41-\pi/4 มีวิธีที่ฉันสามารถตัวอย่างมีประสิทธิภาพมากขึ้น?

3
Cholesky กับ eigendecomposition สำหรับการวาดตัวอย่างจากการแจกแจงปกติหลายตัวแปร
ผมอยากจะวาดตัวอย่าง ) วิกิพีเดียแสดงให้เห็นว่าจะใช้CholeskyหรือEigendecompositionคือ Σ = D 1 D T 1 หรือ Σ = Q Λ Q Tx∼N(0,Σ)x∼N(0,Σ)\mathbf{x} \sim N\left(\mathbf{0}, \mathbf{\Sigma} \right)Σ=D1DT1Σ=D1D1T \mathbf{\Sigma} = \mathbf{D}_1\mathbf{D}_1^T Σ=QΛQTΣ=QΛQT \mathbf{\Sigma} = \mathbf{Q}\mathbf{\Lambda}\mathbf{Q}^T และด้วยเหตุนี้ตัวอย่างสามารถวาดผ่าน: หรือ x = Q √x=D1vx=D1v \mathbf{x} = \mathbf{D}_1 \mathbf{v} โดยที่ v∼N(0,I)x=QΛ−−√vx=QΛv \mathbf{x} = \mathbf{Q}\sqrt{\mathbf{\Lambda}} \mathbf{v} v∼N(0,I)v∼N(0,I) \mathbf{v} \sim N\left(\mathbf{0}, \mathbf{I} \right) …

2
การใช้ตัวเลขสุ่มในการคำนวณทางสถิติมีความสำคัญอะไรบ้าง?
เครื่องกำเนิดเลขสุ่ม (RNG) มีความสำคัญอย่างไรในสถิติการคำนวณ ฉันเข้าใจว่าการสุ่มนั้นมีความสำคัญเมื่อเลือกตัวอย่างสำหรับการทดสอบทางสถิติจำนวนมากเพื่อหลีกเลี่ยงอคติต่อสมมติฐานใด ๆ แต่มีพื้นที่อื่น ๆ ของสถิติการคำนวณที่เครื่องกำเนิดเลขสุ่มมีความสำคัญหรือไม่

5
สร้างตัวเลขสุ่มที่กระจายแบบกระจายด้วยเมทริกซ์ความแปรปรวนร่วมแบบไม่แน่นอนที่แน่นอน
ฉันประเมินเมทริกซ์ความแปรปรวนร่วมตัวอย่างของตัวอย่างและรับเมทริกซ์สมมาตร ด้วย , ผมอยากจะสร้าง -variate rn กระจายปกติ แต่เพราะฉะนั้นเราจึงจำเป็นต้องมีการสลายตัว Cholesky ของCฉันควรทำอย่างไรถ้าไม่แน่นอนแน่นอนC n CCCCCCCnnnCCCCCC

3
บางคำถามเกี่ยวกับการสุ่มทางสถิติ
จากความแร้นแค้นทางสถิติของ Wikipedia : การสุ่มทั่วโลกและการสุ่มในท้องถิ่นนั้นแตกต่างกัน แนวคิดเชิงปรัชญาส่วนใหญ่เกี่ยวกับการสุ่มนั้นเป็นสากล - เพราะพวกมันอยู่บนพื้นฐานความคิดที่ว่า "ในระยะยาว" ลำดับนั้นดูสุ่มอย่างแท้จริงแม้ว่าบางลำดับย่อยจะไม่ดูสุ่ม ในการสุ่มตัวเลขที่มีความยาวเพียงพออย่างแท้จริงอาจเป็นไปได้ว่าจะมีการเรียงลำดับแบบยาวของศูนย์ แต่ในทั้งลำดับอาจเป็นแบบสุ่ม Local Randomness หมายถึงแนวคิดที่ว่าสามารถมีความยาวของลำดับขั้นต่ำที่การแจกแจงแบบสุ่มจะถูกประมาณแม้แต่ตัวเลขที่สร้างขึ้นโดยกระบวนการสุ่มอย่างแท้จริงจะลด "การสุ่มแบบท้องถิ่น" ของตัวอย่าง (มันอาจเป็นแบบสุ่มเฉพาะที่สำหรับลำดับ 10,000 หลัก แต่การวนน้อยกว่า 1,000 อาจไม่ปรากฏแบบสุ่ม ตัวอย่างเช่นทั้งหมด) ลำดับที่แสดงรูปแบบจึงไม่ได้รับการพิสูจน์ว่าไม่สุ่มทางสถิติ ตามหลักการของทฤษฎีแรมซีย์วัตถุขนาดใหญ่อย่างเพียงพอจะต้องมีโครงสร้างพื้นฐานที่กำหนด ("ความไม่สมบูรณ์สมบูรณ์เป็นไปไม่ได้") ฉันไม่เข้าใจความหมายของประโยคทั้งสองเป็นตัวหนา ประโยคแรกหมายความว่ามีบางสิ่งที่ทำให้เกิดการสุ่มตามลำดับที่ความยาวมากกว่าและไม่ใช่การสุ่มแบบท้องถิ่นที่ความยาวสั้นกว่าหรือไม่ ตัวอย่างในวงเล็บทำงานอย่างไร ประโยคที่สองหมายความว่าลำดับที่แสดงรูปแบบไม่สามารถพิสูจน์ได้ว่าไม่ได้สุ่มตัวอย่างเชิงสถิติหรือไม่? ทำไม? ขอบคุณ

2
สร้างตัวแปรสุ่มแบบกระจายที่สัมพันธ์กันสามชุด
สมมติว่าเรามี X1∼unif(n,0,1),X1~ยูนิฟ(n,0,1),X_1 \sim \textrm{unif}(n,0,1), X2∼unif(n,0,1),X2~ยูนิฟ(n,0,1),X_2 \sim \textrm{unif}(n,0,1), โดยที่เป็นตัวอย่างแบบสุ่มขนาดเท่ากันของขนาด n และunif(n,0,1)unif(n,0,1)\textrm{unif}(n,0,1) Y=X1,Y=X1,Y=X_1, Z=0.4X1+1−0.4−−−−−−√X2.Z=0.4X1+1−0.4X2.Z = 0.4 X_1 + \sqrt{1 - 0.4}X_2. จากนั้นความสัมพันธ์ระหว่างและเป็น0.4YYYZZZ0.40.40.4 ฉันสามารถขยายนี้ถึงสามตัวแปร , , ?X1X1X_1X2X2X_2X3X3X_3

4
วิธีสร้างข้อมูลอนุกรมเวลาไบนารีอัตโนมัติแบบสุ่มที่มีความสัมพันธ์กันอย่างไร
ฉันจะสร้างอนุกรมเวลาแบบไบนารี่ได้อย่างไร: ความน่าจะเป็นโดยเฉลี่ยของการสังเกต 1 ถูกระบุ (พูด 5%) ความน่าจะเป็นแบบมีเงื่อนไขของการสังเกต 1 ที่เวลาให้ค่าที่t - 1 (พูด 30% ถ้าt - 1tttt−1t−1t-1t−1t−1t-1เท่ากับ 1)?

2
ตัวเลขสุ่มและแพ็คเกจมัลติคอร์
เมื่อเขียนโปรแกรมใน R ฉันใช้แพ็คเกจมัลติคอร์สองสามครั้ง อย่างไรก็ตามฉันไม่เคยเห็นคำสั่งเกี่ยวกับวิธีการจัดการกับตัวเลขสุ่ม เมื่อฉันใช้ openMP กับ C ฉันระวังที่จะใช้ RNG แบบขนานที่เหมาะสม แต่ด้วย R ฉันคิดว่ามีบางอย่างที่เหมาะสมเกิดขึ้น มีใครยืนยันได้ไหมว่ามีบางสิ่งที่เหมาะสมเกิดขึ้น? ตัวอย่าง จากเอกสารเรามี x <- foreach(icount(1000), .combine = "+") %do% rnorm(4) วิธีนี้เป็นrnorm`s สร้าง?

2
ทำไมการกระจายของแรนด์ () ^ 2 แตกต่างจากแรนด์ () * แรนด์ ()
ใน Lotus Symphony Office rand()ฟังก์ชันจะพร้อมใช้งานซึ่งเลือกค่าสุ่มระหว่าง 0 ถึง 1 จากการแจกแจงแบบเดียวกัน ฉันเป็นสนิมขึ้นอยู่กับความน่าจะเป็นของฉันดังนั้นเมื่อฉันเห็นพฤติกรรมต่อไปนี้ฉันรู้สึกงงงวย: A = 200x1 คอลัมน์ของ rand()^2 B = 200x1 คอลัมน์ของ rand()*rand() mean(A) = 1/3 mean(B) = 1/4 ทำไมmean(A)! = 1/4?

3
สร้างคู่ของตัวเลขสุ่มกระจายอย่างสม่ำเสมอและมีความสัมพันธ์
ฉันต้องการสร้างตัวเลขสุ่มคู่ที่มีความสัมพันธ์บางอย่าง อย่างไรก็ตามวิธีการปกติของการใช้การรวมกันเชิงเส้นของตัวแปรปกติสองตัวนั้นไม่ถูกต้องที่นี่เนื่องจากการรวมกันเชิงเส้นของตัวแปรชุดไม่ได้เป็นตัวแปรการกระจายแบบสม่ำเสมออีกต่อไป ฉันต้องการตัวแปรสองตัวที่เหมือนกัน ความคิดเกี่ยวกับวิธีการสร้างคู่ของตัวแปรเครื่องแบบที่มีความสัมพันธ์ที่กำหนด?

5
วิธีการสร้างข้อมูลที่ไม่สัมพันธ์กัน
ฉันสนใจที่จะหาวิธีในการสร้างข้อมูลที่มีความสัมพันธ์และไม่ปกติ ดังนั้นการกระจายบางอย่างที่ใช้ในเมทริกซ์ความแปรปรวนร่วม (หรือสหสัมพันธ์) เป็นพารามิเตอร์และสร้างข้อมูลที่ใกล้เคียงกับมัน แต่นี่คือสิ่งที่จับได้: วิธีที่ฉันพยายามค้นหาควรมีความยืดหยุ่นในการควบคุมความเบ้และ / หรือ kurtosis หลายตัวแปรด้วย ฉันคุ้นเคยกับวิธีของเฟลชแมนและวิธีการใช้พลังงานของตัวแปรปกติ แต่ฉันเชื่อว่าส่วนขยายเหล่านั้นส่วนใหญ่อนุญาตให้ผู้ใช้ใช้การรวมกันของความเบ้เล็กน้อยและความโด่งเท่านั้นทำให้เหลือความเบ้ / ความหลายหลาก สิ่งที่ฉันสงสัยคือถ้ามีวิธีที่ช่วยระบุความเบ้หลายตัวแปรและ / หรือ kurtosis พร้อมกับโครงสร้างความสัมพันธ์ / ความแปรปรวนร่วมบางอย่าง ประมาณหนึ่งปีที่ผ่านมาฉันได้สัมมนาเกี่ยวกับการแจกแจงแบบโคคูล่าและฉันจำได้ว่าศาสตราจารย์กล่าวอย่างไม่ตั้งใจว่าผ่านการใช้เถาวัลย์โคโพลีสเราสามารถสร้างข้อมูลซึ่งกล่าวคือสมมาตรในระยะขอบ 1-D แต่ร่วมกันเบ้ -versa หรือยิ่งไปกว่านั้นอัตรากำไรขั้นต้นที่ต่ำกว่าอาจมีความเบ้หรือความโด่งในขณะที่ยังคงมีขนาดสมมาตรสูงสุด (หรือไม่) ฉันประหลาดใจกับความคิดที่ว่ามีความยืดหยุ่นเช่นนี้ฉันพยายามค้นหาบทความหรือเอกสารการประชุมที่อธิบายวิธีการดังกล่าว แต่ฉันไม่ประสบความสำเร็จ :( มันไม่จำเป็นต้องผ่านการใช้ copulas ฉันเปิดรับทุกอย่างที่ใช้ได้ แก้ไข: ฉันได้เพิ่มรหัส R เพื่อพยายามแสดงสิ่งที่ฉันหมายถึง จนถึงตอนนี้ฉันคุ้นเคยกับคำจำกัดความของความเบ้หลายตัวแปรและความโด่งของ Mardia เท่านั้น เมื่อฉันเข้าหาปัญหาของฉันครั้งแรกฉันคิดอย่างไร้เดียงสาว่าถ้าฉันใช้ copula symmetric (Gaussian ในกรณีนี้) กับ marginals ที่เบ้ (เบต้าในตัวอย่างนี้) การทดสอบ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.