คำถามติดแท็ก randomness

การสุ่มคือการขาดรูปแบบหรือการคาดเดาเหตุการณ์ การสุ่มมักถูกสร้างแบบจำลองด้วยการแจกแจงความน่าจะเป็น แต่ยังสามารถสร้างขึ้นโดยกระบวนการกำหนด

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

7
เหตุใดจึงไม่ดีที่จะสอนนักเรียนว่าค่า p เป็นความน่าจะเป็นที่การค้นพบเกิดขึ้นเนื่องจากโอกาส
ใครช่วยได้โปรดอธิบายสั้น ๆ ว่าทำไมมันไม่ดีที่จะสอนนักเรียนว่าค่า p เป็นค่าโพรบ (การค้นพบของพวกเขาเกิดจาก [สุ่ม] โอกาส) ความเข้าใจของฉันคือว่า p-value เป็นโพรบ (รับข้อมูลที่มากขึ้น | สมมติฐานว่างเป็นจริง) ความสนใจที่แท้จริงของฉันคือสิ่งที่อันตรายจากการบอกพวกเขาว่ามันคืออดีต (นอกเหนือจากความจริงที่ว่ามันไม่ได้เป็นเช่นนั้น)



3
ตัวอย่างที่ไม่สุ่มสามารถวิเคราะห์โดยใช้การทดสอบทางสถิติมาตรฐานได้หรือไม่
การศึกษาทางคลินิกจำนวนมากขึ้นอยู่กับตัวอย่างที่ไม่สุ่ม อย่างไรก็ตามการทดสอบมาตรฐานส่วนใหญ่ (เช่นการทดสอบ t, ANOVA, การถดถอยเชิงเส้น, การถดถอยโลจิสติก) ขึ้นอยู่กับสมมติฐานที่ตัวอย่างมี "สุ่มหมายเลข" ผลลัพธ์จะถูกต้องหรือไม่หากตัวอย่างที่ไม่ได้สุ่มเหล่านี้ได้รับการวิเคราะห์โดยการทดสอบมาตรฐาน? ขอขอบคุณ.

5
เกิดอะไรขึ้นกับอัลกอริธึมการสลับ "ไร้เดียงสา"
นี่คือการติดตามผลไปยัง Stackoverflow คำถามเกี่ยวกับการสับอาร์เรย์แบบสุ่ม มีอัลกอริธึมที่กำหนดไว้แล้ว (เช่นKnuth-Fisher-Yates Shuffle ) ที่เราควรใช้เพื่อสับเปลี่ยนอาเรย์แทนที่จะใช้การปรับใช้ Ad-hoc แบบ "ไร้เดียงสา" ตอนนี้ฉันสนใจที่จะพิสูจน์ (หรือหักล้าง) ว่าอัลกอริทึมไร้เดียงสาของฉันเสีย (เหมือนใน: ไม่ได้สร้างการเรียงสับเปลี่ยนที่เป็นไปได้ทั้งหมดด้วยความน่าจะเป็นที่เท่ากัน) นี่คืออัลกอริทึม: วนรอบสองสามครั้ง (ควรทำความยาวของอาเรย์) และในการวนซ้ำทุกครั้งรับดัชนีอาเรย์แบบสุ่มสองอันและสลับองค์ประกอบทั้งสองที่นั่น เห็นได้ชัดว่าสิ่งนี้ต้องการตัวเลขสุ่มมากกว่า KFY (มากเป็นสองเท่า) แต่นอกเหนือจากนั้นมันทำงานได้อย่างถูกต้องหรือไม่ และจำนวนการวนซ้ำที่เหมาะสม (คือ "ความยาวของอาเรย์" เพียงพอ)?

7
บางคนสามารถช่วยอธิบายความแตกต่างระหว่างอิสระกับการสุ่มได้ไหม
ในสถิติอิสระและการสุ่มอธิบายลักษณะที่เหมือนกันหรือไม่ ความแตกต่างระหว่างพวกเขาคืออะไร เรามักจะเจอคำอธิบายเช่น "ตัวแปรสุ่มอิสระสองตัว" หรือ "สุ่มตัวอย่างแบบสุ่ม" ฉันสงสัยว่าอะไรคือความแตกต่างที่แน่นอนระหว่างพวกเขา ใครสามารถอธิบายสิ่งนี้และยกตัวอย่างได้บ้าง เช่นกระบวนการไม่อิสระ แต่สุ่ม

5
วิธีการทางสถิติเพื่อตรวจสอบว่าข้อมูลหายไปโดยการสุ่ม
ฉันมีชุดคุณสมบัติเวกเตอร์ขนาดใหญ่ซึ่งฉันจะใช้เพื่อโจมตีปัญหาการจำแนกเลขฐานสอง (โดยใช้ scikit learn ใน Python) ก่อนที่ฉันจะเริ่มคิดเกี่ยวกับการใส่ร้ายฉันมีความสนใจในการพยายามตรวจสอบจากส่วนที่เหลือของข้อมูลว่าข้อมูลที่ขาดหายไปคือ 'ขาดโดยสุ่ม' หรือขาดหายไปโดยไม่สุ่ม อะไรคือวิธีที่สมเหตุสมผลในการเข้าถึงคำถามนี้ กลายเป็นคำถามที่ดีกว่าคือการถามว่าข้อมูล 'สุ่มโดยสมบูรณ์' หายไปหรือไม่ วิธีที่เหมาะสมที่จะทำคืออะไร?

2
เดินสุ่มด้วยโมเมนตัม
พิจารณาการเดินสุ่มจำนวนเต็มเริ่มต้นที่ 0 โดยมีเงื่อนไขดังต่อไปนี้: ขั้นตอนแรกคือบวกหรือลบ 1 ด้วยความน่าจะเป็นที่เท่ากัน ทุกขั้นตอนในอนาคตคือ: 60% มีแนวโน้มที่จะเป็นไปในทิศทางเดียวกันกับขั้นตอนก่อนหน้า 40% มีแนวโน้มที่จะเป็นไปในทิศทางตรงกันข้าม การกระจายแบบนี้ให้ผลเช่นไร? ฉันรู้ว่าการเดินสุ่มแบบไม่โมเมนตัมให้การแจกแจงแบบปกติ โมเมนตัมเปลี่ยนความแปรปรวนหรือเปลี่ยนธรรมชาติของการกระจายตัวทั้งหมดหรือไม่? ฉันกำลังมองหาคำตอบทั่วไปดังนั้นโดย 60% และ 40% ข้างต้นฉันหมายถึงpและ1-pจริงๆ

2
การพูดว่าเหตุการณ์“ เกิดขึ้นในที่สุด” หมายความว่าอะไร?
พิจารณาการเดินสุ่ม 1 มิติบนจำนวนเต็มZZ\mathbb{Z}ด้วยสถานะเริ่มต้นx∈Zx∈Zx\in\mathbb{Z} : Sn=x+∑i=1nξiSn=x+∑i=1nξi\begin{equation} S_n=x+\sum^n_{i=1}\xi_i \end{equation} ที่เพิ่มขึ้นทีละมี IID ดังกล่าวว่า{2}ξiξi\xi_iP{ξi=1}=P{ξi=−1}=12P{ξi=1}=P{ξi=−1}=12P\{\xi_i=1\}=P\{\xi_i=-1\}=\frac{1}{2} หนึ่งสามารถพิสูจน์ได้ว่า (1) Px{Sn reaches +1 eventually}=1Px{Sn reaches +1 eventually}=1\begin{equation} P^x{\{S_n \text{ reaches +1 eventually}\}} = 1 \end{equation} โดยตัวห้อยหมายถึงตำแหน่งเริ่มต้น Letเป็นครั้งแรกที่ทางรัฐ+1ในคำอื่น ๆ\} หนึ่งสามารถพิสูจน์ได้ว่า (2)ττ\tau+1+1+1τ:=τ(1):=min{n≥0:Sn=1}τ:=τ(1):=min{n≥0:Sn=1}\tau:=\tau(1):=\min\{n\geq0:S_n=1\} Eτ=+∞Eτ=+∞\begin{equation} E\tau = +\infty \end{equation} พิสูจน์ทั้งสองสามารถพบได้ในhttp://galton.uchicago.edu/~lalley/Courses/312/RW.pdf ผ่านการอ่านบทความฉันจะเข้าใจทั้งสองพิสูจน์ อย่างไรก็ตามคำถามของฉันคือสิ่งที่ความหมายของ "ในที่สุด" ในคำสั่งแรกเช่นเดียวกับโดยทั่วไป หากสิ่งที่เกิดขึ้น "ในที่สุด" มันไม่จำเป็นต้องเกิดขึ้นในเวลา จำกัด มันได้หรือไม่ ถ้าเป็นเช่นนั้นอะไรคือความแตกต่างระหว่างสิ่งที่ไม่เกิดขึ้นกับสิ่งที่ไม่เกิดขึ้น "ในที่สุด"? ข้อความบางข้อ …

1
การต่อสู้และความสัมพันธ์ในลำดับความคลาดเคลื่อนต่ำ (Halton / Sobol)
ขณะนี้ฉันกำลังทำงานในโครงการที่ฉันสร้างค่าสุ่มโดยใช้ชุดจุดที่มีความคลาดเคลื่อน / กึ่งสุ่มต่ำเช่นชุดจุด Halton และ Sobol เหล่านี้เป็นหลักdddมิติเวกเตอร์ที่เลียนแบบdddมิติเครื่องแบบ (0,1) ตัวแปร แต่มีการแพร่กระจายที่ดีขึ้น ในทางทฤษฎีพวกเขาควรจะช่วยลดความแปรปรวนของการประมาณของฉันในส่วนอื่นของโครงการ แต่น่าเสียดายที่ฉันพบเจอปัญหาการทำงานกับพวกเขาและงานเขียนของพวกเขาส่วนใหญ่นั้นหนาแน่น ดังนั้นฉันจึงหวังที่จะได้รับข้อมูลเชิงลึกจากคนที่มีประสบการณ์กับพวกเขาหรืออย่างน้อยก็หาวิธีที่จะประเมินสิ่งที่เกิดขึ้นโดยประจักษ์ หากคุณทำงานกับพวกเขา: การต่อสู้คืออะไร? และผลกระทบอะไรที่มีต่อกระแสคะแนนที่สร้างขึ้น โดยเฉพาะมีผลเมื่อขนาดของคะแนนที่สร้างเพิ่มขึ้นหรือไม่ ทำไมถ้าฉันสร้างกระแส Sobol สองจุดด้วย MatousekAffineOwen scrambling ฉันได้รับกระแสสองจุดที่แตกต่างกัน เหตุใดจึงไม่เป็นเช่นนี้เมื่อฉันใช้ scrambling แบบย้อนกลับด้วยคะแนนฮาลตัน? มีวิธีการแย่งชิงอื่น ๆ ที่มีอยู่สำหรับชุดจุดเหล่านี้ - และถ้าเป็นเช่นนั้นมีการใช้ MATLAB หรือไม่? หากคุณไม่ได้ทำงานกับพวกเขา: ว่าฉันมีลำดับS 1 , S 2 , … , S nของตัวเลขสุ่มที่คาดคะเนสถิติประเภทใดที่ฉันควรใช้เพื่อแสดงว่าพวกเขาไม่ได้มีความสัมพันธ์กัน? และสิ่งที่จำนวนnฉันจะต้องพิสูจน์ให้เห็นว่าผลของฉันคือนัยสำคัญทางสถิติ? นอกจากนี้ฉันจะทำสิ่งเดียวกันได้อย่างไรถ้าฉันมีnซีเควนซ์S 1 , S 2 …

1
เอนโทรปีต่าง ๆ
เอนโทรปีความแตกต่างของเกาส์ RV เป็น ) สิ่งนี้ขึ้นอยู่กับσซึ่งเป็นค่าเบี่ยงเบนมาตรฐานเข้าสู่ระบบ2( σ2 πอี---√)log2⁡(σ2πe)\log_2(\sigma \sqrt{2\pi e})σσ\sigma ถ้าเราทำให้ตัวแปรสุ่มเป็นมาตรฐานเพื่อให้มันมีความแปรปรวนของหน่วย สำหรับฉันนี่คือการตอบโต้ที่ใช้งานง่ายเพราะ Kolmogorov ความซับซ้อนของค่าคงที่ normalizing ควรมีขนาดเล็กมากเมื่อเทียบกับการลดลงของเอนโทรปี หนึ่งสามารถประดิษฐ์ตัวถอดรหัสที่แบ่ง / ทวีคูณด้วยค่าคงที่ normalizing เพื่อกู้คืนชุดข้อมูลใด ๆ ที่สร้างขึ้นโดยตัวแปรสุ่มนี้ ความเข้าใจของฉันอาจจะปิด คุณช่วยชี้จุดบกพร่องของฉันได้ไหม

3
ทำไมการทดสอบสมมติฐานทางพารามิเตอร์หลายอย่าง (ถ้าไม่ได้ทั้งหมด) จะเป็นการสุ่มตัวอย่างแบบสุ่ม?
การทดสอบอย่าง Z, t และอีกหลายคนคิดว่าข้อมูลนั้นมาจากการสุ่มตัวอย่าง ทำไม? สมมติว่าฉันกำลังทำวิจัยเชิงทดลองที่ฉันสนใจเรื่องความถูกต้องภายในมากกว่าสิ่งภายนอก ดังนั้นหากตัวอย่างของฉันอาจมีอคติเล็กน้อยโอเคอย่างที่ฉันยอมรับไม่ได้อนุมานสมมติฐานสำหรับประชากรทั้งหมด และการจัดกลุ่มจะยังคงเป็นแบบสุ่มนั่นคือฉันจะเลือกเพื่อความสะดวกของผู้เข้าร่วมตัวอย่าง แต่ฉันจะสุ่มให้กลุ่มต่าง ๆ ทำไมฉันถึงเพิกเฉยต่อสมมติฐานนี้ไม่ได้?

2
การโยนเหรียญเป็นวิธีที่ยุติธรรมในการสุ่มกลุ่มเป็นสองกลุ่มหรือไม่?
ดังนั้นตัวฉันและลุงของฉันจึงโต้เถียงกันว่าการพลิกเหรียญเป็นการสุ่มอย่างแท้จริงหรือไม่ ฉันโต้เถียงมันไม่ใช่เพราะในความเป็นจริงเหรียญ tosser มักจะจัดการเหรียญดังนั้นผลไม่ใช่ 50/50 ดังนั้นจึงไม่ใช่ทางเลือกที่ดีสำหรับเทคนิคการสุ่มสำหรับการมอบหมายกลุ่มในการทดลองทางคลินิก อย่างไรก็ตามเขาระบุว่ามันเป็นความไม่สมบูรณ์แบบนาทีในการโยนเหรียญที่สร้างแบบแผน ดังนั้นเขาจึงตั้งสมมติฐานเครื่องจักรที่จะสามารถโยนเหรียญที่ยุติธรรมได้ตลอดกาลและวางมันไว้บนหัวและพูดตามตรงฉันก็แค่ต้องการใครสักคนมาโต้แย้งเรื่องนี้กับฉัน การโยนเหรียญเป็นวิธีที่ยุติธรรมในการสุ่มกลุ่มเป็นสองกลุ่มหรือไม่?

2
สิ่งนี้จะทำให้มีอคติในสิ่งที่ควรเป็นตัวเลขสุ่มหรือไม่
สมมติว่าไฟล์ข้อมูลที่มี 80 ล้านไฟล์และเลขศูนย์ถูกสร้างแบบสุ่ม จากไฟล์นี้เราต้องการสร้างรายการจำนวนเต็มทศนิยมแบบสุ่ม นี่คือแผนที่จะทำการแปลงนี้ แบ่งตัวเลข 80 ล้านหลักเป็นกลุ่ม 4 หลัก แปลงเลขฐานสอง 4 หลักเป็นทศนิยม ยกเลิกค่าทศนิยมทั้งหมดที่มากกว่า 9 สิ่งนี้ควรส่งผลให้เกิดสตริงของจำนวนเต็มแบบสุ่มจาก 0-9 นี่คือความกังวล เลขฐานสอง 24 หลักที่ประกอบด้วยการจัดกลุ่ม 6 ตัวของเลขฐานสอง 4 หลักที่สอดคล้องกับค่า 10 ถึง 15 ประกอบด้วย 17 อันและ 7 ศูนย์เท่านั้น ความไม่สมดุลนี้จะส่งผลกระทบต่อการแจกแจงของเลขจำนวนเต็มคู่กับคี่หรือทำให้การสุ่มของสตริงสุดท้ายของเลขทศนิยมในทางใดทางหนึ่งหรือไม่? อัปเดต: จากคำตอบที่โพสต์ดูเหมือนว่าวิธีการที่ระบุข้างต้นเป็นเสียง ฉันเห็นด้วยกับข้อสรุปนั้น อย่างไรก็ตามฉันยังไม่เข้าใจว่าทำไมการลบมากกว่าสองเท่าของค่าศูนย์จากสตริงเลขฐานสองจึงไม่ทำให้ผลที่ออกมามีเลขคี่น้อยลง ฉันขอคำอธิบาย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.