คำถามติดแท็ก random-variable

ตัวแปรสุ่มหรือตัวแปรสุ่มคือค่าที่อยู่ภายใต้การเปลี่ยนแปลงของโอกาส (เช่นการสุ่มในแง่คณิตศาสตร์)

1
ความสัมพันธ์ของตัวแปรสุ่มแบบล็อก - ปกติ
กำหนดตัวแปรสุ่มปกติX1X1X_1และX2X2X_2มีสัมประสิทธิ์สหสัมพันธ์ฉันจะค้นหาความสัมพันธ์ระหว่างตัวแปรสุ่ม lognormalและอย่างไรρρ\rhoY1Y1Y_1Y2Y2Y_2 Y1=a1exp(μ1T+T−−√X1)Y1=a1exp⁡(μ1T+TX1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}X_1) Y2=a2exp(μ2T+T−−√X2)Y2=a2exp⁡(μ2T+TX2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}X_2) Now, if X1=σ1Z1X1=σ1Z1X_1 = \sigma_1 Z_1 and X2=σ1Z2X2=σ1Z2X_2 = \sigma_1 Z_2, where Z1Z1Z_1 and Z2Z2Z_2 are standard normals, from the linear transformation property, we get: Y1=a1exp(μ1T+T−−√σ1Z1)Y1=a1exp⁡(μ1T+Tσ1Z1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}\sigma_1 Z_1) Y2=a2exp(μ2T+T−−√σ2(ρZ1+1−ρ2−−−−−√Z2)Y2=a2exp⁡(μ2T+Tσ2(ρZ1+1−ρ2Z2)Y_2 …

2
สำหรับ iid varianbles สุ่ม
มีการแจกแจงสำหรับตัวแปรสุ่ม iid สองตัวที่การกระจายข้อต่อของX - Yเหมือนกันมากกว่าการสนับสนุน [0,1] หรือไม่?X,YX,YX,YX−YX−YX-Y

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
วิธีสร้างข้อมูลอนุกรมเวลาไบนารีอัตโนมัติแบบสุ่มที่มีความสัมพันธ์กันอย่างไร
ฉันจะสร้างอนุกรมเวลาแบบไบนารี่ได้อย่างไร: ความน่าจะเป็นโดยเฉลี่ยของการสังเกต 1 ถูกระบุ (พูด 5%) ความน่าจะเป็นแบบมีเงื่อนไขของการสังเกต 1 ที่เวลาให้ค่าที่t - 1 (พูด 30% ถ้าt - 1tttt−1t−1t-1t−1t−1t-1เท่ากับ 1)?


4
จะสร้างข้อมูลเด็ดขาดแบบสุ่มได้อย่างไร?
สมมติว่าฉันมีตัวแปรเด็ดขาดซึ่งสามารถรับค่า A, B, C และ D ฉันจะสร้างจุดข้อมูลและการควบคุม 10,000 จุดสำหรับแต่ละความถี่ได้อย่างไร ตัวอย่างเช่น: A = 10% B = 20% C = 65% D = 5% ความคิดใดที่ฉันสามารถทำได้

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to …

3
ทำไมเป็น
ในหน้ากลาง AP นี้ตัวแปรสุ่มเทียบกับตัวแปรเชิงพีชคณิตผู้เขียนปีเตอร์ฟลานาแกน - ไฮด์ดึงดูดความแตกต่างระหว่างตัวแปรพีชคณิตและสุ่ม ในส่วนที่เขาพูดว่า x+x=2xx+x=2xx + x = 2xแต่ X+X≠2XX+X≠2XX + X \neq 2X - ในความเป็นจริงมันเป็นคำบรรยายของบทความ อะไรคือความแตกต่างพื้นฐานระหว่างตัวแปรพีชคณิตและตัวแปรสุ่ม?

3
ความสัมพันธ์ระหว่างผลรวมของ Gaussian RVs และ Gaussian Mixture
ฉันรู้ว่าจำนวนของเกาส์คือเกาส์ ดังนั้นส่วนผสมของ Gaussians แตกต่างกันอย่างไร ฉันหมายถึงส่วนผสมของ Gaussians เป็นเพียงผลรวมของ Gaussians (ซึ่งแต่ละ Gaussian ถูกคูณด้วยสัมประสิทธิ์การผสมตามลำดับ) ใช่ไหม?

1
หมายความว่าอย่างไรถ้าค่ามัธยฐานหรือค่าเฉลี่ยของผลรวมมากกว่าผลรวมของผลรวม
ฉันกำลังวิเคราะห์การกระจายตัวของเวลาแฝงเครือข่าย เวลาอัปโหลดเฉลี่ย (U) คือ 0.5 วินาที เวลาเฉลี่ยในการดาวน์โหลด (D) คือ 2 วินาที อย่างไรก็ตามเวลาทั้งหมดเฉลี่ย (สำหรับแต่ละจุดข้อมูล T = U + D) คือ 4s ข้อสรุปอะไรที่สามารถดึงดูดได้โดยรู้ว่าค่ามัธยฐานของผลรวมนั้นยิ่งใหญ่กว่าผลรวมของค่ามัธยฐานของผลรวม จากความอยากรู้อยากเห็นเกี่ยวกับสถิติมันจะเกิดอะไรขึ้นถ้าคำถามนี้แทนที่ค่ามัธยฐานด้วยค่าเฉลี่ย

1
พารามิเตอร์เทียบกับตัวแปรแฝง
ฉันเคยถามเรื่องนี้มาก่อนและพยายามดิ้นรนกับการระบุสิ่งที่ทำให้พารามิเตอร์โมเดลและสิ่งที่ทำให้มันเป็นตัวแปรแฝง ดังนั้นเมื่อดูที่หัวข้อต่างๆในหัวข้อนี้ในเว็บไซต์นี้ความแตกต่างหลัก ๆ น่าจะเป็น: ตัวแปรแฝงไม่ได้ถูกสังเกต แต่มีการแจกแจงความน่าจะเป็นที่เกี่ยวข้องกับมันเนื่องจากมันเป็นตัวแปรและพารามิเตอร์ก็ไม่ได้ถูกสังเกตและไม่มีการแจกแจงที่เกี่ยวข้องกับพวกมันซึ่งฉันเข้าใจว่ามันเป็นค่าคงที่และมีค่าคงที่ หา. นอกจากนี้เราสามารถใส่ค่าพารามิเตอร์ให้กับตัวแทนเพื่อแสดงถึงความไม่แน่นอนของเราเกี่ยวกับพารามิเตอร์เหล่านี้แม้ว่าจะมีค่าจริงเพียงค่าเดียวที่เกี่ยวข้องกับพวกเขาหรืออย่างน้อยนั่นคือสิ่งที่เราคิด ฉันหวังว่าฉันถูกต้องจนถึงตอนนี้? ตอนนี้ฉันได้ดูตัวอย่างนี้สำหรับการถดถอยเชิงเส้นแบบเบย์แบบถ่วงน้ำหนักจากวารสารและพยายามดิ้นรนจริงๆที่จะเข้าใจว่าอะไรคือพารามิเตอร์และตัวแปรคืออะไร: yi=βTxi+ϵyiyi=βTxi+ϵyi y_i = \beta^T x_i + \epsilon_{y_i} ที่นี่และyถูกสังเกต แต่yเท่านั้นที่ถือว่าเป็นตัวแปรเช่นมีการกระจายที่เกี่ยวข้องกับมันxxxyyyyyy ตอนนี้สมมติฐานการสร้างแบบจำลองคือ: y∼N(βTxi,σ2/wi)y∼N(βTxi,σ2/wi) y \sim N(\beta^Tx_i, \sigma^2/w_i) ดังนั้นความแปรปรวนของจึงถูกถ่วงน้ำหนักyyy นอกจากนี้ยังมีการแจกแจงก่อนหน้าในและwซึ่งเป็นการแจกแจงแบบปกติและแกมมาตามลำดับ ββ\betawww ดังนั้นโอกาสในการบันทึกอย่างสมบูรณ์จะได้รับจาก: logp(y,w,β|x)=ΣlogP(yi|w,β,xi)+logP(β)+ΣlogP(wi)log⁡p(y,w,β|x)=Σlog⁡P(yi|w,β,xi)+log⁡P(β)+Σlog⁡P(wi) \log p(y, w, \beta |x) = \Sigma \log P(y_i|w, \beta, x_i) + \log P(\beta) + \Sigma \log P(w_i) ตอนนี้ฉันเข้าใจแล้วทั้งและwคือพารามิเตอร์ของแบบจำลอง อย่างไรก็ตามในเอกสารพวกเขาอ้างถึงพวกเขาเป็นตัวแปรแฝง …

2
จะเพิ่มตัวแปรสุ่มสองตัวแบบพึ่งพาได้อย่างไร?
ฉันรู้ว่าฉันไม่สามารถใช้การโน้มน้าวใจได้ ฉันมีตัวแปรสุ่มสองตัวคือ A และ B และพวกมันขึ้นอยู่กับ ฉันต้องการฟังก์ชันการกระจายแบบ A + B

4
ตัวประมาณที่ไม่เอนเอียงสำหรับตัวแปรสุ่มสองตัวที่เล็กกว่า
สมมติว่าและY ∼ N ( μ y , σ 2 y )X∼N(μx,σ2x)X∼N(μx,σx2)X \sim \mathcal{N}(\mu_x, \sigma^2_x)Y∼ N( μY, σ2Y)Y∼N(μy,σy2)Y \sim \mathcal{N}(\mu_y, \sigma^2_y) ฉันสนใจในmu_y) มีตัวประมาณค่าที่เป็นกลางสำหรับzหรือไม่zZ= min ( μx, μY)z=min(μx,μy)z = \min(\mu_x, \mu_y)Zzz ตัวประมาณอย่างง่ายของขั้นต่ำ( x¯, y¯)min(x¯,y¯)\min(\bar{x}, \bar{y})โดยที่x¯x¯\bar{x}และY¯y¯\bar{y}เป็นตัวอย่างค่าเฉลี่ยของXXXและYYYตัวอย่างเช่นมีความเอนเอียง (แม้ว่าจะสอดคล้องกัน) มันมีแนวโน้มที่ undershoot ZZzz ฉันไม่สามารถคิดถึงตัวประมาณค่าที่เป็นกลางสำหรับZzzได้ มีอยู่จริงไหม? ขอบคุณสำหรับความช่วยเหลือ

1
LARS เทียบกับโคตรของโคตร
ข้อดีและข้อเสียของการใช้ LARS [1] เมื่อเทียบกับการใช้โคตรของพิกัดสำหรับการถดถอยเชิงเส้นแบบ L1 ที่เหมาะสมคืออะไร ฉันสนใจในเรื่องของประสิทธิภาพเป็นหลัก (ปัญหาของฉันมักจะNอยู่ในหลักแสนและp<20) อย่างไรก็ตามข้อมูลเชิงลึกอื่น ๆ ก็จะได้รับการชื่นชมเช่นกัน แก้ไข: เนื่องจากฉันได้โพสต์คำถาม, chl ได้ชี้ให้เห็นกระดาษ [2] โดย Friedman และคณะที่พิกัดโคตรถูกแสดงว่าเร็วกว่าวิธีอื่นมาก หากเป็นกรณีนี้ฉันควรเป็นผู้ประกอบการเพียงแค่ลืมเกี่ยวกับ LARS ในความโปรดปรานของการสืบเชื้อสายมาประสานงาน? [1] Efron, Bradley; Hastie เทรเวอร์; Johnstone, Iain และ Tibshirani, Robert (2004) "การถดถอยมุมน้อยที่สุด" พงศาวดารของสถิติ 32 (2): pp 407–499 [2] Jerome H. Friedman, Trevor Hastie, Rob Tibshirani, "เส้นทางการทำให้เป็นมาตรฐานสำหรับตัวแบบเชิงเส้นทั่วไปผ่านพิกัดโคตร", วารสารซอฟท์แวร์สถิติ, อัตรา …

1
แพคเกจ GBM กับ Caret ใช้ GBM
ฉันเคยใช้การจูนโมเดลcaretแต่แล้วก็รันโมเดลอีกครั้งโดยใช้gbmแพ็คเกจ ฉันเข้าใจว่าcaretแพ็กเกจที่ใช้gbmและเอาต์พุตควรเหมือนกัน อย่างไรก็ตามการทดสอบการทำงานอย่างรวดเร็วโดยใช้data(iris)แสดงความแตกต่างในรูปแบบประมาณ 5% โดยใช้ RMSE และ R ^ 2 เป็นตัวชี้วัดการประเมินผล ฉันต้องการค้นหาประสิทธิภาพของแบบจำลองที่ดีที่สุดโดยใช้caretแต่เรียกใช้อีกครั้งgbmเพื่อใช้ประโยชน์จากแผนการพึ่งพาบางส่วน รหัสด้านล่างสำหรับการทำซ้ำ คำถามของฉันจะเป็น: 1) เหตุใดฉันจึงเห็นความแตกต่างระหว่างแพ็คเกจทั้งสองนี้ถึงแม้ว่าพวกเขาจะเหมือนกัน (ฉันเข้าใจว่าพวกมันสุ่ม แต่ 5% ค่อนข้างแตกต่างกันมากโดยเฉพาะอย่างยิ่งเมื่อฉันไม่ได้ใช้ชุดข้อมูลที่ดีirisสำหรับการสร้างแบบจำลองของฉัน) . 2) มีข้อดีหรือข้อเสียในการใช้ทั้งสองแพคเกจหรือไม่ 3) ไม่เกี่ยวข้อง: การใช้irisชุดข้อมูลที่ดีที่สุดinteraction.depthคือ 5 แต่สูงกว่าที่ฉันได้อ่านควรจะใช้สูงสุดfloor(sqrt(ncol(iris)))ซึ่งควรจะเป็น 2 นี่เป็นกฎง่ายๆหรือเข้มงวดหรือไม่? library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.