คำถามติดแท็ก indicator-function

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
ความเข้าใจผิดเกี่ยวกับการประมาณการ Monte Carlo Pi
ฉันค่อนข้างแน่ใจว่าฉันเข้าใจการทำงานร่วมกันของ Monte Carlo แต่ฉันไม่เข้าใจการกำหนดวิธีการใช้ Pi เพื่อประเมิน ฉันกำลังทำตามขั้นตอนที่ระบุไว้ในสไลด์ที่ 5 ของงานนำเสนอนี้http://homepages.inf.ed.ac.uk/imurray2/teaching/09mlss/slides.pdf ฉันเข้าใจขั้นตอนเบื้องต้น Pi เท่ากับ 4 คูณพื้นที่ของหนึ่งในสี่ของวงกลมหน่วย และพื้นที่ของไตรมาสบนขวาของหน่วยวงกลมตรงกลางที่ (0,0) เท่ากับอินทิกรัลของส่วนโค้งที่เป็นไตรมาสบนขวาของวงกลมหน่วยในและ . 0&lt;x&lt;10&lt;x&lt;10<x<10&lt;y&lt;10&lt;y&lt;10<y<1 สิ่งที่ฉันไม่เข้าใจก็คืออินทิกรัลนี้คืออะไร ∬I((x2+y2)&lt;1)P(x,y)dxdy∬I((x2+y2)&lt;1)P(x,y)dxdy\iint I((x^2+y^2)<1)P(x,y)dxdy โดยที่P(x,y)P(x,y)P(x,y)มีการกระจายอย่างสม่ำเสมอในหน่วยสี่เหลี่ยมจัตุรัสรอบวงกลมไตรมาส (นั่นคือเท่ากับ 1 เสมอถ้า0&lt;x&lt;10&lt;x&lt;10<x<1และ0&lt;y&lt;10&lt;y&lt;10<y<1และ 0 เป็นอย่างอื่น) นี่ก็หมายความว่า I((x2+y2)&lt;1)P(x,y)I((x2+y2)&lt;1)P(x,y)I((x^2+y^2)<1)P(x,y) คือฟังก์ชั่นที่เป็นจตุภาคบนขวาของวงกลมหน่วยที่0&lt;x&lt;10&lt;x&lt;10<x<1และ0&lt;y&lt;10&lt;y&lt;10<y<1แต่ฉันไม่เข้าใจว่าสิ่งนี้เป็นจริงได้อย่างไรเนื่องจากฟังก์ชันตัวบ่งชี้สามารถเป็น 1 หรือ 0 เท่านั้นฉันเข้าใจว่ามันอาจจะเขียนด้วยวิธีนี้เพื่อให้การสุ่มตัวอย่าง Monte Carlo ง่าย (นั่นคือความคาดหวังดังนั้นเพียงแค่ตัวอย่างจากP(x,y)P(x,y)P(x,y)และรับค่าเฉลี่ยของตัวอย่างที่ใช้กับI((x2+y2)&lt;1)I((x2+y2)&lt;1)I((x^2+y^2)<1)) แต่มันไม่สมเหตุสมผลเลยสำหรับฉันว่าทำไมอินทิกรัลนั้นแทนพื้นที่ใต้เส้นโค้งนั้น ใครบางคนสามารถให้คำอธิบายที่เข้าใจง่ายเกี่ยวกับเรื่องนี้ อาจแสดงให้เห็นว่าอินทิกรัลนั้นได้มาในแบบทีละขั้นตอนหรือไม่? แก้ไข: ฉันสามารถรับความเข้าใจที่ดีขึ้นโดยเชื่อมโยงความคาดหวังกับพื้นที่ ฉันจะอธิบายที่นี่ในกรณีที่มันช่วยทุกคน เริ่มแรกด้วยการเกี่ยวข้องกับ Pi ไปยังพื้นที่ของควอดเร้นท์ด้านขวาของวงกลมหน่วย π=4×Atrπ=4×Atr\pi=4\times A_{tr} …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.