5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12
r
random-forest
missing-data
data-imputation
multiple-imputation
large-data
definition
moving-window
self-study
categorical-data
econometrics
standard-error
regression-coefficients
normal-distribution
pdf
lognormal
regression
python
scikit-learn
interpolation
r
self-study
poisson-distribution
chi-squared
matlab
matrix
r
modeling
multinomial
mlogit
choice
monte-carlo
indicator-function
r
aic
garch
likelihood
r
regression
repeated-measures
simulation
multilevel-analysis
chi-squared
expected-value
multinomial
yates-correction
classification
regression
self-study
repeated-measures
references
residuals
confidence-interval
bootstrap
normality-assumption
resampling
entropy
cauchy
clustering
k-means
r
clustering
categorical-data
continuous-data
r
hypothesis-testing
nonparametric
probability
bayesian
pdf
distributions
exponential
repeated-measures
random-effects-model
non-independent
regression
error
regression-to-the-mean
correlation
group-differences
post-hoc
neural-networks
r
time-series
t-test
p-value
normalization
probability
moments
mgf
time-series
model
seasonality
r
anova
generalized-linear-model
proportion
percentage
nonparametric
ranks
weighted-regression
variogram
classification
neural-networks
fuzzy
variance
dimensionality-reduction
confidence-interval
proportion
z-test
r
self-study
pdf