การคำนวณค่า p ในกำลังสองน้อยที่สุด (ไม่เป็นลบ) ข้อ จำกัด

ฉันใช้ Matlab เพื่อดำเนินการแบบไม่ จำกัด สแควร์น้อย (กำลังสองน้อยที่สุดธรรมดา) และมันจะส่งออกสัมประสิทธิ์, สถิติการทดสอบและค่า p โดยอัตโนมัติ

คำถามของฉันคือเมื่อทำการ จำกัด กำลังสองน้อยสุด (สัมประสิทธิ์ nonnegative อย่างเคร่งครัด), มันจะออกเฉพาะค่าสัมประสิทธิ์, ไม่มีสถิติทดสอบ, ค่า p

เป็นไปได้หรือไม่ที่จะคำนวณค่าเหล่านี้เพื่อให้แน่ใจว่ามีความสำคัญ? และทำไมถึงไม่สามารถใช้งานได้โดยตรงบนซอฟต์แวร์ (หรือซอฟต์แวร์อื่น ๆ สำหรับเรื่องนั้น)

— CGO
แหล่งที่มา

คุณสามารถอธิบายให้ชัดเจนว่าคุณหมายถึงอะไรโดยใช้ "* คำนวณเพื่อ ... รับรองว่ามีความสำคัญ" คุณไม่สามารถแน่ใจได้ว่าคุณจะได้รับความสำคัญในช่องสี่เหลี่ยมน้อยที่สุดธรรมดา คุณสามารถตรวจสอบความสำคัญ แต่คุณไม่มีวิธีที่จะทำให้แน่ใจว่าคุณจะได้รับ คุณหมายถึง "มีวิธีการทดสอบความสำคัญที่มีข้อ จำกัด อย่างน้อยกำลังสองเหมาะสมหรือไม่?"

— Glen_b -Reinstate Monica

@Glen_b ให้ชื่อคำถามฉันคิดว่า "มั่นใจ" เทียบเท่ากับการตรวจสอบให้แน่ใจ

— จิม Heteroskedastic

@HeteroskedasticJim มีแนวโน้ม; แน่นอนว่ามันจะสมเหตุสมผลถ้าแน่ใจว่าเป็นเจตนา

— Glen_b -Reinstate Monica

ใช่ฉันหมายถึงวิธีคำนวณค่า pvalues เพื่อตรวจสอบว่าสมมติฐานว่างจะถูกปฏิเสธหรือไม่

— cgo

เป้าหมายของคุณคือการแสดงค่า p? พวกเขาจะมีความหมาย / ความสำคัญ / ฟังก์ชั่นอะไรสำหรับคุณ เหตุผลที่ฉันถามคือถ้าคุณเพียงแค่สนใจความถูกต้องของแบบจำลองของคุณคุณสามารถทดสอบได้โดยการแบ่งพาร์ติชันข้อมูลของคุณและใช้ส่วนหนึ่งของข้อมูลเพื่อทดสอบแบบจำลองที่ได้รับและการวัดเชิงปริมาณของประสิทธิภาพ แบบ

— Sextus Empiricus

คำตอบ:

การแก้กำลังสองน้อยที่สุดที่ไม่เป็นลบ (NNLS) ขึ้นอยู่กับอัลกอริทึมซึ่งทำให้แตกต่างจากกำลังสองน้อยที่สุดปกติ

นิพจน์พีชคณิตสำหรับข้อผิดพลาดมาตรฐาน (ไม่ทำงาน)

ด้วยกำลังสองน้อยที่สุดเป็นประจำคุณสามารถแสดงค่า p โดยใช้การทดสอบ t ร่วมกับค่าประมาณสำหรับความแปรปรวนของสัมประสิทธิ์

แสดงออกความแปรปรวนตัวอย่างของประมาณการของค่าสัมประสิทธิ์นี้คือแปรปรวนของความผิดพลาดโดยทั่วไปจะไม่รู้จัก แต่ก็สามารถคำนวณโดยใช้วิธีคลาดเคลื่อน . นิพจน์นี้สามารถหาได้จากพีชคณิตโดยเริ่มจากนิพจน์สำหรับสัมประสิทธิ์ในแง่ของการวัด $\hat\theta$

V a R (\hat{θ}) = σ^{2} (X^{T} X)^{- 1}

$Var(\hat\theta) = \sigma^2(X^TX)^{-1}$

σ

$\sigma$

y

$y$

\hat{θ} = (X^{T} X)^{- 1} X^{T} Y

$\hat\theta = (X^TX)^{-1} X^T y$

สิ่งนี้แสดงถึง / สมมติว่า $\theta$ สามารถเป็นลบได้และดังนั้นจึงหยุดพักลงเมื่อค่าสัมประสิทธิ์ถูก จำกัด

ผกผันของเมทริกซ์ข้อมูลฟิชเชอร์ (ไม่สามารถใช้ได้)

ความแปรปรวน / การกระจายของการประมาณค่าสัมประสิทธิ์ยังเป็นแบบไม่บอกกล่าวด้วยวิธีการสังเกตเมทริกซ์ข้อมูลฟิชเชอร์ :

(\hat{θ} - θ) \overset{d}{\to} ยังไม่มีข้อความ (0, ผม (\hat{θ}))

$(\hat\theta-\theta) \xrightarrow{d} N(0,\mathcal{I}(\hat\theta))$

แต่ฉันไม่แน่ใจว่าสิ่งนี้ใช้ได้ดีหรือไม่ การประมาณการ NNLS ไม่ใช่การประมาณการแบบไม่ลำเอียง

วิธีมอนติคาร์โล

เมื่อใดก็ตามที่นิพจน์ซับซ้อนเกินไปคุณสามารถใช้วิธีคำนวณเพื่อประเมินข้อผิดพลาด ด้วยวิธีมอนติคาร์โลคุณจำลองการแจกแจงของการสุ่มของการทดลองโดยจำลองการทำซ้ำของการทดลอง (การคำนวณ / การสร้างแบบจำลองข้อมูลใหม่) และจากนี้คุณประเมินความแปรปรวนของค่าสัมประสิทธิ์

สิ่งที่คุณจะทำคือการใช้ประมาณการสังเกตของรูปแบบสัมประสิทธิ์และความแปรปรวนที่เหลือและขึ้นอยู่กับข้อมูลใหม่นี้คำนวณ (คู่ของพันซ้ำ แต่มันขึ้นอยู่กับว่ามีความแม่นยำมากที่คุณต้องการ) จากการที่คุณสามารถสังเกต การแจกแจง (และความแปรปรวนและได้มาจากการประมาณนี้สำหรับข้อผิดพลาด) สำหรับสัมประสิทธิ์ (และมีรูปแบบที่ซับซ้อนกว่าในการทำแบบจำลองนี้) $\hat\theta$ $\hat\sigma$

— Sextus Empiricus
แหล่งที่มา

χ^{2}

$\chi^2$

@whuber ฉันได้เพิ่มวิธีการแก้ปัญหาด้านล่างตามการคำนวณข้อมูลการประมงของเมทริกซ์โควาเรียตซึ่งค่าสัมประสิทธิ์ nnls ไม่เป็นค่าลบและการคำนวณข้อมูลการประมงนี้ในสเกลบันทึกการแปลงเพื่อทำให้เส้นโค้งมีความเป็นไปได้มากกว่า ยินดีต้อนรับความคิดเห็น!

— Tom Wenseleers

หากคุณจะตกลงใช้ RI คิดว่าคุณยังสามารถใช้bbmleของmle2ฟังก์ชั่นเพื่อเพิ่มประสิทธิภาพการทำงานอย่างน้อยสี่เหลี่ยมโอกาสและคำนวณช่วงความเชื่อมั่น 95% สำหรับค่าสัมประสิทธิ์ nnls ไม่ติดลบ นอกจากนี้คุณสามารถคำนึงถึงว่าสัมประสิทธิ์ของคุณไม่สามารถลบได้ด้วยการปรับบันทึกของสัมประสิทธิ์ของคุณให้ดีที่สุดเพื่อให้อยู่ในระดับที่เปลี่ยนรูปแบบที่ไม่สามารถลบได้

นี่คือตัวอย่างเชิงตัวเลขที่แสดงให้เห็นถึงวิธีการนี้ที่นี่ในบริบทของการ deconvoluting การทับซ้อนของยอดโครมาโตกราฟีที่มีรูปทรงแบบเกาส์พร้อมกับเสียงแบบเกาส์ที่พวกมัน: (ยินดีต้อนรับความคิดเห็นใด ๆ )

ก่อนอื่นเราลองจำลองข้อมูล:

require(Matrix)
n = 200
x = 1:n
npeaks = 20
set.seed(123)
u = sample(x, npeaks, replace=FALSE) # peak locations which later need to be estimated
peakhrange = c(10,1E3) # peak height range
h = 10^runif(npeaks, min=log10(min(peakhrange)), max=log10(max(peakhrange))) # simulated peak heights, to be estimated
a = rep(0, n) # locations of spikes of simulated spike train, need to be estimated
a[u] = h
gauspeak = function(x, u, w, h=1) h*exp(((x-u)^2)/(-2*(w^2))) # shape of single peak, assumed to be known
bM = do.call(cbind, lapply(1:n, function (u) gauspeak(x, u=u, w=5, h=1) )) # banded matrix with theoretical peak shape function used
y_nonoise = as.vector(bM %*% a) # noiseless simulated signal = linear convolution of spike train with peak shape function
y = y_nonoise + rnorm(n, mean=0, sd=100) # simulated signal with gaussian noise on it
y = pmax(y,0)
par(mfrow=c(1,1))
plot(y, type="l", ylab="Signal", xlab="x", main="Simulated spike train (red) to be estimated given known blur kernel & with Gaussian noise")
lines(a, type="h", col="red")

ตอนนี้เรามา deconvolute สัญญาณที่วัดได้yด้วยเมทริกซ์แบนด์ที่มีการเลื่อนสำเนาของเคอร์เนลเบลอที่มีรูปร่างแบบเกาส์ที่รู้จักbM(นี่คือเมทริกซ์โควาเรียต / การออกแบบของเรา)

ก่อนอื่นเราลองถอดรหัสสัญญาณที่มีกำลังสองน้อยที่สุด:

library(nnls)
library(microbenchmark)
microbenchmark(a_nnls <- nnls(A=bM,b=y)$x) # 5.5 ms
plot(x, y, type="l", main="Ground truth (red), nnls estimate (blue)", ylab="Signal (black) & peaks (red & blue)", xlab="Time", ylim=c(-max(y),max(y)))
lines(x,-y)
lines(a, type="h", col="red", lwd=2)
lines(-a_nnls, type="h", col="blue", lwd=2)
yhat = as.vector(bM %*% a_nnls) # predicted values
residuals = (y-yhat)
nonzero = (a_nnls!=0) # nonzero coefficients
n = nrow(bM)
p = sum(nonzero)+1 # nr of estimated parameters = nr of nonzero coefficients+estimated variance
variance = sum(residuals^2)/(n-p) # estimated variance = 8114.505

ตอนนี้เรามาปรับความน่าจะเป็นบันทึกเชิงลบของเป้าหมายการสูญเสียแบบเกาส์เซียนของเราและเพิ่มประสิทธิภาพการบันทึกค่าสัมประสิทธิ์ของคุณเพื่อที่ว่าในแง่ของการเปลี่ยนรูปย้อนกลับที่พวกเขาไม่สามารถลบได้:

library(bbmle)
XM=as.matrix(bM)[,nonzero,drop=FALSE] # design matrix, keeping only covariates with nonnegative nnls coefs
colnames(XM)=paste0("v",as.character(1:n))[nonzero]
yv=as.vector(y) # response
# negative log likelihood function for gaussian loss
NEGLL_gaus_logbetas <- function(logbetas, X=XM, y=yv, sd=sqrt(variance)) {
  -sum(stats::dnorm(x = y, mean = X %*% exp(logbetas), sd = sd, log = TRUE))
}  
parnames(NEGLL_gaus_logbetas) <- colnames(XM)
system.time(fit <- mle2(
  minuslogl = NEGLL_gaus_logbetas, 
  start = setNames(log(a_nnls[nonzero]+1E-10), colnames(XM)), # we initialise with nnls estimates
  vecpar = TRUE,
  optimizer = "nlminb"
)) # takes 0.86s
AIC(fit) # 2394.857
summary(fit) # now gives log(coefficients) (note that p values are 2 sided)
# Coefficients:
#       Estimate Std. Error z value     Pr(z)    
# v10    4.57339    2.28665  2.0000 0.0454962 *  
# v11    5.30521    1.10127  4.8173 1.455e-06 ***
# v27    3.36162    1.37185  2.4504 0.0142689 *  
# v38    3.08328   23.98324  0.1286 0.8977059    
# v39    3.88101   12.01675  0.3230 0.7467206    
# v48    5.63771    3.33932  1.6883 0.0913571 .  
# v49    4.07475   16.21209  0.2513 0.8015511    
# v58    3.77749   19.78448  0.1909 0.8485789    
# v59    6.28745    1.53541  4.0950 4.222e-05 ***
# v70    1.23613  222.34992  0.0056 0.9955643    
# v71    2.67320   54.28789  0.0492 0.9607271    
# v80    5.54908    1.12656  4.9257 8.407e-07 ***
# v86    5.96813    9.31872  0.6404 0.5218830    
# v87    4.27829   84.86010  0.0504 0.9597911    
# v88    4.83853   21.42043  0.2259 0.8212918    
# v107   6.11318    0.64794  9.4348 < 2.2e-16 ***
# v108   4.13673    4.85345  0.8523 0.3940316    
# v117   3.27223    1.86578  1.7538 0.0794627 .  
# v129   4.48811    2.82435  1.5891 0.1120434    
# v130   4.79551    2.04481  2.3452 0.0190165 *  
# v145   3.97314    0.60547  6.5620 5.308e-11 ***
# v157   5.49003    0.13670 40.1608 < 2.2e-16 ***
# v172   5.88622    1.65908  3.5479 0.0003884 ***
# v173   6.49017    1.08156  6.0008 1.964e-09 ***
# v181   6.79913    1.81802  3.7399 0.0001841 ***
# v182   5.43450    7.66955  0.7086 0.4785848    
# v188   1.51878  233.81977  0.0065 0.9948174    
# v189   5.06634    5.20058  0.9742 0.3299632    
# ---
#   Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
# 
# -2 log L: 2338.857 
exp(confint(fit, method="quad"))  # backtransformed confidence intervals calculated via quadratic approximation (=Wald confidence intervals)
#              2.5 %        97.5 %
# v10   1.095964e+00  8.562480e+03
# v11   2.326040e+01  1.743531e+03
# v27   1.959787e+00  4.242829e+02
# v38   8.403942e-20  5.670507e+21
# v39   2.863032e-09  8.206810e+11
# v48   4.036402e-01  1.953696e+05
# v49   9.330044e-13  3.710221e+15
# v58   6.309090e-16  3.027742e+18
# v59   2.652533e+01  1.090313e+04
# v70  1.871739e-189 6.330566e+189
# v71   8.933534e-46  2.349031e+47
# v80   2.824905e+01  2.338118e+03
# v86   4.568985e-06  3.342200e+10
# v87   4.216892e-71  1.233336e+74
# v88   7.383119e-17  2.159994e+20
# v107  1.268806e+02  1.608602e+03
# v108  4.626990e-03  8.468795e+05
# v117  6.806996e-01  1.021572e+03
# v129  3.508065e-01  2.255556e+04
# v130  2.198449e+00  6.655952e+03
# v145  1.622306e+01  1.741383e+02
# v157  1.853224e+02  3.167003e+02
# v172  1.393601e+01  9.301732e+03
# v173  7.907170e+01  5.486191e+03
# v181  2.542890e+01  3.164652e+04
# v182  6.789470e-05  7.735850e+08
# v188 4.284006e-199 4.867958e+199
# v189  5.936664e-03  4.236704e+06
library(broom)
signlevels = tidy(fit)$p.value/2 # 1-sided p values for peak to be sign higher than 1
adjsignlevels = p.adjust(signlevels, method="fdr") # FDR corrected p values
a_nnlsbbmle = exp(coef(fit)) # exp to backtransform
max(a_nnls[nonzero]-a_nnlsbbmle) # -9.981704e-11, coefficients as expected almost the same
plot(x, y, type="l", main="Ground truth (red), nnls bbmle logcoeff estimate (blue & green, green=FDR p value<0.05)", ylab="Signal (black) & peaks (red & blue)", xlab="Time", ylim=c(-max(y),max(y)))
lines(x,-y)
lines(a, type="h", col="red", lwd=2)
lines(x[nonzero], -a_nnlsbbmle, type="h", col="blue", lwd=2)
lines(x[nonzero][(adjsignlevels<0.05)&(a_nnlsbbmle>1)], -a_nnlsbbmle[(adjsignlevels<0.05)&(a_nnlsbbmle>1)], 
      type="h", col="green", lwd=2)
sum((signlevels<0.05)&(a_nnlsbbmle>1)) # 14 peaks significantly higher than 1 before FDR correction
sum((adjsignlevels<0.05)&(a_nnlsbbmle>1)) # 11 peaks significant after FDR correction

ฉันไม่ได้พยายามเปรียบเทียบประสิทธิภาพของวิธีนี้เทียบกับ bootstrapping แบบไม่ใช้พารามิเตอร์หรือพาราเมตริก แต่มันเร็วกว่ามาก

ฉันยังมีความโน้มเอียงที่จะคิดว่าฉันควรจะสามารถในการคำนวณช่วงความเชื่อมั่น Wald สำหรับค่าลบnnlsค่าสัมประสิทธิ์บนพื้นฐานของการสังเกตข้อมูลเมทริกซ์ฟิชเชอร์คำนวณที่บันทึกเปลี่ยนขนาดค่าสัมประสิทธิ์การบังคับใช้ข้อ จำกัด nonnegativity และการประเมินที่nnlsประมาณการ

ฉันคิดว่ามันจะเป็นเช่นนี้และในความเป็นจริงแล้วควรจะเหมือนกันอย่างเป็นทางการกับสิ่งที่ฉันใช้mle2ด้านบน:

XM=as.matrix(bM)[,nonzero,drop=FALSE] # design matrix
posbetas = a_nnls[nonzero] # nonzero nnls coefficients
dispersion=sum(residuals^2)/(n-p) # estimated dispersion (variance in case of gaussian noise) (1 if noise were poisson or binomial)
information_matrix = t(XM) %*% XM # observed Fisher information matrix for nonzero coefs, ie negative of the 2nd derivative (Hessian) of the log likelihood at param estimates
scaled_information_matrix = (t(XM) %*% XM)*(1/dispersion) # information matrix scaled by 1/dispersion
# let's now calculate this scaled information matrix on a log transformed Y scale (cf. stat.psu.edu/~sesa/stat504/Lecture/lec2part2.pdf, slide 20 eqn 8 & Table 1) to take into account the nonnegativity constraints on the parameters
scaled_information_matrix_logscale = scaled_information_matrix/((1/posbetas)^2) # scaled information_matrix on transformed log scale=scaled information matrix/(PHI'(betas)^2) if PHI(beta)=log(beta)
vcov_logscale = solve(scaled_information_matrix_logscale) # scaled variance-covariance matrix of coefs on log scale ie of log(posbetas) # PS maybe figure out how to do this in better way using chol2inv & QR decomposition - in R unscaled covariance matrix is calculated as chol2inv(qr(XW_glm)$qr)
SEs_logscale = sqrt(diag(vcov_logscale)) # SEs of coefs on log scale ie of log(posbetas)
posbetas_LOWER95CL = exp(log(posbetas) - 1.96*SEs_logscale)
posbetas_UPPER95CL = exp(log(posbetas) + 1.96*SEs_logscale)
data.frame("2.5 %"=posbetas_LOWER95CL,"97.5 %"=posbetas_UPPER95CL,check.names=F)
#            2.5 %        97.5 %
# 1   1.095874e+00  8.563185e+03
# 2   2.325947e+01  1.743600e+03
# 3   1.959691e+00  4.243037e+02
# 4   8.397159e-20  5.675087e+21
# 5   2.861885e-09  8.210098e+11
# 6   4.036017e-01  1.953882e+05
# 7   9.325838e-13  3.711894e+15
# 8   6.306894e-16  3.028796e+18
# 9   2.652467e+01  1.090340e+04
# 10 1.870702e-189 6.334074e+189
# 11  8.932335e-46  2.349347e+47
# 12  2.824872e+01  2.338145e+03
# 13  4.568282e-06  3.342714e+10
# 14  4.210592e-71  1.235182e+74
# 15  7.380152e-17  2.160863e+20
# 16  1.268778e+02  1.608639e+03
# 17  4.626207e-03  8.470228e+05
# 18  6.806543e-01  1.021640e+03
# 19  3.507709e-01  2.255786e+04
# 20  2.198287e+00  6.656441e+03
# 21  1.622270e+01  1.741421e+02
# 22  1.853214e+02  3.167018e+02
# 23  1.393520e+01  9.302273e+03
# 24  7.906871e+01  5.486398e+03
# 25  2.542730e+01  3.164851e+04
# 26  6.787667e-05  7.737904e+08
# 27 4.249153e-199 4.907886e+199
# 28  5.935583e-03  4.237476e+06
z_logscale = log(posbetas)/SEs_logscale # z values for log(coefs) being greater than 0, ie coefs being > 1 (since log(1) = 0) 
pvals = pnorm(z_logscale, lower.tail=FALSE) # one-sided p values for log(coefs) being greater than 0, ie coefs being > 1 (since log(1) = 0)
pvals.adj = p.adjust(pvals, method="fdr") # FDR corrected p values

plot(x, y, type="l", main="Ground truth (red), nnls estimates (blue & green, green=FDR Wald p value<0.05)", ylab="Signal (black) & peaks (red & blue)", xlab="Time", ylim=c(-max(y),max(y)))
lines(x,-y)
lines(a, type="h", col="red", lwd=2)
lines(-a_nnls, type="h", col="blue", lwd=2)
lines(x[nonzero][pvals.adj<0.05], -a_nnls[nonzero][pvals.adj<0.05], 
      type="h", col="green", lwd=2)
sum((pvals<0.05)&(posbetas>1)) # 14 peaks significantly higher than 1 before FDR correction
sum((pvals.adj<0.05)&(posbetas>1)) # 11 peaks significantly higher than 1 after FDR correction

ผลลัพธ์ของการคำนวณเหล่านี้และสิ่งที่คืนค่ามาmle2นั้นเกือบจะเหมือนกัน (แต่เร็วกว่ามาก) ดังนั้นฉันคิดว่ามันถูกต้องและจะสอดคล้องกับสิ่งที่เราทำโดยปริยายmle2...

เพียงแค่ refitting covariates ที่มีสัมประสิทธิ์เป็นบวกในnnlsแบบที่ใช้แบบจำลองเชิงเส้นปกติพอดี btw ไม่ทำงานเนื่องจากแบบจำลองเชิงเส้นแบบพอดีจะไม่คำนึงถึงข้อ จำกัด ที่ไม่เป็นค่าลบดังนั้นจะส่งผลให้ช่วงความเชื่อมั่นที่ไม่เป็นไปตามธรรมชาตินั้น บทความนี้"การอนุมานการเลือกแบบจำลองหลังการคัดกรองเบื้องต้น" โดย Jason Lee และ Jonathan Taylorยังนำเสนอวิธีการอนุมานการเลือกแบบจำลองภายหลังในสัมประสิทธิ์ nnls (หรือ LASSO) และใช้การแจกแจงแบบเกาส์แบบตัดทอน ฉันไม่เคยเห็นการใช้งานวิธีการนี้สำหรับ nnls พอดี แต่สำหรับ LASSO ที่พอดีก็มีการเลือกที่น่าสนใจแพคเกจที่ทำอะไรแบบนั้น หากใครจะมีการใช้งานโปรดแจ้งให้เราทราบ!

ในวิธีการข้างต้นเราสามารถแยกข้อมูลในชุดการฝึกอบรม & การตรวจสอบความถูกต้อง (เช่นการสังเกตแบบคี่ & คู่) และสรุปค่าโควาเรียตที่มีค่าสัมประสิทธิ์เป็นบวกจากชุดการฝึกอบรม & จากนั้นคำนวณช่วงความมั่นใจ & ค่า p จากชุดการตรวจสอบความถูกต้อง นั่นจะเป็นความต้านทานต่อการ overfitting อีกเล็กน้อยแม้ว่ามันจะทำให้เกิดการสูญเสียพลังงานเนื่องจากจะใช้เพียงครึ่งหนึ่งของข้อมูล ฉันไม่ได้ทำที่นี่เพราะข้อ จำกัด ในตัวเองนั้นค่อนข้างมีประสิทธิภาพในการป้องกันการ overfitting

— Tom Wenseleers
แหล่งที่มา

ค่าสัมประสิทธิ์ในตัวอย่างของคุณควรมีข้อผิดพลาดอย่างมากเพราะเข็มสามารถเลื่อนได้ 1 จุดโดยไม่มีผลกระทบต่อโอกาสหรือฉันขาดอะไรไป? นี้จะเปลี่ยนค่าสัมประสิทธิ์การใด ๆ ที่ 0 และใกล้เคียง 0 ถึงค่าขนาดใหญ่ ...

— อะมีบา

ใช่ที่ถูกต้อง. แต่สิ่งต่าง ๆ จะดีขึ้นถ้าคุณเพิ่มบทลงโทษ l0 หรือ l1 เพิ่มเติมเพื่อสนับสนุนโซลูชันที่กระจัดกระจาย ฉันใช้โมเดล nnls ที่ถูกลงโทษ l0 พอดีโดยใช้อัลกอริทึมสันเขาที่ปรับตัวได้และนั่นก็ให้โซลูชันที่กระจัดกระจายมาก การทดสอบอัตราส่วนความน่าจะเป็นอาจใช้งานได้ในกรณีของฉันโดยทำการลบคำเดียว แต่ไม่ได้ refitting โมเดลด้วยคำที่ถูกทิ้ง

— Tom Wenseleers

ผมก็ไม่เข้าใจวิธีการที่คุณจะได้รับสิ่งที่มีค่า Z ขนาดใหญ่ ...

— อะมีบา

ดี จำกัด nonnegativity ช่วยมากแน่นอนบวกกับความจริงที่ว่าเรากำลังทำอนุมานโพสต์ตัวเลือกคือการรักษาที่ใช้งานชุดค่าสัมประสิทธิ์เป็นบวกคงที่ ...

— ทอม Wenseleers

โอ้ฉันไม่เข้าใจว่ามันเป็นข้อสรุปหลังการคัดเลือก

— อะมีบา

หากต้องการข้อมูลเฉพาะเจาะจงมากขึ้นเกี่ยวกับวิธี Monte Carlo @Martijn ที่อ้างถึงคุณสามารถใช้ Bootstrap ซึ่งเป็นวิธีการสุ่มตัวอย่างที่เกี่ยวข้องกับการสุ่มตัวอย่างจากข้อมูลดั้งเดิม (พร้อมการแทนที่) ชุดข้อมูลหลายชุดสำหรับการประเมินการกระจายของค่าสัมประสิทธิ์โดยประมาณ รวมถึงช่วงความมั่นใจและค่า p

วิธีการที่ใช้กันอย่างแพร่หลายมีรายละเอียดที่นี่: Efron, Bradley "วิธี Bootstrap: ดูที่ jackknife" ความก้าวหน้าทางสถิติ Springer, New York, NY, 1992. 569-593

Matlab มีการนำไปใช้แล้วให้ดูที่https://www.mathworks.com/help/stats/bootstrp.htmlโดยเฉพาะอย่างยิ่งในส่วนที่มีชื่อว่า Bootstrapping a Regression Model

— dzeltzer
แหล่งที่มา

การบูตสแตรปจะมีประโยชน์สำหรับกรณีพิเศษเมื่อข้อผิดพลาดไม่ได้รับการกระจายแบบเกาส์เซียน สิ่งนี้อาจเกิดขึ้นในหลาย ๆ ปัญหาที่พารามิเตอร์ถูก จำกัด (เช่นตัวแปรตามอาจถูก จำกัด ซึ่งขัดแย้งกับข้อผิดพลาดการกระจายแบบเกาส์) แต่จำเป็นเสมอ ตัวอย่างเช่น: หากคุณมีส่วนผสมของสารเคมีในสารละลาย (ซึ่งถูกจำลองโดยจำนวนบวกที่เพิ่มขึ้นอย่างเข้มงวดของส่วนประกอบ) และคุณทำการวัดคุณสมบัติหลายอย่างของการแก้ปัญหาข้อผิดพลาดของการวัดอาจจะมีการแจกแจงแบบเกาส์ ไม่จำเป็นต้อง bootstrapping

— Sextus Empiricus