คำถามติดแท็ก self-study

แบบฝึกหัดประจำจากตำราหลักสูตรหรือแบบทดสอบที่ใช้สำหรับชั้นเรียนหรือเรียนด้วยตนเอง นโยบายของชุมชนนี้คือ "ให้คำแนะนำที่เป็นประโยชน์" สำหรับคำถามดังกล่าวแทนที่จะตอบเต็ม

1
ตัวประมาณที่ไม่เอนเอียงพร้อมความแปรปรวนขั้นต่ำสำหรับ
ให้เป็นตัวอย่าง feom สุ่มกระจายสำหรับ&lt;1 กล่าวคือX1,...,XnX1,...,Xn X_1, ...,X_nGeometric(θ)Geometric(θ)Geometric(\theta)0&lt;θ&lt;10&lt;θ&lt;10<\theta<1 pθ(x)=θ(1−θ)x−1I{1,2,...}(x)pθ(x)=θ(1−θ)x−1I{1,2,...}(x)p_{\theta}(x)=\theta(1-\theta)^{x-1} I_{\{1,2,...\}}(x) ค้นหาตัวประมาณค่าที่เป็นกลางพร้อมค่าความแปรปรวนขั้นต่ำสำหรับg(θ)=1θg(θ)=1θg(\theta)=\frac{1}{\theta} ความพยายามของฉัน: ตั้งแต่การกระจายทางเรขาคณิตจากครอบครัวชี้แจงสถิติเสร็จสมบูรณ์และเพียงพอสำหรับ\นอกจากนี้หากเป็นตัวประมาณสำหรับมันจะไม่เอนเอียง ดังนั้นโดยทฤษฎีบท Rao-Blackwell และทฤษฎีบท Lehmann-Schefféทฤษฎีบท เป็นตัวประมาณที่เรากำลังมองหา∑Xi∑Xi\sum X_i θθ \thetaT(X)=X1T(X)=X1T(X)=X_1g(θ)g(θ)g(\theta)W(X)=E[X1|∑Xi]W(X)=E[X1|∑Xi]W(X) = E[X_1|\sum X_i] เรามีดังต่อไปนี้: W(X)=∑ti=1iP(X1=i|∑Xi=t)=∑ti=1iP(∑i≥2Xi=t−i)P(X1=i)P(∑i≥1Xi=t)W(X)=∑i=1tiP(X1=i|∑Xi=t)=∑i=1tiP(∑i≥2Xi=t−i)P(X1=i)P(∑i≥1Xi=t)W(X) = \sum_{i=1}^t i\, P(X_1=i|\sum X_i =t) = \sum_{i=1}^t i\, \frac{P(\sum_{i \geq 2} X_i =t-i)P(X_1=i)}{P(\sum_{i \geq 1}X_i =t)} เนื่องจากตัวแปรเป็น iid เรขาคณิตการกระจายผลรวมนั้นมีทั้งแบบทวินามลบ แต่ฉันกำลังมีปัญหาในการประมาณค่าสัมประสิทธิ์ทวินามและให้คำตอบสุดท้ายด้วยแบบฟอร์มที่ดีกว่าถ้าเป็นไปได้ฉันจะดีใจถ้าฉันได้รับความช่วยเหลือ ขอบคุณ! แก้ไข:ฉันไม่คิดว่าพวกคุณเข้าใจความสงสัยของฉัน:ฉันคิดว่าฉันทำทุกขั้นตอนที่ถูกต้องอาจจะลืมฟังก์ชั่นตัวบ่งชี้บางอย่างเท่านั้น นี่คือสิ่งที่ฉันทำ: ...=∑i=1ti(t−i−1n−2)θn−i(1−θ)t−i−n+1θ(1−θ)i−1(t−1n−1)θn(1−θ)t−n=∑i=1ti(t−i−1n−2)(t−1n−1)...=∑i=1ti(t−i−1n−2)θn−i(1−θ)t−i−n+1θ(1−θ)i−1(t−1n−1)θn(1−θ)t−n=∑i=1ti(t−i−1n−2)(t−1n−1)...=\sum_{i=1}^ti\frac{\binom{t-i-1}{n-2}\theta^{n-i}(1-\theta)^{t-i-n+1} \theta(1-\theta)^{i-1}}{\binom{t-1}{n-1}\theta^n(1-\theta)^{t-n}}=\sum_{i=1}^t …

1
ครอบครัวเอ็กซ์โพเนนเชียล: พบกับสถิติที่เพียงพอที่คาดหวัง
คำถามของฉันเกิดขึ้นจากการอ่านการอ่านของ Minka "การประมาณการแจกแจงดีริชเลต์"ซึ่งระบุสิ่งต่อไปนี้โดยไม่มีข้อพิสูจน์ในบริบทของการหาตัวประมาณความน่าจะเป็นสูงสุดสำหรับการแจกแจงไดริชเล็ตจากการสังเกตเวกเตอร์สุ่ม เช่นเดียวกับตระกูลเอ็กซ์โพเนนเชียลเมื่อการไล่ระดับสีเป็นศูนย์สถิติเพียงพอที่คาดหวังจะเท่ากับสถิติที่เพียงพอที่สังเกตได้ ฉันไม่เห็นการประเมินความเป็นไปได้สูงสุดในตระกูลเอ็กซ์โปเนนเชียลที่นำเสนอด้วยวิธีนี้และฉันไม่พบคำอธิบายที่เหมาะสมในการค้นหาของฉัน ใครบางคนสามารถให้ข้อมูลเชิงลึกเกี่ยวกับความสัมพันธ์ระหว่างสถิติที่สังเกตและคาดว่าเพียงพอและอาจช่วยให้เข้าใจการประมาณค่าความน่าจะเป็นสูงสุดในการลดความแตกต่างได้

1
บันทึกโอกาสสำหรับ GLM
ในรหัสต่อไปนี้ฉันทำการถดถอยโลจิสติกในข้อมูลที่จัดกลุ่มโดยใช้ glm และ "ด้วยมือ" โดยใช้ mle2 ทำไมฟังก์ชั่น logLik ใน R จึงให้ความเป็นไปได้ในการบันทึก logLik (fit.glm) = - 2.336 ที่แตกต่างจากหนึ่ง logLik (fit.ml) = - 5.514 ฉันได้รับด้วยมือ? library(bbmle) #successes in first column, failures in second Y &lt;- matrix(c(1,2,4,3,2,0),3,2) #predictor X &lt;- c(0,1,2) #use glm fit.glm &lt;- glm(Y ~ X,family=binomial (link=logit)) summary(fit.glm) #use mle2 invlogit …

3
แบบฝึกหัดที่ 2.2 ขององค์ประกอบของการเรียนรู้ทางสถิติ
หนังสือเรียนจะสร้างข้อมูล 2 ระดับก่อนผ่าน: ซึ่งจะช่วยให้: แล้วมันจะถามว่า: ฉันพยายามที่จะแก้ปัญหานี้โดยการสร้างแบบจำลองนี้ครั้งแรกด้วยโมเดลกราฟิกนี้: ที่ไหน ccc คือฉลาก h(1≤h≤10)h(1≤h≤10)h\,(1\le h \le 10) คือดัชนีของค่าเฉลี่ยที่เลือก mchmhcm_h^cและ xxxเป็นจุดข้อมูล นี้จะให้ Pr(x∣mch)=Pr(mch∣h,c=blue)=Pr(mch∣h,c=orange)=Pr(h)=Pr(c)=N(mch,I/5)N((1,0)T,I)N((0,1)T,I)11012Pr(x∣mhc)=N(mhc,I/5)Pr(mhc∣h,c=blue)=N((1,0)T,I)Pr(mhc∣h,c=orange)=N((0,1)T,I)Pr(h)=110Pr(c)=12 \begin{align*} \Pr(x\mid m_h^c) =& \mathcal{N}(m_h^c,\mathbf{I}/5)\\ \Pr(m_h^c\mid h,c=\mathrm{blue}) =& \mathcal{N}((1,0)^T,\mathbf{I})\\ \Pr(m_h^c\mid h,c=\mathrm{orange}) =& \mathcal{N}((0,1)^T,\mathbf{I})\\ \Pr(h) =& \frac{1}{10}\\ \Pr(c) =& \frac{1}{2} \end{align*} ในทางตรงกันข้ามเขตแดนเป็น\} ด้วยกฎของเบย์เรามี{x:Pr(c=blue∣x)=Pr(c=orange∣x)}{x:Pr(c=blue∣x)=Pr(c=orange∣x)}\{x:\Pr(c=\mathrm{blue}\mid x)=\Pr(c=\mathrm{orange}\mid x)\} Pr(c∣x)=Pr(x∣c)=Pr(x∣c)Pr(c)∑cPr(x∣c)Pr(c)∑h∫mchPr(h)Pr(mch∣h,c)Pr(x∣mch)Pr(c∣x)=Pr(x∣c)Pr(c)∑cPr(x∣c)Pr(c)Pr(x∣c)=∑h∫mhcPr(h)Pr(mhc∣h,c)Pr(x∣mhc) \begin{align*} \Pr(c\mid x) =& \frac{\Pr(x\mid c)\Pr(c)}{\sum_c\Pr(x\mid c)\Pr(c)}\\ …

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
หากสแควร์ของซีรีย์เวลาหยุดนิ่งอนุกรมเวลาดั้งเดิมจะอยู่กับที่หรือไม่?
ฉันพบวิธีแก้ปัญหาที่ระบุว่าหากตารางเวลาของอนุกรมเวลาคงที่ดังนั้นอนุกรมเวลาเดิมและในทางกลับกัน อย่างไรก็ตามฉันดูเหมือนจะไม่สามารถพิสูจน์ได้ว่าใครมีความคิดว่านี่เป็นเรื่องจริงและถ้ามันเป็นวิธีการที่จะได้รับมัน?

2
ความน่าจะเป็นของ
สมมติว่าและมีความเป็นอิสระตัวแปรสุ่มเรขาคณิตกับพารามิเตอร์พีความน่าจะเป็นที่คืออะไร?X1X1X_1X2X2X_2pppX1≥X2X1≥X2X_1 \geq X_2 ฉันสับสนเกี่ยวกับคำถามนี้เพราะเราไม่ได้บอกอะไรเกี่ยวกับและนอกเหนือจากพวกเขาเป็นรูปทรงเรขาคณิต สิ่งนี้จะไม่เป็นเพราะและสามารถเป็นอะไรก็ได้ในช่วงนี้X1X1X_1X2X2X_250%50%50\%X1X1X_1X2X2X_2 แก้ไข: ความพยายามใหม่ P(X1≥X2)=P(X1&gt;X2)+P(X1=X2)P(X1≥X2)=P(X1&gt;X2)+P(X1=X2)P(X1 ≥ X2) = P(X1 > X2) + P(X1 = X2) P(X1=X2)P(X1=X2)P(X1 = X2) = =∑x∑x\sum_{x} (1−p)x−1p(1−p)x−1p(1−p)x−1p(1−p)x−1p(1-p)^{x-1}p(1-p)^{x-1}pp2−pp2−p\frac{p}{2-p} P(X1&gt;X2)P(X1&gt;X2)P(X1 > X2) = และP(X1&lt;X2)P(X1&lt;X2)P(X1 < X2)P(X1&lt;X2)+P(X1&gt;X2)+P(X1=X2)=1P(X1&lt;X2)+P(X1&gt;X2)+P(X1=X2)=1P(X1 < X2) + P(X1 > X2) + P(X1 = X2) = 1 ดังนั้น = =เพิ่มถึงฉันจะได้ =P(X1&gt;X2)P(X1&gt;X2)P(X1 > X2)1−P(X1=X2)21−P(X1=X2)2\frac{1-P(X1 = …

3
ความเป็นอิสระของสถิติจากการแจกแจงแกมม่า
ให้เป็นตัวอย่างที่สุ่มจากการกระจายรังสีแกมมาขวา)X1,...,XnX1,...,XnX_1,...,X_nGamma(α,β)Gamma(α,β)\mathrm{Gamma}\left(\alpha,\beta\right) ให้และS ^ 2เป็นค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างตามลำดับX¯X¯\bar{X}S2S2S^2 จากนั้นพิสูจน์หรือพิสูจน์ว่าX¯X¯\bar{X}และS2/X¯2S2/X¯2S^2/\bar{X}^2นั้นเป็นอิสระ ความพยายามของฉัน: ตั้งแต่S2/X¯2=1n−1∑ni=1(XiX¯−1)2S2/X¯2=1n−1∑i=1n(XiX¯−1)2S^2/\bar{X}^2 = \frac{1}{n-1} \sum_{i=1}^n \left(\frac{X_i}{\bar{X}}-1\right)^2 เราต้องตรวจสอบความเป็นอิสระของX¯X¯\bar{X}และ(XผมX¯)ni = 1(XผมX¯)ผม=1n\left(\frac{X_i}{\bar{X}} \right)_{i=1}^{n} , แต่ฉันจะสร้างความเป็นอิสระระหว่างพวกเขาได้อย่างไร?

2
การแสดง
ถ้า X∼ C( 0 , 1 )X∼C(0,1)X\sim\mathcal C(0,1)หาการกระจายของ Y=2 X1 -X2Y=2X1−X2Y=\frac{2X}{1-X^2}. เรามี FY( y) = P r ( Y≤ y)FY(y)=Pr(Y≤y)F_Y(y)=\mathrm{Pr}(Y\le y) = P r (2 X1 -X2≤ y)=Pr(2X1−X2≤y)\qquad\qquad\qquad=\mathrm{Pr}\left(\frac{2X}{1-X^2}\le y\right) =⎧⎩⎨⎪⎪⎪⎪⎪⎪Pr(X∈(−∞,−1−1+y2√y])+Pr(X∈(−1,−1+1+y2√y]),ify&gt;0Pr(X∈(−1,−1+1+y2√y])+Pr(X∈(1,−1−1+y2√y]),ify&lt;0={Pr(X∈(−∞,−1−1+y2y])+Pr(X∈(−1,−1+1+y2y]),ify&gt;0Pr(X∈(−1,−1+1+y2y])+Pr(X∈(1,−1−1+y2y]),ify&lt;0\qquad\qquad=\begin{cases} \mathrm{Pr}\left(X\in\left(-\infty,\frac{-1-\sqrt{1+y^2}}{y}\right]\right)+\mathrm{Pr}\left(X\in\left(-1,\frac{-1+\sqrt{1+y^2}}{y}\right]\right),\text{if}\quad y>0\\ \mathrm{Pr}\left(X\in\left(-1,\frac{-1+\sqrt{1+y^2}}{y}\right]\right)+\mathrm{Pr}\left(X\in\left(1,\frac{-1-\sqrt{1+y^2}}{y}\right]\right),\text{if}\quad y<0 \end{cases} ฉันสงสัยว่าความแตกต่างของกรณีด้านบนนั้นถูกต้องหรือไม่ ในทางตรงกันข้ามต่อไปนี้ดูเหมือนว่าวิธีที่ง่ายกว่า: เราสามารถเขียน Y=tan(2tan- 1X)Y=tan⁡(2tan−1⁡X)Y=\tan(2\tan^{-1}X) ใช้ตัวตน 2 ตันZ1 -สีน้ำตาล2Z= ผิวสีแทน2 z2tan⁡z1−tan2⁡z=tan⁡2z\frac{2\tan z}{1-\tan^2z}=\tan 2z ตอนนี้ X∼ …

3
มีอะไรสูงกว่า
ดังนั้นฉันจึงมีการทดสอบความน่าจะเป็นและฉันไม่สามารถตอบคำถามนี้ได้ มันเพิ่งถามอะไรแบบนี้ พิจารณาว่า XXX เป็นตัวแปรสุ่ม XXX ⩾⩾\geqslant 000ใช้ความไม่เท่าเทียมกันที่ถูกต้องที่จะพิสูจน์สิ่งที่สูงกว่าหรือเท่ากับ,หรือ 2E(X2)3E(X2)3E(X^2)^3E(X3)2E(X3)2E(X^3)^2 สิ่งเดียวที่ฉันคิดได้ก็คือความไม่เท่าเทียมของ Jensen แต่ฉันไม่รู้วิธีนำไปใช้ที่นี่จริง ๆ

2
คุณสมบัติความไม่แปรเปลี่ยนของตัวประมาณค่า ML นั้นไร้ความหมายจากมุมมองแบบเบย์หรือไม่?
Casella และ Bergerระบุคุณสมบัติ invariance ของตัวประมาณค่า ML ดังนี้: อย่างไรก็ตามดูเหมือนว่าพวกเขาจะกำหนด "โอกาส" ของ ηη\eta อย่างสมบูรณ์แบบและไร้สาระ: ถ้าฉันใช้กฎพื้นฐานของทฤษฎีความน่าจะเป็นกับกรณีอย่างง่าย η=τ(θ)=θ2η=τ(θ)=θ2\eta=\tau(\theta)=\theta^2ฉันได้รับต่อไปนี้แทน: L(η|x)=p(x|θ2=η)=p(x|θ=−η–√∨θ=η–√)=:p(x|A∨B)L(η|x)=p(x|θ2=η)=p(x|θ=−η∨θ=η)=:p(x|A∨B)L(\eta|x)=p(x|\theta^2=\eta)=p(x|\theta = -\sqrt \eta \lor \theta = \sqrt \eta)=:p(x|A \lor B) ตอนนี้ใช้ทฤษฎีบทของเบย์แล้วจากข้อเท็จจริงที่ว่า AAA และ BBB เป็นเอกสิทธิ์เฉพาะบุคคลร่วมกันเพื่อให้เราสามารถใช้กฎผลรวม: p(x|A∨B)=p(x)p(A∨B|x)p(A∨B)=p(x|A∨B)=p(x)p(A|x)+p(B|x)p(A)+p(B)p(x|A∨B)=p(x)p(A∨B|x)p(A∨B)=p(x|A∨B)=p(x)p(A|x)+p(B|x)p(A)+p(B)p(x|A\lor B)=p(x)\frac {p(A\lor B|x)}{p(A\lor B)}=p(x|A\lor B)=p(x)\frac {p(A|x)+p(B|x)}{p(A)+p(B)} ตอนนี้ใช้ทฤษฎีบทของเบย์กับเงื่อนไขในตัวเศษอีกครั้ง: p(x)p(A)p(x|A)p(x)+p(B)p(x|B)p(x)p(A)+p(B)=p(A)p(x|A)+p(B)p(x|B)p(A)+p(B)p(x)p(A)p(x|A)p(x)+p(B)p(x|B)p(x)p(A)+p(B)=p(A)p(x|A)+p(B)p(x|B)p(A)+p(B)p(x)\frac {p(A)\frac {p(x|A)}{p(x)}+p(B)\frac {p(x|B)}{p(x)}}{p(A)+p(B)}=\frac {p(A)p(x|A)+p(B)p(x|B)}{p(A)+p(B)} ถ้าเราต้องการเพิ่ม wrt นี้ให้สูงสุด ηη\eta เพื่อให้ได้ค่าประมาณโอกาสสูงสุด ηη\etaเราต้องเพิ่มสูงสุด: pθ(−η–√)p(x|θ=−η–√)+pθ(η–√)p(x|θ=η–√)pθ(−η)p(x|θ=−η)+pθ(η)p(x|θ=η)p_\theta(-\sqrt …

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
ฉันจะตีความกราฟความอยู่รอดของโมเดลอันตราย Cox ได้อย่างไร
คุณจะตีความเส้นโค้งการอยู่รอดจากโมเดลอันตรายตามสัดส่วนของค็อกซ์ได้อย่างไร ในตัวอย่างของเล่นนี้สมมติว่าเรามีโมเดลอันตรายตามสัดส่วนในageตัวแปรในkidneyข้อมูลและสร้างเส้นโค้งการอยู่รอด library(survival) fit &lt;- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() ตัวอย่างเช่น ณ เวลาคำสั่งใดเป็นจริง หรือทั้งสองอย่างผิดปกติ?200200200 คำแถลงที่ 1: เราจะเหลือวิชา 20% (เช่นถ้าเรามีคนโดยวันที่เราควรเหลืออีกประมาณ ) 100010001000200200200200200200 งบ 2: สำหรับคนที่ได้รับหนึ่งเขา / เธอมีมีโอกาสที่จะอยู่รอดได้ในวันที่20020%20%20\%200200200 ความพยายามของฉัน: ฉันไม่คิดว่าทั้งสองงบจะเหมือนกัน (แก้ไขฉันถ้าฉันผิด) เนื่องจากเราไม่ได้มีการสันนิษฐาน iid (เวลารอดสำหรับทุกคนไม่ได้มาจากการกระจายอย่างอิสระ) มันคล้ายกับการถดถอยโลจิสติกในคำถามของฉันที่นี่อัตราความเป็นอันตรายของแต่ละคนขึ้นอยู่กับสำหรับบุคคลนั้นβTxβTx\beta^Tx

1
ข้อผิดพลาดที่กระจายตามปกติและทฤษฎีขีด จำกัด กลาง
ในเศรษฐศาสตรเบื้องต้นของ Wooldridge มีข้อความอ้างอิง: ข้อโต้แย้งที่แสดงให้เห็นถึงการแจกแจงปกติสำหรับข้อผิดพลาดมักจะทำสิ่งนี้: เพราะเป็นผลรวมของปัจจัยที่ไม่ได้สังเกตเห็นหลายอย่างที่มีผลต่อเราจึงสามารถเรียกทฤษฎีบทขีด จำกัด กลางเพื่อสรุปว่ามีการแจกแจงแบบปกติโดยประมาณuuuyyyuuu คำพูดนี้เกี่ยวข้องกับหนึ่งในสมมติฐานโมเดลเชิงเส้นคือ: u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2) โดยที่uuuคือคำผิดพลาดในตัวแบบประชากร ทีนี้เท่าที่ฉันรู้ทฤษฎีขีด จำกัด กลางระบุว่าการกระจายตัวของ Zi=(Yi¯¯¯¯¯−μ)/(σ/√n)Zi=(Yi¯−μ)/(σ/√n)Z_i=(\overline{Y_i}-μ)/(σ/√n) (โดยที่Yi¯¯¯¯¯Yi¯\overline{Y_i} เป็นค่าเฉลี่ยของกลุ่มตัวอย่างสุ่มจากประชากรใด ๆ ที่มีค่าเฉลี่ยμμμและความแปรปรวนσ2σ2σ^2 ) วิธีการที่ของตัวแปรปกติมาตรฐานn→∞n→∞n \rightarrow \infty\ คำถาม: ช่วยฉันเข้าใจว่ามาตรฐานความเป็นซีมโทติคของZiZiZ_iหมายถึงu∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.