คำถามติดแท็ก self-study

แบบฝึกหัดประจำจากตำราหลักสูตรหรือแบบทดสอบที่ใช้สำหรับชั้นเรียนหรือเรียนด้วยตนเอง นโยบายของชุมชนนี้คือ "ให้คำแนะนำที่เป็นประโยชน์" สำหรับคำถามดังกล่าวแทนที่จะตอบเต็ม

14
หนังสือสำหรับการวิเคราะห์อนุกรมเวลาด้วยตนเอง
ฉันเริ่มต้นด้วยการวิเคราะห์อนุกรมเวลาโดยแฮมิลตัน แต่ฉันหมดหวังอย่างสิ้นหวัง หนังสือเล่มนี้เป็นทฤษฎีจริงเกินไปที่ฉันจะเรียนรู้ด้วยตนเอง ใครบ้างมีคำแนะนำสำหรับหนังสือเรียนเกี่ยวกับการวิเคราะห์อนุกรมเวลาที่เหมาะสำหรับการศึกษาด้วยตนเอง

3
ตัวอย่าง: การถดถอย LASSO โดยใช้ glmnet สำหรับผลลัพธ์ไบนารี
ฉันเริ่มตะลุยกับการใช้งานglmnetกับการถดถอยแบบ LASSOซึ่งผลลัพธ์ของความสนใจของฉันนั้นเป็นแบบขั้วคู่ ฉันได้สร้างกรอบข้อมูลจำลองขนาดเล็กด้านล่าง: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


8
ข้อผิดพลาดในการวิเคราะห์อนุกรมเวลา
ฉันเพิ่งเริ่มเรียนรู้ด้วยตนเองในการวิเคราะห์อนุกรมเวลา ฉันสังเกตเห็นว่ามีข้อผิดพลาดที่อาจเกิดขึ้นจำนวนหนึ่งซึ่งไม่สามารถใช้ได้กับสถิติทั่วไป ดังนั้นการสร้างความผิดทางสถิติทั่วไปคืออะไร , ฉันอยากจะถาม: ข้อผิดพลาดทั่วไปหรือความผิดทางสถิติในการวิเคราะห์อนุกรมเวลาคืออะไร สิ่งนี้มีจุดประสงค์เพื่อเป็นชุมชนวิกิหนึ่งแนวคิดต่อหนึ่งคำตอบและโปรดไม่มีการทำซ้ำของข้อผิดพลาดทางสถิติทั่วไปเพิ่มเติมที่ (หรือควรจะ) แสดงรายการที่บาปทางสถิติทั่วไปคืออะไร

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

3
ลักษณะทั่วไปของกฎหมายว่าด้วยความคาดหวังซ้ำแล้วซ้ำอีก
ฉันเพิ่งเจอตัวตนนี้: E[ E( Y| X,Z)|X]=E[Y|X]E[E(Y|X,Z)|X]=E[Y|X]E \left[ E \left(Y|X,Z \right) |X \right] =E \left[Y | X \right] แน่นอนว่าฉันคุ้นเคยกับกฎฉบับนั้นง่ายกว่านั่นคือแต่ฉันไม่สามารถหาเหตุผลในการวางหลักเกณฑ์ทั่วไปได้E[E(Y|X)]=E(Y)E[E(Y|X)]=E(Y)E \left[ E \left(Y|X \right) \right]=E \left(Y\right) ฉันจะขอบคุณถ้ามีคนสามารถชี้ให้ฉันอ้างอิงที่ไม่ช่างเทคนิคสำหรับความจริงที่ว่าหรือดีกว่าถ้ามีคนสามารถวางหลักฐานง่าย ๆ สำหรับผลลัพธ์ที่สำคัญนี้

4
ความคาดหวังของซีรี่ส์เทย์เลอร์
คำถามของฉันเกี่ยวข้องกับการพยายามพิสูจน์วิธีการที่ใช้กันอย่างแพร่หลายนั่นคือการนำค่าที่คาดหวังของ Taylor Series สมมติเรามีตัวแปรสุ่มมีค่าเฉลี่ยบวกและความแปรปรวน 2 นอกจากนี้เรายังมีฟังก์ชั่นการพูด,(x)XXXμμ\muσ2σ2\sigma^2log(x)log⁡(x)\log(x) การขยายตัวของรอบ ๆเทย์เลอร์เราจะได้ ที่คือ st.logXlog⁡X\log XlogX=logμ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξ3X,log⁡X=log⁡μ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξX3, \log X = \log\mu + \frac{X - \mu}{\mu} - \frac12 \frac{(X-\mu)^2}{\mu^2} + \frac13 \frac{(X - \mu)^3}{\xi_X^3}, ξXξX\xi_X|ξX−μ|&lt;|X−μ||ξX−μ|&lt;|X−μ||\xi_X - \mu| < |X - \mu| ถ้าเราใช้ความคาดหวังเราจะได้สมการโดยประมาณซึ่งผู้คนมักจะอ้างถึงว่าเป็นสิ่งที่เห็นได้ชัดในตัวเอง(ดูเครื่องหมายในสมการแรกที่นี่)≈≈\approx : ElogX≈logμ−12σ2μ2Elog⁡X≈log⁡μ−12σ2μ2 \mathbb{E}\log X \approx \log \mu - \frac12 \frac{\sigma^2}{\mu^2} คำถาม : ฉันสนใจที่จะพิสูจน์ว่ามูลค่าที่คาดหวังของคำศัพท์ที่เหลือนั้นน้อยมากนั่นคือ (หรือกล่าวอีกนัยหนึ่ง )E[(X−μ)3ξ3X]=o(σ2)E[(X−μ)3ξX3]=o(σ2) …

5
LDA กับ word2vec
ฉันพยายามที่จะเข้าใจความคล้ายคลึงกันระหว่างLatent Dirichlet Allocationและword2vecสำหรับการคำนวณความคล้ายคลึงกันของคำ ดังที่ฉันเข้าใจ LDA จับคู่คำกับเวกเตอร์ของความน่าจะเป็นของหัวข้อแฝงในขณะที่ word2vec จับคู่คำกับเวกเตอร์ของจำนวนจริง (เกี่ยวข้องกับการสลายตัวตามตัวอักษรเอกพจน์ของข้อมูลร่วมกันแบบพอยต์ดูO. Levy, Y. Goldberg) ตามตัวประกอบเมทริกซ์โดยนัย " ; ดูเพิ่มเติมที่word2vec ทำงานอย่างไร? ) ฉันสนใจทั้งในด้านความสัมพันธ์ทางทฤษฎี (สามารถพิจารณาได้ว่าเป็นลักษณะทั่วไปหรือการเปลี่ยนแปลงอื่น ๆ ) และในทางปฏิบัติ (เมื่อใช้อย่างใดอย่างหนึ่ง แต่ไม่ใช่แบบอื่น) ที่เกี่ยวข้อง: อะไรคือวิธีมาตรฐานในการคำนวณระยะห่างระหว่างเอกสาร - DataScience.SE

9
ความสัมพันธ์ระหว่าง
ความสัมพันธ์ระหว่างและในโครงเรื่องต่อไปนี้คืออะไร? ในมุมมองของฉันมีความสัมพันธ์เชิงเส้นเชิงลบ แต่เนื่องจากเรามีค่าผิดจำนวนมากความสัมพันธ์จึงอ่อนมาก ฉันถูกไหม? ฉันต้องการเรียนรู้วิธีที่เราสามารถอธิบายแผนการกระจายXYYYXXX

5
ความจริงที่ว่าลูกชายชาวอิตาเลียนของฉันจะเข้าเรียนในโรงเรียนประถมจะเปลี่ยนจำนวนเด็กอิตาเลียนที่คาดหวังให้เข้าเรียนในชั้นเรียนของเขาหรือไม่?
นี่เป็นคำถามที่เกิดจากสถานการณ์ในชีวิตจริงซึ่งฉันได้รับความสับสนอย่างแท้จริงเกี่ยวกับคำตอบ ลูกชายของฉันเกิดจากการเริ่มต้นโรงเรียนประถมในลอนดอน ในขณะที่เราเป็นชาวอิตาลีฉันอยากรู้ว่าเด็ก ๆ ชาวอิตาเลียนจำนวนเท่าใดที่เข้าเรียนในโรงเรียนนี้แล้ว ฉันถามเรื่องนี้กับเจ้าหน้าที่รับสมัครในขณะที่สมัครและเธอบอกฉันว่าพวกเขามีเด็กอิตาเลียน 2 คนต่อชั้นเรียน (จาก 30) โดยเฉลี่ย ตอนนี้ฉันอยู่ในช่วงเวลาที่ฉันรู้ว่าลูกของฉันได้รับการยอมรับ แต่ฉันไม่มีข้อมูลอื่นเกี่ยวกับเด็กคนอื่น เกณฑ์การรับเข้าเรียนนั้นขึ้นอยู่กับระยะทาง แต่สำหรับวัตถุประสงค์ของคำถามนี้ฉันเชื่อว่าเราสามารถสันนิษฐานได้ว่าขึ้นอยู่กับการจัดสรรแบบสุ่มจากกลุ่มตัวอย่างจำนวนมากของผู้สมัคร มีเด็กอิตาเลี่ยนกี่คนที่คาดว่าจะอยู่ในชั้นเรียนของลูกชายของฉัน จะใกล้เคียงกับ 2 หรือ 3 หรือไม่

6
ทำไมตัวหารของตัวประมาณความแปรปรวนร่วมไม่ควรเป็น n-2 แทนที่จะเป็น n-1
ตัวหารของตัวประมาณค่าความแปรปรวน (ไม่เอนเอียง) คือเนื่องจากมีการสังเกตและมีการประมาณเพียงหนึ่งพารามิเตอร์เท่านั้นn−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} ในทำนองเดียวกันฉันสงสัยว่าทำไมตัวหารความแปรปรวนร่วมไม่ควรเป็นเมื่อมีการประมาณสองพารามิเตอร์?n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}

3
จะหาอนุพันธ์ของความหนาแน่นปกติหลายตัวแปรได้อย่างไร
สมมติว่าฉันมีความหนาแน่นหลายตัวแปรปกติฉันต้องการที่จะได้รับที่สอง (บางส่วน) WRT อนุพันธ์\ไม่แน่ใจว่าจะหาอนุพันธ์ของเมทริกซ์ได้อย่างไรN(μ,Σ)N(μ,Σ)N(\mu, \Sigma)μμ\mu Wiki กล่าวว่านำองค์ประกอบอนุพันธ์โดยองค์ประกอบภายในเมทริกซ์ ฉันกำลังทำงานกับ Laplace ประมาณ โหมดคือ\θ = μlogPN(θ)=logPN−12(θ−θ^)TΣ−1(θ−θ^).log⁡PN(θ)=log⁡PN−12(θ−θ^)TΣ−1(θ−θ^).\log{P}_{N}(\theta)=\log {P}_{N}-\frac{1}{2}{(\theta-\hat{\theta})}^{T}{\Sigma}^{-1}(\theta-\hat{\theta}) \>.θ^=μθ^=μ\hat\theta=\mu ฉันได้รับสิ่งนี้เกิดขึ้นได้อย่างไร?Σ−1=−∂2∂θ2logp(θ^|y),Σ−1=−∂2∂θ2log⁡p(θ^|y),{\Sigma}^{-1}=-\frac{{{\partial }^{2}}}{\partial {{\theta }^{2}}}\log p(\hat{\theta }|y), สิ่งที่ฉันได้ทำ: logP(θ|y)=−k2log2π−12log|Σ|−12(θ−θ^)TΣ−1(θ−θ^)log⁡P(θ|y)=−k2log⁡2π−12log⁡|Σ|−12(θ−θ^)TΣ−1(θ−θ^)\log P(\theta|y) = -\frac{k}{2} \log 2 \pi - \frac{1}{2} \log \left| \Sigma \right| - \frac{1}{2} {(\theta-\hat \theta)}^{T}{\Sigma}^{-1}(\theta-\hat\theta) ดังนั้นฉันเอาอนุพันธ์ wrt มาที่ก่อนอื่นมีการแปลงที่สองคือเมทริกซ์ ดังนั้นฉันติดอยู่θθ\theta หมายเหตุ: หากอาจารย์ของฉันพบสิ่งนี้ฉันหมายถึงการบรรยาย

3
คะแนน Akaike Information Criterion (AIC) ของแบบจำลองหมายถึงอะไร
ฉันได้เห็นคำถามบางอย่างที่นี่เกี่ยวกับความหมายในแง่คนธรรมดา แต่สิ่งเหล่านี้มันธรรมดาเกินไปสำหรับวัตถุประสงค์ของฉันที่นี่ ฉันกำลังพยายามที่จะเข้าใจทางคณิตศาสตร์ว่าคะแนน AIC หมายถึงอะไร แต่ในเวลาเดียวกันฉันไม่ต้องการหลักฐานที่เข้มงวดซึ่งจะทำให้ฉันไม่เห็นประเด็นที่สำคัญกว่านี้ ตัวอย่างเช่นถ้านี่คือแคลคูลัสฉันจะมีความสุขกับ infinitesimals และถ้านี่เป็นทฤษฎีความน่าจะเป็น ความพยายามของฉัน โดยอ่านที่นี่และสัญกรณ์น้ำตาลของฉันเองเป็นเกณฑ์ AIC ของรุ่นบนชุดข้อมูลดังนี้: ที่เป็นจำนวนพารามิเตอร์ของแบบจำลองและเป็นค่าฟังก์ชั่นความน่าจะเป็นสูงสุดของรุ่นบนชุดDAICm,DAICm,D\text{AIC}_{m,D}mmmDDDAICm,D=2km−2ln(Lm,D)AICm,D=2km−2ln⁡(Lm,D) \text{AIC}_{m,D} = 2k_m - 2 \ln(L_{m,D}) kmkmk_mmmmLm,DLm,DL_{m,D}mmmDDD นี่คือความเข้าใจของฉันในสิ่งที่ข้างต้นหมายถึง: m=arg maxθPr(D|θ)m=arg maxθPr(D|θ) m = \underset{\theta}{\text{arg max}\,} \Pr(D|\theta) ทางนี้: kmkmk_mเป็นจำนวนพารามิเตอร์ของม.mmm Lm,D=Pr(D|m)=L(m|D)Lm,D=Pr(D|m)=L(m|D)L_{m,D} = \Pr(D|m) = \mathcal{L}(m|D)D) ตอนนี้ลองเขียน AIC: AICm,D===2km−2ln(Lm,D)2km−2ln(Pr(D|m))2km−2loge(Pr(D|m))AICm,D=2km−2ln⁡(Lm,D)=2km−2ln⁡(Pr(D|m))=2km−2loge⁡(Pr(D|m))\begin{split} \text{AIC}_{m,D} =& 2k_m - 2 \ln(L_{m,D})\\ =& 2k_m - 2 …

5
ค้นหาค่าที่คาดหวังโดยใช้ CDF
ฉันจะเริ่มด้วยการบอกว่านี่เป็นปัญหาการบ้านตรงๆจากหนังสือ ฉันใช้เวลาสองสามชั่วโมงเพื่อค้นหาวิธีการค้นหาค่าที่คาดหวังและตัดสินใจว่าฉันไม่เข้าใจอะไรเลย Letมี CDFx ค้นหาสำหรับค่าเหล่านั้นของซึ่งมีอยู่XXXF(x)=1−x−α,x≥1F(x)=1−x−α,x≥1F(x) = 1 - x^{-\alpha}, x\ge1E(X)E(X)E(X)αα\alphaE(X)E(X)E(X) ฉันไม่รู้ว่าจะเริ่มต้นอย่างไร ฉันจะกำหนดค่าของมีอยู่ได้อย่างไร ฉันยังไม่รู้ว่าจะทำอย่างไรกับ CDF (ฉันสมมติว่านี่หมายถึง Cumulative Distribution Function) มีสูตรสำหรับค้นหาค่าที่คาดไว้เมื่อคุณมีฟังก์ชันความถี่หรือฟังก์ชันความหนาแน่น Wikipedia กล่าวว่า CDF ของสามารถนิยามได้ในรูปของฟังก์ชันความหนาแน่นของความน่าจะเป็นดังนี้:αα\alphaXXXfff F(x)=∫x−∞f(t)dtF(x)=∫−∞xf(t)dtF(x) = \int_{-\infty}^x f(t)\,dt เท่าที่ฉันได้รับ ฉันจะไปจากที่นี่ที่ไหน แก้ไข: ฉันหมายถึงการใส่xx≥1x≥1x\ge1

4
ผลลัพธ์ของการสอบนั้นเป็นแบบทวินามหรือไม่?
นี่เป็นคำถามเชิงสถิติอย่างง่ายที่ฉันได้รับ ฉันไม่แน่ใจจริงๆฉันเข้าใจ X = จำนวนคะแนน aquired ในการสอบ (ตัวเลือกที่หลากหลายและคำตอบที่ถูกคือหนึ่งจุด) X มีการแจกแจงแบบทวินามหรือไม่ คำตอบของอาจารย์คือ: ใช่เพราะมีเพียงคำตอบที่ถูกหรือผิด คำตอบของฉัน: ไม่เพราะคำถามแต่ละข้อมี "ความน่าจะเป็นที่ประสบความสำเร็จ" ที่แตกต่างกัน อย่างที่ฉันเข้าใจว่าการแจกแจงทวินามเป็นเพียงชุดของการทดลองของ Bernoulli ซึ่งแต่ละคนมีผลลัพธ์ที่เรียบง่าย เช่นการพลิกเหรียญ a (ยุติธรรม) 100 ครั้งนี่คือการทดลอง 100 Bernoulli และทั้งหมดมี p = 0.5 แต่ที่นี่คำถามมี p ที่แตกต่างกันใช่มั้ย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.