คำถามติดแท็ก t-distribution

t คือการแจกแจงของสถิติ t ที่เป็นผลมาจากการทดสอบ t ใช้แท็กนี้สำหรับคำถามเกี่ยวกับการแจกจ่ายเท่านั้น ใช้ [t-test] สำหรับคำถามเกี่ยวกับการทดสอบ

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

1
พิสูจน์ว่าสัมประสิทธิ์ในแบบจำลอง OLS เป็นไปตามการแจกแจงแบบ t ด้วย (nk) องศาอิสระ
พื้นหลัง สมมติว่าเรามีโมเดลกำลังสองน้อยที่สุดซึ่งเรามีค่าสัมประสิทธิ์ในแบบจำลองการถดถอยของเรา kkky=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} โดยที่เป็นเวกเตอร์ของสัมประสิทธิ์ ,คือเมทริกซ์การออกแบบที่กำหนดโดยββ\mathbf{\beta}(k×1)(k×1)(k\times1)XX\mathbf{X} X=⎛⎝⎜⎜⎜⎜⎜⎜11⋮1x11x21xn1x12…⋱………x1(k−1)⋮⋮xn(k−1)⎞⎠⎟⎟⎟⎟⎟⎟X=(1x11x12…x1(k−1)1x21…⋮⋮⋱⋮1xn1……xn(k−1))\mathbf{X} = \begin{pmatrix} 1 & x_{11} & x_{12} & \dots & x_{1\;(k-1)} \\ 1 & x_{21} & \dots & & \vdots \\ \vdots & & \ddots & & \vdots \\ 1 & x_{n1} & \dots & \dots & x_{n\;(k-1)} \end{pmatrix} และข้อผิดพลาดคือ IID ปกติ …

4
การประมาณค่าพารามิเตอร์ของการแจกแจงแบบ t
ตัวประมาณโอกาสสูงสุดสำหรับพารามิเตอร์ของการแจกแจงแบบ t คืออะไร พวกมันมีอยู่ในรูปแบบปิดหรือไม่? การค้นหาโดย Google อย่างรวดเร็วไม่ได้ให้ผลลัพธ์ใด ๆ แก่ฉัน วันนี้ฉันสนใจกรณี univariate แต่บางทีฉันอาจจะต้องขยายโมเดลเป็นหลายมิติ แก้ไข: ฉันจริง ๆ แล้วส่วนใหญ่สนใจในพารามิเตอร์ที่ตั้งและขนาด สำหรับตอนนี้ฉันสามารถสรุปได้ว่าค่าพารามิเตอร์องศาอิสระได้รับการแก้ไขและอาจใช้รูปแบบตัวเลขเพื่อหาค่าที่ดีที่สุดในภายหลัง

3
ผลรวมของผลต่างกำลังสอง t คืออะไร?
ปล่อยให้ถูกดึงออกมาจากการแจกแจงของนักเรียนโดยมีองศาอิสระสำหรับขนาดปานกลาง(พูดน้อยกว่า 100) กำหนด คือกระจายเกือบเป็นไคสแควร์กับองศาอิสระ? มีทฤษฎีบท จำกัด กลางสำหรับผลรวมของตัวแปรสุ่มกำลังสองหรือไม่?เสื้อผมtit_innnnnnT= ∑1 ≤ ฉัน≤ kเสื้อ2ผมT=∑1≤i≤kti2T = \sum_{1\le i \le k} t_i^2TTTkkk

3
ทำไมการแจกแจงแบบ t จึงปกติมากกว่าเมื่อขนาดตัวอย่างเพิ่มขึ้น?
ตามวิกิพีเดียฉันเข้าใจว่าการแจกแจงแบบ t เป็นการกระจายตัวตัวอย่างของค่า t เมื่อตัวอย่างเป็นการสังเกตแบบ iid จากประชากรที่กระจายตัวตามปกติ อย่างไรก็ตามฉันไม่เข้าใจโดยสัญชาตญาณว่าทำไมทำให้รูปร่างของการแจกแจงแบบ t เปลี่ยนจากไขมันหางเป็นปกติเกือบสมบูรณ์ ฉันได้ว่าถ้าคุณสุ่มตัวอย่างจากการแจกแจงแบบปกติแล้วถ้าคุณลองสุ่มกลุ่มใหญ่มันจะคล้ายกับการกระจายตัวนั้น แต่ฉันไม่เข้าใจว่าทำไมมันเริ่มต้นด้วยรูปร่างอ้วนท้วน

2
การกระจายตัวของความแตกต่างของการแจกแจงสองค่าคืออะไร
... และทำไม ? สมมติว่า , X 2เป็นตัวแปรสุ่มอิสระที่มีค่าเฉลี่ยμ 1 , μ 2และความแปรปรวนσ 2 1 , σ 2 2ตามลำดับ หนังสือสถิติพื้นฐานของฉันบอกฉันว่าการกระจายตัวของX 1 - X 2มีคุณสมบัติดังต่อไปนี้:X1X1X_1X2X2X_2μ1,μ2μ1,μ2\mu_1,\mu_2σ21,σ22σ12,σ22\sigma^2_1,\sigma^2_2X1−X2X1−X2X_1-X_2 E(X1−X2)=μ1−μ2E(X1−X2)=μ1−μ2E(X_1-X_2)=\mu_1-\mu_2 Var(X1−X2)=σ21+σ22Var(X1−X2)=σ12+σ22Var(X_1-X_2)=\sigma^2_1 +\sigma^2_2 สมมุติว่า , X 2 คือการแจกแจงแบบ t กับn 1 - 1 , n 2 - 2ดีกรีอิสระ การกระจายตัวของX 1 - X 2คืออะไร?X1X1X_1X2X2X_2n1−1n1−1n_1-1n2−2n2−2n_2-2X1−X2X1−X2X_1-X_2 คำถามนี้ได้รับการแก้ไข:คำถามเดิมคือ"อะไรคือองศาอิสระของความแตกต่างของการแจกแจงแบบสองจุด?" . mpiktas ได้ชี้ให้เห็นแล้วว่าสิ่งนี้ไม่สมเหตุสมผลเนื่องจากไม่ได้ถูกแจกแจงแบบ t …

5
ทำไมเราไม่ใช้การแจกแจงแบบ t เพื่อสร้างช่วงความมั่นใจสำหรับสัดส่วน?
ในการคำนวณช่วงความเชื่อมั่น (CI) สำหรับค่าเฉลี่ยด้วยค่าเบี่ยงเบนมาตรฐานประชากรที่ไม่รู้จัก (sd) เราประมาณค่าเบี่ยงเบนมาตรฐานประชากรโดยใช้การแจกแจงแบบ t ยวดที่n} แต่เนื่องจากเราไม่ได้ประมาณค่าเบี่ยงเบนมาตรฐานของประชากรเราประเมินผ่านการประมาณโดยที่CI=X¯±Z95%σX¯CI=X¯±Z95%σX¯CI=\bar{X} \pm Z_{95\% }\sigma_{\bar X}σX¯=σn√σX¯=σn\sigma_{\bar X} = \frac{\sigma}{\sqrt n}CI=X¯±t95%(se)CI=X¯±t95%(se)CI=\bar{X} \pm t_{95\% }(se)se=sn√se=snse = \frac{s}{\sqrt n} ในทางตรงกันข้ามสำหรับสัดส่วนประชากรเพื่อคำนวณ CI เราประมาณว่าโดยที่ให้และCI=p^±Z95%(se)CI=p^±Z95%(se)CI = \hat{p} \pm Z_{95\% }(se)se=p^(1−p^)n−−−−−√se=p^(1−p^)nse = \sqrt\frac{\hat{p}(1-\hat{p})}{n}np^≥15np^≥15n \hat{p} \ge 15n(1−p^)≥15n(1−p^)≥15n(1-\hat{p}) \ge 15 คำถามของฉันคือทำไมเราพึงพอใจกับการกระจายมาตรฐานสำหรับสัดส่วนประชากร?

1
การสุ่มตัวอย่างตัวอย่างด้วย MLE ที่กำหนด
คำถามนี้รอการตรวจสอบถามเกี่ยวกับการเลียนแบบตามเงื่อนไขที่กลุ่มตัวอย่างที่มีผลรวมคงที่ทำให้ผมนึกถึงชุดปัญหาให้ฉันโดยจอร์จ Casella f(x|θ)f(x|θ)f(x|\theta)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θθ\thetaθ^(x1,…,xn)=argmin∑i=1nlogf(xi|θ)θ^(x1,…,xn)=arg⁡min∑i=1nlog⁡f(xi|θ)\hat{\theta}(x_1,\ldots,x_n)=\arg\min \sum_{i=1}^n \log f(x_i|\theta)θθ\theta θ (X1,...,Xn)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θ^(X1,…,Xn)θ^(X1,…,Xn)\hat{\theta}(X_1,\ldots,X_n) ตัวอย่างเช่นใช้การแจกแจงด้วยพารามิเตอร์ตำแหน่งซึ่งความหนาแน่นคือถ้าเราจะจำลองเงื่อนไข(X_1, \ ldots, X_n)บน\ hat {\ mu} (X_1, \ ldots, X_n) = \ mu_0 ได้อย่างไร? ในตัวอย่าง\ mathfrak {T} _5นี้การกระจายของ\ hat {\ mu} (X_1, \ ldots, X_n)ไม่มีนิพจน์แบบปิดT5T5\mathfrak{T}_5μμ\mu (X1,...,Xn) IID ~ F(x|μ)(X1,...,Xn) μ (X1,...,Xn)=μ0 T 5 μ (X1ฉ( x | μ ) = Γ …

3
ทำไมไม่ใช้การแจกแจงแบบ T เพื่อประมาณค่าเฉลี่ยเมื่อกลุ่มตัวอย่างมีขนาดใหญ่
หลักสูตรสถิติพื้นฐานมักแนะนำให้ใช้การแจกแจงแบบปกติเพื่อประมาณค่าเฉลี่ยของพารามิเตอร์ประชากรเมื่อขนาดตัวอย่างnมีขนาดใหญ่ (โดยทั่วไปแล้วจะมากกว่า 30 หรือ 50) การแจกแจงแบบ T ของนักเรียนใช้สำหรับกลุ่มตัวอย่างขนาดเล็กลงเพื่ออธิบายความไม่แน่นอนในค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง เมื่อขนาดตัวอย่างมีขนาดใหญ่ค่าเบี่ยงเบนมาตรฐานตัวอย่างจะให้ข้อมูลที่ดีเกี่ยวกับค่าเบี่ยงเบนมาตรฐานประชากรทำให้สามารถประมาณการกระจายตัวแบบปกติได้ ฉันเข้าใจ. แต่ทำไมต้องใช้การประมาณเมื่อคุณได้รับช่วงความมั่นใจอย่างแน่นอน ไม่ว่าขนาดของกลุ่มตัวอย่างจะเป็นอะไรจุดของการใช้การแจกแจงแบบปกติคือถ้าเป็นเพียงการประมาณบางอย่างที่คุณจะได้รับจากการแจกแจงแบบ T

2
ทำไมการแจกแจงแบบ T ใช้สำหรับการทดสอบสมมุติฐานสัมประสิทธิ์การถดถอยเชิงเส้น?
ในทางปฏิบัติการใช้ T-test มาตรฐานเพื่อตรวจสอบความสำคัญของสัมประสิทธิ์การถดถอยเชิงเส้นคือการปฏิบัติทั่วไป กลไกของการคำนวณนั้นสมเหตุสมผลสำหรับฉัน ทำไมการแจกแจงแบบ T สามารถใช้เป็นแบบจำลองสถิติการทดสอบมาตรฐานที่ใช้ในการทดสอบสมมติฐานการถดถอยเชิงเส้น สถิติทดสอบมาตรฐานฉันหมายถึงที่นี่: T0=βˆ−β0SE(βˆ)T0=β^−β0SE(β^) T_{0} = \frac{\widehat{\beta} - \beta_{0}}{SE(\widehat{\beta})}

3
ความสับสนเกี่ยวกับเวลาที่จะใช้
ผมหมายถึงการบรรยายวิดีโอนี้สำหรับการคำนวณช่วงความเชื่อมั่น อย่างไรก็ตามฉันมีความสับสน เจ้านี่ใช้ -statistics สำหรับการคำนวณ แต่ผมคิดว่ามันควรจะได้รับเสื้อ -statistics เราไม่ได้รับค่าเบี่ยงเบนมาตรฐานที่แท้จริงของประชากร เราใช้ค่าเบี่ยงเบนมาตรฐานตัวอย่างเพื่อประมาณค่าจริงzzzttt แล้วทำไมเขาถึงกระจายตัวแบบปกติสำหรับช่วงความมั่นใจแทนที่จะเป็น ?ttt

2
คำอธิบายสำหรับองศาอิสระที่ไม่ใช่จำนวนเต็มในการทดสอบ t กับผลต่างที่ไม่เท่ากัน
ขั้นตอนการทดสอบ SPSS รายงานการวิเคราะห์ 2 เมื่อเปรียบเทียบวิธีอิสระ 2 วิธีการวิเคราะห์หนึ่งที่มีความแปรปรวนเท่ากันและหนึ่งที่มีผลต่างไม่เท่ากัน องศาอิสระ (df) เมื่อถือว่าผลต่างเท่ากันนั้นถือเป็นค่าจำนวนเต็มเสมอ (และเท่ากับ n-2) df เมื่อความแปรปรวนที่เท่ากันจะไม่ถือว่าไม่ใช่จำนวนเต็ม (เช่น 11.467) และไม่มีที่ไหนใกล้ n-2 ฉันกำลังหาคำอธิบายเกี่ยวกับตรรกะและวิธีการที่ใช้ในการคำนวณ df ที่ไม่ใช่จำนวนเต็มเหล่านี้


2
สัญชาตญาณเบื้องหลังฟังก์ชันความหนาแน่นของการแจกแจงแบบ t
ฉันกำลังศึกษาเกี่ยวกับการแจกแจงค่า t ของนักเรียนและฉันเริ่มสงสัยว่าจะได้รับฟังก์ชันความหนาแน่นของการแจกแจงแบบ t (จากวิกิพีเดีย, http://en.wikipedia.org/wiki/Student%27s_t-distribution ) ได้อย่างไร: f(t)=Γ(v+12)vπ−−√Γ(v2)(1+t2v)−v+12f(t)=Γ(v+12)vπΓ(v2)(1+t2v)−v+12f(t) = \frac{\Gamma(\frac{v+1}{2})}{\sqrt{v\pi}\:\Gamma(\frac{v}{2})}\left(1+\frac{t^2}{v} \right)^{-\frac{v+1}{2}} โดยที่คือองศาอิสระและคือฟังก์ชันแกมม่า สัญชาตญาณของฟังก์ชั่นนี้คืออะไร? ฉันหมายถึงถ้าฉันดูฟังก์ชันความน่าจะเป็นแบบกระจายมวลแบบทวินามมันก็สมเหตุสมผลสำหรับฉัน แต่ฟังก์ชั่นความหนาแน่นของการแจกแจงแบบ t ทำให้ฉันไม่เข้าใจเลย ... มันไม่ง่ายเลยตั้งแต่แรกพบ หรือสัญชาตญาณเพียงว่ามันมีรูปทรงระฆังและมันตอบสนองความต้องการของเรา?vvvΓΓ\Gamma ขอบคุณสำหรับความช่วยเหลือใด ๆ :)

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.