คำถามติดแท็ก notation

สำหรับคำถามเกี่ยวกับสัญกรณ์ทางสถิติและสัญกรณ์ทางคณิตศาสตร์ที่ใช้ในสถิติ

1
อะไรคือความหมายของบาร์คู่และ 2 ที่ด้านล่างในช่องสี่เหลี่ยมน้อยที่สุดธรรมดา?
ผมเห็นเครื่องหมายนี้สำหรับสองน้อยสามัญที่นี่ นาทีW∥ Xw - y∥22minw‖Xw−y‖22 \min_w \left\| Xw - y \right\|^2_2 ฉันไม่เคยเห็นแถบคู่และ 2 ที่ด้านล่าง สัญลักษณ์เหล่านี้หมายถึงอะไร พวกเขามีคำศัพท์เฉพาะสำหรับพวกเขาหรือไม่?

1
ชื่อลำดับที่สูงขึ้นและโมเมนต์ที่เกินความแปรปรวนความเบ้และความโด่ง
ในฟิสิกส์หรือคณิตศาสตร์กลเริ่มจากตำแหน่งตามเวลา , หนึ่งได้รับอัตราการเปลี่ยนแปลงผ่านอนุพันธ์ที่เกี่ยวกับเวลา: ความเร็ว, การเร่ง, เหวี่ยง (ลำดับที่ 3), jounce (ลำดับที่ 4)x ( t )x(เสื้อ)x(t) มีบางคนเสนอ snap, crackle, popสำหรับอนุพันธ์ถึงลำดับที่เจ็ด ช่วงเวลาที่ได้รับแรงบันดาลใจจากฟิสิกส์เชิงกลและทฤษฎีความยืดหยุ่นนั้นมีความสำคัญในสถิติเช่นกันดู'ช่วงเวลา' เกี่ยวกับ 'ช่วงเวลา' ของการแจกแจงความน่าจะเป็นอย่างไร สำหรับการกล่าวถึงต้นในงานของคุณเพียร์สัน -lag cumulants แรกซึ่งบางครั้งเป็นมาตรฐานหรือกึ่งกลางเป็นความแปรปรวนชื่อคลาสสิก(คำสั่งที่ 2) ความเบ้ (คำสั่งที่ 3) และkurtosis หรือความเรียบ (ลำดับที่ 4)000 มีการยอมรับกันโดยทั่วไปหรือชื่อที่เป็นที่ยอมรับสำหรับลำดับที่ 5 หรือลำดับที่ 6 หรือมากกว่าและนอกเหนือจาก (นอกเหนือจาก "ช่วงเวลาที่สูงขึ้นของคำสั่งซื้อ") ถึงแม้ว่าการประมาณของพวกเขาจะมีปัญหาในตัวอย่าง จำกัด การอ้างอิงจากสูตรอาหารเชิงตัวเลขรุ่นที่ 3: ศิลปะการคำนวณทางวิทยาศาสตร์หน้า 723 : ควรใช้ความเบ้ (หรือช่วงเวลาที่สาม) …

2
อะไรที่ไม่ตรง
อะไรสัญกรณ์ (dot กว่าตัวหนอน) หมายถึงในบริบทเช่น ? x ˙ ∼ N(0,1)~˙∼˙\dot\simx ∼˙ยังไม่มีข้อความ( 0 , 1 )x∼˙N(0,1)x \mathrel{\dot\sim} \mathcal N(0,1) พบว่าเป็นการง่ายกว่าที่จะหาวิธีการเรียงพิมพ์อย่างถูกต้อง: tex.SE อธิบายว่าควรพิมพ์\mathrel{\dot\sim}แทนที่จะ\dot\simแก้ไขปัญหาระยะห่าง - ง่ายกว่าการค้นหาความหมายที่แท้จริง มีการใช้งานCV เพียง4 ครั้งจนถึงขณะนี้ เป็นมาตรฐานหรือไม่

1
มี "มาตรฐาน" สำหรับสัญลักษณ์แบบจำลองทางสถิติหรือไม่
ตัวอย่างเช่นในคู่มือ BUGSหรือหนังสือที่กำลังจะมาถึงโดย Lee และ Wagenmakers ( pdf ) และในสถานที่อื่น ๆ มีการใช้สัญกรณ์ประเภทหนึ่งซึ่งดูเหมือนว่าฉันจะมีความยืดหยุ่นมากในการอธิบายรูปแบบทางสถิติส่วนใหญ่ ตัวอย่างของสัญกรณ์นี้มีดังต่อไปนี้: yi∼Binomial(pi,ni)log(pi1−pi)=bibi∼Normal(μp,σp)yi∼Binomial(pi,ni)log⁡(pi1−pi)=bibi∼Normal(μp,σp) y_i \sim \text{Binomial}(p_i,n_i) \\ \log(\frac{p_i}{1 - p_i}) = b_i \\ b_i \sim \text{Normal}(\mu_p,\sigma_p) ซึ่งจะอธิบายถึงรูปแบบการโลจิสติกลำดับชั้นโดยไม่มีการพยากรณ์ แต่ด้วยกลุ่ม วิธีการอธิบายแบบจำลองนี้ดูเหมือนจะทำงานอย่างเท่าเทียมกันทั้งสำหรับการอธิบายและรูปแบบ frequentist คชกรรมตัวอย่างเช่นการให้คำอธิบายรูปแบบนี้อย่างเต็มที่คชกรรมคุณก็จะต้องเพิ่มไพรเออร์ในและ\i=1…ni=1…ni = 1\dots n μpμp\mu_pσpσp\sigma_p รูปแบบของสัญกรณ์รุ่นนี้มีการอธิบายไว้โดยละเอียดในบทความหรือหนังสือบางเล่มหรือไม่? หากคุณต้องการใช้สัญกรณ์นี้เพื่อเขียนแบบจำลองมีหลายวิธีในการทำสิ่งต่าง ๆ และมันจะมีประโยชน์มากกับคู่มือที่ครอบคลุมทั้งในการติดตามและอ้างอิงผู้อื่น ความแตกต่างบางประการที่ฉันพบในวิธีที่คนใช้สัญกรณ์ประเภทนี้: สิ่งใดที่คุณเรียกการแจกแจง เช่นฉันเคยเห็นฯลฯN,N,Norm,NormalN,N,Norm,Normal\mathcal{N},\text{N},\text{Norm},\text{Normal} คุณจัดการกับดัชนีอย่างไร เช่นฉันเห็น , ,ฯลฯyijyijy_{ij}yi[j]yi[j]y_{i[j]}yj|iyj|iy_{j|i} สัญลักษณ์พารามิเตอร์ใดที่มักใช้สำหรับพารามิเตอร์ ตัวอย่างเช่นเป็นเรื่องปกติที่จะใช้เป็นค่าเฉลี่ยสำหรับการแจกแจงแบบปกติ แต่จะมีการแจกแจงแบบอื่นอย่างไร (สำหรับเรื่องนี้ฉันมักจะตรวจสอบการกระจายของ …

6
สัญกรณ์เป็นอย่างไร
สัญกรณ์อ่านอย่างไร? มันเป็นต่อไปนี้การกระจายปกติ? หรือคือการกระจายปกติ? หรือบางทีเป็นปกติประมาณ ..X∼N(μ,σ2)X∼N(μ,σ2)X\sim N(\mu,\sigma^2)XXX XXX XXX เกิดอะไรขึ้นถ้ามีตัวแปรหลายตัวที่ตามมา (หรือคำใดก็ตาม) การกระจายตัวเดียวกัน มันเขียนอย่างไร

1
มีความหมายตามปกติของสัญลักษณ์ในสถิติหรือไม่?
ผมอ่านกระดาษในคชกรรมเส้นโค้ง ( DiMatteo et. al. คชกรรมโค้งกระชับกับเส้นโค้งฟรีปม 2001 ) และมาข้ามสัญลักษณ์\≏≏\bumpeqมันถูกใช้สองสามครั้งทั่วทั้งกระดาษ แต่ไม่เคยกำหนดไว้อย่างชัดเจน หลังจากค้นหา google และ stackexchange สองสามรายการจะปรากฏราวกับว่าสัญลักษณ์นั้นไม่ได้ใช้กันอย่างแพร่หลายหรือไม่ได้นิยามไว้ตามอัตภาพ ด้านล่างฉันให้ตัวอย่างกับบริบทจากเอกสารอ้างอิง ฉันขอโทษล่วงหน้าที่ไม่ได้กำหนดสัญลักษณ์อื่นใด แต่การทำเช่นนั้นจะเป็นการคัดลอกข้อความส่วนใหญ่จากกระดาษที่ฉันเชื่อมโยงและจะใช้กับคำถามเล็กน้อย จาก p1059 (สมการ 8): อนึ่งเราสามารถเห็นสิ่งนี้ในการประมาณอัตราส่วนความน่าจะเป็นสำหรับโมเดลปกติในสมการ (6) โดย p(y|kc,ξc)p(y|k,ξ)≏1n−−√((y−Bk,ξβ^)T(y−Bk,ξβ^)(y−Bk,ξcβc^)T(y−Bk,ξcβc^))n/2=exp(−BIC/2)p(y|kc,ξc)p(y|k,ξ)≏1n((y−Bk,ξβ^)T(y−Bk,ξβ^)(y−Bk,ξcβc^)T(y−Bk,ξcβc^))n/2=exp(−BIC/2)\frac{p(y|k^c,\xi^c)}{p(y|k,\xi)}\bumpeq\frac{1}{\sqrt{n}}\left(\frac{(y-B_{k,\xi}\hat{\beta})^T(y-B_{k,\xi}\hat{\beta})}{(y-B_{k,\xi^c}\hat{\beta^c})^T(y-B_{k,\xi^c}\hat{\beta^c})}\right)^{n/2}=exp(-\text{BIC}/2) จากบริบทดูเหมือนว่า≏≏\bumpeqแสดงถึงการประมาณ ถ้าเป็นกรณีนี้มันจะมีความหมายเหมือนกันกับสัญลักษณ์ธรรมดามากขึ้นสำหรับการประมาณเช่น≈≈\approxหรือ∼∼\sim ? หรือมันถูกใช้ในการแสดงชนิดหนึ่งของการประมาณที่≈≈\approxหรือ∼∼\simจะไม่เพียงพอหรือทำให้เข้าใจผิด?

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.