คำถามติดแท็ก descriptive-statistics

สถิติเชิงพรรณนาสรุปคุณสมบัติของกลุ่มตัวอย่างเช่นค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานค่ามัธยฐานและค่าควอไทล์สูงสุดและต่ำสุด ด้วยตัวแปรหลายตัวอาจรวมความสัมพันธ์และแท็บไขว้ สามารถรวมการแสดงภาพ - boxplots, ฮิสโทแกรม, scatterplots และอื่น ๆ

3
วิธีการพิสูจน์ว่า
ฉันพยายามสร้างความไม่เท่าเทียมกัน |Ti|=∣∣Xi−X¯∣∣S≤n−1n−−√|Ti|=|Xi−X¯|S≤n−1n\left| T_i \right|=\frac{\left|X_i -\bar{X} \right|}{S} \leq\frac{n-1}{\sqrt{n}} โดยที่คือค่าเฉลี่ยตัวอย่างและเป็นส่วนเบี่ยงเบนมาตรฐานตัวอย่างนั่นคือ {n-1}}X¯X¯\bar{X}SSSS=∑ni=1(Xi−X¯)2n−1−−−−−−−−−√S=∑i=1n(Xi−X¯)2n−1S=\sqrt{\frac{\sum_{i=1}^n \left( X_i -\bar{X} \right)^2}{n-1}} มันง่ายที่จะเห็นว่าและแต่สิ่งนี้ไม่ใกล้เคียงกับสิ่งที่ฉันค้นหามามากและมันก็ไม่มีประโยชน์ ฉันได้ทดลองกับ Cauchy-Schwarz และความไม่เท่าเทียมกันของรูปสามเหลี่ยม แต่ไม่มีที่ไหนเลย จะต้องมีขั้นตอนที่บอบบางที่ฉันหายไปที่ไหนสักแห่ง ฉันขอขอบคุณความช่วยเหลือบางส่วนขอบคุณ∑ni=1T2i=n−1∑i=1nTi2=n−1\sum_{i=1}^n T_i^2 = n-1 |Ti|&lt;n−1−−−−−√|Ti|&lt;n−1\left| T_i \right| < \sqrt{n-1}

2
สรุปความยุ่งเหยิงของส่วนของเส้นตรงที่มองเห็นได้
ฉันมีชุดข้อมูลของส่วนของเส้นตรงกำกับหลายล้านชุด ส่วนของเส้นตรงเป็นลำดับ - เป็นตัวแปรภูมิอากาศ (ความร้อนที่เหมาะสม) โดยมีค่าที่สังเกตและจำลองในช่วงเวลาครึ่งชั่วโมง ฉันพยายามค้นหารูปแบบในการจำลองการทำงาน ฉันกำลังดูโครงเรื่องของ Obs เทียบกับค่าการจำลองและการเชื่อมโยงพวกมันเข้ากับส่วนของเส้นตรง (ลูกศรแสดงทิศทางของเวลา) หากฉันพล็อตพวกเขาฉันแค่สับสนเบลอที่ไม่สามารถตีความได้เช่นนี้ นี่เป็นส่วนย่อยของ 10,000 บรรทัดโดยละเอียดและมีความทึบต่ำ: ggplot(d, aes(x=Qh_obs, xend=lead(Qh_obs), y=Qh_sim, yend=lead(Qh_sim))) + geom_segment(size=0.1, alpha=0.2, arrow=arrow(length=unit(2, units='mm'))) dput() ของข้อมูล 700 แถวแรก (ถูก จำกัด โดยความยาวโพสต์): structure( list( Qh_sim = c( 56.401439666748, 33.9568634033203, 16.2147789001465, 0.797790050506592, -3.19529962539673, -10.3250732421875, -11.6082448959351, -21.5074787139893, -21.5963478088379, -21.4389324188232, -19.8912830352783, -18.5908279418945, -19.2523441314697, …

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn &lt;- function(data, indices){ data &lt;- data[indices, ] mod &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out &lt;- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
ทำไมชุดข้อมูลนี้จึงไม่มีความแปรปรวนร่วม
ความเข้าใจของฉันเกี่ยวกับความแปรปรวนร่วมในการทำงานคือข้อมูลที่มีความสัมพันธ์ควรมีความแปรปรวนร่วมค่อนข้างสูง ฉันเจอสถานการณ์ที่ข้อมูลของฉันดูมีความสัมพันธ์ (ดังที่แสดงในพล็อตกระจาย) แต่ความแปรปรวนร่วมอยู่ใกล้ศูนย์ ความแปรปรวนร่วมของข้อมูลจะเป็นศูนย์ได้อย่างไรถ้าพวกมันมีความสัมพันธ์กัน? import numpy as np x1 = np.array([ 0.03551153, 0.01656052, 0.03344669, 0.02551755, 0.02344788, 0.02904475, 0.03334179, 0.02683399, 0.02966126, 0.03947681, 0.02537157, 0.03015175, 0.02206443, 0.03590149, 0.03702152, 0.02697212, 0.03777607, 0.02468797, 0.03489873, 0.02167536]) x2 = np.array([ 0.0372599 , 0.02398212, 0.03649548, 0.03145494, 0.02925334, 0.03328783, 0.03638871, 0.03196318, 0.03347346, 0.03874528, 0.03098697, 0.03357531, 0.02808358, 0.03747998, …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.