คำถามติดแท็ก percentage


10
ทำไม 600 จาก 1,000 จึงน่าเชื่อถือมากกว่า 6 จาก 10?
ดูข้อความที่ตัดตอนมาจาก "คู่มือทักษะการศึกษา", Palgrave, 2012, โดย Stella Cottrell, หน้า 155: เปอร์เซ็นต์แจ้งให้ทราบเมื่อได้รับร้อยละ สมมติว่าคำสั่งด้านบนอ่านแทน: 60% ของคนชอบส้ม 40% กล่าวว่าพวกเขาชอบแอปเปิ้ล สิ่งนี้ดูน่าเชื่อถือ: มีการระบุปริมาณที่เป็นตัวเลข แต่ความแตกต่างระหว่าง 60% และ 40% อย่างมีนัยสำคัญคืออะไร? ที่นี่เราจะต้องรู้ว่ามีคนถามกี่คน หากมีคน 1,000 คนถูกถามถึงส้มที่ต้องการ 600 ตัวจำนวนนั้นจะน่าเชื่อถือ อย่างไรก็ตามหากมีผู้ถูกถามเพียง 10 คน 60% หมายถึงส้มที่ต้องการ 6 คน "60%" ฟังดูน่าเชื่อถือในแบบที่ "6 จาก 10" ไม่ ในฐานะผู้อ่านที่สำคัญคุณต้องระวังเปอร์เซ็นต์ที่ใช้ในการทำให้ข้อมูลไม่เพียงพอดูน่าประทับใจ ลักษณะนี้เรียกว่าอะไรในสถิติ ฉันต้องการอ่านเพิ่มเติมเกี่ยวกับเรื่องนี้

4
คือ 50% 100% สูงกว่า 25% หรือ 25% สูงกว่า 25%?
หากฉันมีสองค่า A และ B ซึ่งทั้งคู่แสดงเป็นเปอร์เซ็นต์ของ C และฉันต้องการแสดงความแตกต่างของขนาดระหว่าง A และ B เป็นเปอร์เซ็นต์ D มันถูกต้องมากกว่าหรือไม่ที่จะแสดง D เป็นเปอร์เซ็นต์ของ C หรือ เป็นเปอร์เซ็นต์ของ B (หรือ A จริง ๆ ) เห็นได้ชัดว่าผู้ว่างงาน 50 คนนั้นใหญ่กว่าผู้ว่างงาน 25% เพราะเห็นได้ชัดว่า '%' ที่นี่หมายถึง '% ของผู้ว่างงาน 25 คน' แต่ใหญ่กว่าการว่างงาน 50% มากกว่าการว่างงาน 25% เป็นการเพิ่มขึ้นของการว่างงาน 100% จาก 25% แต่เพิ่มขึ้นเพียง 25% ของอัตราการว่างงานทั้งหมด

7
เส้นโค้ง (หรือรุ่น) ชนิดใดที่ฉันควรจะพอดีกับข้อมูลเปอร์เซ็นต์ของฉัน
ฉันพยายามสร้างรูปที่แสดงความสัมพันธ์ระหว่างสำเนาไวรัสและการครอบคลุมจีโนม (GCC) นี่คือข้อมูลของฉันที่มีลักษณะ: ตอนแรกฉันเพิ่งวางแผนการถดถอยเชิงเส้น แต่หัวหน้างานของฉันบอกฉันว่ามันไม่ถูกต้องและลองใช้เส้นโค้ง sigmoidal ดังนั้นฉันจึงใช้ geom_smooth: library(scales) ggplot(scatter_plot_new, aes(x = Copies_per_uL, y = Genome_cov, colour = Virus)) + geom_point() + scale_x_continuous(trans = log10_trans(), breaks = trans_breaks("log10", function(x) 10^x), labels = trans_format("log10", math_format(10^.x))) + geom_smooth(method = "gam", formula = y ~ s(x), se = FALSE, size = 1) + …

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
ปัญหาของการใช้เปอร์เซ็นต์ผลลัพธ์ในการถดถอยเชิงเส้นคืออะไร
ฉันมีการศึกษาที่ผลลัพธ์จำนวนมากแสดงเป็นเปอร์เซ็นต์และฉันใช้การถดถอยเชิงเส้นหลายครั้งเพื่อประเมินผลของตัวแปรหมวดหมู่ต่อผลลัพธ์เหล่านี้ ฉันสงสัยว่าเนื่องจากการถดถอยเชิงเส้นสันนิษฐานว่าผลลัพธ์คือการกระจายอย่างต่อเนื่องมีปัญหาเกี่ยวกับระเบียบวิธีในการใช้แบบจำลองดังกล่าวกับเปอร์เซ็นต์ซึ่งมีข้อ จำกัด ระหว่าง 0 ถึง 100

1
ร้อยละไม่สามารถเพิ่มเป็นร้อยเป็นไปได้อย่างไร
ฉันกำลังอ่านบทความนี้เกี่ยวกับ aquaponics และสถิติบางอย่างไม่ได้มีเหตุผลใด ๆ เกี่ยวกับเปอร์เซ็นต์ที่ระบุไว้ วิธีการใดที่จะทำให้เปอร์เซ็นเหล่านี้มีอยู่ สัตว์น้ำที่เลี้ยงมากที่สุดโดยร้อยละคือปลานิล (69%) ปลาสวยงาม (43%) ปลาดุก (25%) สัตว์น้ำอื่น ๆ (18%) คอน (16%) บลูกิลล์ (15%) ปลาเทราท์ ( 10%) และเบส (7%) ~ http://www.sciencedirect.com/science/article/pii/S0044848614004724
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.