คำถามติดแท็ก quantiles

quantiles ของการแจกแจงอ้างถึงจุดบนฟังก์ชันการแจกแจงสะสม ควอไทล์ทั่วไปบางส่วนเป็นควอไทล์และเปอร์เซ็นไทล์

1
การใช้เปอร์เซ็นไทล์เป็นตัวทำนาย - เป็นความคิดที่ดีหรือไม่?
ฉันกำลังคิดเกี่ยวกับปัญหาที่จะทำนายการใช้จ่ายของลูกค้าโดยใช้การถดถอยเชิงเส้น ฉันกำลังพิจารณาว่าฟีเจอร์ใดที่จะใช้เป็นอินพุตและสงสัยว่ามันจะโอเคที่จะใช้เปอร์เซ็นไทล์ของตัวแปรเป็นอินพุต ตัวอย่างเช่นฉันสามารถใช้รายได้ของ บริษัท เป็นอินพุท สิ่งที่ฉันสงสัยคือฉันสามารถใช้เปอร์เซ็นต์รายได้ของ บริษัท แทนได้หรือไม่ อีกตัวอย่างหนึ่งจะเป็นลักษณนามอุตสาหกรรมเด็ดขาด (NAICS) - ถ้าฉันดูค่าใช้จ่ายเฉลี่ยต่อรหัส NAICS แล้วกำหนดรหัส NAICS ให้กับ 'NAICS Percentile' ซึ่งเป็นตัวแปรอธิบายที่ถูกต้องที่ฉันสามารถใช้ได้หรือไม่ เพียงแค่สงสัยว่ามีปัญหาใด ๆ ที่ควรระวังเมื่อใช้เปอร์เซ็นไทล์หรือไม่ ในบางวิธีเทียบเท่ากับการปรับขนาดประเภทหรือไม่

1
มีวิธีในการประมาณค่าพารามิเตอร์การกระจายที่ได้รับเพียงแค่จำนวน
มีวิธีที่จะพอดีกับการกระจายที่ระบุถ้าคุณได้รับเพียงไม่กี่ quantiles? ตัวอย่างเช่นถ้าฉันบอกคุณว่าฉันมีชุดข้อมูลแกมม่ากระจายและเชิงประจักษ์ 20%, 30%, 50% และ 90% - คุณสมบัติคือตามลำดับ: 20% 30% 50% 90% 0.3936833 0.4890963 0.6751703 1.3404074 ฉันจะไปและประมาณค่าพารามิเตอร์ได้อย่างไร มีหลายวิธีในการทำเช่นนั้นหรือมีขั้นตอนเฉพาะอยู่แล้ว? แก้ไขเพิ่มเติม:ฉันไม่ได้ขอการกระจายแกมม่าโดยเฉพาะนี่เป็นเพียงตัวอย่างเพราะฉันกังวลว่าฉันไม่สามารถอธิบายคำถามได้อย่างเหมาะสม งานของฉันคือฉันมี quantiles ที่กำหนด (2-4) และต้องการประเมินพารามิเตอร์ (1-3) ของการแจกแจงไม่กี่อย่างที่เป็น "ปิด" ที่สุด บางครั้งมีวิธีแก้ปัญหาที่แน่นอน (หรือไม่มีที่สิ้นสุด) บางครั้งไม่ถูกต้องใช่ไหม

2
ทดสอบความแตกต่างของ quantile-Q ระหว่างกลุ่มหรือไม่?
สำหรับตัวแปร Y บางตัวที่แบ่งออกเป็น 3 กลุ่ม (X) ฉันต้องการเปรียบเทียบกลุ่มและสำหรับสมมติฐานที่ว่าควอนไทล์ 90% นั้นเหมือนกันระหว่างทั้งสามกลุ่ม ฉันสามารถใช้การทดสอบอะไรได้บ้าง ทางเลือกหนึ่งที่ฉันคิดว่าใช้การถดถอยแบบควอไทล์มีทางเลือกอื่น ๆ ฉันคิดว่าถ้าฉันต้องการเปรียบเทียบค่ามัธยฐานฉันสามารถใช้การทดสอบ kruskal วอลลิส (แม้ว่ามันจะขึ้นอยู่กับอันดับ แต่ถ้าฉันจำได้อย่างถูกต้องมันจะให้ผลลัพธ์ที่เหมือนกันเมื่อการกระจายตัวที่เหลือเป็นสมมาตร) ขอบคุณ

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.