คำถามติดแท็ก rating

"การให้คะแนนคือการประเมินหรือการประเมินบางสิ่งบางอย่างในแง่ของคุณภาพ (เช่นเดียวกับการให้คะแนนนักวิจารณ์นวนิยาย) ปริมาณ (เช่นเดียวกับนักกีฬาที่ได้รับการจัดอันดับจากสถิติของเขาหรือเธอ) หรือบางอย่างรวมกันทั้งสองอย่าง" (Wikipedia)

3
ตัวอย่าง: การถดถอย LASSO โดยใช้ glmnet สำหรับผลลัพธ์ไบนารี
ฉันเริ่มตะลุยกับการใช้งานglmnetกับการถดถอยแบบ LASSOซึ่งผลลัพธ์ของความสนใจของฉันนั้นเป็นแบบขั้วคู่ ฉันได้สร้างกรอบข้อมูลจำลองขนาดเล็กด้านล่าง: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

4
จะเริ่มต้นด้วยการจัดเรตและการจัดอันดับโดยใช้ข้อมูลการแข่งขันแบบจับคู่ได้อย่างไร
ฉันน่าสนใจในการเรียนรู้เกี่ยวกับวิธีจัดอันดับและจัดอันดับบุคคลในกลุ่มที่โต้ตอบ / แข่งขันแบบคู่เท่านั้น (เช่นระบบเช่นระบบจัดอันดับELOสำหรับหมากรุก) มีวิธีใดที่จะไปหรือมีวิธีการที่ถูกต้องและทันสมัยกว่าหรือไม่ มีแพ็คเกจ R ที่ทำให้การติดตั้งง่ายหรือไม่? มีวิธีการใดบ้างที่สามารถใช้ข้อมูลเสริมเช่นเดียวกับผลลัพธ์ของการแข่งขัน / เกม? มีวิธีการใดที่สามารถใช้ข้อมูลการชนะมาร์จิ้นได้ดีขึ้นเมื่อเทียบกับการชนะ / แพ้แบบแบ่งขั้วคู่ ฉันควรมองหาอะไรในวรรณกรรม?

2
การสร้างดัชนีเดียวจากองค์ประกอบหลักหรือปัจจัยหลายประการที่เก็บรักษาไว้จาก PCA / FA
ฉันใช้การวิเคราะห์ส่วนประกอบหลัก (PCA) เพื่อสร้างดัชนีที่จำเป็นสำหรับการวิจัยของฉัน คำถามของฉันคือวิธีที่ฉันควรสร้างดัชนีเดียวโดยใช้ส่วนประกอบหลักที่คงไว้ซึ่งคำนวณผ่าน PCA ตัวอย่างเช่นฉันตัดสินใจที่จะเก็บส่วนประกอบหลัก 3 ชิ้นหลังจากใช้ PCA และฉันคำนวณคะแนนสำหรับส่วนประกอบหลักทั้งสามนี้ วิธีที่เหมาะสมในการสร้างดัชนีเดียวจากคะแนนทั้งสามนี้คืออะไร? การเพิ่ม 3 คะแนนที่คำนวณนั้นมีค่าคอมโพสิตหรือไม่ หรือโดยเฉลี่ย 3 คะแนนเพื่อให้มีค่าเช่นนี้? หรือฉันควรจะรักษาองค์ประกอบหลักแรก (ที่แข็งแกร่งที่สุด) เท่านั้นและใช้คะแนนเป็นดัชนี? อีกวิธีหนึ่งสามารถใช้การวิเคราะห์ปัจจัย (FA) แต่คำถามเดียวกันยังคงอยู่: วิธีการสร้างดัชนีเดียวตามคะแนนหลายปัจจัย?

5
จะพิสูจน์ได้อย่างไรว่าการให้คะแนนของ Elo หรือการจัดอันดับหน้ามีความหมายสำหรับชุดของฉัน
ฉันมีชุดผู้เล่น พวกเขาเล่นกัน (คู่) คู่ของผู้เล่นจะถูกสุ่มเลือก ในเกมใด ๆ ผู้เล่นคนหนึ่งชนะและอีกคนหนึ่งแพ้ ผู้เล่นเล่นกัน จำกัด จำนวนเกม (ผู้เล่นบางคนเล่นเกมมากขึ้นบางคนน้อย) ดังนั้นฉันมีข้อมูล (ผู้ชนะต่อใครและกี่ครั้ง) ตอนนี้ฉันคิดว่าผู้เล่นทุกคนมีอันดับที่กำหนดความน่าจะเป็นในการชนะ ฉันต้องการตรวจสอบว่าข้อสมมติฐานนี้เป็นจริงหรือไม่ แน่นอนฉันสามารถใช้ระบบการจัดอันดับ Eloหรืออัลกอริทึม PageRankเพื่อจัดอันดับการคำนวณสำหรับผู้เล่นทุกคน แต่ด้วยการคำนวณเรตติ้งฉันไม่ได้พิสูจน์ว่าพวกเขา (เรตติ้ง) มีอยู่จริงหรือพวกเขาหมายถึงอะไร กล่าวอีกนัยหนึ่งฉันต้องการมีวิธีพิสูจน์ (หรือตรวจสอบ) ว่าผู้เล่นมีจุดแข็งที่แตกต่างกัน ฉันจะทำมันได้อย่างไร ADDED จะเจาะจงมากขึ้นฉันมีผู้เล่น 8 คนและเพียง 18 เกม ดังนั้นจึงมีผู้เล่นหลายคู่ที่ไม่ได้เล่นกันเองและมีคู่มากที่เล่นกันเพียงครั้งเดียว ผลก็คือฉันไม่สามารถประมาณความน่าจะเป็นของการชนะสำหรับผู้เล่นคู่หนึ่ง ตัวอย่างเช่นฉันเห็นว่ามีผู้เล่นที่ชนะ 6 ครั้งใน 6 เกม แต่บางทีมันอาจเป็นเรื่องบังเอิญ

2
เกณฑ์การให้คะแนนอัจฉริยะและการตัดสินผู้ชนะ
มีพอดคาสต์ NPR ที่เรียกว่า Intelligence Squared แต่ละตอนเป็นการถ่ายทอดสดการโต้วาทีในแถลงการณ์ที่ถกเถียงเช่น "การแก้ไขครั้งที่ 2 ไม่มีความเกี่ยวข้องอีกต่อไป" หรือ "การกระทำที่ยืนยันในวิทยาเขตของวิทยาลัยจะเป็นอันตรายมากกว่าดี" ผู้แทนสี่คนถกเถียงกัน - สองเรื่องต่อการเคลื่อนไหวและอีกสองเรื่องต่อต้าน เพื่อตัดสินว่าฝ่ายใดชนะฝ่ายผู้ชมจะทำการสำรวจทั้งก่อนและหลังการอภิปราย ด้านที่ได้รับมากขึ้นในแง่ของเปอร์เซ็นต์แน่นอนถือเป็นผู้ชนะ ตัวอย่างเช่น: For Against Undecided Before 18% 42% 40% After 23% 49% 28% Winner: Against team -- The motion is rejected. ฉันคิดว่ามาตรวัดความสำเร็จนี้มีอคติและฉันสงสัยว่าจะสำรวจความคิดเห็นของผู้ชมเพื่อตัดสินผู้ชนะอย่างยุติธรรมอย่างไร สามประเด็นที่ฉันเห็นทันทีด้วยวิธีปัจจุบัน: ที่สุดขั้วถ้าด้านใดด้านหนึ่งเริ่มต้นด้วยข้อตกลง 100% พวกเขาสามารถผูกหรือแพ้เท่านั้น หากไม่มีการลังเลจากนั้นด้านที่มีข้อตกลงเริ่มต้นน้อยสามารถดูได้ว่ามีตัวอย่างขนาดใหญ่กว่าที่จะวาด ด้านที่ไม่แน่ใจนั้นไม่น่าจะแน่ใจได้อย่างแท้จริง ถ้าเราคิดว่าทั้งสองฝ่ายมีความเท่าเทียมกันดูเหมือนว่าเราเชื่อว่าประชากรที่ไม่มีความมั่นใจก่อนหน้านี้ควรเป็นหากแต่ละฝ่ายถูกบังคับให้เข้าข้าง .เบต้า( # สำหรับ, # Against )Beta(# …
12 bayesian  rating 

2
ความน่าจะเป็นที่ใครบางคนจะชอบภาพ
ฉันมีปัญหาต่อไปนี้: - เราได้ตั้งค่าของคน N - เรามีชุดของภาพ K - แต่ละคนให้คะแนนภาพจำนวนหนึ่ง บุคคลอาจจะชอบหรือไม่ชอบภาพ (สิ่งเหล่านี้เป็นเพียงสมบัติสองอย่าง) - ปัญหาคือวิธีการคำนวณความน่าจะเป็นที่บางคนชอบภาพที่เฉพาะเจาะจง ฉันจะยกตัวอย่างนำเสนอสัญชาตญาณของฉัน N = 4 K = 5 + หมายความว่าบุคคลนั้นชอบภาพ - หมายความว่าบุคคลนั้นไม่ชอบรูปภาพ 0 หมายความว่าบุคคลนั้นไม่ได้ถูกถามเกี่ยวกับภาพและควรคาดการณ์ค่านั้น x 1 2 3 4 5 1 + - 0 0 + 2 + - + 0 + 3 - - + + 0 …

3
ฉันจะสั่งซื้อหรือจัดอันดับชุดของผู้เชี่ยวชาญได้อย่างไร
ฉันมีฐานข้อมูลที่มีผู้เชี่ยวชาญจำนวนมากในสาขา สำหรับผู้เชี่ยวชาญแต่ละคนฉันมีคุณลักษณะ / จุดข้อมูลที่หลากหลายเช่น: จำนวนประสบการณ์ ใบอนุญาต จำนวนบทวิจารณ์ เนื้อหาที่เป็นข้อความของบทวิจารณ์เหล่านั้น ระดับ 5 ดาวจากการรีวิวแต่ละรายการสำหรับปัจจัยหลายประการเช่นความเร็วคุณภาพและอื่น ๆ รางวัลการเข้าร่วมการประชุม ฯลฯ ฉันต้องการให้คะแนนกับผู้เชี่ยวชาญเหล่านี้ว่าคะแนนเต็ม 10 จากความสำคัญของพวกเขา จุดข้อมูลบางส่วนอาจหายไปสำหรับผู้เชี่ยวชาญบางคน ตอนนี้คำถามของฉันคือฉันจะทำอัลกอริธึมแบบนี้ได้อย่างไร? ใครช่วยชี้ให้ฉันดูวรรณกรรมที่เกี่ยวข้องได้บ้าง นอกจากนี้ฉันยังกังวลว่าเช่นเดียวกับการให้คะแนน / รีวิวตัวเลขอาจรวมอยู่ใกล้กับค่าบางอย่าง ตัวอย่างเช่นพวกเขาส่วนใหญ่อาจได้รับคะแนน 8 หรือ 5 มีวิธีการเน้นความแตกต่างของ litle ให้แตกต่างกันมากขึ้นในคะแนนสำหรับคุณลักษณะบางอย่างเท่านั้น การสนทนาอื่น ๆ ที่ฉันคิดว่าอาจเกี่ยวข้อง: ระบบการให้คะแนนแบบเบย์ที่มีหลายหมวดหมู่สำหรับการจัดระดับแต่ละประเภท คุณจะคำนวณอันดับภาพยนตร์ IMDB อย่างไร ลวงตาบวชจากผู้เชี่ยวชาญ อะไรคืออัลกอริทึมการจัดอันดับที่ดีที่สุดที่มีอินพุตเป็นคะแนนขึ้นและลง?
11 rating  valuation 

1
ทำไมระบบการให้คะแนน Elo ใช้กฎการอัปเดตที่ไม่ถูกต้อง
ระบบการจัดระดับ Elo ใช้อัลกอริธึมการลดความลาดชันแบบลาดชันของฟังก์ชั่นการสูญเสียข้ามเอนโทรปีระหว่างความน่าจะเป็นที่คาดหวังและที่สังเกตได้ของผลลัพธ์ในการเปรียบเทียบแบบคู่ เราสามารถเขียนฟังก์ชั่นการสูญเสียทั่วไปเป็น E= - ∑n , ฉันพีผมL o กรัม( qผม)E=−∑n,ipiLog(qi) E=-\sum_{n,i} p_i Log (q_i) ที่ผลรวมจะดำเนินการมากกว่าผลลัพธ์และฝ่ายตรงข้ามทั้งหมดn คือความถี่ที่สังเกตได้ของเหตุการณ์และถึงความถี่ที่คาดหวังn P ฉันฉันถามฉันผมผมinnnพีผมพีผมp_iผมผม_iQผมQผมq_i ในกรณีที่มีเพียงสองผลลัพธ์ที่เป็นไปได้ (ชนะหรือหลวม) และหนึ่งฝ่ายตรงข้ามที่เรามี E= - p L o g( q) - ( 1 - p ) L o g( 1 - q)E=-พีLโอก.(Q)-(1-พี)Lโอก.(1-Q) E=-p Log (q)-(1-p)Log(1-q) ถ้าคืออันดับของผู้เล่นและคืออันดับของผู้เล่นเราสามารถสร้างความน่าจะเป็นที่คาดหวังในฐานะ จากนั้นกฎการอัพเดทลาดลงทางลาดชันฉันπ j j q …

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
จะตัดสินผู้ชนะอย่างยุติธรรมในงานวิทยาศาสตร์ระดับภูมิภาคได้อย่างไร?
ฉันต้องการความช่วยเหลือในการหาวิธีที่ถูกต้องในการคำนวณผู้ชนะในงานวิทยาศาสตร์ของเรา ฉันไม่ต้องการให้ฉันไม่รู้ถึงสถิติและคณิตศาสตร์เพื่อให้เด็กมีโอกาสชนะ (ทุนการศึกษาจำนวนมาก & ผลประโยชน์ความก้าวหน้าในการเดิมพัน) ขอบคุณล่วงหน้าสำหรับความช่วยเหลือของ. พื้นหลังเล็กน้อยของวิธีการตั้งค่าสิ่งต่าง ๆ : โดยทั่วไปงานของเรามีโครงการนักศึกษาประมาณ 600 โครงการ โครงการเหล่านี้เสร็จสมบูรณ์และนำเสนอโดยนักเรียนเป็นรายบุคคลหรือเป็นทีมของนักเรียน ทีมสามารถประกอบด้วยเด็ก 2 หรือ 3 คน นักเรียนแบ่งออกเป็นสองแผนก: ระดับประถมศึกษา (ระดับ 6-8) และระดับมัธยมศึกษา (เกรด 9-12) แต่ละแผนกมีประเภทที่แตกต่างกัน: 9 หมวดหมู่สำหรับโครงการระดับประถมศึกษาและ 17 หมวดหมู่สำหรับโครงการแผนกรอง รางวัลจะมอบให้สำหรับที่หนึ่งที่สองและสามสำหรับแต่ละหมวดหมู่ในแต่ละหมวด รางวัลชมเชยที่มอบรางวัลนั้นมอบให้สำหรับตำแหน่งนอกเหนือจากที่สาม สำหรับแต่ละโครงการเรามอบหมายผู้ตัดสินระหว่าง 4 ถึง 6 คน เราทำสิ่งที่ได้รับมอบหมายตามคุณสมบัติของผู้ตัดสินความพึงพอใจในหมวดหมู่และประสบการณ์การตัดสินที่ผ่านมาของพวกเขา (มีประสบการณ์มากขึ้นถูกมอบหมายให้ทำงานในแผนกอาวุโส) วิธีการตัดสินคะแนนโครงการ: สำหรับแต่ละโครงการมี 5 เกณฑ์ที่กำหนดคะแนน แต่ละเกณฑ์สามารถมอบให้ระหว่าง 1 ถึง 20 คะแนน เกณฑ์ทั่วไปคือ: วัตถุประสงค์ …

2
น้ำหนักระบบการให้คะแนนเพื่อให้รายการที่ได้รับการจัดอันดับสูงขึ้นจากผู้คนจำนวนมากกว่ารายการที่จัดอันดับสูงโดยมีผู้คนน้อยลงหรือไม่
ขอบคุณล่วงหน้าสำหรับการแบกกับฉันฉันไม่ได้เป็นนักสถิติทุกประเภทและไม่รู้วิธีอธิบายสิ่งที่ฉันจินตนาการดังนั้น Google จึงไม่ได้ช่วยฉันที่นี่ ... ฉันรวมระบบการให้คะแนนในเว็บแอปพลิเคชันที่ฉันทำงานอยู่ ผู้ใช้แต่ละคนสามารถให้คะแนนแต่ละรายการได้หนึ่งครั้ง ฉันจินตนาการถึงมาตราส่วนด้วยค่า 4 ค่า: "ไม่ชอบอย่างยิ่ง", "ไม่ชอบ", "ชอบ" และ "ขอชอบมาก" และฉันวางแผนที่จะกำหนดค่าเหล่านี้เป็น -5, -2, +2 และ +5 ตามลำดับ . ตอนนี้ถ้าทุกรายการจะมีคะแนนเท่ากันฉันก็จะค่อนข้างสบายใจกับระบบการให้คะแนนนี้ซึ่งแตกต่างอย่างชัดเจนจากรายการที่ชอบมากที่สุดและรายการที่ชอบน้อยที่สุด อย่างไรก็ตามรายการจะไม่มีการจัดอันดับจำนวนเท่ากันและความไม่เท่าเทียมกันระหว่างจำนวนคะแนนโหวตของภาพถ่ายที่แตกต่างกันอาจค่อนข้างน่าทึ่ง ในกรณีนี้การเปรียบเทียบคะแนนสะสมของสองรายการหมายความว่ารายการเก่าที่มีคะแนนปานกลางมากจะมีคะแนนสูงกว่ารายการใหม่ที่ยอดเยี่ยมที่มีคะแนนโหวตน้อยกว่ามาก สิ่งแรกที่ชัดเจนที่ฉันคิดว่าเราใช้โดยเฉลี่ย ... แต่ตอนนี้หากรายการมีการจัดอันดับเดียวที่ "5" จะมีค่าเฉลี่ยที่ดีกว่ารายการที่มีคะแนน 99 "+5" และ 1 "+2" ให้คะแนน โดยสังหรณ์ที่ไม่ได้เป็นตัวแทนที่ถูกต้องของความนิยมของรายการ ฉันคิดว่าปัญหานี้เป็นเรื่องปกติและพวกคุณไม่ต้องการให้ฉันเชื่อในตัวอย่างอีกดังนั้นฉันจะหยุดที่จุดนี้และอธิบายอย่างละเอียดในความคิดเห็นหากจำเป็น คำถามของฉันคือ: ปัญหาแบบนี้เรียกว่าอะไรและมีศัพท์สำหรับเทคนิคที่ใช้ในการแก้ปัญหานี้หรือไม่? ฉันอยากรู้สิ่งนี้เพื่อที่ฉันจะได้อ่านมันได้ หากคุณรู้ว่ามีแหล่งข้อมูลที่เป็นมิตรในเรื่องใดฉันจะขอขอบคุณลิงค์ สุดท้ายนี้ฉันขอขอบคุณข้อเสนอแนะอื่น ๆ เกี่ยวกับวิธีการรวบรวมและวิเคราะห์ข้อมูลประเภทนี้อย่างมีประสิทธิภาพ
9 scales  rating 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.