คำถามติดแท็ก k-means

k-mean เป็นวิธีการแบ่งพาร์ติชันข้อมูลออกเป็นกระจุกโดยการค้นหาจำนวนวิธีที่ระบุ, k, st เมื่อข้อมูลถูกกำหนดให้กับกลุ่ม w / ค่าเฉลี่ยที่ใกล้ที่สุด

1
การจัดกลุ่มสูตรความเฉื่อยใน scikit เรียนรู้
ฉันต้องการรหัสการจัดกลุ่ม kmeans ใน python โดยใช้ pandas และ scikit เรียนรู้ ในการเลือก k ที่ดีฉันต้องการรหัสสถิติ Gap จาก Tibshirani และ al 2001 ( pdf ) ฉันต้องการทราบว่าฉันสามารถใช้ผลเฉื่อยจาก scikit และปรับสูตรสถิติช่องว่างโดยไม่ต้องคำนวณการคำนวณระยะทางทั้งหมดอีกครั้ง ไม่มีใครรู้สูตรความเฉื่อยที่ใช้ใน scikit / รู้วิธีที่ง่ายในการถอดรหัสสถิติช่องว่างโดยใช้ฟังก์ชั่นระยะทางระดับสูง?

1
กำหนดจำนวนที่ตั้งที่ไม่รู้จักในโลกแห่งความจริงจากรายงานที่อิงกับ GPS
ผมทำงานเกี่ยวกับซอฟแวร์บางอย่างที่ควรตรวจสอบสถานที่โลกแห่งความจริง (fe กล้องความเร็ว) จากหลายรายงานจีพีเอสตาม ผู้ใช้จะขับรถเมื่อรายงานตำแหน่งดังนั้นรายงานจะไม่ถูกต้องมาก เพื่อแก้ปัญหานั้นฉันต้องจัดกลุ่มรายงานเกี่ยวกับสถานที่เดียวกันและคำนวณค่าเฉลี่ย คำถามของฉันเป็นเรื่องเกี่ยวกับวิธีการจัดกลุ่มรายงานเหล่านั้น ฉันอ่านเกี่ยวกับอัลกอริทึมการคาดหวัง - สูงสุดและการจัดกลุ่ม k-meanแต่เท่าที่ฉันเข้าใจฉันจะต้องกำหนดจำนวนสถานที่จริงล่วงหน้า มีอัลกอริธึมอื่น ๆ ซึ่งไม่ต้องการจำนวนตำแหน่งจริงแน่นอน แต่ใช้เงื่อนไขขอบ (แทนระยะทางน้อยที่สุด) แทน รายงานมีเส้นแวง , ละติจูดและความถูกต้อง (เมตร) ไม่มีชื่อหรือสิ่งอื่นใดที่สามารถใช้เพื่อระบุรายการที่ซ้ำกันได้ อุปสรรคอีกประการหนึ่งอาจเป็นเรื่องธรรมดาที่จะมีเพียงรายงานเดียวสำหรับที่ตั้งจริง ทำให้แยกความแตกต่างค่าผิดพลาดกับข้อมูลที่ดีได้ยาก

3
การเลือกกลุ่มสำหรับ k-mean: กรณีที่ 1 คลัสเตอร์
ไม่มีใครรู้วิธีที่ดีในการพิจารณาว่าการจัดกลุ่มโดยใช้ kmeans เหมาะสมหรือไม่ นั่นคือสิ่งที่ถ้าตัวอย่างของคุณเป็นเนื้อเดียวกันจริง ๆ ? ฉันรู้ว่าแบบจำลองการผสม (ผ่าน mclust ใน R) จะให้ข้อมูลสถิติที่เหมาะสมสำหรับกรณีคลัสเตอร์ 1: k แต่ดูเหมือนว่าเทคนิคทั้งหมดในการประเมิน kmeans ต้องการอย่างน้อย 2 กลุ่ม ไม่มีใครรู้เทคนิคในการเปรียบเทียบเคส 1 และ 2 กลุ่มสำหรับ kmeans
9 r  clustering  k-means 

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

3
การขี่จักรยานในอัลกอริทึม k-mean
ตามที่วิกิพีเดียลู่เกณฑ์ใช้กันอย่างแพร่หลายคือ "มอบหมายไม่ได้เปลี่ยนแปลง" ฉันสงสัยว่าการขี่จักรยานอาจเกิดขึ้นได้หรือไม่ถ้าเราใช้เกณฑ์การลู่เข้าเช่นนี้ ฉันยินดีถ้ามีคนอ้างอิงถึงบทความที่ให้ตัวอย่างของการขี่จักรยานหรือพิสูจน์ว่าเป็นไปไม่ได้
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.