คำถามติดแท็ก application

การประยุกต์ใช้สถิติและแบบจำลองทางสถิติ

5
เกมที่ดีสำหรับการเรียนรู้การคิดเชิงสถิติ?
มีเกมใดบ้างที่ทำให้ผู้เล่น "คิดเหมือนนักสถิติ"? ตัวอย่างเช่นlightbotทำให้คุณ "คิดเหมือนโปรแกรมเมอร์" (ในลักษณะพื้นฐานมาก) มีเกมใดบ้างที่ออกแบบมาเพื่อความบันเทิงหรือการสอนที่สามารถช่วยให้คุณคุ้นเคยกับแนวคิดพื้นฐานเช่นความสัมพันธ์ค่า p ค่ากำลังสองน้อยที่สุดความแปรปรวนการแจกแจงความน่าจะเป็นชนิดต่าง ๆ ถดถอยไปถึงค่าเฉลี่ย ... ตัวอย่างหนึ่งที่จะเป็นเกมที่คาดเดาความสัมพันธ์นี้ (ฉันถามเพราะฉันกำลังคิดเกี่ยวกับการพัฒนาแอปพลิเคชันดังกล่าวและฉันกำลังพยายามที่จะรับมุมมองที่กว้างของสิ่งที่มีอยู่ก่อนหน้านี้)

2
หลักฐานของภาวะโลกร้อนที่มนุษย์สร้างขึ้นได้มาถึง 'มาตรฐานทองคำ': พวกเขาทำเช่นนี้ได้อย่างไร?
ข้อความนี้ในบทความของ Reuter จาก 25.02.2019 ขณะนี้มีอยู่ทั่วข่าว: หลักฐานของภาวะโลกร้อนที่มนุษย์สร้างขึ้นได้รับความนิยม 'มาตรฐานทองคำ' [นักวิทยาศาสตร์] กล่าวว่าความมั่นใจว่ากิจกรรมของมนุษย์กำลังเพิ่มความร้อนที่พื้นผิวโลกได้ถึงระดับ "ห้าซิกม่า" ซึ่งเป็นมาตรวัดทางสถิติซึ่งหมายความว่ามีโอกาสเพียงหนึ่งในล้านเท่านั้นที่สัญญาณจะปรากฏขึ้นหากมี ไม่มีภาวะโลกร้อน ฉันเชื่อว่านี่หมายถึงบทความนี้"ฉลองครบรอบสามเหตุการณ์สำคัญในวิทยาศาสตร์การเปลี่ยนแปลงสภาพภูมิอากาศ"ซึ่งมีพล็อตซึ่งแสดงแผนผังด้านล่าง (เป็นภาพร่างเพราะฉันไม่สามารถหาภาพโอเพนซอร์สสำหรับต้นฉบับที่คล้ายกัน พบรูปภาพฟรีที่นี่ ) บทความอื่นจากกลุ่มการวิจัยเดียวกันซึ่งดูเหมือนว่าจะเป็นแหล่งต้นฉบับมากกว่าอยู่ที่นี่ (แต่ใช้นัยสำคัญ 1% แทน5 σ5σ5\sigma ) พล็อตนำเสนอการวัดจากกลุ่มวิจัยที่แตกต่างกันสามกลุ่ม ได้แก่ ระบบตรวจจับระยะไกล, ศูนย์สำหรับการใช้งานและการวิจัยดาวเทียมและมหาวิทยาลัยอลาบามาที่ Huntsville พล็อตแสดงเส้นโค้งสัญญาณที่เพิ่มขึ้นสามเส้นต่ออัตราส่วนสัญญาณรบกวนเป็นฟังก์ชันของแนวโน้มความยาว 5 σ5σ5\sigma ††^{\dagger}5 σ5σ5\sigma 5 σ5σ5 \sigma ††^\dagger

5
ตัวอย่างชีวิตจริงของการแจกแจงทั่วไป
ฉันเป็นนักเรียนที่จบการศึกษาที่สนใจเรื่องสถิติ ฉันชอบเนื้อหาที่มากเกินไป แต่บางครั้งฉันก็รู้สึกลำบากกับการใช้งานกับชีวิตจริง โดยเฉพาะคำถามของฉันเกี่ยวกับการแจกแจงเชิงสถิติที่ใช้กันทั่วไป (ปกติ - เบต้า - แกมม่า ฯลฯ ) ฉันเดาว่าในบางกรณีฉันได้รับคุณสมบัติเฉพาะที่ทำให้การแจกแจงค่อนข้างดี - ตัวอย่างเช่นคุณสมบัติไร้ความจำของเลขชี้กำลัง แต่สำหรับอีกหลายกรณีฉันไม่ได้มีสัญชาตญาณเกี่ยวกับความสำคัญและพื้นที่การใช้งานของการแจกแจงทั่วไปที่เราเห็นในตำราเรียน อาจมีแหล่งข้อมูลที่ดีมากมายที่จัดการกับข้อกังวลของฉันฉันจะดีใจถ้าคุณสามารถแบ่งปันสิ่งเหล่านั้น ฉันจะมีแรงจูงใจมากขึ้นในเนื้อหาถ้าฉันสามารถเชื่อมโยงกับตัวอย่างในชีวิตจริง

6
มีสถิติทางสถิติที่น่าสนใจและเป็นที่เขียนบ้างบ้าง?
มีบทความอะไรบ้างที่อธิบายการใช้งานสถิติที่จะสนุกและให้ข้อมูลในการอ่าน? เพื่อความชัดเจนฉันไม่ได้มองหาเอกสารที่อธิบายวิธีการทางสถิติแบบใหม่ (เช่นบทความเกี่ยวกับการถดถอยมุมน้อย) แต่เป็นเอกสารที่อธิบายถึงวิธีการแก้ปัญหาในโลกแห่งความเป็นจริง ตัวอย่างเช่นกระดาษหนึ่งแผ่นที่เหมาะกับสิ่งที่ฉันกำลังมองหาคือกระดาษสภาพภูมิอากาศจากชมรมวารสารที่ผ่านการตรวจสอบข้ามฉบับที่สอง ฉันกำลังมองหาเอกสารสถิติ - ish เพิ่มเติมมากกว่าเอกสารการเรียนรู้ด้วยเครื่อง แต่ฉันคิดว่ามันเป็นความแตกต่างที่คลุมเครือ (ฉันจะจัดประเภทเอกสาร Netflix Prize เป็นแนวเขตบิตและกระดาษในการวิเคราะห์ความเชื่อมั่นเป็นบางสิ่ง ฉันไม่ได้มองหา) ฉันถามเพราะแอปพลิเคชันสถิติส่วนใหญ่ที่ฉันเห็นเป็นตัวอย่างเล็ก ๆ น้อย ๆ ที่คุณเห็นในตำราเรียนหรือสิ่งต่าง ๆ ที่เกี่ยวข้องกับงานของฉันเองดังนั้นฉันจึงต้องการแยกสาขาออกเล็กน้อย

10
คุณมีคำแนะนำสำหรับหนังสือเกี่ยวกับสถิติประยุกต์ที่สอนด้วยตนเองในระดับบัณฑิตศึกษาหรือไม่?
ฉันเรียนวิชาสถิติหลายหลักสูตรในวิทยาลัย แต่ฉันพบว่าการศึกษาของฉันเป็นไปตามทฤษฎีมาก ฉันสงสัยว่ามีผู้ใดที่มีข้อความในสถิติประยุกต์ (ระดับบัณฑิตศึกษา) ที่คุณแนะนำหรือเคยมีประสบการณ์ที่ดีมาก่อนหรือไม่

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

5
การหดตัวของเจมส์ - สไตน์ 'อยู่ในป่า'?
ฉันถูกจับโดยความคิดเรื่องการหดตัวของเจมส์ - สไตน์ (นั่นคือฟังก์ชั่นแบบไม่เชิงเส้นของการสังเกตเพียงครั้งเดียวของเวกเตอร์ที่มีบรรทัดฐานอิสระอาจเป็นตัวประมาณที่ดีกว่าของวิธีการของตัวแปรสุ่ม ) อย่างไรก็ตามฉันไม่เคยเห็นมันในงานที่นำไปใช้ เห็นได้ชัดว่าฉันอ่านไม่ดีพอ มีตัวอย่างคลาสสิกที่เจมส์ - สไตน์ปรับปรุงการประมาณค่าในการตั้งค่าที่ใช้หรือไม่? ถ้าไม่การหดตัวแบบนี้เป็นเพียงความอยากรู้ทางปัญญาหรือไม่?

10
ตัวจําแนกคลาส 2 ระดับที่ดีที่สุดสำหรับการใช้งานของคุณคืออะไร? [ปิด]
ปิด คำถามนี้เป็นคำถามความคิดเห็นตาม ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้สามารถตอบข้อเท็จจริงและการอ้างอิงได้โดยแก้ไขโพสต์นี้ ปิดให้บริการใน3 ปีที่ผ่านมา กฎ: หนึ่งลักษณนามต่อคำตอบ ลงคะแนนถ้าคุณเห็นด้วย downvote / ลบรายการที่ซ้ำ ใส่ใบสมัครของคุณในความคิดเห็น

3
บทสรุปที่ดี (ความคิดเห็นหนังสือ) เกี่ยวกับการใช้งานที่หลากหลายของห่วงโซ่มาร์คอฟมอนติคาร์โล (MCMC)?
มีบทสรุปที่ดี (บทวิจารณ์หนังสือ) ในแอปพลิเคชั่นต่างๆของ Markov chain Monte Carlo (MCMC) หรือไม่? ฉันเคยเห็นมาร์คอฟเชนมอนติคาร์โลในทางปฏิบัติแต่หนังสือเล่มนี้ดูเก่าไปหน่อย มีหนังสืออัปเดตเพิ่มเติมเกี่ยวกับแอปพลิเคชันต่างๆของ MCMC ในด้านต่าง ๆ เช่นการเรียนรู้ด้วยคอมพิวเตอร์, การมองเห็นคอมพิวเตอร์และชีววิทยาการคำนวณหรือไม่?

1
Kinect ใช้ป่าสุ่มอย่างไร
ฉันอ่านในเว็บไซต์นี้ซึ่งเห็นได้ชัดว่า Kinect ใช้อัลกอริทึมป่าสุ่มสำหรับการเรียนรู้ของเครื่องในทางใดทางหนึ่ง ใครสามารถอธิบายสิ่งที่มันใช้ป่าสุ่มสำหรับและวิธีการทำงานของพวกเขา?

4
ตัวอย่าง / หนังสือ / แหล่งข้อมูลที่ดีเพื่อเรียนรู้เกี่ยวกับการเรียนรู้ด้วยเครื่องประยุกต์ (ไม่ใช่แค่ ML เท่านั้น)
ก่อนหน้านี้ฉันเคยเรียนหลักสูตร ML แต่ตอนนี้ฉันทำงานกับโครงการที่เกี่ยวข้องกับ ML ในงานของฉัน ฉันแน่ใจว่าสิ่งที่ฉันทำได้รับการวิจัย / จัดการกับก่อนหน้านี้ แต่ฉันไม่สามารถหาหัวข้อที่เฉพาะเจาะจง ตัวอย่างการเรียนรู้ของเครื่องทั้งหมดที่ฉันพบออนไลน์นั้นง่ายมาก (เช่นวิธีใช้โมเดล KMeans ใน Python และดูการคาดคะเน) ฉันกำลังมองหาแหล่งข้อมูลที่ดีเกี่ยวกับวิธีการใช้งานจริงเหล่านี้และอาจเป็นตัวอย่างรหัสของการใช้งานเครื่องเรียนรู้ขนาดใหญ่และการฝึกอบรมแบบจำลอง ฉันต้องการเรียนรู้เกี่ยวกับวิธีการดำเนินการอย่างมีประสิทธิภาพและสร้างข้อมูลใหม่ที่สามารถทำให้อัลกอริทึม ML มีประสิทธิภาพมากขึ้น

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.