คำถามติดแท็ก terminology

การใช้และความหมายของคำศัพท์ / แนวคิดทางเทคนิคที่เฉพาะเจาะจงในสถิติ

2
ทำไมชื่อ“ เคอร์เนล” ในสถิติและ ML
สิ่งนี้ถูกถามในไซต์ SE อื่น ๆ ในบริบทของระบบปฏิบัติการและพีชคณิตเชิงเส้น แต่คำถามเดียวกันทำให้ฉันสับสนเกี่ยวกับวิธีเคอร์เนลที่ใช้ในสถิติและการเรียนรู้ของเครื่อง บ่อยครั้งมีการกล่าวว่าเมล็ดเช่นในการประมาณความหนาแน่นของเคอร์เนลหรือ SVMs แสดงถึงความคล้ายคลึงกันบางอย่าง แต่ฉันไม่เข้าใจว่าชื่อ 'เคอร์เนล' มาจากไหนและเป็นสัญลักษณ์ของอะไร ดังนั้นนิรุกติศาสตร์ของเมล็ดในบริบทของสถิติและการเรียนรู้ของเครื่องคืออะไร? เพื่อให้ชัดเจนฉันรู้ดีว่าเคอร์เนลคืออะไรและคุณสมบัติหลักของมันฉันแค่อยากรู้เกี่ยวกับชื่อเนื่องจากฉันไม่เห็นสิ่งที่เกี่ยวข้องกับเมล็ดหรือแกนหลักตามที่กำหนดไว้เป็นส่วนใหญ่ พจนานุกรม หรืออย่างน้อยฉันก็ไม่สามารถมองเห็นความหมายที่ลึกซึ้งยิ่งกว่า 'ส่วนสำคัญของวิธีการ'

4
คือ 50% 100% สูงกว่า 25% หรือ 25% สูงกว่า 25%?
หากฉันมีสองค่า A และ B ซึ่งทั้งคู่แสดงเป็นเปอร์เซ็นต์ของ C และฉันต้องการแสดงความแตกต่างของขนาดระหว่าง A และ B เป็นเปอร์เซ็นต์ D มันถูกต้องมากกว่าหรือไม่ที่จะแสดง D เป็นเปอร์เซ็นต์ของ C หรือ เป็นเปอร์เซ็นต์ของ B (หรือ A จริง ๆ ) เห็นได้ชัดว่าผู้ว่างงาน 50 คนนั้นใหญ่กว่าผู้ว่างงาน 25% เพราะเห็นได้ชัดว่า '%' ที่นี่หมายถึง '% ของผู้ว่างงาน 25 คน' แต่ใหญ่กว่าการว่างงาน 50% มากกว่าการว่างงาน 25% เป็นการเพิ่มขึ้นของการว่างงาน 100% จาก 25% แต่เพิ่มขึ้นเพียง 25% ของอัตราการว่างงานทั้งหมด

3
ทำไมการกระจายโลจิสติกส์จึงเรียกว่า“ โลจิสติกส์”?
"โลจิสติกส์" เกี่ยวกับการกระจายโลจิสติกส์ในวิธีสามัญสำนึกคืออะไร นิรุกติศาสตร์ของและเหตุผลศัพท์สำหรับชื่อไม่ใช่แค่นิยามคณิตศาสตร์บริสุทธิ์?

2
การกระจายแบบไม่ต่อเนื่องนี้มีชื่อหรือไม่?
การกระจายแบบไม่ต่อเนื่องนี้มีชื่อหรือไม่? สำหรับi∈1...Ni∈1...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} ฉันเจอการกระจายตัวนี้จากรายการต่อไปนี้: ฉันมีรายการของรายการที่ถูกจัดอันดับโดยฟังก์ชั่นยูทิลิตี้ ฉันต้องการสุ่มเลือกหนึ่งในรายการโดยให้ความเอนเอียงไปยังจุดเริ่มต้นของรายการ ดังนั้นก่อนอื่นให้เลือกดัชนีระหว่าง 1 ถึงอย่างสม่ำเสมอ จากนั้นผมก็เลือกรายการระหว่างดัชนี 1 และเจฉันเชื่อว่ากระบวนการนี้ส่งผลให้เกิดการกระจายตัวข้างต้นj N jNNNJjjยังไม่มีข้อความNNJjj

1
ความแตกต่างระหว่างการถดถอยโลจิสติกและ Logit คืออะไร?
ความแตกต่างระหว่างการถดถอยโลจิสติกและ Logit คืออะไร? ฉันเข้าใจว่าพวกเขาเหมือนกัน (หรือแม้กระทั่งสิ่งเดียวกัน) แต่มีคนอธิบายความแตกต่างระหว่างสองสิ่งนี้ได้ไหม เป็นเรื่องเกี่ยวกับอัตราต่อรองหรือไม่

6
อะไรคือความแตกต่างระหว่างสถิติเชิงพรรณนาและเชิงอนุมาน
ความเข้าใจของฉันคือสถิติเชิงพรรณนาอธิบายคุณลักษณะเชิงปริมาณของตัวอย่างข้อมูลในขณะที่สถิติเชิงอนุมานได้ทำการอนุมานเกี่ยวกับประชากรที่ตัวอย่างถูกวาดขึ้นมา อย่างไรก็ตามหน้าวิกิพีเดียสำหรับสถานะการอนุมานทางสถิติ : โดยส่วนใหญ่แล้วการอนุมานทางสถิติทำให้ข้อเสนอเกี่ยวกับประชากรโดยใช้ข้อมูลที่ดึงมาจากประชากรที่สนใจผ่านการสุ่มตัวอย่างบางรูปแบบ "ส่วนใหญ่" ทำให้ฉันคิดว่าฉันอาจไม่เข้าใจแนวคิดเหล่านี้อย่างเหมาะสม มีตัวอย่างของสถิติเชิงอนุมานที่ไม่ได้ทำข้อเสนอเกี่ยวกับประชากรหรือไม่

3
“ ความลำเอียง” คืออะไร?
ฉันพยายามเข้าใจแนวคิดเรื่องความเอนเอียงในบริบทของการวิเคราะห์การถดถอยเชิงเส้น นิยามทางคณิตศาสตร์ของอคติคืออะไร? ลำเอียงคืออะไรและทำไม / อย่างไร? ตัวอย่างที่แสดง?


2
ทำไมตัวแปรสุ่ม“ ลบทวินาม” จึงเรียกว่า
ฉันไม่เข้าใจว่าทำไมตัวแปรสุ่ม "ลบทวินาม" จึงมีชื่อนั้น สิ่งที่เป็นลบเกี่ยวกับมัน? ทวินามเกี่ยวกับมันคืออะไร? อะไรคือลบ - ทวินามเกี่ยวกับมัน

4
ทุกคนสามารถอธิบายแนวคิดของ "ผลรวมของตัวแปรสุ่ม"
ในชั้นความน่าจะเป็นของฉันคำว่า "ผลรวมของตัวแปรสุ่ม" ถูกนำมาใช้อย่างต่อเนื่อง อย่างไรก็ตามฉันติดอยู่กับสิ่งที่ว่าหมายถึงอะไร? เรากำลังพูดถึงผลรวมของกลุ่มของการรับรู้จากตัวแปรสุ่มหรือไม่? ถ้าใช่นั่นจะไม่รวมกันเป็นตัวเลขเดียวใช่หรือไม่ ผลรวมของการรับรู้ตัวแปรแบบสุ่มนำเราไปสู่การแจกแจงอย่างไรหรือ cdf / pdf / ฟังก์ชันทุกชนิด และถ้าไม่ใช่การรับรู้ตัวแปรแบบสุ่มแล้วจะมีอะไรเพิ่มเข้ามาบ้าง?

4
ความแตกต่างระหว่างการเรียนรู้และการอนุมานคืออะไร?
เอกสารการเรียนรู้การเรียนรู้ด้วยเครื่องมักจะรักษาการเรียนรู้และการอนุมานว่าเป็นภารกิจสองอย่างที่แยกกัน แต่ก็ไม่ชัดเจนสำหรับฉันว่าความแตกต่างคืออะไร ในหนังสือเล่มนี้พวกเขาใช้สถิติแบบเบย์สำหรับงานทั้งสองประเภท แต่ไม่ได้ให้แรงจูงใจสำหรับความแตกต่างนั้น ฉันมีความคิดที่คลุมเครือหลายอย่างเกี่ยวกับสิ่งที่อาจเป็นเกี่ยวกับ แต่ฉันอยากจะเห็นคำจำกัดความที่มั่นคงและบางทีก็อาจเป็นการโต้แย้งหรือการขยายความคิดของฉัน: ความแตกต่างระหว่างการอนุมานค่าของตัวแปรแฝงสำหรับจุดข้อมูลที่แน่นอนและการเรียนรู้รูปแบบที่เหมาะสมสำหรับข้อมูล ความแตกต่างระหว่างการแยกความแปรปรวน (การอนุมาน) และการเรียนรู้การบุกรุกเพื่อที่จะสามารถแยกความแปรปรวน (โดยการเรียนรู้พลวัตของพื้นที่อินพุต / กระบวนการ / โลก) การเปรียบเทียบทางระบบประสาทอาจเป็น potentiation / depression ระยะสั้น (ร่องรอยความจำ) เทียบกับ potentiation / depression ระยะยาว

4
มีการทดสอบสถิติใด ๆ ที่เป็นพารามิเตอร์และไม่ใช่พารามิเตอร์
มีการทดสอบสถิติใด ๆ ที่เป็นพารามิเตอร์และไม่ใช่พารามิเตอร์ คำถามนี้ถูกถามโดยคณะผู้สัมภาษณ์ เป็นคำถามที่ถูกต้องหรือไม่

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
โมเดลนั้นพอดีกับข้อมูลหรือเป็นข้อมูลที่ติดตั้งกับโมเดลหรือไม่?
มีความแตกต่างทางแนวคิดหรือขั้นตอนระหว่างการปรับโมเดลให้เป็นข้อมูลและการปรับข้อมูลให้พอดีกับโมเดลหรือไม่? ตัวอย่างของถ้อยคำแรกสามารถดูได้ในhttps://courses.washington.edu/matlab1/ModelFitting.htmlและที่สองในhttps://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html .

2
ชื่ออะไร: ความแม่นยำ (อินเวอร์สของความแปรปรวน)
สังหรณ์ใจค่าเฉลี่ยเป็นเพียงค่าเฉลี่ยของการสังเกต ความแปรปรวนคือการสังเกตเหล่านี้แตกต่างจากค่าเฉลี่ยเท่าใด ฉันต้องการทราบว่าทำไมการผกผันของความแปรปรวนจึงเป็นที่รู้จักกันอย่างแม่นยำ เราสามารถทำอะไรได้จากสัญชาตญาณนี้ และทำไมเมทริกซ์ความแม่นยำจึงมีประโยชน์เหมือนเมทริกซ์ความแปรปรวนร่วมในการแจกแจงหลายตัวแปร (ปกติ) กรุณาเข้าใจด้วย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.