คำถามติดแท็ก references

คำถามที่ค้นหาแหล่งอ้างอิงภายนอก (หนังสือเอกสาร ฯลฯ ) เกี่ยวกับเรื่องเฉพาะ ใช้แท็กเฉพาะเจาะจงเพิ่มเติมทุกครั้ง

17
บล็อกการสร้างภาพข้อมูลที่คุณชื่นชอบคืออะไร?
บล็อกที่ดีที่สุดในการสร้างภาพข้อมูลคืออะไร? ฉันตั้งคำถามนี้เป็นวิกิชุมชนเพราะเป็นอัตวิสัยสูง โปรด จำกัด คำตอบแต่ละข้อไว้ที่ลิงก์เดียว โปรดทราบเกณฑ์ต่อไปนี้สำหรับคำตอบที่เสนอ: [A] คำตอบที่ยอมรับได้สำหรับคำถามเช่นนี้ ... จำเป็นต้องให้คำอธิบายที่เพียงพอและเหตุผลที่สมเหตุสมผล การเชื่อมโยงหลายมิติเพียงอย่างเดียวไม่สามารถทำได้ ... [A] ny อนาคตตอบกลับ [ต้อง] พบ ... [เหล่านี้] มาตรฐาน; มิฉะนั้นพวกเขาจะถูกลบโดยไม่มีความเห็นเพิ่มเติม

7
จะเริ่มต้นด้วยสถิติสำหรับนักพัฒนาที่มีประสบการณ์
ในช่วงครึ่งแรกของปี 2558 ฉันเรียนหลักสูตร Machine Learning (โดย Andrew Ng หลักสูตร GREAT) และเรียนรู้พื้นฐานของการเรียนรู้ของเครื่อง (การถดถอยเชิงเส้น, การถดถอยโลจิสติก, SVM, Neuronal Networks ... ) นอกจากนี้ฉันยังเป็นนักพัฒนาเป็นเวลา 10 ปีดังนั้นการเรียนรู้ภาษาการเขียนโปรแกรมใหม่จะไม่เป็นปัญหา เมื่อเร็ว ๆ นี้ฉันเริ่มเรียนรู้ R เพื่อที่จะใช้อัลกอริทึมการเรียนรู้ของเครื่อง อย่างไรก็ตามฉันได้ตระหนักว่าถ้าฉันต้องการเรียนรู้ต่อไปฉันจะต้องมีความรู้ด้านสถิติอย่างเป็นทางการมากขึ้นในปัจจุบันฉันมีความรู้นอกระบบ แต่มีข้อ จำกัด อย่างเช่นฉันไม่สามารถระบุได้ว่าแบบจำลองเชิงเส้นแบบใด จะดีกว่า (ปกติฉันมักจะใช้ R-Square สำหรับมัน แต่เห็นได้ชัดว่าไม่ใช่ความคิดที่ดีมาก) ดังนั้นสำหรับฉันดูเหมือนว่าจะค่อนข้างชัดเจนว่าฉันต้องเรียนรู้พื้นฐานของสถิติ (ฉันศึกษาว่าในสถาบันเดียว แต่ลืมไปแล้วส่วนใหญ่) ที่ฉันควรเรียนรู้โปรดทราบว่าฉันไม่ต้องการหลักสูตรที่ครบวงจรจริง ๆ เพียงบางอย่าง ภายในหนึ่งเดือนให้ฉันรู้มากพอฉันจะกระตือรือร้นและเรียนรู้เพิ่มเติม :) จนถึงตอนนี้ฉันได้อ่าน " สถิติไร้น้ำตา " แล้วมีคำแนะนำอื่น ๆ อีกไหม?

6
แบบฝึกหัดสถิติแบบเบย์
ฉันพยายามเพิ่มความเร็วให้มากที่สุดในสถิติแบบเบย์ ฉันมีพื้นหลังของสถิติเล็กน้อย (สถานะ 101) แต่ไม่มากเกินไป - ฉันคิดว่าฉันสามารถเข้าใจก่อนหน้าหลังและโอกาส: D ฉันยังไม่ต้องการอ่านหนังสือแบบเบย์ ฉันต้องการอ่านจากแหล่งที่มา (ต้องการเว็บไซต์) ที่จะเพิ่มความรวดเร็วให้ฉัน บางอย่างเช่นนี้แต่มีรายละเอียดเพิ่มเติม คำแนะนำใด ๆ?

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
เคอร์เนลเชิงเส้นและเคอร์เนลที่ไม่ใช่เชิงเส้นสำหรับเครื่องเวกเตอร์สนับสนุน?
เมื่อใช้เครื่องสนับสนุนเวกเตอร์มีแนวทางในการเลือกเคอร์เนลเชิงเส้นกับเคอร์เนลแบบไม่เชิงเส้นเช่น RBF หรือไม่? ฉันเคยได้ยินว่าเคอร์เนลที่ไม่ใช่เชิงเส้นมีแนวโน้มที่จะไม่ทำงานได้ดีเมื่อจำนวนของคุณลักษณะมีขนาดใหญ่ มีการอ้างอิงใด ๆ เกี่ยวกับปัญหานี้หรือไม่?

4
แบบจำลองทางสถิติโกงแผ่น
ฉันสงสัยว่ามีรูปแบบทางสถิติ "cheat sheet (s)" ที่แสดงข้อมูลใด ๆ หรือมากกว่า: เมื่อใช้โมเดล เมื่อไม่ใช้โมเดล อินพุตที่จำเป็นและอินพุตเพิ่มเติม ผลลัพธ์ที่คาดหวัง โมเดลได้รับการทดสอบในด้านต่างๆ (นโยบาย, ชีวภาพ, วิศวกรรม, การผลิต ฯลฯ ) หรือไม่ เป็นที่ยอมรับในทางปฏิบัติหรือการวิจัย? รูปแบบที่คาดหวัง / ความแม่นยำ / ความแม่นยำ คำเตือน ความยืดหยุ่น รูปแบบที่เลิกใช้หลีกเลี่ยงหรือไม่ใช้ ฯลฯ ฉันเคยเห็นลำดับชั้นมาก่อนในเว็บไซต์ต่าง ๆ และแบบจำลองแบบง่าย ๆ ชีตชีตในตำราต่างๆ อย่างไรก็ตามมันจะดีถ้ามีรุ่นที่ใหญ่กว่าซึ่งรวมโมเดลหลากหลายประเภทตามการวิเคราะห์และทฤษฎีประเภทต่าง ๆ

7
การอ้างอิงเครือข่ายนิวรัล (ตำรา, หลักสูตรออนไลน์) สำหรับผู้เริ่มต้น
ฉันต้องการเรียนรู้โครงข่ายประสาท ฉันเป็นนักภาษาศาสตร์คอมพิวเตอร์ ฉันรู้วิธีการเรียนรู้ด้วยเครื่องเชิงสถิติและสามารถเขียนโค้ดใน Python ได้ ฉันกำลังมองหาที่จะเริ่มต้นด้วยแนวคิดของมันและรู้ว่าหนึ่งหรือสองรูปแบบที่นิยมซึ่งอาจเป็นประโยชน์จากมุมมองของภาษาศาสตร์เชิงคำนวณ ฉันเรียกดูเว็บเพื่อการอ้างอิงและพบหนังสือและเอกสารสองสามฉบับ Ripley, Brian D. (1996) การจดจำรูปแบบและ Neural Networks, Cambridge บิชอปซม. (2538) เครือข่ายประสาทรับรู้รูปแบบออกซ์ฟอร์ด: สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด เชื่อมโยงบางอย่างเช่นวิทยานิพนธ์ฉบับนี้ , เหล่านี้บันทึกหลักสูตร (มหาวิทยาลัยโตรอนโตจิตวิทยากรม) เหล่านี้บันทึกหลักสูตร (มหาวิทยาลัยวิสคอนซินวิทยาการคอมพิวเตอร์) และสไลด์โชว์ (การวิจัย Facebook) โดยทั่วไปแล้วหลักสูตร Coursera นั้นดีถ้ามีใครรู้อะไรที่เกี่ยวข้องกับพวกเขา ฉันชอบวัสดุที่มีภาษาที่ชัดเจนและเป็นตัวอย่างที่กว้างขวาง

9
ชุดข้อมูลจิ๋ว (ของจริง) สำหรับยกตัวอย่างในชั้นเรียน
เมื่อสอนชั้นเรียนระดับเบื้องต้นครูที่ฉันรู้จักมักจะประดิษฐ์ตัวเลขและเรื่องราวเพื่อเป็นตัวอย่างวิธีการสอนของพวกเขา สิ่งที่ฉันต้องการคือการบอกเรื่องจริงกับตัวเลขจริง อย่างไรก็ตามเรื่องราวเหล่านี้จำเป็นต้องเกี่ยวข้องกับชุดข้อมูลขนาดเล็กมากซึ่งช่วยให้การคำนวณด้วยตนเอง ข้อเสนอแนะสำหรับชุดข้อมูลดังกล่าวจะได้รับการต้อนรับมาก ตัวอย่างหัวข้อบางหัวข้อสำหรับชุดข้อมูลขนาดเล็ก: สหสัมพันธ์ / การถดถอย (พื้นฐาน) ANOVA (1/2 วิธี) การทดสอบ z / t - หนึ่ง / สองตัวอย่าง un / จับคู่ การเปรียบเทียบสัดส่วน - ตารางสองทาง / หลายทาง

20
มีภาพยนตร์ที่ดีเกี่ยวกับคณิตศาสตร์หรือความน่าจะเป็นหรือไม่?
คุณช่วยแนะนำภาพยนตร์ดีๆที่เกี่ยวข้องกับคณิตศาสตร์ความน่าจะเป็น ฯลฯ ได้ไหม? ตัวอย่างหนึ่งคือ21 ฉันจะสนใจภาพยนตร์ที่เกี่ยวข้องกับอัลกอริธึม (เช่นการถอดรหัสข้อความ) โดยทั่วไปภาพยนตร์ "geeky" ที่มีทฤษฎีทางวิทยาศาสตร์ที่มีชื่อเสียง แต่ไม่มีนิยายวิทยาศาสตร์หรือสารคดี ขอบคุณล่วงหน้า!

4
การอ้างอิงใดที่ควรอ้างอิงเพื่อสนับสนุนการใช้ 30 เป็นขนาดตัวอย่างที่ใหญ่พอ
ฉันได้อ่าน / ได้ยินหลายครั้งว่าขนาดตัวอย่างของหน่วยอย่างน้อย 30 หน่วยนั้นถือว่าเป็น "กลุ่มตัวอย่างขนาดใหญ่" (สมมติฐานปกติของวิธีการมักจะถือประมาณเนื่องจาก CLT, ... ) ดังนั้นในการทดลองของฉันฉันมักจะสร้างตัวอย่าง 30 หน่วย คุณช่วยให้ฉันอ้างอิงซึ่งควรจะอ้างถึงเมื่อใช้ขนาดตัวอย่าง 30?

15
ฉันควรทำตามแนวทางปฏิบัติที่ดีที่สุดอย่างไรเมื่อเตรียมแปลง?
ฉันมักจะสร้างทางเลือกที่แปลกประหลาดของตัวเองเมื่อเตรียมแปลง อย่างไรก็ตามฉันสงสัยว่ามีวิธีปฏิบัติที่ดีที่สุดในการสร้างแปลงหรือไม่ หมายเหตุ: ความคิดเห็นของ Robต่อคำตอบสำหรับคำถามนี้มีความเกี่ยวข้องมากที่นี่

3
ความแตกต่างระหว่างป่าสุ่มและต้นไม้ที่สุ่มมาก
ฉันเข้าใจว่าป่าสุ่มและต้นไม้ที่สุ่มมากที่สุดนั้นแตกต่างกันในแง่ที่ว่าต้นไม้ในป่าสุ่มนั้นแตกต่างกันไปในขณะที่พวกมันสุ่มในกรณีของต้นไม้ที่สุ่มมาก ๆ (เพื่อความแม่นยำมากขึ้น ท่ามกลางการแยกแบบสุ่มในตัวแปรที่เลือกสำหรับต้นไม้ปัจจุบัน) แต่ฉันไม่เข้าใจถึงผลกระทบของการแบ่งแยกที่แตกต่างกันนี้ในสถานการณ์ต่างๆ พวกเขาเปรียบเทียบในแง่ของอคติ / ความแปรปรวนได้อย่างไร พวกเขาจะเปรียบเทียบต่อหน้าตัวแปรที่ไม่เกี่ยวข้องได้อย่างไร? พวกเขาจะเปรียบเทียบในที่ที่มีตัวแปรที่สัมพันธ์กันอย่างไร?

10
มีหนังสือวิทยาศาสตร์ยอดนิยมเล่มใดบ้างเกี่ยวกับสถิติหรือการเรียนรู้ของเครื่อง?
มีหนังสือวิทยาศาสตร์ยอดนิยมมากมายที่เกี่ยวข้องกับวิทยาศาสตร์จริงตลอดจนประวัติศาสตร์และเหตุผลเบื้องหลังทฤษฎีปัจจุบันขณะที่ยังคงสนุกกับการอ่าน ตัวอย่างเช่น "Chaos" โดย James Gleick (Chaos, fractals, nonlinearity), "ประวัติย่อของเวลา" โดย Stephen Hawking (ฟิสิกส์ต้นกำเนิดของจักรวาล, เวลา, blackholes) หรือ "The Selfish Gene" โดย Richard Dawkins ( วิวัฒนาการและการคัดเลือกโดยธรรมชาติ) หนังสือเหล่านี้บางเล่มมีข้อโต้แย้ง (ดอว์คินส์) และบางเล่มไม่มี (กลีค) แต่พวกเขาทั้งหมดทำหน้าที่เพื่อให้ง่ายสำหรับพวกเราที่ไม่มีการศึกษาทางวิทยาศาสตร์ในเชิงลึกที่จะเข้าใจแนวคิดที่ยากเป็นอย่างอื่น มีหนังสือประเภทใดบ้างที่เน้นเรื่องสถิติหรือการเรียนรู้ของเครื่องเป็นหลัก? โปรดระบุบทสรุปของหนังสือแต่ละเล่มที่ครอบคลุม

4
ภูมิหลังที่แข็งแกร่งในวิชาคณิตศาสตร์เป็นสิ่งจำเป็นสำหรับ ML หรือไม่?
ฉันเริ่มต้องการพัฒนาทักษะของฉันเองและฉันก็รู้สึกทึ่งกับการเรียนรู้ของเครื่องจักร อย่างไรก็ตามเมื่อหกปีที่แล้วแทนที่จะทำตามนี้ฉันตัดสินใจที่จะศึกษาระดับปริญญาที่ไม่เกี่ยวข้องกับวิทยาศาสตร์คอมพิวเตอร์ ฉันได้พัฒนาซอฟต์แวร์และแอพพลิเคชั่นมาประมาณ 8-10 ปีแล้วดังนั้นฉันจึงมีความสามารถที่ดี แต่ฉันก็ไม่สามารถเจาะด้านคณิตศาสตร์ของการเรียนรู้ของเครื่อง / ความน่าจะเป็น / สถิติ ฉันเริ่มมองหาสื่อการเรียนรู้และในหน้าแรกอาจมีสิ่งที่ทำให้ฉันสับสนและตั้งอุปสรรคในการเรียนรู้ของฉันทันที ภูมิหลังที่แข็งแกร่งในวิชาคณิตศาสตร์เป็นสิ่งจำเป็นสำหรับ ML หรือไม่? ฉันควรลองและเติมคำในช่องว่างของคณิตศาสตร์ก่อนที่จะเรียนต่อกับ ML หรือไม่? การเรียนรู้ด้วยตนเองสามารถใช้ได้กับนักพัฒนาที่ไม่มีพื้นฐานด้านวิทยาศาสตร์คอมพิวเตอร์หรือไม่? คำถามที่เกี่ยวข้อง: หนังสือสำหรับอ่านก่อนองค์ประกอบของการเรียนรู้ทางสถิติ?

10
แหล่งข้อมูลเศรษฐศาสตร์ที่มีประโยชน์ที่สุดคืออะไร
เมื่อทำการวิจัยในเศรษฐกิจมักจะต้องตรวจสอบข้อสรุปเชิงทฤษฎีเกี่ยวกับข้อมูลจริง แหล่งข้อมูลที่เชื่อถือได้คืออะไรที่จะใช้และอ้างอิง? ฉันสนใจแหล่งข้อมูลที่ให้ข้อมูลทางสถิติที่หลากหลายเช่น GDP ประชากร CPI PPI เป็นต้น แก้ไข: นี่คือการรวมของลิงค์ที่ปรากฏในกระทู้นี้ + อีกสองสามที่ฉันจำได้ ทั่วไป: - Thomson Reuters Datastream (ไม่ฟรีครอบคลุมมาก) - ข้อมูลธนาคารโลก - ข้อมูลสหประชาชาติ - ข้อมูลIMF - ข้อมูล ADB - สถิติ WTO - Infochimps - แหล่งทรัพยากรขนาดใหญ่ของแหล่งข้อมูลภาครัฐและเอกชน - รวมถึงของพวกเขาAPI - Freebase (ปัจจุบันเป็นของ Google) - แหล่งข้อมูลเปิด - DBpedia - แนวทางการใช้ Wikipedia API - Wikipedia …
37 references 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.