สถิติและข้อมูลขนาดใหญ่

4

หมายความว่าโหมด = แปลว่าการกระจายแบบสมมาตรหรือไม่?

ฉันรู้ว่าคำถามนี้ถูกถามด้วย case Mean = มัธยฐาน แต่ฉันไม่พบสิ่งใดที่เกี่ยวข้องกับโหมด Mean = หากโหมดเท่ากับค่าเฉลี่ยฉันสามารถสรุปได้ว่านี่คือการแจกแจงแบบสมมาตรหรือไม่? ฉันจะถูกบังคับให้รู้ค่ามัธยฐานด้วยวิธีนี้หรือไม่?

30 distributions mean skewness mode symmetry

2

การเซ็นเซอร์และการตัดทอนแตกต่างกันอย่างไร

ในหนังสือแบบจำลองทางสถิติและวิธีการสำหรับข้อมูลอายุการใช้งานเขียนไว้: การเซ็นเซอร์:เมื่อการสังเกตไม่สมบูรณ์เนื่องจากสาเหตุบางอย่างแบบสุ่ม การตัดปลาย:เมื่อธรรมชาติที่ไม่สมบูรณ์ของการสังเกตเกิดจากกระบวนการคัดเลือกอย่างเป็นระบบซึ่งมีอยู่ในการออกแบบการศึกษา อะไรคือความหมายของ "กระบวนการคัดเลือกอย่างเป็นระบบซึ่งมีอยู่ในการออกแบบการศึกษา" ในคำจำกัดความของการตัดทอน? การเซ็นเซอร์และการตัดทอนแตกต่างกันอย่างไร

30 self-study censoring truncation

2

การเรียนรู้แบบมีผู้เรียนการเรียนรู้แบบไม่มีผู้ดูแลและการเสริมแรง: พื้นฐานการทำงาน

การเรียนรู้ภายใต้การดูแล 1) มนุษย์สร้างลักษณนามอยู่บนพื้นฐานของการป้อนข้อมูลและการส่งออกข้อมูล 2) ลักษณนามนั้นได้รับการฝึกอบรมพร้อมชุดข้อมูลการฝึกอบรม 3) ลักษณนามนั้นทดสอบด้วยชุดข้อมูลทดสอบ 4) การปรับใช้ถ้าผลลัพธ์เป็นที่น่าพอใจ หากต้องการใช้เมื่อ "ฉันรู้วิธีจัดประเภทข้อมูลนี้ฉันแค่ต้องการให้คุณ (ตัวจําแนก) เพื่อจัดเรียงข้อมูล" จุดของวิธีการ: ใช้ป้ายกำกับคลาสหรือสร้างจำนวนจริง การเรียนรู้ที่ไม่จำเป็น 1) มนุษย์สร้างอัลกอริทึมบนพื้นฐานของการป้อนข้อมูล 2) อัลกอริทึมนั้นทดสอบด้วยชุดทดสอบข้อมูล (ซึ่งอัลกอริทึมสร้างลักษณนาม) 3) การปรับใช้ถ้าลักษณนามเป็นที่น่าพอใจ เมื่อต้องการใช้เมื่อ "ฉันไม่รู้ว่าจะจัดประเภทข้อมูลนี้ได้อย่างไรคุณ (อัลกอริทึม) สามารถสร้างตัวจําแนกสำหรับฉันได้หรือไม่" จุดของวิธีการ: ใช้ป้ายกำกับคลาสหรือทำนาย (PDF) เสริมการเรียนรู้ 1) มนุษย์สร้างอัลกอริทึมบนพื้นฐานของการป้อนข้อมูล 2) อัลกอริทึมนั้นนำเสนอสถานะที่ขึ้นอยู่กับข้อมูลอินพุตที่ผู้ใช้ให้รางวัลหรือลงโทษอัลกอริทึมผ่านการกระทำที่อัลกอริทึมดำเนินการซึ่งจะดำเนินต่อไปตามกาลเวลา 3) อัลกอริทึมนั้นเรียนรู้จากการให้รางวัล / การลงโทษและอัปเดตตัวเองซึ่งจะดำเนินต่อไป 4) มันอยู่ในการผลิตเสมอมันต้องเรียนรู้ข้อมูลจริงเพื่อให้สามารถนำเสนอการกระทำจากรัฐ เพื่อใช้เมื่อ "ฉันไม่รู้ว่าจะจำแนกข้อมูลนี้อย่างไรคุณสามารถจำแนกข้อมูลนี้และฉันจะให้รางวัลแก่คุณหากมันถูกต้องหรือฉันจะลงโทษคุณหากไม่ใช่" นี่คือการไหลของการปฏิบัติเหล่านี้ฉันได้ยินมามากมายเกี่ยวกับสิ่งที่พวกเขาทำ แต่ข้อมูลที่เป็นประโยชน์และเป็นแบบอย่างนั้นน่ากลัวเล็กน้อย!

30 machine-learning unsupervised-learning supervised-learning reinforcement-learning

7

การอนุมานกับการประมาณค่า?

อะไรคือความแตกต่างระหว่าง "การอนุมาน" และ "การประมาณค่า" ภายใต้บริบทของการเรียนรู้ของเครื่อง ? ในฐานะมือใหม่ฉันรู้สึกว่าเราอนุมานตัวแปรแบบสุ่มและประเมินพารามิเตอร์โมเดล ความเข้าใจนี้ถูกต้องหรือไม่ ถ้าไม่สิ่งที่แตกต่างกันคืออะไรและเมื่อใดที่ฉันควรใช้ นอกจากนี้คำพ้องความหมายของคำว่า "เรียนรู้" คืออะไร?

30 machine-learning inference terminology

2

มีช่วงความเชื่อมั่นที่ไม่ใช่พารามิเตอร์ที่เชื่อถือได้สำหรับค่าเฉลี่ยของการแจกแจงแบบเบ้หรือไม่?

การแจกแจงแบบเบ้อย่างมากเช่นบันทึกปกติไม่ส่งผลให้ช่วงความมั่นใจในการบูตที่ถูกต้องแม่นยำ นี่คือตัวอย่างที่แสดงว่าบริเวณหางด้านซ้ายและขวาอยู่ห่างจากอุดมคติในอุดมคติ 0.025 ไม่ว่าคุณจะลองใช้วิธีบูตสแตรปแบบใดใน R: require(boot) n <- 25 B <- 1000 nsim <- 1000 set.seed(1) which <- c('basic', 'perc', 'norm', 'bca', 'stud') mul <- 0; sdl <- 1.65 # on log scale dist <- c('normal', 'lognormal')[2] switch(dist, normal = {g <- function(x) x; mu <- mul}, lognormal = {g …

30 confidence-interval nonparametric mean bootstrap median

2

ทำไมเราควรใช้ข้อผิดพลาด t แทนข้อผิดพลาดปกติ?

ในบล็อกโพสต์นี้โดย Andrew Gelman มีข้อความต่อไปนี้: แบบจำลองของ Bayesian เมื่อ 50 ปีที่แล้วดูเรียบง่ายอย่างสิ้นหวัง (ยกเว้นแน่นอนสำหรับปัญหาง่าย ๆ ) และฉันคาดหวังว่าแบบจำลองของ Bayesian ในวันนี้จะดูเรียบง่ายอย่างสิ้นหวัง 50 ปี (สำหรับตัวอย่างง่ายๆ: เราควรใช้ t แทนข้อผิดพลาดทั่วไปทุกที่ทุกเวลา แต่เรายังไม่ทำเช่นนี้เพราะความคุ้นเคยนิสัยและความสะดวกสบายทางคณิตศาสตร์สิ่งเหล่านี้อาจเป็นเหตุผลที่ดี ในการเมืองอนุรักษ์นิยมมีข้อโต้แย้งที่ดีหลายประการ - แต่ฉันคิดว่าท้ายที่สุดเมื่อเราคุ้นเคยกับแบบจำลองที่ซับซ้อนกว่านี้เราจะไปในทิศทางนั้น) ทำไมเราควร "ใช้ t เป็นประจำแทนที่จะเป็นข้อผิดพลาดทั่วไปทุกที่"

30 distributions bayesian normal-distribution model robust

3

การวิเคราะห์ระดับแฝงกับการวิเคราะห์กลุ่ม - ความแตกต่างในการอนุมาน?

การอนุมานที่แตกต่างกันสามารถทำอะไรได้จากการวิเคราะห์ระดับแฝง (LCA) กับการวิเคราะห์คลัสเตอร์ มันถูกต้องหรือไม่ที่ LCA ถือว่าตัวแปรแฝงแฝงที่ก่อให้เกิดคลาสในขณะที่การวิเคราะห์กลุ่มเป็นคำอธิบายเชิงประจักษ์ของคุณลักษณะที่สัมพันธ์กันจากอัลกอริทึมการจัดกลุ่ม? ดูเหมือนว่าในสังคมศาสตร์ LCA ได้รับความนิยมและได้รับการพิจารณาว่าเป็นระบบที่เหนือกว่าเนื่องจากมีการทดสอบความสำคัญแบบไคสแควร์อย่างเป็นทางการซึ่งการวิเคราะห์กลุ่มไม่ได้ มันจะเป็นการดีถ้าตัวอย่างสามารถเสนอในรูปแบบของ "LCA จะเหมาะสมกับสิ่งนี้ (แต่ไม่ใช่การวิเคราะห์คลัสเตอร์) และการวิเคราะห์กลุ่มจะเหมาะสมสำหรับสิ่งนี้ (แต่ไม่ใช่การวิเคราะห์ระดับที่ซ่อนเร้น) ขอบคุณ! ไบรอัน

30 clustering latent-variable latent-class

2

เครือข่ายประสาทเทียม Convolutional: เซลล์ประสาทส่วนกลางไม่ได้แสดงออกมามากเกินไปในผลลัพธ์หรือไม่

[คำถามนี้ถูกวางที่กองล้นเช่นกัน] คำถามในระยะสั้น ฉันกำลังศึกษาโครงข่ายประสาทเทียมและฉันเชื่อว่าเครือข่ายเหล่านี้ไม่ได้ปฏิบัติต่อเซลล์ประสาทอินพุต (พิกเซล / พารามิเตอร์) ทุกตัวเท่ากัน ลองจินตนาการว่าเรามีเครือข่ายที่ลึก (หลายเลเยอร์) ที่ใช้การแปลงภาพอินพุตบางส่วน เซลล์ประสาทใน "ตรงกลาง" ของภาพมีทางเดินที่ไม่ซ้ำกันหลายไปยังเซลล์ประสาทชั้นลึกที่มากขึ้นซึ่งหมายความว่าการเปลี่ยนแปลงเล็ก ๆ ในเซลล์ประสาทกลางมีผลอย่างมากต่อการส่งออก อย่างไรก็ตามเซลล์ประสาทที่ขอบของภาพมีเพียงวิธี (หรือขึ้นอยู่กับการดำเนินการตามลำดับที่1 ) ของเส้นทางที่ข้อมูลไหลผ่านกราฟ ดูเหมือนว่าสิ่งเหล่านี้เป็น "ภายใต้การเป็นตัวแทน"111111 ฉันกังวลเกี่ยวกับเรื่องนี้เนื่องจากการเลือกปฏิบัติของเซลล์ประสาทขอบขนาดนี้ ตัวอย่างมากด้วยความลึก (จำนวนชั้น) ของเครือข่าย แม้การเพิ่มเลเยอร์แบบรวมกำไรสูงสุดจะไม่หยุดการเพิ่มแบบเอ็กซ์โพเนนเชียล แต่การเชื่อมต่อแบบเต็มทำให้เซลล์ประสาททั้งหมดมีฐานรากเท่ากัน ฉันไม่เชื่อว่าเหตุผลของฉันถูกต้องแล้วดังนั้นคำถามของฉันคือ: ฉันถูกต้องไหมว่าเอฟเฟกต์นี้เกิดขึ้นในเครือข่ายการสนทนาเชิงลึก? มีทฤษฎีใดบ้างเกี่ยวกับเรื่องนี้เคยถูกกล่าวถึงในวรรณคดีหรือไม่? มีวิธีที่จะเอาชนะผลกระทบนี้หรือไม่? เพราะฉันไม่แน่ใจว่านี่จะให้ข้อมูลที่เพียงพอหรือไม่ฉันจะอธิบายเพิ่มเติมเกี่ยวกับคำแถลงปัญหาอีกเล็กน้อยและทำไมฉันจึงเชื่อว่านี่เป็นข้อกังวล คำอธิบายโดยละเอียดเพิ่มเติม ลองนึกภาพเรามีเครือข่ายประสาทลึกที่ใช้ภาพเป็นอินพุท สมมติว่าเราใช้ฟิลเตอร์แบบ Convolutional เป็นตัวกรองขนาดพิกเซลเหนือภาพซึ่งเราจะทำการเปลี่ยนวินโดว์คอนวิชัน4พิกเซลในแต่ละครั้ง ซึ่งหมายความว่าเซลล์ประสาทในการป้อนข้อมูลทุกส่งยืนยันการใช้งานของมันไป16 × 16 = 265เซลล์ประสาทในชั้น2 แต่ละเซลล์เหล่านี้อาจส่งการเปิดใช้งานของพวกเขาไปยังอีก265เช่นเซลล์ประสาทสูงสุดของเราจะถูกแสดงใน265 264×6464×6464\times 6444416×16=26516×16=26516 \times 16 = 26522226526526526522652265^2เซลล์ประสาทการส่งออกและอื่น ๆ …

30 machine-learning neural-networks convolution

2

การกระจายแบบกึ่งทวินามคืออะไร (ในบริบทของ GLM)

ฉันหวังว่าบางคนสามารถให้ภาพรวมที่เข้าใจง่ายเกี่ยวกับการกระจายตัวของ quasibinomial คืออะไรและมันทำอะไร ฉันสนใจในประเด็นเหล่านี้เป็นพิเศษ: วิธี quasibinomial แตกต่างกับการกระจายทวินาม เมื่อตัวแปรตอบสนองเป็นสัดส่วน (ค่าตัวอย่าง ได้แก่ 0.23, 0.11, 0.78, 0.98) โมเดล quasibinomial จะทำงานใน R แต่โมเดลทวินามจะไม่ ทำไมรูปแบบ quasibinomial ควรใช้เมื่อตัวแปรการตอบสนอง TRUE / FALSE เกินกำหนด

30 r generalized-linear-model binomial overdispersion quasi-likelihood

2

ฉันต้องติดสติ๊กเกอร์จำนวนเท่าใดเพื่อทำให้อัลบั้ม FIFA Panini สมบูรณ์

ฉันกำลังเล่นFIFA Panini Online Sticker Albumซึ่งเป็นการดัดแปลงอินเทอร์เน็ตของอัลบั้ม Panini คลาสสิคที่มักเผยแพร่สำหรับฟุตบอลโลกฟุตบอลชิงแชมป์ยุโรปและทัวร์นาเมนต์อื่น ๆ อัลบั้มมีตัวยึดสำหรับสติ๊กเกอร์ต่าง ๆ 424 วัตถุประสงค์ของเกมคือการรวบรวมทั้งหมด 424 สติกเกอร์มาในชุด 5 ซึ่งสามารถรับได้ผ่านรหัสที่พบออนไลน์ (หรือในกรณีของอัลบั้มพิมพ์คลาสสิกซื้อที่แผงขายหนังสือพิมพ์ท้องถิ่นของคุณ) ฉันทำสมมติฐานดังต่อไปนี้: สติกเกอร์ทั้งหมดมีการเผยแพร่ในปริมาณเดียวกัน สติ๊กเกอร์หนึ่งชุดไม่มีการทำซ้ำ ฉันจะทราบได้อย่างไรว่าต้องมีสติกเกอร์กี่ชุดเพื่อให้แน่ใจว่าสมเหตุสมผล (สมมติว่า 90%) ว่าฉันมีสติ๊กเกอร์ที่ไม่ซ้ำกันทั้งหมด 424 ชิ้น

30 probability coupon-collector-problem

9

ทำไมต้องใช้โมเดลการแก้ไขข้อผิดพลาดเวกเตอร์

ฉันสับสนเกี่ยวกับรูปแบบการแก้ไขข้อผิดพลาดของเวกเตอร์ ( VECM ) พื้นหลังทางเทคนิค: VECMนำเสนอความเป็นไปได้ในการใช้Vector Autoregressive Model ( VAR ) กับอนุกรมเวลาหลายตัวแปรในตัว ในตำราเรียนพวกเขาตั้งชื่อปัญหาบางอย่างในการใช้VARกับอนุกรมเวลาแบบบูรณาการสิ่งสำคัญที่สุดคือการถดถอยแบบเผด็จการ กระบวนการประเมินVECMประกอบด้วยขั้นตอนสามขั้นตอนต่อไปนี้ซึ่งเป็นขั้นตอนที่สับสนสำหรับฉันขั้นตอนแรก: ข้อมูลจำเพาะและการประมาณค่าของโมเดลVARสำหรับอนุกรมเวลาหลายตัวแปรรวม คำนวณการทดสอบอัตราส่วนความน่าจะเป็นเพื่อกำหนดจำนวนความสัมพันธ์ของการมีส่วนร่วม หลังจากกำหนดจำนวน cointegrations ให้ประเมินVECM ในขั้นตอนแรกหนึ่งประมาณการแบบจำลองVAR ที่มีจำนวนของความล่าช้าที่เหมาะสม (ใช้ความดีปกติของเกณฑ์พอดี) และตรวจสอบว่าส่วนที่เหลือสอดคล้องกับสมมติฐานของแบบจำลองหรือไม่นั่นคือการไม่มีความสัมพันธ์แบบอนุกรมและความสัมพันธ์แบบ heteroscedasticity . ดังนั้นหนึ่งการตรวจสอบว่ารูปแบบVARอย่างเหมาะสมอธิบายอนุกรมเวลาหลายตัวแปรและหนึ่งดำเนินการเพื่อขั้นตอนต่อไปถ้ามันเป็นเท่านั้น และตอนนี้สำหรับคำถามของฉัน: ถ้าแบบจำลองVARอธิบายข้อมูลได้ดีทำไมฉันต้องใช้VECMเลย? หากเป้าหมายของฉันคือการสร้างการคาดการณ์มันไม่เพียงพอที่จะประเมินVARและตรวจสอบสมมติฐานและถ้าพวกเขาบรรลุเป้าหมายเพียงใช้โมเดลนี้

30 time-series forecasting var cointegration vecm

1

คำสั่ง anova () ทำอะไรกับวัตถุโมเดล lmer

หวังว่านี่เป็นคำถามที่ใครบางคนที่นี่สามารถตอบสำหรับฉันเกี่ยวกับธรรมชาติของการสลายจำนวนสแควร์สจากรูปแบบเอฟเฟกต์ผสมกับlmer(จากแพ็คเกจ lme4 R) ก่อนอื่นฉันควรจะบอกว่าฉันรู้ถึงความขัดแย้งกับการใช้วิธีการนี้และในทางปฏิบัติฉันมีแนวโน้มที่จะใช้ bootstrapped LRT เพื่อเปรียบเทียบแบบจำลอง (ตามที่ Faraway, 2006 แนะนำ) อย่างไรก็ตามฉันสับสนในวิธีการทำซ้ำผลลัพธ์และเพื่อความมีสติของตัวเองฉันคิดว่าฉันจะถามที่นี่ โดยพื้นฐานแล้วฉันจะได้สัมผัสกับการใช้แบบจำลองเอฟเฟกต์ที่เหมาะสมกับlme4แพ็คเกจ ฉันรู้ว่าคุณสามารถใช้anova()คำสั่งเพื่อให้บทสรุปของการทดสอบผลกระทบคงที่ตามลำดับในรูปแบบ เท่าที่ฉันรู้ว่าสิ่งนี้คือสิ่งที่ Faraway (2006) อ้างถึงเป็นวิธีการ 'คาดหมายถึงกำลังสอง' สิ่งที่ฉันอยากรู้คือการคำนวณจำนวนเงินสแควร์สเป็นอย่างไร? ฉันรู้ว่าฉันสามารถนำค่าประมาณจากโมเดลเฉพาะ (โดยใช้coef()) สมมติว่าได้รับการแก้ไขแล้วทำการทดสอบโดยใช้ผลรวมของกำลังสองของเศษซากโมเดลที่มีและไม่มีปัจจัยที่น่าสนใจ นี่เป็นสิ่งที่ดีสำหรับโมเดลที่มีปัจจัยภายในเรื่องเดียว อย่างไรก็ตามเมื่อใช้การออกแบบการแยกส่วนผลบวกของค่ากำลังสองที่ฉันได้รับจะเท่ากับค่าที่ผลิตโดย R โดยใช้aov()การError()กำหนดที่เหมาะสม อย่างไรก็ตามนี่ไม่เหมือนกับผลบวกของกำลังสองที่สร้างโดยanova()คำสั่งบนวัตถุจำลองแม้ว่าข้อเท็จจริงที่ว่าอัตราส่วน F จะเหมือนกันก็ตาม ของหลักสูตรนี้เหมาะสมอย่างสมบูรณ์เนื่องจากไม่จำเป็นต้องมีError()ชั้นในรูปแบบผสม อย่างไรก็ตามนี่ต้องหมายความว่าผลรวมของกำลังสองจะถูกลงโทษในรูปแบบผสมเพื่อให้ได้อัตราส่วน F ที่เหมาะสม สิ่งนี้สำเร็จได้อย่างไร และรูปแบบอย่างไรแก้ไขผลรวมระหว่างพล็อตของสี่เหลี่ยม แต่ไม่แก้ไขผลรวมภายในพล็อตของสแควร์ เห็นได้ชัดว่านี่เป็นสิ่งที่จำเป็นสำหรับ ANOVA แบบแยกส่วนแบบคลาสสิกที่ทำได้โดยการกำหนดค่าความผิดพลาดต่างกันสำหรับเอฟเฟกต์ต่าง ๆ ดังนั้นโมเดลผสมเอฟเฟกต์จะอนุญาตได้อย่างไร โดยพื้นฐานแล้วฉันต้องการที่จะสามารถจำลองผลลัพธ์ที่ได้จากanova()คำสั่งที่ใช้กับวัตถุโมเดล lmer เพื่อตรวจสอบผลลัพธ์และความเข้าใจของฉันอย่างไรก็ตามในปัจจุบันฉันสามารถทำสิ่งนี้ได้สำหรับการออกแบบภายในเรื่องปกติ แต่ไม่ใช่สำหรับการแยก - พล็อตเรื่องการออกแบบและฉันไม่สามารถหาสาเหตุได้ในกรณีนี้ ตัวอย่างเช่น: library(faraway) …

30 r anova mixed-model lme4-nlme

6

หาก 'ความสัมพันธ์ไม่ได้บ่งบอกถึงสาเหตุ' ถ้าฉันพบความสัมพันธ์ที่มีนัยสำคัญทางสถิติฉันจะพิสูจน์ความเป็นเหตุเป็นผลได้อย่างไร

ผมเข้าใจว่าความสัมพันธ์ไม่ได้เป็นสาเหตุ สมมติว่าเรามีความสัมพันธ์สูงระหว่างตัวแปรสองตัว คุณจะตรวจสอบว่าความสัมพันธ์นี้เป็นเพราะสาเหตุได้อย่างไร? หรือภายใต้เงื่อนไขใดที่เราสามารถใช้ข้อมูลทดลองเพื่ออนุมานความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรสองตัวหรือมากกว่าได้

30 correlation mathematical-statistics causality

5

สร้างตัวเลขสุ่มด้วยตนเอง

ฉันจะสร้างตัวเลขสุ่มด้วยตนเองจากการแจกแจงที่กำหนดได้อย่างไรเช่น 10 การรับรู้จากการแจกแจงแบบปกติมาตรฐาน

30 normal-distribution simulation monte-carlo random-generation randomness

8

วิชาคณิตศาสตร์ใดที่คุณแนะนำให้เตรียมตัวสำหรับการขุดข้อมูลและการเรียนรู้ของเครื่อง

ฉันพยายามรวบรวมหลักสูตรคณิตศาสตร์ที่กำกับตนเองเพื่อเตรียมการเรียนรู้การขุดข้อมูลและการเรียนรู้ของเครื่อง นี่คือแรงบันดาลใจจากการเริ่มเรียนการเรียนรู้ด้วยเครื่องจักรของ Andrew Ngบน Coursera และรู้สึกว่าก่อนที่จะดำเนินการต่อฉันต้องพัฒนาทักษะคณิตศาสตร์ของฉัน ฉันเรียนจบวิทยาลัยมานานแล้วดังนั้นพีชคณิตและสถิติของฉัน (โดยเฉพาะจากวิชารัฐศาสตร์ / จิตวิทยา) เป็นสนิม คำตอบในเธรดพื้นหลังที่แข็งแกร่งในวิชาคณิตศาสตร์เป็นสิ่งจำเป็นสำหรับ ML หรือไม่? แนะนำเฉพาะหนังสือหรือชั้นเรียนที่เกี่ยวข้องโดยตรงกับการเรียนรู้ของเครื่อง ฉันได้ดูในชั้นเรียนและหนังสือเหล่านั้นแล้วและไม่ทราบแน่ชัดว่าวิชาคณิตศาสตร์จะต้องเรียนอะไร (เช่น: เขตที่อยู่ทางคณิตศาสตร์ที่ได้รับสมการเพื่อ "ลดฟังก์ชั่นต้นทุน") หัวข้ออื่น ๆ ที่แนะนำ ( ทักษะและหลักสูตรที่จำเป็นในการเป็นนักวิเคราะห์ข้อมูล ) กล่าวถึงเฉพาะหมวดหมู่ทักษะที่จำเป็นสำหรับการวิเคราะห์ข้อมูลเท่านั้น ความรู้เบื้องต้นเกี่ยวกับสถิติสำหรับนักคณิตศาสตร์ไม่ได้ใช้เพราะฉันยังไม่มีวุฒิทางคณิตศาสตร์ หัวข้อที่คล้ายกันนักคณิตศาสตร์ต้องการความรู้ที่เทียบเท่ากับระดับสถิติที่มีคุณภาพ มีรายการสถิติหนังสือที่น่าเหลือเชื่อ แต่อีกครั้งฉันกำลังดูคณิตศาสตร์เริ่มต้นจากการจำพีชคณิตและสนิมขึ้นจากที่นั่น ดังนั้นสำหรับผู้ที่ทำงานในการเรียนรู้ของเครื่องจักรและการขุดข้อมูลคุณต้องใช้วิชาคณิตศาสตร์ในสาขาใด วิชาคณิตศาสตร์ใดที่คุณแนะนำให้เตรียมตัวสำหรับการขุดข้อมูลและการเรียนรู้ของเครื่องและในลำดับใด นี่คือรายการและคำสั่งที่ฉันมี: พีชคณิต Pre-แคลคูลัส แคลคูลัส พีชคณิตเชิงเส้น ความน่าจะเป็น สถิติ (ฟิลด์ย่อยต่าง ๆ มากมายที่นี่ แต่ไม่ทราบวิธีแบ่งย่อย) สำหรับการขุดข้อมูลและการเรียนรู้ของเครื่องจักรผ่านงานปัจจุบันของฉันฉันสามารถเข้าถึงบันทึกบนเว็บไซต์ / กิจกรรมแอพธุรกรรมลูกค้า / การสมัครสมาชิกและข้อมูลอสังหาริมทรัพย์ (ทั้งแบบคงที่และอนุกรมเวลา) ฉันหวังว่าจะใช้การขุดข้อมูลและการเรียนรู้เครื่องกับชุดข้อมูลเหล่านี้ …

30 machine-learning references data-mining