คำถามติดแท็ก intuition

คำถามที่แสวงหาความเข้าใจในแนวคิดหรือไม่ใช่คณิตศาสตร์ของสถิติ

28
ทำความเข้าใจกับการวิเคราะห์องค์ประกอบหลัก, ค่าเฉพาะและค่าลักษณะเฉพาะ
ในชั้นเรียนรู้รูปแบบวันนี้อาจารย์ของฉันพูดคุยเกี่ยวกับ PCA, eigenvectors และค่าลักษณะเฉพาะ ฉันเข้าใจคณิตศาสตร์ของมัน ถ้าฉันถูกขอให้หาค่าลักษณะเฉพาะ ฯลฯ ฉันจะทำอย่างถูกต้องเหมือนเครื่อง แต่ผมไม่เข้าใจมัน ฉันไม่ได้รับวัตถุประสงค์ของมัน ฉันไม่ได้รับความรู้สึกของมัน ฉันเชื่อมั่นในคำพูดต่อไปนี้: คุณไม่เข้าใจอะไรจริงๆเว้นแต่คุณจะอธิบายให้คุณยายฟัง -- Albert Einstein ฉันไม่สามารถอธิบายแนวคิดเหล่านี้กับคนธรรมดาหรือยายได้ ทำไมต้องเลือก PCA, eigenvectors & eigenvalues อะไรคือสิ่งที่จำเป็นสำหรับแนวคิดเหล่านี้ คุณจะอธิบายเรื่องนี้กับคนธรรมดาได้อย่างไร?

11
สัญชาตญาณของการกระจายเบต้าคืออะไร
ข้อจำกัดความรับผิดชอบ: ฉันไม่ใช่นักสถิติ แต่เป็นวิศวกรซอฟต์แวร์ ความรู้เกี่ยวกับสถิติส่วนใหญ่มาจากการเรียนรู้ด้วยตนเองดังนั้นฉันยังมีช่องว่างมากมายในการทำความเข้าใจแนวคิดที่อาจดูไม่สำคัญสำหรับคนอื่นที่นี่ ดังนั้นฉันจะขอบคุณมากถ้าคำตอบมีคำศัพท์เฉพาะน้อยกว่าและคำอธิบายเพิ่มเติม ลองนึกภาพว่าคุณกำลังคุยกับคุณยายอยู่ :) ฉันพยายามที่จะเข้าใจลักษณะของการแจกแจงเบต้า - สิ่งที่ควรใช้และวิธีตีความในแต่ละกรณี ถ้าเราพูดถึงการกระจายตัวแบบปกติเราสามารถอธิบายได้ว่าเป็นเวลาที่รถไฟมาถึง: บ่อยที่สุดมันมาถึงในเวลาน้อยกว่าบ่อยครั้งคือ 1 นาทีก่อนหน้าหรือ 1 นาทีและไม่ค่อยมาถึงด้วยความแตกต่าง 20 นาทีจากค่าเฉลี่ย การแจกแจงแบบสม่ำเสมอจะอธิบายโอกาสของตั๋วแต่ละใบด้วยลอตเตอรี การแจกแจงแบบทวินามอาจอธิบายได้ด้วยการโยนเหรียญและอื่น ๆ แต่มีคำอธิบายที่เข้าใจง่ายเกี่ยวกับการแจกแจงเบต้าหรือไม่ สมมติว่าα=.99α=.99\alpha=.99และ\β=.5β=.5\beta=.5การกระจายเบต้าB(α,β)B(α,β)B(\alpha, \beta)ในกรณีนี้มีลักษณะเช่นนี้ (สร้างใน R): แต่จริงๆแล้วมันหมายถึงอะไร? เห็นได้ชัดว่าแกน Y เป็นความหนาแน่นของความน่าจะเป็น แต่สิ่งที่อยู่ในแกน X? ฉันขอขอบคุณคำอธิบายใด ๆ ไม่ว่าจะด้วยตัวอย่างนี้หรืออย่างอื่น

11
จะเข้าใจองศาอิสระได้อย่างไร?
จากWikipediaมีการตีความสามระดับของอิสรภาพในสถิติ: ในสถิติจำนวนองศาความเป็นอิสระคือจำนวนของค่าในการคำนวณขั้นสุดท้ายของสถิติที่สามารถเปลี่ยนแปลงได้ฟรี การประมาณค่าพารามิเตอร์ทางสถิติอาจขึ้นอยู่กับจำนวนข้อมูลหรือข้อมูลที่แตกต่างกัน จำนวนชิ้นส่วนข้อมูลอิสระที่เข้าสู่การประมาณค่าพารามิเตอร์เรียกว่า degree of freedom (df) โดยทั่วไปแล้วองศาอิสระของการประมาณค่าพารามิเตอร์จะเท่ากับจำนวนคะแนนอิสระที่เข้าไปในการประมาณลบด้วยจำนวนพารามิเตอร์ที่ใช้เป็นขั้นตอนกลางในการประมาณค่าพารามิเตอร์ของตัวเอง (ซึ่งในความแปรปรวนตัวอย่าง) หนึ่งเนื่องจากค่าเฉลี่ยตัวอย่างเป็นเพียงขั้นตอนกลางเท่านั้น) ศาสตร์องศาอิสระคือมิติของโดเมนของเวกเตอร์สุ่มหรือหลักจำนวนขององค์ประกอบ 'ฟรี': วิธีหลายส่วนประกอบจะต้องมีการรู้จักมาก่อนเวกเตอร์จะถูกกำหนดอย่างเต็มที่ คำที่เป็นตัวหนาคือสิ่งที่ฉันไม่ค่อยเข้าใจ ถ้าเป็นไปได้สูตรทางคณิตศาสตร์บางอย่างจะช่วยอธิบายแนวคิด การตีความทั้งสามนี้เห็นด้วยกันหรือไม่

16
ความหมายของค่า p และค่า t ในการทดสอบทางสถิติคืออะไร?
หลังจากลงเรียนวิชาสถิติแล้วพยายามช่วยเหลือเพื่อนนักเรียนฉันสังเกตเห็นวิชาหนึ่งที่ดลใจให้อาจารย์ใหญ่ตีกันมากคือตีความผลการทดสอบสมมติฐานทางสถิติ ดูเหมือนว่านักเรียนจะเรียนรู้วิธีการคำนวณตามที่กำหนดโดยการทดสอบที่กำหนดได้อย่างง่ายดาย เครื่องมือที่ใช้คอมพิวเตอร์หลายเครื่องรายงานผลการทดสอบในรูปของ "ค่า p" หรือ "ค่าที" คุณจะอธิบายประเด็นต่อไปนี้ให้กับนักเรียนที่เรียนหลักสูตรแรกในสถิติได้อย่างไร: "p-value" หมายถึงอะไรที่เกี่ยวข้องกับสมมติฐานที่กำลังทดสอบ มีกรณีที่ควรมองหาค่า p สูงหรือค่า p ต่ำหรือไม่ ความสัมพันธ์ระหว่างค่า p และค่า t คืออะไร?


10
คุณจะอธิบายความแปรปรวนร่วมกับคนที่เข้าใจเฉพาะค่าเฉลี่ยได้อย่างไร
... สมมติว่าฉันสามารถเพิ่มพูนความรู้เกี่ยวกับความแปรปรวนในรูปแบบที่เข้าใจง่าย (การทำความเข้าใจ "ความแปรปรวน" อย่างสังหรณ์ใจ ) หรือโดยการพูดว่า: มันเป็นระยะทางเฉลี่ยของค่าข้อมูลจาก 'เฉลี่ย' - และเนื่องจากความแปรปรวนอยู่ในตาราง หน่วยเราใช้สแควร์รูทเพื่อให้หน่วยเดียวกันและที่เรียกว่าส่วนเบี่ยงเบนมาตรฐาน สมมติว่าเรื่องนี้ชัดเจนมากและหวังว่าจะเข้าใจโดย 'ผู้รับ' ทีนี้ความแปรปรวนร่วมคืออะไรและจะอธิบายได้อย่างไรในภาษาอังกฤษง่าย ๆ โดยไม่ใช้คำศัพท์ / สูตรทางคณิตศาสตร์ใด ๆ (เช่นคำอธิบายที่เข้าใจง่าย;) โปรดทราบ: ฉันรู้สูตรและคณิตศาสตร์ที่อยู่เบื้องหลังแนวคิด ฉันต้องการที่จะ 'อธิบาย' สิ่งเดียวกันในรูปแบบที่เข้าใจง่ายโดยไม่รวมคณิตศาสตร์ เช่น 'ความแปรปรวนร่วม' หมายถึงอะไร

7
มีคำอธิบายที่เข้าใจง่ายสำหรับทฤษฎีบทขีด จำกัด กลางคืออะไร?
ในบริบทที่แตกต่างกันเราเรียกใช้ทฤษฎีขีด จำกัด กลางเพื่อพิสูจน์ว่าวิธีการทางสถิติใดก็ตามที่เราต้องการนำมาใช้ (เช่นประมาณการแจกแจงทวินามโดยการแจกแจงแบบปกติ) ฉันเข้าใจรายละเอียดทางเทคนิคว่าทำไมทฤษฎีบทถึงเป็นจริง แต่ตอนนี้เพิ่งเกิดขึ้นกับฉันที่ฉันไม่เข้าใจสัญชาตญาณเบื้องหลังทฤษฎีขีด จำกัด กลาง ดังนั้นสัญชาตญาณที่อยู่เบื้องหลังทฤษฎีบทขีด จำกัด กลางคืออะไร? คำอธิบายของคนธรรมดาจะเหมาะ หากต้องการรายละเอียดทางเทคนิคโปรดสันนิษฐานว่าฉันเข้าใจแนวคิดของ pdf, cdf, ตัวแปรสุ่ม ฯลฯ แต่ไม่มีความรู้เกี่ยวกับแนวคิดคอนเวอร์เจนซ์ฟังก์ชั่นลักษณะหรือสิ่งใดที่เกี่ยวข้องกับทฤษฎีการวัด

15
คำอธิบายที่ใช้งานง่ายสำหรับการหารด้วย
ฉันถูกถามในชั้นเรียนวันนี้ว่าทำไมคุณหารผลรวมของความคลาดเคลื่อนกำลังสองด้วยแทนที่จะเป็นกับเมื่อคำนวณส่วนเบี่ยงเบนมาตรฐานnn - 1n−1n-1nnn ฉันบอกว่าฉันจะไม่ตอบคำถามนี้ในชั้นเรียน (เนื่องจากฉันไม่ต้องการเข้าไปในตัวประมาณค่าที่เป็นกลาง) แต่ต่อมาฉันสงสัยว่า - มีคำอธิบายที่เข้าใจง่ายสำหรับเรื่องนี้หรือไม่!

9
คำอธิบายจากระยะไกลถึงบนสุดของระยะทาง Mahalanobis คืออะไร?
ฉันเรียนรู้รูปแบบและสถิติและเกือบหนังสือฉันเปิดในเรื่องที่ทุกฉันชนแนวคิดของระยะทาง Mahalanobis หนังสือให้คำอธิบายที่เข้าใจง่าย แต่ก็ยังไม่ดีพอสำหรับฉันที่จะเข้าใจสิ่งที่เกิดขึ้นจริง ๆ ถ้ามีคนถามฉันว่า "มาฮาโลโนบิสระยะทางเท่าไหร่" ฉันทำได้แค่ตอบว่า: "มันเป็นสิ่งที่ดีมากซึ่งวัดระยะทางได้" :) คำจำกัดความมักจะมีค่าลักษณะเฉพาะและค่าลักษณะเฉพาะซึ่งฉันมีปัญหาเล็กน้อยในการเชื่อมต่อกับระยะทาง Mahalanobis ฉันเข้าใจความหมายของคำว่า eigenvector และค่าลักษณะเฉพาะ แต่พวกมันเกี่ยวข้องกับระยะทาง Mahalanobis อย่างไร มีอะไรเกี่ยวข้องกับการเปลี่ยนฐานใน Linear Algebra เป็นต้นหรือไม่? ฉันได้อ่านคำถามก่อนหน้านี้ในหัวข้อนี้ด้วย: ระยะ Mahalanobis คืออะไรและใช้ในการจดจำรูปแบบอย่างไร คำอธิบายที่ใช้งานง่ายสำหรับฟังก์ชั่นการแจกแจงแบบเกาส์และระยะทาง mahalanobis (Math.SE) ฉันได้อ่านคำอธิบายนี้ด้วย คำตอบที่ดีและภาพที่ดี แต่ยังคงฉันไม่ได้จริงๆได้รับมัน ... ฉันมีความคิด แต่ก็ยังคงอยู่ในความมืด ใครสามารถให้ "คุณจะอธิบายให้คุณยายของคุณ" ได้อย่างไร - อธิบายเพื่อที่ฉันจะได้สรุปในที่สุดและไม่เคยสงสัยอีกครั้งว่าห่าคือระยะทาง Mahalanobis? :) มันมาจากอะไรทำไม? UPDATE: นี่คือสิ่งที่ช่วยทำความเข้าใจสูตร Mahalanobis: https://math.stackexchange.com/questions/428064/distance-of-a-test-point-from-the-center-of-an-ellipsoid

3
ทำไมเราต้องใช้ซิกม่า - อัลจีบราเพื่อกำหนดช่องว่างของความน่าจะเป็น
เรามีการทดลองแบบสุ่มกับผลลัพธ์ที่แตกต่างกันในการสร้างพื้นที่ตัวอย่าง ซึ่งเรามองด้วยความสนใจในรูปแบบบางอย่างที่เรียกว่าeventsSigma-algebras (หรือ sigma-fields)ประกอบด้วยเหตุการณ์ที่สามารถวัดความน่าจะเป็นได้ คุณสมบัติบางอย่างเป็นจริงรวมทั้งการรวมของชุด nullและตัวอย่างพื้นที่ทั้งหมดและพีชคณิตที่อธิบายสหภาพแรงงานและสี่แยกที่มีแผนภาพเวนน์Ω ,Ω,\Omega,F หน้า ∅ F.F.\mathscr{F}. PP\mathbb{P}∅∅\varnothing น่าจะมีการกำหนดเป็นฟังก์ชั่นระหว่างที่พีชคณิตและช่วง[0,1]พรึบสามรูปแบบพื้นที่น่าจะเป็นσσ\sigma[0,1][0,1][0,1](Ω,F,P)(Ω,F,P)(\Omega, \mathscr{F}, \mathbb{P}) มีคนอธิบายเป็นภาษาอังกฤษธรรมดาได้หรือไม่ว่าทำไมความน่าจะเป็นที่พังทลายลงมาถ้าเราไม่มี -algebra? พวกเขาเพิ่งจะยืนอยู่ตรงกลางด้วย "F" การประดิษฐ์ตัวอักษรที่เป็นไปไม่ได้ ฉันเชื่อว่าพวกเขามีความจำเป็น ฉันเห็นว่าเหตุการณ์แตกต่างจากผลลัพธ์ แต่สิ่งใดที่จะผิดไปได้หากไม่มี -algebrasσσ\sigmaσσ\sigma คำถามคือในประเภทใดของปัญหาความน่าจะเป็นความหมายของพื้นที่ความน่าจะเป็นรวมถึง - พีชคณิตกลายเป็นสิ่งจำเป็น?σσ\sigma เอกสารออนไลน์นี้บนเว็บไซต์ของมหาวิทยาลัย Dartmouthมีคำอธิบายที่ใช้ภาษาอังกฤษได้ง่าย แนวคิดนี้เป็นตัวชี้การหมุนทวนเข็มนาฬิกาในวงกลมของหน่วยปริมณฑล: เราเริ่มต้นด้วยการสร้างสปินเนอร์ซึ่งประกอบด้วยวงกลมของหน่วยรอบและตัวชี้ตามที่แสดงใน [รูป] รูป เราเลือกจุดบนวงกลมแล้วทำเครื่องหมายจากนั้นติดป้ายทุกจุดอื่นบนวงกลมด้วยระยะทางพูดจากถึงจุดนั้นวัดทวนเข็มนาฬิกา การทดสอบประกอบด้วยการหมุนตัวชี้และบันทึกฉลากของจุดที่ปลายตัวชี้ เราปล่อยให้ตัวแปรสุ่มแทนค่าของผลลัพธ์นี้ พื้นที่ตัวอย่างเป็นช่วงเวลาที่ชัดเจน000xxx000XXX[0,1)[0,1)[0,1). เราต้องการสร้างแบบจำลองความน่าจะเป็นที่แต่ละผลลัพธ์มีแนวโน้มที่จะเกิดขึ้นอย่างเท่าเทียมกัน หากเราดำเนินการตามที่เราทำ [... ] สำหรับการทดลองที่มีจำนวนผลลัพธ์ที่เป็นไปได้ จำกัด เราจะต้องกำหนดความน่าจะเป็นให้แต่ละผลลัพธ์เนื่องจากมิฉะนั้นผลรวมของความน่าจะเป็นเหนือผลลัพธ์ที่เป็นไปได้ทั้งหมดจะไม่ เท่ากับ 1 (อันที่จริงแล้วการรวมจำนวนจริงจำนวนที่นับไม่ได้เป็นธุรกิจที่ยุ่งยากโดยเฉพาะอย่างยิ่งเพื่อให้ผลรวมดังกล่าวมีความหมายใด ๆ โดยสรุปแล้วการสรุปจำนวนมากอาจแตกต่างจาก ) อย่างไรก็ตามถ้า …

9
ตัวอย่างเชิงตัวเลขเพื่อทำความเข้าใจเกี่ยวกับความคาดหวังสูงสุด
ฉันพยายามเข้าใจอัลกอริธึม EM อย่างดีเพื่อให้สามารถใช้งานและใช้งานได้ ฉันใช้เวลาทั้งวันในการอ่านทฤษฎีและกระดาษที่ EM ใช้ในการติดตามอากาศยานโดยใช้ข้อมูลตำแหน่งที่มาจากเรดาร์ สุจริตฉันไม่คิดว่าฉันเข้าใจความคิดพื้นฐานทั้งหมด ใครบางคนสามารถชี้ให้ฉันเป็นตัวอย่างของตัวเลขที่แสดงการวนซ้ำสองสาม (3-4) ของ EM สำหรับปัญหาที่ง่ายกว่า (เช่นการประมาณค่าพารามิเตอร์ของการแจกแจงแบบเกาส์หรือลำดับของชุดไซน์หรือปรับเส้นตรง) แม้ว่าใครบางคนสามารถชี้ให้ฉันเห็นชิ้นส่วนของรหัส (ด้วยข้อมูลสังเคราะห์) ฉันสามารถลองผ่านรหัสได้

3
คำอธิบายที่ใช้งานง่ายของหน่วยรูท
คุณจะอธิบายได้อย่างไรว่ารูทยูนิทรูทในบริบทของการทดสอบรูทยูนิตเป็นอย่างไร ฉันกำลังคิดถึงวิธีอธิบายอย่างที่ฉันได้ก่อตั้งขึ้นในคำถามนี้ กรณีที่มีหน่วยรูทคือฉันรู้ (เล็กน้อยโดยวิธี) ที่ใช้ทดสอบรูทยูนิตเพื่อทดสอบความคงที่ในอนุกรมเวลา แต่มันก็แค่นั้น คุณจะอธิบายเรื่องนี้กับคนทั่วไปหรือคนที่ศึกษาความน่าจะเป็นพื้นฐานและสถิติได้อย่างไร UPDATE ฉันยอมรับคำตอบของ whuber เพราะมันเป็นสิ่งที่สะท้อนถึงสิ่งที่ฉันถามมากที่สุดที่นี่ แต่ฉันขอให้ทุกคนที่มาที่นี่เพื่ออ่านคำตอบของ Patrick และ Michael เช่นกันเนื่องจากเป็น "ขั้นตอนต่อไป" โดยธรรมชาติในการทำความเข้าใจรูทยูนิต พวกเขาใช้คณิตศาสตร์ แต่ในวิธีที่ง่ายมาก

4
ความแตกต่างระหว่างข้อผิดพลาดมาตรฐานและค่าเบี่ยงเบนมาตรฐาน
ฉันพยายามเข้าใจถึงความแตกต่างระหว่างข้อผิดพลาดมาตรฐานและส่วนเบี่ยงเบนมาตรฐาน มันแตกต่างกันอย่างไรและทำไมคุณต้องวัดความผิดพลาดมาตรฐาน?

4
จะอธิบายได้อย่างไรว่าเคอร์เนลคืออะไร
ตัวแยกประเภทการเรียนรู้ของเครื่องจำนวนมาก (เช่นสนับสนุนเครื่องเวกเตอร์) อนุญาตให้หนึ่งเพื่อระบุเคอร์เนล อะไรจะเป็นวิธีที่ใช้งานง่ายในการอธิบายว่าเคอร์เนลคืออะไร? แง่มุมหนึ่งที่ฉันนึกถึงก็คือความแตกต่างระหว่างเมล็ดเชิงเส้นและไม่ใช่เชิงเส้น ในแง่ง่ายฉันสามารถพูดถึง 'ฟังก์ชั่นการตัดสินใจเชิงเส้น' และ 'ฟังก์ชั่นการตัดสินใจที่ไม่ใช่เชิงเส้น' อย่างไรก็ตามฉันไม่แน่ใจว่าการเรียกเคอร์เนล 'ฟังก์ชั่นการตัดสินใจ' เป็นความคิดที่ดีหรือไม่ ข้อเสนอแนะ?

11
การประมาณความน่าจะเป็นสูงสุด (MLE) ในแง่คนธรรมดา
ใครสามารถอธิบายให้ฉันอย่างละเอียดเกี่ยวกับการประมาณค่าความน่าจะเป็นสูงสุด (MLE) ในแง่ของคนธรรมดา ฉันต้องการทราบแนวคิดพื้นฐานก่อนที่จะเข้ามาทางคณิตศาสตร์หรือสมการ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.