คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

6
ความแตกต่างระหว่างความแปรปรวนกับค่าเบี่ยงเบนมาตรฐานคืออะไร
ฉันสงสัยว่าความแตกต่างระหว่างความแปรปรวนกับส่วนเบี่ยงเบนมาตรฐานคืออะไร หากคุณคำนวณค่าทั้งสองเป็นที่ชัดเจนว่าคุณได้ค่าเบี่ยงเบนมาตรฐานจากความแปรปรวน แต่นั่นหมายความว่าในแง่ของการกระจายที่คุณสังเกต นอกจากนี้ทำไมคุณต้องมีค่าเบี่ยงเบนมาตรฐานจริง ๆ

9
คำอธิบายจากระยะไกลถึงบนสุดของระยะทาง Mahalanobis คืออะไร?
ฉันเรียนรู้รูปแบบและสถิติและเกือบหนังสือฉันเปิดในเรื่องที่ทุกฉันชนแนวคิดของระยะทาง Mahalanobis หนังสือให้คำอธิบายที่เข้าใจง่าย แต่ก็ยังไม่ดีพอสำหรับฉันที่จะเข้าใจสิ่งที่เกิดขึ้นจริง ๆ ถ้ามีคนถามฉันว่า "มาฮาโลโนบิสระยะทางเท่าไหร่" ฉันทำได้แค่ตอบว่า: "มันเป็นสิ่งที่ดีมากซึ่งวัดระยะทางได้" :) คำจำกัดความมักจะมีค่าลักษณะเฉพาะและค่าลักษณะเฉพาะซึ่งฉันมีปัญหาเล็กน้อยในการเชื่อมต่อกับระยะทาง Mahalanobis ฉันเข้าใจความหมายของคำว่า eigenvector และค่าลักษณะเฉพาะ แต่พวกมันเกี่ยวข้องกับระยะทาง Mahalanobis อย่างไร มีอะไรเกี่ยวข้องกับการเปลี่ยนฐานใน Linear Algebra เป็นต้นหรือไม่? ฉันได้อ่านคำถามก่อนหน้านี้ในหัวข้อนี้ด้วย: ระยะ Mahalanobis คืออะไรและใช้ในการจดจำรูปแบบอย่างไร คำอธิบายที่ใช้งานง่ายสำหรับฟังก์ชั่นการแจกแจงแบบเกาส์และระยะทาง mahalanobis (Math.SE) ฉันได้อ่านคำอธิบายนี้ด้วย คำตอบที่ดีและภาพที่ดี แต่ยังคงฉันไม่ได้จริงๆได้รับมัน ... ฉันมีความคิด แต่ก็ยังคงอยู่ในความมืด ใครสามารถให้ "คุณจะอธิบายให้คุณยายของคุณ" ได้อย่างไร - อธิบายเพื่อที่ฉันจะได้สรุปในที่สุดและไม่เคยสงสัยอีกครั้งว่าห่าคือระยะทาง Mahalanobis? :) มันมาจากอะไรทำไม? UPDATE: นี่คือสิ่งที่ช่วยทำความเข้าใจสูตร Mahalanobis: https://math.stackexchange.com/questions/428064/distance-of-a-test-point-from-the-center-of-an-ellipsoid

9
ตัวอย่างเชิงตัวเลขเพื่อทำความเข้าใจเกี่ยวกับความคาดหวังสูงสุด
ฉันพยายามเข้าใจอัลกอริธึม EM อย่างดีเพื่อให้สามารถใช้งานและใช้งานได้ ฉันใช้เวลาทั้งวันในการอ่านทฤษฎีและกระดาษที่ EM ใช้ในการติดตามอากาศยานโดยใช้ข้อมูลตำแหน่งที่มาจากเรดาร์ สุจริตฉันไม่คิดว่าฉันเข้าใจความคิดพื้นฐานทั้งหมด ใครบางคนสามารถชี้ให้ฉันเป็นตัวอย่างของตัวเลขที่แสดงการวนซ้ำสองสาม (3-4) ของ EM สำหรับปัญหาที่ง่ายกว่า (เช่นการประมาณค่าพารามิเตอร์ของการแจกแจงแบบเกาส์หรือลำดับของชุดไซน์หรือปรับเส้นตรง) แม้ว่าใครบางคนสามารถชี้ให้ฉันเห็นชิ้นส่วนของรหัส (ด้วยข้อมูลสังเคราะห์) ฉันสามารถลองผ่านรหัสได้


10
ทำไมการแจกแจงโคชีจึงไม่มีความหมาย?
จากฟังก์ชันความหนาแน่นของการกระจายเราสามารถระบุค่าเฉลี่ย (= 0) สำหรับการแจกแจงโคชีเช่นเดียวกับกราฟด้านล่างที่แสดง แต่ทำไมเราถึงบอกว่าการกระจาย Cauchy นั้นไม่มีความหมายเลย?

12
Bayesians คือใคร?
ในฐานะที่เป็นหนึ่งในความสนใจในสถิติที่แตกต่าง"บ่อย" และ "Bayesian"ในไม่ช้าก็กลายเป็นเรื่องธรรมดา (และผู้ที่ยังไม่ได้อ่านสัญญาณและเสียงของเนทซิลเวอร์ ? ในหลักสูตรการพูดคุยและการแนะนำมุมมองเป็นประจำอย่างท่วมท้น ( MLE , ค่า ) แต่มีแนวโน้มที่จะมีเวลาเพียงเล็กน้อยในการชื่นชมสูตร Bayes และสัมผัสกับแนวคิดของการกระจายก่อนหน้านี้พีpp น้ำเสียงที่ใช้เพื่อหารือเกี่ยวกับสถิติของ Bayesian แกว่งไปมาระหว่างการให้ความเคารพต่อการสนับสนุนแนวคิดและคำใบ้ของความสงสัยเกี่ยวกับช่องว่างระหว่างวัตถุประสงค์อันสูงส่งและความไม่ลงรอยกันในการเลือกการแจกแจงก่อนหน้า ประโยคเช่น "ถ้าคุณเป็น Bayesian ฮาร์ดคอร์ ... " มาก คำถามคือใครคือชาวเบย์ในปัจจุบัน? พวกเขาบางสถาบันการศึกษาที่เลือกที่คุณรู้ว่าถ้าคุณไปที่นั่นคุณจะกลายเป็นเบย์? ถ้าเป็นเช่นนั้นพวกเขาต้องการเป็นพิเศษหรือไม่? เราหมายถึงนักสถิติและนักคณิตศาสตร์ที่ได้รับการเคารพเพียงไม่กี่คนและหากเป็นเช่นนั้น พวกมันมีอยู่จริงหรือเปล่าเช่น "Bayesians" บริสุทธิ์เหล่านี้หรือไม่? พวกเขาจะยอมรับฉลากอย่างมีความสุขหรือไม่? มันเป็นความแตกต่างที่ประจบเสมอ? พวกเขาเป็นนักคณิตศาสตร์ที่มีสไลด์แปลก ๆ ในการประชุมปราศจากค่าใด ๆและช่วงความเชื่อมั่นหรือไม่พีpp มีโพรงจำนวนเท่าใดที่เป็น "Bayesian" เราหมายถึงนักสถิติส่วนน้อยหรือไม่? หรือ Bayesian-ism ปัจจุบันมีแอปพลิเคชันการเรียนรู้ของเครื่อง? ... หรือมากกว่านั้นคือสถิติแบบเบย์ไม่ได้เป็นสาขาวิชาสถิติมากนัก แต่เป็นขบวนการญาณวิทยาที่ครอบคลุมการคำนวณความน่าจะเป็นในปรัชญาของวิทยาศาสตร์? ในเรื่องนี้นักวิทยาศาสตร์ทุกคนจะเป็นแบบเบย์ในใจ ... แต่จะไม่มีสิ่งใดในฐานะนักสถิติแบบเบย์ที่บริสุทธิ์ซึ่งไม่สามารถผ่านไปได้กับเทคนิคที่ใช้บ่อย ๆ …

11
การประมาณความน่าจะเป็นสูงสุด (MLE) ในแง่คนธรรมดา
ใครสามารถอธิบายให้ฉันอย่างละเอียดเกี่ยวกับการประมาณค่าความน่าจะเป็นสูงสุด (MLE) ในแง่ของคนธรรมดา ฉันต้องการทราบแนวคิดพื้นฐานก่อนที่จะเข้ามาทางคณิตศาสตร์หรือสมการ

14
อัลกอริทึมง่าย ๆ สำหรับการตรวจหาค่าผิดปกติทางออนไลน์ของอนุกรมเวลาทั่วไป
ฉันทำงานกับอนุกรมเวลาจำนวนมาก อนุกรมเวลาเหล่านี้โดยทั่วไปแล้วการวัดเครือข่ายมาทุก ๆ 10 นาทีและบางส่วนนั้นเป็นระยะ (เช่นแบนด์วิดท์) ในขณะที่บางส่วนไม่ได้เป็น (เช่นปริมาณการรับส่งข้อมูลเส้นทาง) ฉันต้องการอัลกอริทึมง่าย ๆ สำหรับการทำแบบออนไลน์ โดยทั่วไปฉันต้องการเก็บไว้ในหน่วยความจำ (หรือบนดิสก์) ข้อมูลประวัติทั้งหมดสำหรับแต่ละชุดเวลาและฉันต้องการตรวจสอบค่าผิดปกติใด ๆ ในสถานการณ์สด (ทุกครั้งที่มีการสุ่มตัวอย่างใหม่) วิธีที่ดีที่สุดในการบรรลุผลลัพธ์เหล่านี้คืออะไร? ฉันกำลังใช้ค่าเฉลี่ยเคลื่อนที่เพื่อลบเสียงรบกวน แต่แล้วจะทำอย่างไรต่อไป สิ่งที่เรียบง่ายเช่นค่าเบี่ยงเบนมาตรฐาน, บ้า, ... กับชุดข้อมูลทั้งหมดทำงานได้ไม่ดี (ฉันไม่สามารถคิดว่าอนุกรมเวลาคงที่) และฉันต้องการบางสิ่งที่ "แม่นยำ" ยิ่งกว่าเดิมกล่องดำแบบ: double outlier_detection (double * vector, double value); โดยที่ vector คืออาร์เรย์ของ double ที่มีข้อมูลประวัติและค่าส่งคืนคือคะแนนความผิดปกติสำหรับ "value" ตัวอย่างใหม่

8
ถ้าหมายถึงอ่อนไหวทำไมใช้มันตั้งแต่แรก?
มันเป็นความจริงที่รู้จักกันว่าค่ามัธยฐานสามารถทนต่อค่าผิดปกติ ถ้าเป็นเช่นนั้นเราจะใช้ค่าเริ่มต้นเมื่อใดและทำไม สิ่งหนึ่งที่ฉันสามารถนึกได้ก็คือเข้าใจว่ามีค่าผิดปกติเช่นถ้าค่ามัธยฐานอยู่ห่างจากค่าเฉลี่ยจากนั้นการแจกแจงจะเบ้และอาจต้องมีการตรวจสอบข้อมูลเพื่อตัดสินใจว่าจะทำอย่างไรกับค่าผิดปกติ มีการใช้อื่น ๆ ?


8
Bayesians: ทาสของฟังก์ชั่นโอกาส?
ในหนังสือของเขา "All of Statistics" ศ. Larry Wasserman นำเสนอตัวอย่างต่อไปนี้ (11.10, หน้า 188) สมมติว่าเรามีความหนาแน่นเช่นนั้นf ( x ) = cfffซึ่งกรัมเป็นที่รู้จักกัน(ไม่เป็นลบ, integrable) ฟังก์ชั่นและการฟื้นฟูอย่างต่อเนื่องค> 0คือไม่รู้จักf(x)=cg(x)f(x)=cg(x)f(x)=c\,g(x)gggc>0c>0c>0 เราสนใจในกรณีที่เราไม่สามารถคำนวณ x ตัวอย่างเช่นอาจเป็นกรณีที่ fเป็น pdf ในพื้นที่ตัวอย่างที่มีมิติสูงมากc=1/∫g(x)dxc=1/∫g(x)dxc=1/\int g(x)\,dxfff เป็นที่ทราบกันดีว่ามีเทคนิคการจำลองที่ช่วยให้เราสามารถสุ่มตัวอย่างจากแม้ว่าcจะไม่เป็นที่รู้จัก ดังนั้นตัวต่อคือ: เราจะประมาณค่าcจากตัวอย่างได้อย่างไร?fffcccccc ศ. Wasserman อธิบายถึงวิธีการแก้ปัญหาแบบเบย์ต่อไปนี้: ให้เป็นบางส่วนก่อนสำหรับค ความน่าจะเป็นคือ L x ( c ) = n ∏ i = 1 f ( x i …

15
ทำไมสถิติแบบพารามิเตอร์จะได้รับความนิยมมากกว่าแบบ nonparametric
ใครสามารถอธิบายให้ฉันฟังได้ว่าทำไมทุกคนจะเลือกพาราเมทริกสำหรับวิธีการทดสอบสมมติฐานหรือการวิเคราะห์การถดถอย ในใจของฉันมันเหมือนกับการไปล่องแพและเลือกนาฬิกาที่ไม่กันน้ำเพราะคุณอาจไม่เปียก ทำไมไม่ใช้เครื่องมือที่ใช้ได้กับทุกโอกาส?

7
reparameterization trick สำหรับ VAEs ทำงานอย่างไรและทำไมจึงมีความสำคัญ
อย่างไรเคล็ดลับ reparameterizationสำหรับ autoencoders แปรผัน (VAE) ทำงานอย่างไร มีคำอธิบายที่เข้าใจง่ายและเข้าใจง่ายโดยไม่ทำให้คณิตศาสตร์ง่ายขึ้นหรือไม่? แล้วทำไมเราถึงต้องการ 'เคล็ดลับ'?

10
ข้อผิดพลาดในการตรวจสอบความถูกต้องน้อยกว่าข้อผิดพลาดการฝึกอบรม?
ฉันพบคำถามสองข้อที่นี่และที่นี่เกี่ยวกับปัญหานี้ แต่ยังไม่มีคำตอบหรือคำอธิบายที่ชัดเจนฉันบังคับใช้ปัญหาเดียวกันที่ข้อผิดพลาดในการตรวจสอบความถูกต้องน้อยกว่าข้อผิดพลาดการฝึกอบรมในเครือข่าย Convolution Neural นั่นหมายความว่าอย่างไร?

13
อะไรคือความก้าวหน้าของสถิติในช่วง 15 ปีที่ผ่านมา?
ฉันยังจำเอกสารพงศาวดารสถิติเกี่ยวกับการส่งเสริมโดย Friedman-Hastie-Tibshirani และความคิดเห็นในประเด็นเดียวกันโดยผู้เขียนคนอื่น ๆ (รวมถึง Freund และ Schapire) ในเวลานั้นการส่งเสริมอย่างชัดเจนถูกมองว่าเป็นความก้าวหน้าในหลาย ๆ ด้าน: ความเป็นไปได้ในการคำนวณเป็นวิธีการรวมกับประสิทธิภาพที่ยอดเยี่ยมและลึกลับ ในเวลาเดียวกัน SVM มีอายุมากขึ้นซึ่งมีกรอบการทำงานที่สนับสนุนโดยทฤษฎีที่มั่นคงและมีความหลากหลายและการใช้งานมากมาย นั่นคือใน 90s ที่ยิ่งใหญ่ ในช่วง 15 ปีที่ผ่านมาดูเหมือนว่าสำหรับฉันแล้วสถิติจำนวนมากได้รับการทำความสะอาดและการทำรายละเอียด แต่ด้วยมุมมองใหม่ ๆ ดังนั้นฉันจะถามสองคำถาม: ฉันพลาดบทความปฏิวัติ / น้ำเชื้อบ้างไหม? ถ้าไม่มีวิธีการใหม่ที่คุณคิดว่ามีศักยภาพในการเปลี่ยนมุมมองของการอนุมานทางสถิติหรือไม่? กฎ: หนึ่งคำตอบต่อโพสต์; ยินดีต้อนรับการอ้างอิงหรือลิงค์ PS: ฉันมีผู้สมัครสองสามคนสำหรับการพัฒนาที่มีแนวโน้ม ฉันจะโพสต์ไว้ในภายหลัง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.