คำถามติดแท็ก intuition

คำถามที่แสวงหาความเข้าใจในแนวคิดหรือไม่ใช่คณิตศาสตร์ของสถิติ

2
การตีความเชิงเรขาคณิตของการถดถอยเชิงเส้นเชิงลงโทษ
ฉันรู้ว่าการถดถอยเชิงเส้นสามารถคิดได้ว่า"เส้นที่ใกล้เคียงที่สุดในทุกจุด" : แต่มีวิธีอื่นในการดูโดยการแสดงพื้นที่คอลัมน์ในขณะที่"การฉายภาพลงบนพื้นที่ที่ทอดโดยคอลัมน์ของเมทริกซ์สัมประสิทธิ์" : คำถามของฉันคือในทั้งสองการตีความสิ่งที่เกิดขึ้นเมื่อเราใช้การถดถอยเชิงเส้นลงโทษเช่นการถดถอยสันเขาและ เชือก ? เกิดอะไรขึ้นกับบรรทัดในการตีความครั้งแรก และจะเกิดอะไรขึ้นกับการประมาณการในการตีความครั้งที่สอง? UPDATE: @JohnSmith แสดงความคิดเห็นว่ามีการลงโทษเกิดขึ้นในพื้นที่ของสัมประสิทธิ์ มีการตีความในพื้นที่นี้ด้วยหรือไม่

5
วิธีการ "ไปหาข้อมูลเพิ่มเติม" ของฟิชเชอร์เมื่อใด
การอ้างอิงคำตอบที่ยอดเยี่ยมของ gung นักวิจัยเข้าหา Fisher ด้วยผลลัพธ์ที่“ ไม่สำคัญ” เมื่อถามถึงสิ่งที่เขาควรทำและฟิชเชอร์กล่าวว่า 'ไปหาข้อมูลเพิ่มเติม' จากมุมมองของเพียร์สัน Neyman นี้เป็นที่เห็นได้ชัด -hacking แต่มีกรณีการใช้งานที่ฟิชเชอร์ไปได้รับเพิ่มเติมข้อมูลวิธีการทำให้รู้สึก?ppp

4
สัญชาตญาณที่อยู่เบื้องหลังส่วนเบี่ยงเบนมาตรฐาน
ฉันพยายามที่จะเข้าใจความเบี่ยงเบนมาตรฐานได้ง่ายขึ้น จากสิ่งที่ฉันเข้าใจมันเป็นตัวแทนของค่าเฉลี่ยของความแตกต่างของชุดการสังเกตในชุดข้อมูลจากค่าเฉลี่ยของชุดข้อมูลนั้น อย่างไรก็ตามมันไม่เท่ากับค่าเฉลี่ยของความแตกต่างเนื่องจากมันให้น้ำหนักมากกว่าการสังเกตเพิ่มเติมจากค่าเฉลี่ย ว่าฉันมีประชากรของค่าต่อไปนี้ -{1,3,5,7,9}{1,3,5,7,9}\{1, 3, 5, 7, 9\} ค่าเฉลี่ยคือ5555 ถ้าฉันวัดการแพร่กระจายตามค่าสัมบูรณ์ที่ฉันได้รับ ∑5i=1|xi−μ|5=2.4∑i=15|xi−μ|5=2.4\frac{\sum_{i = 1}^5|x_i - \mu|}{5} = 2.4 ถ้าฉันวัดการแพร่กระจายโดยใช้ค่าเบี่ยงเบนมาตรฐานฉันจะได้รับ ∑5i=1(xi−μ)25−−−−−−−−−−−−√=2.83∑i=15(xi−μ)25=2.83\sqrt{\frac{\sum_{i = 1}^5(x_i - \mu)^2}{5}} = 2.83 ผลลัพธ์ที่ใช้ค่าเบี่ยงเบนมาตรฐานมีขนาดใหญ่ขึ้นอย่างที่คาดไว้เนื่องจากน้ำหนักที่เพิ่มขึ้นจะให้ค่าเพิ่มเติมจากค่าเฉลี่ย แต่ถ้าฉันเพิ่งบอกว่าฉันจัดการกับประชากรที่มีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานที่ฉันจะอนุมานได้อย่างไรว่าประชากรประกอบด้วยค่าบางอย่างเช่น ? ดูเหมือนว่าร่างของนั้นไม่มีกฎเกณฑ์มาก ... ฉันไม่เห็นว่าคุณควรตีความมันอย่างไร ไม่หมายถึงค่าที่มีการแพร่กระจายกว้างมากหรือว่าพวกเขาทั้งหมดคลัสเตอร์แน่นรอบหมายถึง ...5552.832.832.83{1,3,5,7,9}{1,3,5,7,9}\{1, 3, 5, 7, 9\}2.832.832.832.832.832.83 เมื่อคุณนำเสนอด้วยคำแถลงว่าคุณกำลังเผชิญกับประชากรที่มีค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานนั่นบอกอะไรคุณเกี่ยวกับประชากร5552.832.832.83

1
วิธีการทำความเข้าใจ SARIMAX อย่างสังหรณ์ใจ?
ฉันพยายามที่จะเข้าใจกระดาษเกี่ยวกับการพยากรณ์โหลดไฟฟ้า แต่ฉันกำลังดิ้นรนกับแนวคิดที่อยู่ภายในโดยเฉพาะแบบจำลองSARIMAX แบบจำลองนี้ใช้ในการทำนายการโหลดและใช้แนวคิดทางสถิติมากมายที่ฉันไม่เข้าใจ (ฉันเป็นนักศึกษาวิทยาศาสตร์คอมพิวเตอร์ระดับปริญญาตรี - คุณสามารถพิจารณาฉันเป็นคนธรรมดาในสถิติ) ฉันไม่จำเป็นต้องเข้าใจอย่างสมบูรณ์ถึงวิธีการทำงาน แต่อย่างน้อยฉันก็ต้องเข้าใจอย่างถ่องแท้ว่าเกิดอะไรขึ้น ฉันพยายามแยก SARIMAX ออกเป็นชิ้นเล็ก ๆ และพยายามที่จะเข้าใจแต่ละชิ้นแยกกันแล้วรวมเข้าด้วยกัน พวกคุณช่วยฉันได้ไหม นี่คือสิ่งที่ฉันมี ฉันเริ่มต้นด้วย AR และ MA AR : อัตถดถอย ฉันได้เรียนรู้ว่าการถดถอยคืออะไรและจากความเข้าใจของฉันเพียงแค่ตอบคำถาม: จากชุดของค่า / คะแนนฉันจะหาแบบจำลองที่อธิบายค่าเหล่านี้ได้อย่างไร ตัวอย่างเช่นเรามีการถดถอยเชิงเส้นซึ่งพยายามหาเส้นที่สามารถอธิบายประเด็นเหล่านี้ทั้งหมด การตอบโต้อัตโนมัติคือการถดถอยที่พยายามอธิบายค่าโดยใช้ค่าก่อนหน้า MA : ค่าเฉลี่ยเคลื่อนที่ ที่นี่ฉันหลงทางจริงๆ ฉันรู้ว่าค่าเฉลี่ยเคลื่อนที่คืออะไร แต่โมเดลค่าเฉลี่ยเคลื่อนที่ดูเหมือนจะไม่มีส่วนเกี่ยวข้องกับค่าเฉลี่ยเคลื่อนที่ "ปกติ" สูตรของแบบจำลองนั้นดูคล้ายกับ AR อย่างเชื่องช้าและฉันไม่สามารถเข้าใจแนวคิดใด ๆ ที่ฉันพบในอินเทอร์เน็ต วัตถุประสงค์ของ MA คืออะไร? MA และ AR แตกต่างกันอย่างไร? ดังนั้นตอนนี้เรามี ARMA ผมแล้วมาจากแบบบูรณาการซึ่งเท่าที่ผมมีความเข้าใจเพียงแค่จุดมุ่งหมายของการช่วยให้รูปแบบ …

7
ความน่าจะเป็นและสัดส่วนต่างกันอย่างไร
สมมติว่าฉันกินแฮมเบอร์เกอร์ทุกวันอังคารเป็นเวลาหลายปี คุณสามารถพูดได้ว่าฉันกินแฮมเบอร์เกอร์ 14% ในแต่ละครั้งหรือความเป็นไปได้ที่ฉันจะกินแฮมเบอร์เกอร์ในสัปดาห์ที่กำหนดคือ 14% อะไรคือความแตกต่างที่สำคัญระหว่างความน่าจะเป็นและสัดส่วน ความน่าจะเป็นเป็นสัดส่วนที่คาดหวังหรือไม่ ความน่าจะเป็นที่ไม่แน่นอนและมีการประกันสัดส่วน?

5
การค้นหาคำอธิบาย ARIMA บางประเภท
นี้อาจจะเป็นเรื่องยากที่จะหา แต่ฉันต้องการที่จะอ่านดีอธิบายตัวอย่าง ARIMAว่า ใช้คณิตศาสตร์น้อยที่สุด ขยายการอภิปรายนอกเหนือจากการสร้างแบบจำลองโดยใช้แบบจำลองนั้นเพื่อคาดการณ์กรณีเฉพาะ ใช้กราฟิกเช่นเดียวกับผลลัพธ์ที่เป็นตัวเลขเพื่อบอกลักษณะที่พอดีระหว่างค่าที่คาดการณ์และค่าจริง

2
คุณสามารถอธิบายการประมาณความหนาแน่นของ Parzen window (kernel) ในแง่ของคนธรรมดาได้หรือไม่?
การประเมินความหนาแน่นของหน้าต่าง Parzen อธิบายไว้ดังนี้ p ( x ) = 1nΣi = 1n1ชั่วโมง2ϕ ( xผม- xชั่วโมง)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) โดยที่คือจำนวนองค์ประกอบในเวกเตอร์,คือเวกเตอร์,คือความหนาแน่นของความน่าจะเป็นของ ,คือขนาดของหน้าต่าง Parzen และเป็นฟังก์ชันของหน้าต่างx p ( x ) x h ϕnnnxxxp ( x )p(x)p(x)xxxชั่วโมงhhφϕ\phi คำถามของฉันคือ: อะไรคือความแตกต่างพื้นฐานระหว่างฟังก์ชั่น Parzen Window และฟังก์ชั่นความหนาแน่นอื่น ๆ เช่นฟังก์ชั่นเกาส์เซียนเป็นต้น ฟังก์ชั่น Window Function ( ) ในการค้นหาความหนาแน่นของคืออะไร?xφϕ\phixxx ทำไมเราสามารถเสียบฟังก์ชั่นความหนาแน่นอื่น ๆ …

3
การตีความทางสถิติของการกระจายเอนโทรปีสูงสุด
ฉันได้ใช้หลักการของเอนโทรปีสูงสุดเพื่อแสดงให้เห็นถึงการใช้การแจกแจงหลายอย่างในการตั้งค่าต่างๆ อย่างไรก็ตามฉันยังไม่สามารถกำหนดสถิติได้ซึ่งตรงกันข้ามกับข้อมูลทางทฤษฎีและการตีความเอนโทรปีสูงสุด กล่าวอีกนัยหนึ่งการเพิ่มค่าเอนโทรปีให้มากที่สุดหมายถึงคุณสมบัติทางสถิติของการแจกแจงอย่างไร มีใครวิ่งข้ามหรืออาจค้นพบตัวเองตีความทางสถิติของสูงสุด การกระจายของเอนโทรปีที่ไม่ได้ดึงดูดข้อมูล แต่เป็นเพียงแนวคิดที่น่าจะเป็น? เป็นตัวอย่างของการตีความดังกล่าว (ไม่จำเป็นต้องเป็นจริง): "สำหรับช่วงเวลาของความยาว L ตามอำเภอใจบนโดเมนของ RV (สมมติว่า 1-d ต่อเนื่องเพื่อความเรียบง่าย) ความน่าจะเป็นสูงสุดที่สามารถอยู่ในช่วงเวลานี้จะลดลง โดยการกระจายเอนโทรปีสูงสุด " ดังนั้นคุณจะเห็นว่าไม่มีการพูดคุยเกี่ยวกับ "ความเป็นสารสนเทศ" หรือแนวคิดทางปรัชญาอื่น ๆ

3
สถิติที่เพียงพอสำหรับคนธรรมดา
ใครช่วยอธิบายสถิติที่เพียงพอในศัพท์พื้นฐานได้ไหม? ฉันมาจากภูมิหลังทางวิศวกรรมและฉันได้ผ่านสิ่งต่างๆมากมาย แต่ไม่สามารถหาคำอธิบายที่เข้าใจง่าย

5
ทฤษฎีบทของเบย์
ฉันได้รับการพยายามที่จะพัฒนาสัญชาตญาณพื้นฐานของการทำความเข้าใจทฤษฎีบท Bayes' ในแง่ของก่อน , หลัง , ความน่าจะเป็นและร่อแร่ความน่าจะเป็น ด้วยเหตุนี้ฉันจึงใช้สมการต่อไปนี้: โดยที่แทนสมมติฐานหรือความเชื่อและแทนข้อมูลหรือหลักฐาน ฉันเข้าใจแนวคิดของคนหลัง - มันเป็นเอนทิตี้แบบรวมที่รวมความเชื่อก่อนหน้านี้และความน่าจะเป็นของเหตุการณ์ สิ่งที่ฉันไม่เข้าใจคือโอกาสที่จะมีความหมายอะไร และทำไมถึงเป็นชายขอบP(B|A)=P(A|B)P(B)P(A)P(B|A)=P(A|B)P(B)P(A)P(B|A) = \frac{P(A|B)P(B)}{P(A)}AAABBBน่าจะเป็นในส่วนหรือไม่ หลังจากตรวจสอบแหล่งข้อมูลสองสามข้อฉันพบคำพูดนี้: ความน่าจะเป็นคือน้ำหนักของเหตุการณ์กำหนดโดยการเกิดของ ...คือความน่าจะเป็นหลังของเหตุการณ์เนื่องจากเหตุการณ์เกิดขึ้นBBBAAAP(B|A)P(B|A)P(B|A)BBBAAA ข้อความ 2 ข้อข้างต้นดูเหมือนกับฉันเพิ่งเขียนในรูปแบบที่แตกต่างกัน ใครช่วยอธิบายความแตกต่างระหว่างสองคนนี้ได้ไหม?

2
สัญชาตญาณที่อยู่เบื้องหลังการนิยามความสมบูรณ์ในสถิติเป็นสิ่งที่เป็นไปไม่ได้ที่จะสร้างตัวประมาณที่ไม่มีอคติเท่ากับจากอะไร?
ในสถิติคลาสสิคมีคำจำกัดความว่าสถิติของชุดข้อมูลถูกกำหนดให้สมบูรณ์สำหรับพารามิเตอร์มันเป็นไปไม่ได้ที่จะสร้างตัวประมาณค่าที่ไม่เอนเอียงเป็นจากมันโดยไม่ตั้งใจ นั่นคือวิธีเดียวที่จะมีสำหรับทั้งหมดคือการมีเป็นเกือบแน่นอนTTTy1,…,yny1,…,yny_1, \ldots, y_nθθ\theta000Eh(T(y))=0Eh(T(y))=0E h(T (y )) = 0θθ\thetahhh000 มีปรีชาเบื้องหลังนี้ไหม ดูเหมือนว่าจะเป็นวิธีที่ใช้ในการกำหนดสิ่งนี้ฉันรู้ว่าสิ่งนี้ได้รับการถามมาก่อน แต่สงสัยว่ามีสัญชาตญาณที่เข้าใจได้ง่ายซึ่งจะทำให้นักเรียนเกริ่นนำมีเวลาย่อยวัสดุได้ง่ายขึ้น

1
มีคำอธิบายที่เข้าใจได้ง่ายหรือไม่ว่าเหตุใดการถดถอยโลจิสติกจึงไม่สามารถใช้กับกรณีแยกที่สมบูรณ์ได้ และทำไมการเพิ่มการทำให้เป็นมาตรฐานจะแก้ไขได้?
เรามีการสนทนาที่ดีมากมายเกี่ยวกับการแบ่งแยกที่สมบูรณ์แบบในการถดถอยโลจิสติก เช่นการถดถอยโลจิสติกใน R ทำให้เกิดการแยกที่สมบูรณ์แบบ (ปรากฏการณ์ Hauck-Donner) ตอนนี้คืออะไร และรูปแบบการถดถอยโลจิสติกไม่ได้มาบรรจบ ฉันเองก็ยังรู้สึกว่ามันไม่ง่ายสำหรับสาเหตุที่มันเป็นปัญหาและทำไมการเพิ่มการทำให้เป็นมาตรฐานจะแก้ไขได้ ฉันสร้างภาพเคลื่อนไหวและคิดว่ามันจะเป็นประโยชน์ ดังนั้นโพสต์คำถามของเขาและตอบด้วยตนเองเพื่อแบ่งปันกับชุมชน

7
เหตุใดเมทริกซ์เชิงบวกแน่นอนที่แน่นอน (SPD) จึงมีความสำคัญมาก
ฉันรู้ว่าคำจำกัดความของเมทริกซ์ definite positive (SPD) positive symmetric แต่ต้องการเข้าใจมากกว่านี้ ทำไมพวกเขาถึงมีความสำคัญอย่างสังหรณ์ใจ? นี่คือสิ่งที่ฉันรู้ มีอะไรอีกบ้าง? สำหรับข้อมูลที่กำหนดเมทริกซ์ความแปรปรวนร่วมคือ SPD เมทริกซ์ความแปรปรวนร่วมเป็นตัวชี้วัดที่สำคัญให้ดูโพสต์ที่ยอดเยี่ยมนี้สำหรับคำอธิบายที่เข้าใจง่าย รูปแบบสมการกำลังสองนูนออกหากคือ SPD Convexity เป็นคุณสมบัติที่ดีสำหรับฟังก์ชั่นที่สามารถตรวจสอบให้แน่ใจว่าโซลูชันในพื้นที่นั้นเป็นโซลูชันระดับโลก สำหรับปัญหานูนมีวิธีการแก้ปัญหาที่ดีมากมาย แต่ไม่ใช่สำหรับปัญหาที่ไม่ใช่ covex12x⊤Ax−b⊤x+c12x⊤Ax−b⊤x+c\frac 1 2 x^\top Ax-b^\top x +cAAA เมื่อคือ SPD โซลูชันเพิ่มประสิทธิภาพสำหรับรูปแบบสมการกำลังสองและโซลูชันสำหรับระบบเชิงเส้นเหมือนกัน ดังนั้นเราจึงสามารถทำการแปลงระหว่างสองปัญหาคลาสสิค สิ่งนี้มีความสำคัญเพราะช่วยให้เราสามารถใช้เทคนิคที่ค้นพบในโดเมนหนึ่งในอีกโดเมนหนึ่ง ตัวอย่างเช่นเราสามารถใช้วิธีการไล่ระดับสีแบบคอนจูเกตเพื่อแก้ปัญหาระบบเชิงเส้นAAAminimize 12x⊤Ax−b⊤x+cminimize 12x⊤Ax−b⊤x+c\text{minimize}~~~ \frac 1 2 x^\top Ax-b^\top x +cAx=bAx=bAx=b มีอัลกอริธึมที่ดีมากมาย (เร็วและเสถียรเป็นตัวเลข) ที่ทำงานได้ดีกว่าสำหรับเมทริกซ์ SPD เช่นการสลายตัวของ Cholesky แก้ไข: ฉันไม่ได้พยายามถามตัวตนของเมทริกซ์ SPD …

2
ตรรกะเบื้องหลังวิธีการของช่วงเวลาคืออะไร?
ทำไมใน "วิธีการของช่วงเวลา" เราเปรียบเทียบช่วงเวลาตัวอย่างกับช่วงเวลาของประชากรเพื่อหาตัวประมาณค่าจุด ตรรกะอยู่เบื้องหลังสิ่งนี้อยู่ที่ไหน

2
ชื่ออะไร: ความแม่นยำ (อินเวอร์สของความแปรปรวน)
สังหรณ์ใจค่าเฉลี่ยเป็นเพียงค่าเฉลี่ยของการสังเกต ความแปรปรวนคือการสังเกตเหล่านี้แตกต่างจากค่าเฉลี่ยเท่าใด ฉันต้องการทราบว่าทำไมการผกผันของความแปรปรวนจึงเป็นที่รู้จักกันอย่างแม่นยำ เราสามารถทำอะไรได้จากสัญชาตญาณนี้ และทำไมเมทริกซ์ความแม่นยำจึงมีประโยชน์เหมือนเมทริกซ์ความแปรปรวนร่วมในการแจกแจงหลายตัวแปร (ปกติ) กรุณาเข้าใจด้วย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.