คำถามติดแท็ก intuition

คำถามที่แสวงหาความเข้าใจในแนวคิดหรือไม่ใช่คณิตศาสตร์ของสถิติ

9
มีคำอธิบายที่เข้าใจได้ง่ายหรือไม่ว่าทำไมความสัมพันธ์หลายระดับเป็นปัญหาในการถดถอยเชิงเส้น?
wiki กล่าวถึงปัญหาที่เกิดขึ้นเมื่อmulticollinearityเป็นปัญหาในการถดถอยเชิงเส้น ปัญหาพื้นฐานคือความสัมพันธ์ระหว่างกันหลายค่าทำให้การประมาณค่าพารามิเตอร์ไม่เสถียรซึ่งทำให้ยากที่จะประเมินผลของตัวแปรอิสระต่อตัวแปรตาม ผมเข้าใจเหตุผลทางเทคนิคที่อยู่เบื้องหลังปัญหา (อาจจะไม่สามารถที่จะกลับป่วยปรับอากาศฯลฯ ) แต่ฉันกำลังมองหาง่ายขึ้น (อาจเรขาคณิต?) คำอธิบายสำหรับปัญหานี้X ′ XX′XX′XX' XX′XX′XX' X มีรูปแบบทางเรขาคณิตหรือคำอธิบายรูปแบบอื่น ๆ ที่เข้าใจได้ง่ายว่าทำไมความสัมพันธ์หลากหลายรูปแบบเป็นปัญหาในบริบทของการถดถอยเชิงเส้น?

8
เส้นที่พอดีที่สุดดูไม่เหมือนแบบพอดี ทำไม?
ดูกราฟ Excel นี้: แนวความรู้สึกที่ดีที่สุด 'สามัญสำนึก' จะปรากฏเป็นเส้นแนวตั้งเกือบตรงผ่านจุดศูนย์กลางของจุด (แก้ไขด้วยมือด้วยสีแดง) อย่างไรก็ตามเส้นแนวโน้มเชิงเส้นตามที่ Excel ตัดสินใจเป็นเส้นสีดำในแนวทแยงแสดง เหตุใด Excel จึงสร้างบางสิ่งที่ (ต่อสายตามนุษย์) ดูเหมือนว่าผิด ฉันจะสร้างเส้นที่พอดีที่สุดที่ดูเป็นธรรมชาติได้ง่ายขึ้น (เช่นบางอย่างเช่นเส้นสีแดง) ได้อย่างไร ปรับปรุง 1.สเปรดชีต Excel ที่มีข้อมูลและกราฟสามารถใช้ได้ที่นี่: ข้อมูลตัวอย่าง , CSV ใน Pastebin เทคนิคการถดถอยของ type1 และ type2 มีอยู่ในฟังก์ชั่น excel หรือไม่ อัปเดต 2.ข้อมูลแสดงถึงพาราไกลเดอร์ปีนเขาในความร้อนในขณะที่ล่องลอยไปกับสายลม วัตถุประสงค์สุดท้ายคือการตรวจสอบความแรงของลมและทิศทางแตกต่างกันไปตามความสูง ฉันเป็นวิศวกรไม่ใช่นักคณิตศาสตร์หรือนักสถิติดังนั้นข้อมูลในคำตอบเหล่านี้ทำให้ฉันมีพื้นที่มากขึ้นสำหรับการวิจัย

10
การทำความเข้าใจ“ ความแปรปรวน” อย่างสังหรณ์ใจ
อะไรคือวิธีที่สะอาดและง่ายที่สุดในการอธิบายแนวคิดเรื่องความแปรปรวนของใครบางคน? มันหมายถึงอะไรอย่างสังหรณ์ใจ? ถ้ามีใครอธิบายเรื่องนี้ให้ลูกฟัง มันเป็นแนวคิดที่ฉันมีปัญหาในการสื่อสาร - โดยเฉพาะอย่างยิ่งเมื่อเกี่ยวข้องกับความแปรปรวนกับความเสี่ยง ฉันเข้าใจในเชิงคณิตศาสตร์และสามารถอธิบายได้เช่นกัน แต่เมื่ออธิบายปรากฏการณ์ในโลกแห่งความเป็นจริงคุณจะทำให้คนหนึ่งเข้าใจถึงความแปรปรวนและการบังคับใช้ใน 'โลกแห่งความจริง' ได้อย่างไร สมมติว่าเรากำลังจำลองการลงทุนในหุ้นโดยใช้ตัวเลขสุ่ม (กลิ้งแม่พิมพ์หรือใช้แผ่นงาน Excel ไม่สำคัญ) เราได้รับผลตอบแทนจากการลงทุนโดยเชื่อมโยงแต่ละตัวแปรสุ่มกับ 'การเปลี่ยนแปลงบางอย่าง' ในผลตอบแทน เช่น.: การกลิ้ง 1 หมายถึงการเปลี่ยนแปลง 0.8 ต่อ$ 1 ในการลงทุน 5 การเปลี่ยนแปลง 1.1 ต่อ$ 1 และอื่น ๆ ตอนนี้หากการจำลองนี้ดำเนินการประมาณ 50 ครั้ง (หรือ 20 หรือ 100) เราจะได้รับค่าบางอย่างและมูลค่าสุดท้ายของการลงทุน ดังนั้น 'ความแปรปรวน' จริง ๆ แล้วบอกอะไรเราถ้าเราจะคำนวณจากชุดข้อมูลด้านบน สิ่งใดที่ "เห็น" - หากความแปรปรวนปรากฎเป็น 1.7654 …

13
อะไรคือบทบาทของลอการิทึมในเอนโทรปีของแชนนอน?
เอนโทรปีของแชนนอนนั้นเป็นผลลบของผลรวมของความน่าจะเป็นของผลลัพธ์แต่ละรายการคูณด้วยลอการิทึมของความน่าจะเป็นสำหรับแต่ละผลลัพธ์ ลอการิทึมมีจุดประสงค์อะไรในสมการนี้ คำตอบที่ใช้งานง่ายหรือภาพ (ตรงข้ามกับคำตอบทางคณิตศาสตร์อย่างลึกซึ้ง) จะได้รับคะแนนโบนัส!


18
คำถามสัมภาษณ์สถิติ
ฉันกำลังมองหาสถิติ (และความน่าจะเป็นฉันเดา) คำถามสัมภาษณ์จากพื้นฐานที่สุดไปจนถึงขั้นสูงกว่า ไม่จำเป็นต้องมีคำตอบ (แม้ว่าลิงก์ไปยังคำถามที่เฉพาะเจาะจงในเว็บไซต์นี้จะทำได้ดี)

4
'ช่วงเวลา' เกี่ยวกับ 'ช่วงเวลา' ของการแจกแจงความน่าจะเป็นอย่างไร
ฉันรู้ว่าช่วงเวลาใดและวิธีการคำนวณและวิธีการใช้ฟังก์ชั่นสร้างช่วงเวลาเพื่อให้ได้ช่วงเวลาที่ดีขึ้น ใช่ฉันรู้คณิตศาสตร์ ตอนนี้ฉันต้องได้รับความรู้สถิติของฉันหล่อลื่นสำหรับการทำงานฉันคิดว่าฉันก็อาจจะถามคำถามนี้ - มันเป็นเรื่องที่จู้จี้ฉันประมาณสองสามปีที่ผ่านมาและในวิทยาลัยกลับไม่มีอาจารย์รู้คำตอบหรือจะเลิกคำถาม . ดังนั้นคำว่า "ช่วงเวลา" หมายถึงอะไรในกรณีนี้ ทำไมต้องเลือกคำนี้ มันฟังดูไม่ง่ายสำหรับฉัน (หรือฉันไม่เคยได้ยินมาก่อนเลยในมหาวิทยาลัย :) ลองคิดดูสิฉันก็อยากรู้อยากเห็นด้วยการใช้งานใน "โมเมนต์ความเฉื่อย";) แต่ตอนนี้เราไม่ได้สนใจเรื่องนี้ ดังนั้น "ชั่วขณะ" ของการกระจายหมายถึงอะไรและมันพยายามทำอะไรและทำไมคำนั้น! :) ทำไมไม่มีใครสนใจช่วงเวลา ในขณะนี้ฉันรู้สึกอย่างอื่นเกี่ยวกับช่วงเวลานั้น) PS: ใช่ฉันอาจถามคำถามที่คล้ายกันเกี่ยวกับความแปรปรวน แต่ฉันให้คุณค่าความเข้าใจที่เข้าใจง่ายกว่า 'ดูในหนังสือเพื่อค้นหา' :)

4
คำอธิบายที่เข้าใจง่ายของ Fisher Information และ Cramer-Rao
ฉันไม่พอใจกับข้อมูลฟิชเชอร์มาตรการและวิธีการที่เป็นประโยชน์ นอกจากนี้ความสัมพันธ์กับขอบเขตแครมเมอร์ - ราวไม่ชัดเจนสำหรับฉัน ใครสามารถช่วยอธิบายแนวคิดเหล่านี้ได้ด้วยตนเอง?

13
10 หัวในแถวจะเพิ่มโอกาสในการโยนต่อไปหรือไม่?
ฉันถือว่าสิ่งต่อไปนี้เป็นจริง: สมมติว่าเป็นเหรียญที่ยุติธรรมการได้รับ 10 หัวติดต่อกันในขณะที่การโยนเหรียญไม่เพิ่มโอกาสในการโยนเหรียญถัดไปเป็นหางไม่ว่าจะมีความน่าจะเป็นและ / หรือศัพท์แสงทางสถิติจำนวนเท่าใด (แก้ตัวการเล่น) สมมติว่าเป็นอย่างนั้นคำถามของฉันคือ: ฉันจะโน้มน้าวให้คนที่เป็นอย่างนั้นได้อย่างไร พวกเขาฉลาดและมีการศึกษา แต่ดูเหมือนตั้งใจว่าจะไม่พิจารณาว่าฉันอาจจะถูก (โต้แย้ง)

2
ทำไมการหดตัวจึงใช้งานได้
เพื่อที่จะแก้ปัญหาของการเลือกแบบจำลองจำนวนของวิธีการ (LASSO, การถดถอยของสันเขา ฯลฯ ) จะลดค่าสัมประสิทธิ์ของตัวแปรทำนายไปทางศูนย์ ฉันกำลังมองหาคำอธิบายที่เข้าใจง่ายว่าทำไมสิ่งนี้จึงปรับปรุงความสามารถในการทำนาย หากผลที่แท้จริงของตัวแปรมีขนาดใหญ่มากทำไมไม่ลดขนาดพารามิเตอร์ส่งผลให้การคาดการณ์แย่ลง?

5
อะไรคือคำอธิบายที่เข้าใจง่ายว่า PCA เปลี่ยนจากปัญหาเชิงเรขาคณิต (ด้วยระยะทาง) เป็นปัญหาพีชคณิตเชิงเส้น (กับ eigenvectors) อย่างไร
ฉันได้อ่านมากเกี่ยวกับ PCA รวมทั้งบทเรียนต่างๆและคำถาม (เช่นนี้ , คนนี้ , คนนี้และคนนี้ ) ปัญหาทางเรขาคณิตที่ PCA พยายามปรับให้เหมาะสมนั้นชัดเจนสำหรับฉัน: PCA พยายามค้นหาส่วนประกอบหลักแรกด้วยการลดข้อผิดพลาดการสร้างใหม่ (การฉายภาพ) ซึ่งลดความแปรปรวนของข้อมูลที่คาดการณ์ไว้พร้อมกัน เมื่อฉันอ่านครั้งแรกฉันก็นึกถึงบางสิ่งอย่างเช่นการถดถอยเชิงเส้น บางทีคุณสามารถแก้มันโดยใช้การไล่ระดับสีถ้าจำเป็น อย่างไรก็ตามแล้วใจของฉันก็ปลิวไปเมื่อฉันอ่านว่าปัญหาการหาค่าเหมาะที่สุดนั้นได้รับการแก้ไขโดยใช้พีชคณิตเชิงเส้นและหาค่าลักษณะเฉพาะและค่าลักษณะเฉพาะ ฉันไม่เข้าใจว่าการใช้พีชคณิตเชิงเส้นนี้เข้ามาในการเล่นได้อย่างไร ดังนั้นคำถามของฉันคือ PCA สามารถเปลี่ยนจากปัญหาการหาค่าเหมาะที่สุดเชิงเรขาคณิตเป็นปัญหาพีชคณิตเชิงเส้นได้อย่างไร ใครสามารถให้คำอธิบายง่ายๆ ฉันไม่ได้มองหาคำตอบเช่นนี้ที่กล่าวว่า "เมื่อคุณแก้ปัญหาทางคณิตศาสตร์ของ PCA มันจะเทียบเท่ากับการหาค่าลักษณะเฉพาะและ eigenvectors ของเมทริกซ์ความแปรปรวนร่วม" โปรดอธิบายว่าเหตุใด eigenvector จึงกลายเป็นองค์ประกอบหลักและทำไมค่าลักษณะเฉพาะออกมาเป็นความแปรปรวนของข้อมูลที่ฉายลงบนพวกเขา ฉันเป็นวิศวกรซอฟต์แวร์ไม่ใช่นักคณิตศาสตร์เลย หมายเหตุ: รูปด้านบนนี้ถูกถ่ายและแก้ไขจากบทช่วยสอน PCAนี้

3
สัญชาตญาณของ SVD คืออะไร?
ฉันได้อ่านเกี่ยวกับการสลายตัวของค่าเอกพจน์ (SVD) แล้ว ในหนังสือเกือบทุกเล่มมีการกล่าวถึงว่ามันทำให้เมทริกซ์แยกตัวเป็นเมทริกซ์สามตัวพร้อมการกำหนด แต่ปรีชาที่อยู่เบื้องหลังการแยกเมทริกซ์ในรูปแบบดังกล่าวคืออะไร? PCA และอัลกอริธึมอื่น ๆ สำหรับการลดขนาดนั้นใช้งานง่ายในแง่ที่ว่าอัลกอริทึมมีคุณสมบัติการสร้างภาพที่ดี แต่ด้วย SVD ไม่ใช่กรณี

4
ทำไมค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ XY มีแนวโน้มที่จะเป็น 0.7
นำมาจากสถิติเชิงปฏิบัติสำหรับการวิจัยทางการแพทย์ที่ Douglas Altman เขียนไว้ในหน้า 285: ... สำหรับสองปริมาณ X และ Y ใด ๆ X จะสัมพันธ์กับ XY แน่นอนแม้ว่า X และ Y เป็นตัวอย่างของตัวเลขสุ่มเราคาดหวังว่าความสัมพันธ์ของ X และ XY จะเท่ากับ 0.7 ฉันพยายามใน R และดูเหมือนว่าจะเป็นกรณี: x <- rnorm(1000000, 10, 2) y <- rnorm(1000000, 10, 2) cor(x, x-y) xu <- sample(1:100, size = 1000000, replace = T) yu …


5
สัญชาตญาณในความแตกต่าง Kullback-Leibler (KL)
ฉันได้เรียนรู้เกี่ยวกับสัญชาตญาณที่อยู่เบื้องหลัง KL Divergence ว่าฟังก์ชันการแจกแจงแบบจำลองแตกต่างจากการกระจายข้อมูลเชิงทฤษฎี / จริง แหล่งที่มาฉันอ่านก็จะบอกว่าเข้าใจง่ายของระยะห่างระหว่างทั้งสองกระจายเป็นประโยชน์ แต่ไม่ควรดำเนินการอย่างแท้จริงเพราะสองกระจายและที่ KL Divergence ไม่สมมาตรในและQPPPQQQPPPQQQ ฉันไม่แน่ใจว่าจะเข้าใจคำแถลงสุดท้ายได้อย่างไรหรือนี่คือสิ่งที่สัญชาตญาณของ 'ระยะทาง' แตกสลายหรือไม่ ฉันขอขอบคุณตัวอย่างที่เรียบง่าย แต่ลึกซึ้ง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.