คำถามติดแท็ก intuition

คำถามที่แสวงหาความเข้าใจในแนวคิดหรือไม่ใช่คณิตศาสตร์ของสถิติ

11
การถดถอยเชิงเส้นอย่างง่ายสามารถทำได้โดยไม่ต้องใช้แปลงและพีชคณิตเชิงเส้น
ฉันตาบอดอย่างสมบูรณ์และมาจากพื้นหลังการเขียนโปรแกรม สิ่งที่ฉันพยายามทำคือการเรียนรู้การเรียนรู้ของเครื่องและเมื่อต้องการทำสิ่งนี้ฉันต้องเรียนรู้เกี่ยวกับการถดถอยเชิงเส้นก่อน คำอธิบายทั้งหมดบนอินเทอร์เน็ตที่ฉันกำลังค้นหาเกี่ยวกับเรื่องนี้พล็อตข้อมูลก่อน ฉันกำลังมองหาคำอธิบายที่ใช้งานได้จริงของการถดถอยเชิงเส้นที่ไม่ได้ขึ้นอยู่กับกราฟและแปลง นี่คือความเข้าใจของฉันเกี่ยวกับเป้าหมายของการถดถอยเชิงเส้นอย่างง่าย: การถดถอยเชิงเส้นอย่างง่ายกำลังพยายามค้นหาสูตรที่เมื่อคุณให้Xแล้วจะให้การประมาณที่ใกล้เคียงที่สุดแก่Yคุณ ดังนั้นที่ฉันเข้าใจมันสิ่งที่ต้องทำคือการเปรียบเทียบตัวทำนาย (ตัวอย่างเช่นพื้นที่ของบ้านในตารางฟุต) กับตัวแปรอิสระ (ราคา) ในตัวอย่างของฉันคุณอาจสร้างวิธีที่ไม่ได้มองเห็นเพื่อให้ได้สูตรที่ดีที่สุดในการคำนวณราคาของบ้านจากพื้นที่ ตัวอย่างเช่นคุณอาจได้รับพื้นที่และราคา 1,000 หลังในละแวกนั้นและแบ่งราคาออกเป็นพื้นที่ใช่ไหม ผลลัพธ์ (อย่างน้อยในอิหร่านที่ฉันอาศัยอยู่) จะมีความแปรปรวนเล็กน้อยมาก ดังนั้นคุณอาจได้รับสิ่งนี้: Price = 2333 Rials * Area of the house แน่นอนว่าคุณจะต้องผ่านบ้านทั้งหมด 1,000 หลังในชุดข้อมูลของคุณวางพื้นที่ในสูตรข้างต้นเปรียบเทียบราคากับราคาจริงจัดตารางผลลัพธ์ (ฉันเดาว่าจะป้องกันไม่ให้ผลต่างกันยกเลิก) จากนั้นรับตัวเลขแล้วเล่นต่อ2333ไปเรื่อยๆ ด้วยเครื่องหมายเพื่อลดข้อผิดพลาด แน่นอนว่านี่คือตัวเลือกกำลังดุร้ายซึ่งอาจใช้เวลานานในการคำนวณข้อผิดพลาดและมาถึงตัวเลือกที่ดีที่สุด แต่คุณเห็นสิ่งที่ฉันกำลังพูด ฉันไม่ได้พูดอะไรเกี่ยวกับกราฟเส้นหรือจุดหรือพล็อตหรือวิธีที่ดีที่สุดในการปรับเส้นให้พอดีกับข้อมูลที่คุณมีอยู่ แล้วทำไมคุณต้องใช้พล็อตกระจายและพีชคณิตเชิงเส้นสำหรับสิ่งนี้ ไม่มีวิธีที่ไม่ใช่ภาพหรือ? ก่อนอื่นฉันคิดถูกหรือไม่? ถ้าไม่ฉันชอบที่จะได้รับการแก้ไข แม้ว่าฉันจะเป็นหรือไม่มีสูตรวิธีใดที่จะไม่เล่นกับพีชคณิตเชิงเส้นหรือไม่? ฉันจะซาบซึ้งจริง ๆ ถ้าฉันได้รับตัวอย่างพร้อมคำอธิบายเพื่อที่ฉันจะได้ทำพร้อมกับข้อความเพื่อทดสอบความเข้าใจของฉัน

3
สัญชาตญาณของการแจกแจงแบบเกาส์ที่มีเงื่อนไขคืออะไร
สมมติว่าSigma}) จากนั้นการแจกแจงตามเงื่อนไขของเนื่องจากนั้นมีการกระจายหลายตัวแปรตามปกติด้วยค่าเฉลี่ยX∼N2(μ,Σ)X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma})X1X1X_1X2=x2X2=x2X_2 = x_2 E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) และความแปรปรวน:Var[P(X1|X2=x2)]=σ11−σ212σ22Var[P(X1|X2=x2)]=σ11−σ122σ22{\rm Var}[P(X_1 | X_2 = x_2)] = \sigma_{11}-\frac{\sigma_{12}^{2}}{\sigma_{22}} มันสมเหตุสมผลที่ความแปรปรวนจะลดลงเนื่องจากเรามีข้อมูลเพิ่มเติม แต่สัญชาตญาณที่อยู่เบื้องหลังสูตรหมายถึงอะไร ความแปรปรวนร่วมระหว่างและเป็นปัจจัยที่มีเงื่อนไขอย่างไรX 2X1X1X_1X2X2X_2

2
สัญชาตญาณว่าทำไมความขัดแย้งของสไตน์จึงนำมาใช้ในมิติ
สไตน์ตัวอย่างแสดงให้เห็นว่าการประมาณการความน่าจะเป็นสูงสุดของตัวแปรกระจายตามปกติด้วยวิธีการและผลต่างคือไม่ยอมรับ (ภายใต้ฟังก์ชั่นการสูญเสียตาราง) IFF3 สำหรับการพิสูจน์ที่เป็นระเบียบดูบทแรกของการอนุมานขนาดใหญ่: วิธีการเชิงประจักษ์เบย์สำหรับการประมาณค่าการทดสอบและการทำนายโดยแบรดลีย์เอฟรอนnnnμ1,…,μnμ1,…,μn\mu_1,\ldots,\mu_n111n≥3n≥3n\ge 3 นี่เป็นเรื่องน่าประหลาดใจอย่างมากสำหรับฉันในตอนแรก แต่มีปรีชาอยู่เบื้องหลังว่าทำไมคน ๆ หนึ่งคาดว่าการประมาณมาตรฐานจะไม่สามารถยอมรับได้ (โดยเฉพาะอย่างยิ่งถ้าจากนั้นตามที่ระบุไว้ในกระดาษต้นฉบับของ Stein ซึ่งเชื่อมโยงกับด้านล่าง)x∼N(μ,1)x∼N(μ,1)x \sim \mathcal N(\mu,1)E∥x∥2≈∥μ∥2+nE‖x‖2≈‖μ‖2+n\mathbb{E}\|x\|^2\approx \|\mu\|^2+n คำถามของฉันค่อนข้างจะ: คุณสมบัติใดของช่องว่างnnn -dimensional (สำหรับn≥3n≥3n\ge 3 ) R2R2\mathbb{R}^2ขาดอะไรบ้างที่อำนวยความสะดวกให้ตัวอย่างของ Stein? คำตอบที่เป็นไปได้อาจเกี่ยวกับความโค้งของnnnกลมหรือสิ่งที่แตกต่างอย่างสิ้นเชิง ในคำอื่น ๆ เหตุผลที่เป็นที่ยอมรับใน MLE R2R2\mathbb{R}^2 ? แก้ไข 1:เพื่อตอบสนองต่อ @mpiktas กังวลเกี่ยวกับ 1.31 จาก 1.30: Eμ(∥z−μ^∥2)=Eμ(S(N−2S)2)=Eμ((N−2)2S).Eμ(‖z−μ^‖2)=Eμ(S(N−2S)2)=Eμ((N−2)2S).E_\mu\left(\|z-\hat{\mu}\|^2\right)=E_\mu\left(S\left(\frac{N-2}{S}\right)^2\right)=E_\mu\left(\frac{(N-2)^2}{S}\right). μi^=(1−N−2S)ziμi^=(1−N−2S)zi\hat{\mu_i} = \left(1-\frac{N-2}{S}\right)z_iดังนั้นEμ(∂μi^∂zi)=Eμ(1−N−2S+2z2iS2).Eμ(∂μi^∂zi)=Eμ(1−N−2S+2zi2S2).E_\mu\left(\frac{\partial\hat{\mu_i}}{\partial z_i} \right)=E_\mu\left( 1-\frac{N-2}{S}+2\frac{z_i^2}{S^2}\right).ดังนั้นเราจึงมี: 2∑i=1NEμ(∂μi^∂zi)=2N−2Eμ(N(N−2)S)+4Eμ((N−2)S)=2N−Eμ2(N−2)2S.2∑i=1NEμ(∂μi^∂zi)=2N−2Eμ(N(N−2)S)+4Eμ((N−2)S)=2N−Eμ2(N−2)2S.2\sum_{i=1}^N E_\mu\left(\frac{\partial\hat{\mu_i}}{\partial z_i} \right)=2N-2E_\mu\left(\frac{N(N-2)}{S}\right)+4E_\mu\left(\frac{(N-2)}{S}\right)\\=2N-E_\mu\frac{2(N-2)^2}{S}. …

1
ใครสามารถอธิบายแนวคิดของ 'การแลกเปลี่ยน' ได้บ้าง
ฉันเห็นแนวคิดของ 'การแลกเปลี่ยนได้' ที่ใช้ในบริบทต่าง ๆ (เช่นตัวแบบเบย์) แต่ฉันไม่เคยเข้าใจคำศัพท์นี้ดีนัก แนวคิดนี้มีความหมายว่าอย่างไร? แนวคิดนี้ถูกเรียกใช้ในสถานการณ์ใดและเพราะเหตุใด

13
ปัญหาของมอนตี้ฮอลล์ - สัญชาติญาณของเราทำให้เราไม่อยู่ไหน?
จาก Wikipedia: สมมติว่าคุณอยู่ในรายการเกมและคุณมีทางเลือกสามประตู: ด้านหลังหนึ่งประตูเป็นรถยนต์ ข้างหลังคนอื่น ๆ แพะ คุณเลือกประตูพูดหมายเลข 1 และโฮสต์ที่รู้ว่ามีอะไรอยู่หลังประตูเปิดประตูอีกประตูหนึ่งพูดหมายเลข 3 ซึ่งมีแพะ จากนั้นเขาก็พูดกับคุณว่า "คุณต้องการเลือกประตูหมายเลข 2 หรือไม่" มันเป็นไปเพื่อประโยชน์ของคุณเพื่อเปลี่ยนทางเลือกของคุณ? แน่นอนคำตอบคือใช่ - แต่ไม่สามารถใช้งานได้อย่างไม่น่าเชื่อ สิ่งที่คนส่วนใหญ่เข้าใจผิดเกี่ยวกับความน่าจะเป็นที่นำไปสู่การเกาหัวของเรา - หรือใส่ดีกว่า; กฎทั่วไปอะไรที่เราสามารถนำออกไปจากปริศนานี้เพื่อฝึกฝนสัญชาตญาณของเราในอนาคต

3
คำอธิบายที่เข้าใจง่ายสำหรับความหนาแน่นของตัวแปรที่ถูกแปลง?
สมมติว่าXXXเป็นตัวแปรสุ่มที่มีรูปแบบไฟล์ PDF ฉX( x )fX(x)f_X(x) ) จากนั้นตัวแปรสุ่มY= X2Y=X2Y=X^2มี pdf ฉY( y) = { 12 ปี√( ฉX( y√) + fX( - y√) )0Y≥ 0Y<0fY(y)={12y(fX(y)+fX(−y))y≥00y<0f_Y(y)=\begin{cases}\frac{1}{2\sqrt{y}}\left(f_X(\sqrt{y})+f_X(-\sqrt{y})\right) & y \ge 0 \\ 0 & y \lt 0\end{cases} ฉันเข้าใจแคลคูลัสที่อยู่เบื้องหลังนี้ แต่ฉันพยายามคิดหาวิธีอธิบายให้คนที่ไม่รู้แคลคูลัส โดยเฉพาะฉันพยายามอธิบายว่าทำไมปัจจัย1y√1y\frac{1}{\sqrt{y}}ปรากฏขึ้นด้านหน้า ฉันจะแทงมัน: สมมติว่าXXXมีการแจกแจงแบบเกาส์ เกือบทั้งหมดน้ำหนักของไฟล์ PDF ที่อยู่ระหว่างค่าการพูด−3−3-3และ3.3.3.แต่แผนที่ที่ 0-9 สำหรับYYYYดังนั้นน้ำหนักหนักใน pdf สำหรับXXXได้รับการขยายในช่วงที่กว้างขึ้นของค่าในการเปลี่ยนแปลงที่จะYYYYดังนั้นสำหรับfY(y)fY(y)f_Y(y)ที่จะเป็นไฟล์ PDF ที่แท้จริงน้ำหนักที่หนักเป็นพิเศษจะต้องลดน้ำหนักโดยปัจจัยคูณ1y√1y\frac{1}{\sqrt{y}} ฟังดูเป็นยังไง? หากใครสามารถให้คำอธิบายที่ดีกว่าของพวกเขาเองหรือเชื่อมโยงไปยังหนึ่งในเอกสารหรือตำราเรียนฉันจะขอบคุณมันมาก ฉันพบตัวอย่างการเปลี่ยนแปลงตัวแปรนี้ในหนังสือคณิตศาสตร์สถิติ …

6
ทำไม "อธิบายออกไป" ทำให้เข้าใจง่าย?
ฉันเพิ่งเรียนรู้เกี่ยวกับหลักการของการให้เหตุผลความน่าจะเป็นที่เรียกว่า " อธิบายออกไป " และฉันพยายามที่จะเข้าใจสัญชาตญาณ ให้ฉันตั้งค่าสถานการณ์ ให้เป็นเหตุการณ์ที่เกิดแผ่นดินไหว ให้เหตุการณ์ เป็นเหตุการณ์ที่ยักษ์เขียวขจีกำลังเดินเล่นรอบเมือง ให้เป็นเหตุการณ์ที่พื้นสั่นสะเทือน ให้B ที่คุณเห็นอย่างใดอย่างหนึ่งหรือสามารถทำให้เกิดซีAAABBBCCCA ⊥⊥ BA⊥⊥BA \perp\!\!\!\perp BAAABBBCCC ฉันใช้การอธิบายแบบ "อธิบายทันที" หากเกิดขึ้นหนึ่งในหรือเพิ่มขึ้น แต่อีกเหตุผลหนึ่งลดลงเนื่องจากฉันไม่ต้องการเหตุผลทางเลือกเพื่ออธิบายว่าทำไมเกิดขึ้น อย่างไรก็ตามปรีชาปัจจุบันของฉันบอกฉันว่าทั้งและควรเพิ่มขึ้นถ้าเกิดขึ้นเนื่องจากเกิดขึ้นทำให้มีโอกาสมากขึ้นที่สาเหตุของเกิดขึ้นCCCP( A )P(A)P(A)P( B )P(B)P(B)CCCP( A )P(A)P(A)P( B )P(B)P(B)CCCCCCCCC ฉันจะปรับความเข้าใจปรีชาปัจจุบันของฉันด้วยแนวคิดที่จะอธิบายได้อย่างไร ฉันจะใช้การอธิบายเพื่อพิสูจน์ว่าและขึ้นอยู่กับเงื่อนไขอย่างไรAAABBBCCC

4
อยู่ที่ไหน
ทฤษฎีบทกลาง จำกัด แบบง่ายมาก ซึ่งก็คือ Lindeberg – Lévy CLT ฉันไม่เข้าใจว่าทำไมมีทางด้านซ้ายมือ และ Lyapunov CLT บอกว่า แต่ทำไม ไม่ใช่ ? ทุกคนจะบอกฉันว่าเป็นปัจจัยเหล่านี้เช่นและ ? เราจะรับพวกเขาในทฤษฎีบทได้อย่างไรn−−√((1n∑i=1nXi)−μ) →d N(0,σ2)n((1n∑i=1nXi)−μ) →d N(0,σ2) \sqrt{n}\bigg(\bigg(\frac{1}{n}\sum_{i=1}^n X_i\bigg) - \mu\bigg)\ \xrightarrow{d}\ \mathcal{N}(0,\;\sigma^2) n−−√n\sqrt{n}1sn∑i=1n(Xi−μi) →d N(0,1)1sn∑i=1n(Xi−μi) →d N(0,1) \frac{1}{s_n} \sum_{i=1}^{n} (X_i - \mu_i) \ \xrightarrow{d}\ \mathcal{N}(0,\;1) sn−−√sn\sqrt{s_n}n−−√n\sqrt{n}1sn1sn\frac{1}{s_n}

2
หลักฐานของภาวะโลกร้อนที่มนุษย์สร้างขึ้นได้มาถึง 'มาตรฐานทองคำ': พวกเขาทำเช่นนี้ได้อย่างไร?
ข้อความนี้ในบทความของ Reuter จาก 25.02.2019 ขณะนี้มีอยู่ทั่วข่าว: หลักฐานของภาวะโลกร้อนที่มนุษย์สร้างขึ้นได้รับความนิยม 'มาตรฐานทองคำ' [นักวิทยาศาสตร์] กล่าวว่าความมั่นใจว่ากิจกรรมของมนุษย์กำลังเพิ่มความร้อนที่พื้นผิวโลกได้ถึงระดับ "ห้าซิกม่า" ซึ่งเป็นมาตรวัดทางสถิติซึ่งหมายความว่ามีโอกาสเพียงหนึ่งในล้านเท่านั้นที่สัญญาณจะปรากฏขึ้นหากมี ไม่มีภาวะโลกร้อน ฉันเชื่อว่านี่หมายถึงบทความนี้"ฉลองครบรอบสามเหตุการณ์สำคัญในวิทยาศาสตร์การเปลี่ยนแปลงสภาพภูมิอากาศ"ซึ่งมีพล็อตซึ่งแสดงแผนผังด้านล่าง (เป็นภาพร่างเพราะฉันไม่สามารถหาภาพโอเพนซอร์สสำหรับต้นฉบับที่คล้ายกัน พบรูปภาพฟรีที่นี่ ) บทความอื่นจากกลุ่มการวิจัยเดียวกันซึ่งดูเหมือนว่าจะเป็นแหล่งต้นฉบับมากกว่าอยู่ที่นี่ (แต่ใช้นัยสำคัญ 1% แทน5 σ5σ5\sigma ) พล็อตนำเสนอการวัดจากกลุ่มวิจัยที่แตกต่างกันสามกลุ่ม ได้แก่ ระบบตรวจจับระยะไกล, ศูนย์สำหรับการใช้งานและการวิจัยดาวเทียมและมหาวิทยาลัยอลาบามาที่ Huntsville พล็อตแสดงเส้นโค้งสัญญาณที่เพิ่มขึ้นสามเส้นต่ออัตราส่วนสัญญาณรบกวนเป็นฟังก์ชันของแนวโน้มความยาว 5 σ5σ5\sigma ††^{\dagger}5 σ5σ5\sigma 5 σ5σ5 \sigma ††^\dagger

4
ความแตกต่างระหว่างความแปรปรวน จำกัด และความแปรปรวนอนันต์คืออะไร
ความแตกต่างระหว่างผลต่างอันตะ จำกัด และความไม่สิ้นสุดคืออะไร? ความรู้สถิติของฉันค่อนข้างพื้นฐาน Wikipedia / Google ไม่ได้ช่วยอะไรมากที่นี่

13
สัญชาตญาณของสูตรความน่าจะเป็นแบบมีเงื่อนไขคืออะไร
สูตรสำหรับความน่าจะเป็นแบบมีเงื่อนไขของเกิดขึ้นเนื่องจากเกิดขึ้นคือ:AA\text{A}BB\text{B}P(A | B)=P(A∩B)P(B).P(A | B)=P(A∩B)P(B). P\left(\text{A}~\middle|~\text{B}\right)=\frac{P\left(\text{A} \cap \text{B}\right)}{P\left(\text{B}\right)}. ตำราเรียนของฉันอธิบายถึงสัญชาตญาณที่อยู่เบื้องหลังสิ่งนี้ในแง่ของแผนภาพเวนน์ ระบุว่าได้เกิดขึ้นเพียงวิธีเดียวสำหรับที่จะเกิดขึ้นสำหรับเหตุการณ์ที่จะตกอยู่ในจุดตัดของและ{B}A A BBB\text{B}AA\text{A}AA\text{A}BB\text{B} ในกรณีนั้นความน่าจะเป็นของจะเท่ากับความน่าจะเป็นของทางแยกเนื่องจาก นั่นเป็นวิธีเดียวที่เหตุการณ์จะเกิดขึ้น? ฉันพลาดอะไรไป A BP(A|B)P(A|B)P\left(\text{A} \middle| \text{B}\right)AA\text{A}BB\text{B}

1
สัญชาตญาณเบื้องหลังการโต้ตอบของผลิตภัณฑ์เทนเซอร์ในเกม (แพ็คเกจ MGCV ใน R)
ทั่วไปรุ่นสารเติมแต่งเป็นคนที่ ตัวอย่างเช่น ฟังก์ชั่นนั้นราบรื่นและสามารถประเมินได้ มักจะถูกลงโทษโดยเส้นโค้ง MGCV เป็นแพ็คเกจใน R ที่ทำเช่นนั้นและผู้แต่ง (Simon Wood) เขียนหนังสือเกี่ยวกับแพ็คเกจของเขาด้วยตัวอย่าง R Ruppert และคณะ (2003) เขียนหนังสือที่เข้าถึงได้ง่ายขึ้นเกี่ยวกับสิ่งที่เรียบง่ายกว่าในสิ่งเดียวกัน y=α+f1(x1)+f2(x2)+eiy=α+f1(x1)+f2(x2)+ei y = \alpha + f_1(x_1) + f_2(x_2) + e_i คำถามของฉันเกี่ยวกับการโต้ตอบภายในแบบจำลองเหล่านี้ ถ้าฉันต้องการทำสิ่งต่อไปนี้: ถ้าเราอยู่ในดินแดน OLS (ที่เป็นเพียงเบต้า) ผมไม่มีปัญหากับการตีความ\หากเราประเมินผ่านเดอร์ไลน์ที่ถูกลงโทษฉันก็ไม่มีปัญหากับการตีความในบริบทเพิ่มเติม ฉฉ 3y=α+f1(x1)+f2(x2)+f3(x1×x2)+eiy=α+f1(x1)+f2(x2)+f3(x1×x2)+ei y = \alpha + f_1(x_1) + f_2(x_2) + f_3(x_1\times x_2) + e_i ffff^3f^3\hat{f}_3 แต่แพ็คเกจ MGCV ใน …

3
ข้อมูลฟิชเชอร์เป็นข้อมูลประเภทใด?
สมมติว่าเรามีตัวแปรสุ่มtheta) ถ้าเป็นพารามิเตอร์จริงฟังก์ชันความน่าจะเป็นควรขยายให้ใหญ่สุดและอนุพันธ์เท่ากับศูนย์ นี่คือหลักการพื้นฐานที่อยู่เบื้องหลังตัวประมาณค่าความน่าจะเป็นสูงสุดX∼f(x|θ)X~ฉ(x|θ)X \sim f(x|\theta)θ0θ0\theta_0 ตามที่ฉันเข้าใจแล้วข้อมูลฟิชเชอร์ถูกกำหนดให้เป็น I(θ)=E[(∂∂θf(X|θ))2]ผม(θ)=E[(∂∂θฉ(X|θ))2]I(\theta) = \Bbb E \Bigg[\left(\frac{\partial}{\partial \theta}f(X|\theta)\right)^2\Bigg ] ดังนั้นหากเป็นพารามิเตอร์ที่จริง0 แต่ถ้ามันไม่ใช่พารามิเตอร์จริงเราจะมีข้อมูลฟิชเชอร์จำนวนมากขึ้นθ0θ0\theta_0I(θ)=0ผม(θ)=0I(\theta) = 0θ0θ0\theta_0 คำถามของฉัน ข้อมูล Fisher ทำการวัด "ข้อผิดพลาด" ของ MLE ที่กำหนดหรือไม่ กล่าวอีกนัยหนึ่งการมีอยู่ของข้อมูลฟิชเชอร์ในเชิงบวกไม่ได้หมายความว่า MLE ของฉันไม่เหมาะอย่างยิ่งหรือ คำจำกัดความของ "ข้อมูล" นี้แตกต่างจากที่ Shannon ใช้อย่างไร ทำไมเราถึงเรียกมันว่าข้อมูล?

5
คำอธิบายอย่างง่ายของการลู่เข้าในการกระจายและการลู่เข้าในความน่าจะเป็น
อะไรคือความแตกต่างระหว่างสัญชาตญาณแบบสุ่มที่มาบรรจบกันของความน่าจะเป็นกับความแปรปรวนแบบสุ่มในการแจกแจง ฉันได้อ่านคำจำกัดความและสมการทางคณิตศาสตร์มากมาย แต่นั่นไม่ได้ช่วยจริงๆ (โปรดทราบว่าฉันเป็นนักศึกษาระดับปริญญาตรีสาขาเศรษฐศาสตร์กำลังศึกษา) ตัวแปรสุ่มสามารถรวมกันเป็นตัวเลขเดียวได้อย่างไร แต่ยังมาบรรจบกับการแจกแจงได้อย่างไร

2
การกระจายตัวของ
การกระจายของสัมประสิทธิ์การตัดสินใจคืออะไรหรือ R กำลังสอง, , ในการถดถอยเชิงเส้นหลายตัวแปรเชิงเส้นภายใต้สมมติฐาน ?R2R2R^2H0:β=0H0:β=0H_0:\beta=0 มันขึ้นอยู่กับจำนวนของตัวทำนายและจำนวนตัวอย่างอย่างไร มีนิพจน์แบบปิดสำหรับโหมดของการแจกแจงนี้หรือไม่?kkkn>kn>kn>k โดยเฉพาะฉันมีความรู้สึกว่าการถดถอยอย่างง่าย (ด้วยตัวทำนายหนึ่งตัว ) การแจกแจงนี้มีโหมดเป็นศูนย์ แต่สำหรับการถดถอยหลายครั้งโหมดจะอยู่ในค่าบวกที่ไม่เป็นศูนย์ หากนี่เป็นเรื่องจริงมีคำอธิบายง่ายๆเกี่ยวกับ "การเปลี่ยนเฟส" นี้หรือไม่?xxx ปรับปรุง ในฐานะที่เป็น @Alecos แสดงให้เห็นด้านล่างกระจายแน่นอนยอดเขาที่ศูนย์เมื่อและและไม่ได้อยู่ที่ศูนย์เมื่อ 3 ฉันรู้สึกว่าควรมีมุมมองทางเรขาคณิตในการเปลี่ยนเฟสนี้ พิจารณามุมมองเชิงเรขาคณิตของ OLS:เป็นเวกเตอร์ใน ,กำหนดพื้นที่ย่อย -dimensional จำนวน OLS จะฉาย\ mathbf Yบนสเปซนี้และR ^ 2คือโคไซน์กำลังสองของมุมระหว่าง\ Y mathbfและประมาณการ\ hat {\ mathbf y}k=2k=2k=2k=3k=3k=3k>3k>3k>3yy\mathbf yRnRn\mathbb R^nXX\mathbf Xkkkyy\mathbf yR2R2R^2yy\mathbf yy^y^\hat{\mathbf y} ทีนี้จากคำตอบของ @ Alecos ตามมาว่าถ้าเวกเตอร์ทั้งหมดสุ่มแล้วการกระจายความน่าจะเป็นของมุมนี้จะสูงสุดที่สำหรับและแต่จะมีโหมดที่ค่าอื่น ๆสำหรับ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.