คำถามติดแท็ก self-study

แบบฝึกหัดประจำจากตำราหลักสูตรหรือแบบทดสอบที่ใช้สำหรับชั้นเรียนหรือเรียนด้วยตนเอง นโยบายของชุมชนนี้คือ "ให้คำแนะนำที่เป็นประโยชน์" สำหรับคำถามดังกล่าวแทนที่จะตอบเต็ม

1
ก่อสร้างการกระจาย Dirichlet ด้วยการกระจายแกมม่า
ให้X 1 , … , X k + 1X1,…,Xk+1X_1,\dots,X_{k+1}เป็นตัวแปรสุ่มอิสระที่ต่างกันซึ่งแต่ละอันมีการแจกแจงแกมม่าที่มีพารามิเตอร์α i , i = 1 , 2 , … , k + 1αi,i=1,2,…,k+1\alpha_i,i=1,2,\dots,k+1แสดงว่าY i = X iX 1 + ⋯ + X k + 1 ,i=1,…,kYi=XiX1+⋯+Xk+1,i=1,…,kY_i=\frac{X_i}{X_1+\cdots+X_{k+1}},i=1,\dots,k, มีการแบ่งส่วนร่วมเป็นDirichlet(α1,α2,…,αk;αk+1)Dirichlet(α1,α2,…,αk;αk+1)\text{Dirichlet}(\alpha_1,\alpha_2,\dots,\alpha_k;\alpha_{k+1}) PDF ร่วมของ( X 1 , … , X k + 1 ) = e …

1
คำถาม: บอกตัวจําแนกตามขอบเขตการตัดสินใจ
รับเป็น 6 ขอบเขตการตัดสินใจด้านล่าง ขอบเขตการตัดสินใจเป็นเส้นสีม่วง จุดและกากบาทเป็นชุดข้อมูลที่แตกต่างกันสองชุด เราต้องตัดสินใจว่าอันไหนคือ: Linear SVM เคอร์เนล SVM (เคอร์เนลโพลิโนเมียลของคำสั่ง 2) Perceptron การถดถอยโลจิสติก Neural Network (1 เลเยอร์ที่ซ่อนอยู่พร้อมหน่วยเชิงเส้น 10 หน่วยแก้ไข) Neural Network (1 เลเยอร์ที่ซ่อนอยู่มี 10 ตัน) ฉันต้องการคำตอบ แต่ที่สำคัญกว่านั้นเข้าใจความแตกต่าง เช่นฉันจะบอกว่า c) เป็น SVM เชิงเส้น ขอบเขตการตัดสินใจเป็นแบบเส้นตรง แต่เรายังสามารถเชื่อมโยงขอบเขตการตัดสินใจ SVM เชิงเส้นเข้าด้วยกันได้ d) Kernelized SVM เนื่องจากเป็นคำสั่งพหุนาม 2. f) แก้ไขโครงข่ายประสาทเนื่องจากขอบ "หยาบ" อาจจะ) การถดถอยโลจิสติก: มันยังเป็นลักษณนามเชิงเส้น แต่ขึ้นอยู่กับความน่าจะเป็น

3
ทำไม“ อนุกรมเวลา” จึงเรียกเช่นนี้
ทำไม“ อนุกรมเวลา” จึงเรียกเช่นนี้ ซีรีส์หมายถึงผลรวมของลำดับ เหตุใดจึงเป็นอนุกรมเวลาไม่ใช่ลำดับเวลา คือเวลาตัวแปรอิสระ?

1
หลักฐานการคงที่ของ AR (2)
พิจารณากระบวนการ AR ที่เป็นศูนย์กลาง (2)โดยที่เป็นกระบวนการเสียงสีขาวมาตรฐาน เพียงเพื่อประโยชน์ของความเรียบง่ายให้ฉันโทรและ a มุ่งเน้นไปที่รากของสมการลักษณะเฉพาะฉันได้ เงื่อนไขแบบคลาสสิกในตำรามีดังต่อไปนี้: ฉันพยายามที่จะแก้ปัญหาด้วยตนเอง (ด้วยความช่วยเหลือของ Mathematica) ความไม่เท่าเทียมกันในรากเช่นระบบได้รับเพียงXt=ϕ1Xt−1+ϕ2Xt−2+ϵtXt=ϕ1Xt−1+ϕ2Xt−2+ϵtX_t=\phi_1X_{t-1}+\phi_2X_{t-2}+\epsilon_tϵtϵt\epsilon_tϕ1=bϕ1=b\phi_1=bϕ2=aϕ2=a\phi_{2}=az1,2=−b±b2+4a−−−−−−√2az1,2=−b±b2+4a2az_{1,2}=\frac{-b\pm\sqrt{b^2+4a}}{2a}{|a|&lt;1a±b&lt;1{|a|&lt;1a±b&lt;1\begin{cases}|a|<1 \\ a\pm b<1 \end{cases}⎧⎩⎨|−b−b2+4a√2a|&gt;1|−b+b2+4a√2a|&gt;1{|−b−b2+4a2a|&gt;1|−b+b2+4a2a|&gt;1\begin{cases}|\frac{-b-\sqrt{b^2+4a}}{2a}|>1 \\ |\frac{-b+\sqrt{b^2+4a}}{2a}|>1\end{cases}a±b&lt;1a±b&lt;1a \pm b<1เงื่อนไขที่สาม ( ) สามารถกู้คืนได้โดยเพิ่มโซลูชันสองรายการก่อนหน้าให้กับแต่ละอื่น ๆ ที่ได้รับที่ผ่านการพิจารณาสัญญาณบางอย่างกลายเป็นหรือไม่ หรือฉันกำลังหาทางแก้ปัญหา?|a|&lt;1|a|&lt;1|a|<1a+b+a−b&lt;2⇒a&lt;1a+b+a−b&lt;2⇒a&lt;1a+b+a-b<2 \Rightarrow a<1|a|&lt;1|a|&lt;1|a|<1

2
ฉันจะคำนวณความแปรปรวนของเครื่องมือประมาณค่า OLS
ฉันรู้ว่า และนี่คือสิ่งที่ฉันได้รับเมื่อคำนวณความแปรปรวน:β0^=y¯−β1^x¯β0^=y¯−β1^x¯\hat{\beta_0}=\bar{y}-\hat{\beta_1}\bar{x} Var(β0^)=Var(y¯−β1^x¯)=Var((−x¯)β1^+y¯)=Var((−x¯)β1^)+Var(y¯)=(−x¯)2Var(β1^)+0=(x¯)2Var(β1^)+0=σ2(x¯)2∑i=1n(xi−x¯)2Var(β0^)=Var(y¯−β1^x¯)=Var((−x¯)β1^+y¯)=Var((−x¯)β1^)+Var(y¯)=(−x¯)2Var(β1^)+0=(x¯)2Var(β1^)+0=σ2(x¯)2∑i=1n(xi−x¯)2\begin{align*} Var(\hat{\beta_0}) &= Var(\bar{y} - \hat{\beta_1}\bar{x}) \\ &= Var((-\bar{x})\hat{\beta_1}+\bar{y}) \\ &= Var((-\bar{x})\hat{\beta_1})+Var(\bar{y}) \\ &= (-\bar{x})^2 Var(\hat{\beta_1}) + 0 \\ &= (\bar{x})^2 Var(\hat{\beta_1}) + 0 \\ &= \frac{\sigma^2 (\bar{x})^2}{\displaystyle\sum\limits_{i=1}^n (x_i - \bar{x})^2} \end{align*} แต่เท่าที่ฉันได้รับ สูตรสุดท้ายที่ฉันพยายามจะคำนวณคือ Var(β0^)=σ2n−1∑i=1nx2i∑i=1n(xi−x¯)2Var(β0^)=σ2n−1∑i=1nxi2∑i=1n(xi−x¯)2\begin{align*} Var(\hat{\beta_0}) &= \frac{\sigma^2 n^{-1}\displaystyle\sum\limits_{i=1}^n x_i^2}{\displaystyle\sum\limits_{i=1}^n (x_i - \bar{x})^2} \end{align*} ฉันไม่แน่ใจว่าจะได้รับอย่างไรสมมติว่าคณิตศาสตร์ของฉันถูกต้องตรงนั้น .(x¯)2=1n∑i=1nx2i(x¯)2=1n∑i=1nxi2(\bar{x})^2 = \frac{1}{n}\displaystyle\sum\limits_{i=1}^n …

8
การแก้ไขเกี่ยวข้องกับแนวคิดของการถดถอยอย่างไร
อธิบายสั้น ๆ การแก้ไขหมายถึงอะไรมันเกี่ยวข้องกับแนวคิดของการถดถอยอย่างไร? การแก้ไขคือศิลปะของการอ่านระหว่างบรรทัดของตารางและในคณิตศาสตร์ระดับประถมศึกษาคำศัพท์มักจะหมายถึงกระบวนการคำนวณค่ากลางของฟังก์ชันจากชุดของค่าที่กำหนดหรือตารางของฟังก์ชันนั้น ฉันไม่สามารถตอบคำถามที่สองได้ กรุณาช่วย

3
ทำไมเราต้องใช้ Bootstrapping
ขณะนี้ฉันกำลังอ่าน "สถิติทั้งหมด" ของ Larry Wasserman และสับสนกับบางสิ่งที่เขาเขียนในบทเกี่ยวกับการประเมินฟังก์ชันทางสถิติของแบบจำลองที่ไม่ใช่พารามิเตอร์ เขาเขียน "บางครั้งเราสามารถค้นหาข้อผิดพลาดมาตรฐานโดยประมาณของฟังก์ชันทางสถิติโดยทำการคำนวณบางอย่างอย่างไรก็ตามในกรณีอื่น ๆ มันไม่ชัดเจนว่าจะประมาณข้อผิดพลาดมาตรฐานได้อย่างไร" ฉันต้องการจะชี้ให้เห็นว่าในบทถัดไปเขาพูดถึง bootstrap เพื่อแก้ไขปัญหานี้ แต่เนื่องจากฉันไม่เข้าใจคำแถลงนี้จริง ๆ ฉันจึงไม่ได้รับแรงจูงใจเบื้องหลัง Bootstrapping? มีตัวอย่างอะไรบ้างเมื่อไม่ทราบวิธีการประเมินข้อผิดพลาดมาตรฐานอย่างชัดเจน ตัวอย่างทั้งหมดที่ฉันเคยเห็น "ชัดเจน" เช่นดังนั้น^ s E ( P n ) = √X1,...Xn Ber(p)X1,...Xn Ber(p)X_1,...X_n ~Ber(p)se^(p^n)=p^⋅(1−p^)/n−−−−−−−−−−√se^(p^n)=p^⋅(1−p^)/n \hat{se}(\hat{p}_n )=\sqrt{\hat{p}\cdot(1-\hat{p})/n}

4
ค่าที่คาดหวังของค่ามัธยฐานตัวอย่างให้ค่าเฉลี่ยตัวอย่าง
Let YYYแสดงค่ามัธยฐานและให้ˉ XX¯\bar{X}หมายถึงค่าเฉลี่ยของตัวอย่างที่สุ่มจากขนาดn = 2 k + 1n=2k+1n=2k+1จากการจัดจำหน่ายที่เป็นN ( μ , σ 2N(μ,σ2)N(\mu,\sigma^2) ) ฉันจะคำนวณE ( Y | ˉ X = ˉ x ) ได้E(Y|X¯=x¯)E(Y|\bar{X}=\bar{x})อย่างไร สังหรณ์ใจเพราะสมมติฐานปกติก็จะทำให้ความรู้สึกที่จะอ้างว่าE ( Y | ˉ X = ˉ x ) = ˉ xE(Y|X¯=x¯)=x¯E(Y|\bar{X}=\bar{x})=\bar{x}และแน่นอนว่าเป็นคำตอบที่ถูกต้อง สามารถที่จะแสดงอย่างจริงจังว่า? ความคิดเริ่มต้นของฉันคือการเข้าถึงปัญหานี้โดยใช้การแจกแจงแบบปกติตามเงื่อนไขซึ่งโดยทั่วไปแล้วจะเป็นผลลัพธ์ที่ทราบ ปัญหาคือว่าเนื่องจากฉันไม่ทราบค่าที่คาดหวังและดังนั้นความแปรปรวนของค่ามัธยฐานฉันจะต้องคำนวณค่าเหล่านั้นโดยใช้สถิติลำดับk + 1 k+1k+1แต่นั่นซับซ้อนมากและฉันจะไม่ไปที่นั่นเว้นแต่ฉันจะต้องทำอย่างแน่นอน

1
คำถามเกี่ยวกับวิธีการทำให้ค่าสัมประสิทธิ์การถดถอยเป็นปกติ
ไม่แน่ใจว่าคำว่า normalize เป็นคำที่ถูกต้องที่จะใช้ที่นี่หรือไม่ แต่ฉันจะพยายามอย่างดีที่สุดเพื่ออธิบายสิ่งที่ฉันพยายามถาม ตัวประมาณที่ใช้ในที่นี้คือกำลังสองน้อยสุด สมมติว่าคุณมีy = β 0 + β 1 x 1y=β0+β1x1y=\beta_0+\beta_1x_1คุณสามารถจัดให้อยู่กึ่งกลางค่าเฉลี่ยโดยy = β ′ 0 + β 1 x ′ 1y=β′0+β1x′1y=\beta_0'+\beta_1x_1'โดยที่β ′ 0 = β 0 + β 1 ˉ x 1β′0=β0+β1x¯1\beta_0'=\beta_0+\beta_1\bar x_1และx ′ 1 = x - ˉ xx′1=x−x¯x_1'=x-\bar x , ดังนั้นβ ′ 0β′0\beta_0'ไม่มีอิทธิพลต่อการประมาณβ 1β1\beta_1อีกต่อไป โดยที่ผมหมายถึงนี้β …

5
หนังสือทฤษฎีความน่าจะเป็นสำหรับการศึกษาด้วยตนเอง
มีหนังสือที่ดีที่อธิบายแนวคิดที่สำคัญของทฤษฎีความน่าจะเป็นเช่นฟังก์ชันการแจกแจงความน่าจะเป็นและฟังก์ชันการแจกแจงสะสมหรือไม่ กรุณาหลีกเลี่ยงการอ้างอิงหนังสือเช่น "คณิตศาสตร์สถิติและการวิเคราะห์ข้อมูล" โดย John Rice ซึ่งเริ่มต้นด้วยแนวคิดการเปลี่ยนแปลงแบบง่าย ๆ จากนั้นทันใดนั้น (ในบทที่ 2) ใช้ความก้าวกระโดดที่สมมติว่ามีความรู้ในการวิเคราะห์จริง PDF และแสดงเป็นตัวเลขสามมิติ หนึ่งถูกทิ้งไว้ที่หัวเกาเป็นวิธีการเชื่อมต่อทุกอย่าง ฉันกำลังมองหาหนังสือเรียนด้วยตนเองและหนังสือทุกเล่มในหมวดหมู่เดียวกันกับ "แคลคูลัสสำหรับผู้ปฏิบัติ" จะเป็นประโยชน์อย่างมาก

1
การได้มาของการเปลี่ยนแปลงตัวแปรของฟังก์ชันความหนาแน่นของความน่าจะเป็น
ในการจดจำรูปแบบหนังสือและการเรียนรู้ของเครื่อง (สูตร 1.27) มันให้ พีY( y) = px( x ) ∣||dxdY|||= px( กรัม( y) ) | ก.'( y) |พีY(Y)=พีx(x)|dxdY|=พีx(ก.(Y))|ก.'(Y)|p_y(y)=p_x(x) \left | \frac{d x}{d y} \right |=p_x(g(y)) | g'(y) | โดยที่ ,เป็น PDF ที่สอดคล้องกับตามการเปลี่ยนแปลงของตัวแปรp x ( x ) p y ( y )x = g( y)x=ก.(Y)x=g(y)พีx( x )พีx(x)p_x(x)พีY( y)พีY(Y)p_y(y) หนังสือบอกว่ามันเป็นเพราะสังเกตว่าตกอยู่ในช่วงจะค่าเล็ก ๆ …

4
รุ่นเชิงเส้นคลาสสิก - การเลือกรูปแบบ
ฉันมีโมเดลเชิงเส้นแบบคลาสสิกโดยมี 5 regressors ที่เป็นไปได้ พวกเขาไม่เกี่ยวข้องกันและมีความสัมพันธ์ค่อนข้างต่ำกับการตอบสนอง ฉันมาถึงแบบจำลองที่มี 3 regressors มีค่าสัมประสิทธิ์นัยสำคัญสำหรับสถิติ t (p &lt;0.05) การเพิ่มตัวแปรที่เหลืออย่างใดอย่างหนึ่งหรือทั้งสองอย่างให้ค่า p&gt; 0.05 สำหรับสถิติ t สำหรับตัวแปรเพิ่ม สิ่งนี้ทำให้ฉันเชื่อว่าโมเดล 3 ตัวแปรนั้น "ดีที่สุด" อย่างไรก็ตามการใช้คำสั่ง anova (a, b) ใน R โดยที่ a คือโมเดลตัวแปร 3 ตัวและ b เป็นรูปแบบเต็มค่า p สำหรับสถิติ F คือ &lt;0.05 ซึ่งบอกให้ฉันชอบแบบเต็มมากกว่าตัวแปร 3 ตัว แบบ ฉันจะกระทบยอดความขัดแย้งที่เห็นได้ชัดเหล่านี้ได้อย่างไร ขอบคุณ PS Edit: พื้นหลังเพิ่มเติมบางส่วน นี่คือการบ้านดังนั้นฉันจะไม่โพสต์รายละเอียด …

1
อนุพันธ์ของฟังก์ชันการเปิดใช้งาน ReLU คืออะไร
อนุพันธ์ของฟังก์ชันการเปิดใช้งาน ReLU คืออะไร: ReLU(x)=max(0,x)ReLU(x)=max(0,x) \mathrm{ReLU}(x) = \mathrm{max}(0, x) แล้วกรณีพิเศษที่ฟังก์ชันมีความไม่ต่อเนื่องที่ไหร่?x=0x=0x=0

2
ไฟล์ PDF ของ
สมมติว่าเป็น iid จากโดยไม่ทราบและX1,X2,...,XnX1,X2,...,XnX_1, X_2,...,X_nN(μ,σ2)N(μ,σ2)N(\mu,\sigma^2)μ∈Rμ∈R\mu \in \mathcal Rσ2&gt;0σ2&gt;0\sigma^2>0 ให้ S คือค่าเบี่ยงเบนมาตรฐานที่นี่Z=X1−X¯S,Z=X1−X¯S,Z=\frac{X_1-\bar{X}}{S}, มันสามารถแสดงให้เห็นว่า มีไฟล์ LebesgueZZZ f(z)=n−−√Γ(n−12)π−−√(n−1)Γ(n−22)[1−nz2(n−1)2]n/2−2I(0,(n−1)/n√)(|Z|)f(z)=nΓ(n−12)π(n−1)Γ(n−22)[1−nz2(n−1)2]n/2−2I(0,(n−1)/n)(|Z|)f(z)=\frac{\sqrt{n} \Gamma\left(\frac{n-1}{2}\right)}{\sqrt{\pi}(n-1)\Gamma\left(\frac{n-2}{2}\right)}\left[1-\frac{nz^2}{(n-1)^2}\right]^{n/2-2}I_{(0,(n-1)/\sqrt{n})}(|Z|) คำถามของฉันคือวิธีการรับ pdf นี้ คำถามคือจากที่นี่ในตัวอย่าง 3.3.4 เพื่อหา UMVUE ของP(X1≤c)P(X1≤c)P(X_1 \le c)ค) ฉันเข้าใจตรรกะและขั้นตอนเพื่อค้นหา UMVUE แต่ไม่รู้วิธีรับ PDF ผมคิดว่าคำถามนี้ยังเกี่ยวข้องกับเรื่องนี้อย่างใดอย่างหนึ่ง ขอบคุณมากสำหรับความช่วยเหลือหรือชี้ไปที่การอ้างอิงใด ๆ ที่เกี่ยวข้องจะได้รับการจัดสรร
15 self-study  umvue 

2
จำลองการดึงจากการกระจายแบบสม่ำเสมอโดยใช้การดึงจากการแจกแจงแบบปกติ
ฉันเพิ่งซื้อแหล่งข้อมูลการสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูลซึ่งมีหนึ่งในคำถามที่น่าจะเป็นดังนี้: ที่ได้รับมาจากการแจกแจงปกติพร้อมพารามิเตอร์ที่รู้จักกันคุณจะจำลองการดึงจากการแจกแจงแบบสม่ำเสมอได้อย่างไร? กระบวนการคิดดั้งเดิมของฉันคือว่าสำหรับตัวแปรสุ่มแบบแยกเราสามารถแบ่งการแจกแจงแบบปกติออกเป็นส่วนย่อยที่ไม่ซ้ำกัน K โดยแต่ละส่วนย่อยมีพื้นที่เท่ากันภายใต้เส้นโค้งปกติ จากนั้นเราสามารถกำหนดได้ว่าค่า K ใดที่ตัวแปรใช้โดยการจดจำพื้นที่ของส่วนโค้งปกติที่ตัวแปรนั้นสิ้นสุดลง แต่สิ่งนี้จะใช้ได้เฉพาะกับตัวแปรสุ่มแบบแยกเท่านั้น ฉันได้ทำการวิจัยเกี่ยวกับวิธีที่เราอาจทำแบบเดียวกันกับตัวแปรสุ่มต่อเนื่อง แต่น่าเสียดายที่ฉันสามารถค้นหาเทคนิคเช่นการสุ่มตัวอย่างการแปลงผกผันที่จะใช้เป็นอินพุตตัวแปรสุ่มแบบสม่ำเสมอและสามารถส่งออกตัวแปรสุ่มจากการกระจายอื่น ๆ ฉันคิดว่าบางทีเราสามารถทำกระบวนการนี้ในทางกลับกันเพื่อให้ได้ตัวแปรสุ่มที่เหมือนกัน? ฉันยังคิดว่าอาจใช้ตัวแปรสุ่มแบบปกติเป็นอินพุตในเครื่องกำเนิดไฟฟ้าเชิงเส้นเชิงเส้น แต่ฉันไม่แน่ใจว่าสิ่งนี้จะได้ผลหรือไม่ มีความคิดเกี่ยวกับวิธีที่ฉันอาจเข้าหาคำถามนี้หรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.