คำถามติดแท็ก iid

iid เป็นคำย่อของอิสระและการกระจายที่เหมือนกัน วิธีการทางสถิติหลายวิธีถือว่าข้อมูลเป็น iid; นั่นคือการสังเกตแต่ละครั้งมาจากการแจกแจงเดียวกันและไม่ขึ้นกับข้อสังเกตอื่น ๆ

5
เกี่ยวกับความสำคัญของการตั้งสมมติฐานในการเรียนรู้ทางสถิติ
ในการเรียนรู้ทางสถิติโดยปริยายหรืออย่างชัดเจนเรามักจะสันนิษฐานว่าชุดการฝึกอบรมD={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}ประกอบด้วยการป้อนข้อมูลNNN / ตอบสนอง tuples (Xi,yi)(Xi,yi)({\bf{X}}_i,y_i)ที่มาจากการกระจายข้อต่อเดียวกัน ด้วยP(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) และความสัมพันธ์ที่เราพยายามรวบรวมผ่านอัลกอริทึมการเรียนรู้เฉพาะ ในทางคณิตศาสตร์สมมติฐาน iid นี้เขียน:p(y|X)p(y|X)p( y \vert {\bf{X}}) (Xi,yi)∼P(X,y),∀i=1,...,N(Xi,yi) independent of (Xj,yj),∀i≠j∈{1,...,N}(Xi,yi)∼P(X,y),∀i=1,...,N(Xi,yi) independent of (Xj,yj),∀i≠j∈{1,...,N}\begin{gather} ({\bf{X}}_i,y_i) \sim \mathbb{P}({\bf{X}},y), \forall i=1,...,N \\ ({\bf{X}}_i,y_i) \text{ independent of } ({\bf{X}}_j,y_j), \forall i \ne j …

3
ช่วยพัฒนาสมอง: ความยาวที่คาดหวังของลำดับ iid ที่เพิ่มขึ้นแบบซ้ำซากคืออะไรเมื่อดึงจากการแจกแจงแบบ [0,1]
นี่เป็นคำถามที่สัมภาษณ์สำหรับตำแหน่งนักวิเคราะห์เชิงปริมาณรายงานที่นี่ สมมติว่าเราวาดจากการแจกแจงแบบสม่ำเสมอและการจับสลากคือ iid ความยาวที่คาดหวังของการแจกแจงแบบซ้ำซ้อนเพิ่มขึ้นคือเท่าใด? คือเราหยุดการวาดถ้าการดึงปัจจุบันมีขนาดเล็กกว่าหรือเท่ากับการวาดก่อนหน้า[0,1][0,1][0,1] ฉันได้รับสองสามครั้งแรก: \ Pr (\ text {length} = 2) = \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_0 ^ {x_2} \ mathrm {d} x_3 \, \ mathrm {d} x_2 \, \ mathrm {d} x_1 = 1/3 \ Pr (\ text {length} = 3) …

1
คุณสมบัติของ PCA สำหรับการสังเกต
เรามักจะใช้ PCA เป็นเทคนิคการลดขนาดสำหรับข้อมูลที่กรณีจะถือว่าเป็น iid คำถาม:อะไรคือความแตกต่างทั่วไปในการใช้ PCA สำหรับข้อมูลที่ขึ้นกับข้อมูลที่ไม่ใช่ของ iid คุณสมบัติที่ดี / มีประโยชน์ของ PCA ที่เก็บไว้สำหรับข้อมูล iid นั้นถูกบุกรุก (หรือสูญหายทั้งหมด)? ตัวอย่างเช่นข้อมูลอาจเป็นอนุกรมเวลาหลายตัวแปรในกรณีที่ autocorrelation หรือ autorgressive heteroskedasticity ตามเงื่อนไข (ARCH) สามารถคาดหวังได้ มีคำถามที่เกี่ยวข้องหลายประการเกี่ยวกับการใช้ PCA กับข้อมูลอนุกรมเวลาซึ่งเคยมีการถามมาก่อนเช่น1 , 2 , 3 , 4แต่ฉันกำลังมองหาคำตอบทั่วไปและครอบคลุมมากขึ้น แก้ไข:ตามที่บันทึกไว้โดย @ttnphns ตัว PCA เองไม่ใช่การวิเคราะห์เชิงอนุมาน อย่างไรก็ตามหนึ่งอาจสนใจในการวางนัยทั่วไปของ PCA คือการเน้นไปที่ประชากรของ PCA ตัวอย่าง เช่นเขียนในNadler (2008) : สมมติว่าข้อมูลที่ได้รับเป็นตัวอย่าง จำกัด และสุ่มจากการแจกแจง (โดยทั่วไปไม่ทราบ) …

2
มีข้อสมมติฐานเกี่ยวกับการถดถอยโลจิสติกหรือไม่
มีข้อสันนิษฐานเกี่ยวกับตัวแปรตอบสนองของการถดถอยโลจิสติก ตัวอย่างเช่นสมมติว่าเรามีจุดข้อมูลจุด ดูเหมือนว่าการตอบสนองY ฉันมาจากการกระจาย Bernoulli กับหน้าฉัน = logit ( β 0 + β 1 x ฉัน ) ดังนั้นเราจึงควรมี1,000กระจาย Bernoulli กับพารามิเตอร์ที่แตกต่างกันP100010001000YiYiY_ipi=logit(β0+β1xi)pi=logit(β0+β1xi)p_i=\text{logit}(\beta_0+\beta_1 x_i)100010001000ppp ดังนั้นพวกเขาจึงเป็น "อิสระ" แต่ไม่ได้ "เหมือนกัน" ฉันถูกไหม? PS ฉันเรียนรู้การถดถอยแบบลอจิสติกจากวรรณกรรม "การเรียนรู้ของเครื่อง" ซึ่งเราทำหน้าที่ของวัตถุประสงค์ให้เหมาะสมและตรวจสอบว่ามันดีในการทดสอบข้อมูลโดยไม่พูดถึงสมมติฐานมากเกินไปหรือไม่ คำถามของฉันเริ่มต้นด้วยโพสต์นี้ทำความเข้าใจกับฟังก์ชั่นการเชื่อมโยงในโมเดลเชิงเส้นทั่วไปที่ฉันพยายามเรียนรู้เพิ่มเติมเกี่ยวกับสมมติฐานทางสถิติ

4
คำพ้องความหมาย“ ตัวอย่างสุ่ม” และ“ ตัวแปรสุ่ม iid” หรือไม่
ฉันได้รับความยากลำบากในการทำความเข้าใจความหมายของ "ตัวอย่างแบบสุ่ม" เช่นเดียวกับ "ตัวแปรแบบสุ่มของ iid" ฉันพยายามหาความหมายจากหลาย ๆ แหล่ง แต่สับสนมากขึ้นเรื่อย ๆ ฉันโพสต์ที่นี่สิ่งที่ฉันพยายามและได้รู้: ความน่าจะเป็นและสถิติของ Degroot บอกว่า: ตัวอย่างสุ่ม / IID / ตัวอย่างขนาด: พิจารณากระจายความน่าจะได้รับในบรรทัดจริงที่สามารถแสดงโดยทั้ง PF หรือไฟล์ PDF ฉได้มีการกล่าวกันว่าตัวแปรสุ่มรูปแบบตัวอย่างที่สุ่มจากการกระจายนี้ถ้าตัวแปรสุ่มเหล่านี้มีความเป็นอิสระและ PF ร่อแร่หรือ PDF ของแต่ละของพวกเขาคือฉตัวแปรสุ่มดังกล่าวถูกกล่าวถึงว่ามีความเป็นอิสระและมีการกระจายเหมือนกันโดยย่อ iid เราอ้างถึงหมายเลข n ของตัวแปรสุ่มเป็นขนาดตัวอย่างn X 1 , . . , X n ffffnnnX1,...,XnX1,...,XnX_1 , . . . , X_nfฉf แต่หนึ่งในหนังสือสถิติอื่น ๆ ที่ฉันได้พูดไป: …

2
ทดสอบการสุ่มตัวอย่าง IID
คุณจะทดสอบหรือตรวจสอบว่าการสุ่มตัวอย่างเป็น IID (เป็นอิสระและกระจายตัวเหมือนกัน) โปรดทราบว่าฉันไม่ได้หมายถึง Gaussian และการกระจายแบบเหมือนจริงเพียง IID และความคิดที่อยู่ในใจของฉันคือการแบ่งตัวอย่างซ้ำ ๆ เป็นสองตัวอย่างย่อยที่มีขนาดเท่ากันทำการทดสอบ Kolmogorov-Smirnov และตรวจสอบว่าการกระจายตัวของค่า p มีค่าเท่ากันหรือไม่ ความคิดเห็นใด ๆ เกี่ยวกับวิธีการนั้นและข้อเสนอแนะใด ๆ ยินดีต้อนรับ ความชัดเจนหลังจากเริ่มรับรางวัล: ฉันกำลังมองหาการทดสอบทั่วไปที่สามารถนำไปใช้กับข้อมูลอนุกรมที่ไม่ใช่เวลา

3
เหตุใดจึงถูกต้องเพื่อทำให้เสียเวลาอนุกรมด้วยการถดถอย
มันอาจเป็นคำถามแปลก ๆ เลย แต่ในฐานะที่เป็นสามเณรในเรื่องที่ฉันสงสัยว่าทำไมเราถึงใช้การถดถอยเพื่อทำให้เป็นอนุกรมเวลาถ้าหนึ่งในสมมติฐานของการถดถอยคือข้อมูลที่ควรใช้ในขณะที่ข้อมูลที่ใช้ในการถดถอยนั้น ไม่ใช่ id

1
วิธีการหนึ่งที่แสดงให้เห็นว่าไม่มีความเป็นกลาง estimator ของ
สมมติว่าเป็นตัวแปรสุ่ม IID ที่เป็นไปตามการกระจาย Poisson ที่มีค่าเฉลี่ย\ฉันจะพิสูจน์ได้อย่างไรว่าไม่มีตัวประมาณปริมาณไม่ λ 1X0, X1, … , XnX0,X1,…,Xn X_{0},X_{1},\ldots,X_{n} λλ \lambda 1λ1λ \dfrac{1}{\lambda}

1
ค่าที่คาดหวังของตัวแปรสุ่ม iid
ฉันมาข้ามมานี้ซึ่งผมไม่เข้าใจ: ถ้าX1, X2, . . . , XnX1,X2,...,XnX_1, X_2, ..., X_nเป็นตัวอย่างแบบสุ่มขนาด n นำมาจากประชากรของค่าเฉลี่ยμμ\muและความแปรปรวนσ2σ2\sigma^2จากนั้น X¯= ( X1+ X2+ . . . + Xn) / nX¯=(X1+X2+...+Xn)/n\bar{X} = (X_1 + X_2 + ... + X_n)/n E( X¯) = E( X1+ X2+ . . . + Xn) / n = ( 1 / n …

4
สมมติว่าเป็นตัวแปรสุ่มของ iid ลำดับใดที่คาดว่าจะลดลงเป็นครั้งแรก
ตามที่แนะนำในชื่อ สมมติว่าอย่างต่อเนื่องตัวแปรสุ่ม IID กับไฟล์ PDF ฉพิจารณาเหตุการณ์ที่ ,ดังนั้นคือเมื่อลำดับลดลงเป็นครั้งแรก แล้วค่าของคืออะไร?X1,X2,…,XnX1,X2,…,XnX_1, X_2, \dotsc, X_nfffX1≤X2…≤XN−1>XNX1≤X2…≤XN−1>XNX_1 \leq X_2 \dotsc \leq X_{N-1} > X_NN≥2N≥2N \geq 2NNNE[N]E[N]E[N] ฉันพยายามประเมินก่อน ฉันมี ในทำนองเดียวกันผมได้{8} เมื่อมีขนาดใหญ่การคำนวณจะซับซ้อนมากขึ้นและฉันไม่สามารถหารูปแบบได้ ใครช่วยแนะนำฉันควรดำเนินการต่อP[N=i]P[N=i]P[N = i]P[N=2]P[N=3]=∫∞−∞f(x)F(x)dx=F(x)22|∞−∞=12=∫∞−∞f(x)∫∞xf(y)F(y)dydx=∫∞−∞f(x)1−F(x)22dx=F(x)−F(x)3/32|∞−∞=13P[N=2]=∫−∞∞f(x)F(x)dx=F(x)22|−∞∞=12P[N=3]=∫−∞∞f(x)∫x∞f(y)F(y)dydx=∫−∞∞f(x)1−F(x)22dx=F(x)−F(x)3/32|−∞∞=13\begin{align*} P[N = 2] & = \int_{-\infty}^{\infty} f(x)F(x)dx \\ & = \frac{F(x)^2}{2}\Large|_{-\infty}^{\infty} \\ & = \frac{1}{2} \\ P[N = 3] & = \int_{-\infty}^{\infty} f(x)\int_x^{\infty}f(y)F(y)dydx …

2
PDF ที่เหมือนกันของความแตกต่างของสอง rv
เป็นไปได้ไหมที่จะมี PDF ของความแตกต่างของรูปลักษณ์ของ iid rv สองอันที่เป็นรูปสี่เหลี่ยมผืนผ้า (แทนที่จะบอกว่าสามเหลี่ยมที่เราได้รับถ้า rv ถูกนำมาจากการแจกแจงแบบเดียวกัน) เช่นเป็นไปได้หรือไม่ที่ PDF f ของ jk (สำหรับสอง iid rv ที่นำมาจากการแจกแจงบางส่วน) ให้มี f (x) = 0.5 สำหรับ -1 ทั้งหมด <<<1? ไม่มีข้อ จำกัด ในการแจกแจงที่เราใช้ j และ k ยกเว้นว่าค่าต่ำสุดคือ -1 และค่าสูงสุดคือ 1 หลังจากการทดลองฉันคิดว่ามันอาจเป็นไปไม่ได้
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.