คำถามติดแท็ก sufficient-statistics

สถิติที่เพียงพอคือฟังก์ชันมิติข้อมูลที่ต่ำกว่าซึ่งมีข้อมูลที่เกี่ยวข้องทั้งหมดเกี่ยวกับพารามิเตอร์บางตัวในตัวเอง

1
เมื่อใดหากเคยเป็นค่ามัธยฐานของสถิติสถิติที่เพียงพอหรือไม่
ฉันพบข้อสังเกตเกี่ยวกับสถิติทางเคมีว่าค่ามัธยฐานตัวอย่างมักจะเป็นทางเลือกสำหรับสถิติที่เพียงพอ แต่นอกเหนือจากกรณีที่เห็นได้ชัดจากการสังเกตเพียงหนึ่งหรือสองครั้งซึ่งมันเท่ากับค่าเฉลี่ยตัวอย่างฉันไม่สามารถคิดถึงสิ่งอื่น ๆ กรณีที่ค่ามัธยฐานตัวอย่างเพียงพอ

1
สถิติเพียงพอปัญหาเฉพาะ / ปรีชาญาณ
ฉันสอนตัวเองสถิติบางอย่างเพื่อความสนุกสนานและฉันมีความสับสนบางอย่างเกี่ยวกับสถิติที่เพียงพอ ฉันจะเขียนความสับสนในรูปแบบรายการ: หากการจัดจำหน่ายที่มีพารามิเตอร์แล้วมันจะมีnสถิติเพียงพอ?nnnnnn มีการติดต่อโดยตรงใด ๆ ระหว่างสถิติที่เพียงพอและพารามิเตอร์หรือไม่? หรือทำสถิติที่เพียงพอเพียงทำหน้าที่เป็นแหล่งรวมของ "ข้อมูล" เพื่อให้เราสามารถสร้างการตั้งค่าใหม่เพื่อให้เราสามารถคำนวณค่าประมาณเดียวกันสำหรับพารามิเตอร์ของการแจกแจงต้นแบบ การแจกแจงทั้งหมดมีสถิติเพียงพอหรือไม่ กล่าวคือ ทฤษฎีการแยกตัวประกอบสามารถล้มเหลวได้หรือไม่? การใช้ตัวอย่างข้อมูลของเราเราถือว่าการแจกแจงว่าข้อมูลน่าจะมาจากและสามารถคำนวณการประมาณ (เช่น MLE) สำหรับพารามิเตอร์สำหรับการแจกแจง สถิติที่เพียงพอก็เป็นวิธีที่สามารถคำนวณค่าประมาณเดียวกันสำหรับพารามิเตอร์โดยไม่ต้องพึ่งพาข้อมูลเองใช่ไหม ชุดของสถิติที่เพียงพอทั้งหมดจะมีสถิติที่น้อยที่สุดหรือไม่ นี่คือเนื้อหาที่ฉันใช้เพื่อพยายามทำความเข้าใจกับหัวข้อ: https://onlinecourses.science.psu.edu/stat414/node/283 จากสิ่งที่ฉันเข้าใจว่าเรามีทฤษฎีการแยกตัวประกอบที่แยกการกระจายตัวของข้อต่อออกเป็นสองหน้าที่ แต่ฉันไม่เข้าใจว่าเราสามารถแยกสถิติที่เพียงพอได้อย่างไรหลังจากแยกตัวประกอบการกระจายออกเป็นฟังก์ชันของเรา คำถามปัวซองที่ให้ไว้ในตัวอย่างนี้มีการแยกตัวประกอบที่ชัดเจน แต่แล้วมันก็ระบุว่าสถิติที่เพียงพอคือค่าเฉลี่ยตัวอย่างและผลรวมตัวอย่าง เรารู้ได้อย่างไรว่าสิ่งเหล่านั้นเป็นสถิติที่เพียงพอเพียงแค่ดูที่รูปแบบของสมการแรก มันเป็นวิธีการที่เป็นไปได้ที่จะดำเนินการ MLE เดียวกันประมาณการโดยใช้สถิติเพียงพอถ้าสมการที่สองของผลตีนเป็ดบางครั้งจะขึ้นอยู่กับค่าของข้อมูลXiXiX_iเอง? ตัวอย่างเช่นในกรณีปัวซองฟังก์ชันที่สองขึ้นอยู่กับการผกผันของผลคูณของแฟคทอเรียลของข้อมูลและเราจะไม่มีข้อมูลอีกต่อไป! ทำไมจะขนาดตัวอย่างไม่เป็นสถิติที่เพียงพอในความสัมพันธ์กับตัวอย่าง Poisson บนหน้าเว็บ ? เราต้องการให้nสร้างบางส่วนของฟังก์ชั่นแรกอีกครั้งดังนั้นทำไมมันถึงมีสถิติไม่เพียงพอเช่นกัน?nnnnnn

3
เหตุใดสถิติที่เพียงพอจึงมีข้อมูลทั้งหมดที่จำเป็นในการคำนวณค่าประมาณของพารามิเตอร์
ฉันเพิ่งเริ่มเรียนสถิติและไม่สามารถเข้าใจความพอเพียงได้ เพื่อให้แม่นยำยิ่งขึ้นฉันไม่เข้าใจวิธีแสดงให้เห็นว่าสองย่อหน้าต่อไปนี้เทียบเท่ากัน: โดยประมาณให้ชุด X ของข้อมูลกระจายแบบอิสระที่เหมือนกันซึ่งมีเงื่อนไขในพารามิเตอร์ที่ไม่รู้จัก stat สถิติที่เพียงพอคือฟังก์ชัน T (X) ซึ่งมีค่าประกอบด้วยข้อมูลทั้งหมดที่จำเป็นในการคำนวณการประมาณค่าพารามิเตอร์ใด ๆ สถิติ T (X) เพียงพอสำหรับพารามิเตอร์พื้นฐานθอย่างแม่นยำหากการแจกแจงความน่าจะเป็นแบบมีเงื่อนไขของข้อมูล X, เมื่อได้รับสถิติ T (X) ไม่ได้ขึ้นอยู่กับพารามิเตอร์θ (ฉันใช้คำพูดจากสถิติที่เพียงพอ ) แม้ว่าฉันจะเข้าใจข้อความที่สองและฉันสามารถใช้ทฤษฎีบทการแยกตัวประกอบเพื่อแสดงว่าสถิติที่กำหนดนั้นเพียงพอ แต่ฉันไม่สามารถเข้าใจได้ว่าทำไมสถิติที่มีคุณสมบัติเช่นนี้มีคุณสมบัติที่มัน "มีข้อมูลทั้งหมดที่จำเป็นในการคำนวณใด ๆ การประมาณของพารามิเตอร์ " ฉันไม่ได้มองหาหลักฐานที่เป็นทางการซึ่งจะช่วยแก้ไขความเข้าใจของฉันต่อไป ในการสรุปคำถามของฉันคือ: ทำไมทั้งสองข้อความจึงเทียบเท่ากัน? ใครสามารถให้คำอธิบายที่เข้าใจง่ายเพื่อความเท่าเทียมของพวกเขา

1
GAM กับ LOESS และ splines
บริบท : ผมอยากจะวาดเส้นใน scatterplot ที่ไม่ปรากฏพาราดังนั้นฉันใช้geom_smooth()ในในggplot Rมันจะส่งคืนโดยอัตโนมัติที่geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method.ฉันรวบรวม GAM มาสำหรับโมเดลเสริมทั่วไปและใช้ลูกบาศก์อิสระ การรับรู้ต่อไปนี้ถูกต้องหรือไม่ ดินเหลืองคาดการณ์การตอบสนองที่ค่าเฉพาะ เส้นโค้งเป็นการประมาณที่เชื่อมต่อฟังก์ชั่นที่แตกต่างกันที่เหมาะสมกับข้อมูล (ซึ่งประกอบเป็นแบบจำลองการเติมทั่วไป) และลูกบาศก์ Splines เป็นประเภทของเส้นโค้งที่ใช้เฉพาะที่นี่ ในที่สุดควรใช้ splines เมื่อใดควรใช้ LOESS เมื่อใด

1
สถิติที่เพียงพอต่อความสำเร็จร่วมกัน: เครื่องแบบ (a, b)
Letเป็นตัวอย่างที่สุ่มจากการกระจายชุดบนที่&lt;bให้และเป็นสถิติการสั่งซื้อที่ใหญ่ที่สุดและเล็กที่สุด แสดงให้เห็นว่าสถิติเป็นสถิติที่เพียงพอสมบูรณ์ร่วมกันสำหรับพารามิเตอร์B) X=(x1,x2,…xn)X=(x1,x2,…xn)\mathbf{X}= (x_1, x_2, \dots x_n)(a,b)(a,b)(a,b)a&lt;ba&lt;ba < bY1Y1Y_1YnYnY_n(Y1,Yn)(Y1,Yn)(Y_1, Y_n)θ=(a,b)θ=(a,b)\theta = (a, b) ไม่มีปัญหาสำหรับฉันที่จะแสดงความพอเพียงโดยใช้การแยกตัวประกอบ คำถาม:ฉันจะแสดงความสมบูรณ์ได้อย่างไร โดยเฉพาะอย่างยิ่งฉันต้องการคำใบ้ ความพยายาม:ฉันสามารถแสดงหมายถึงสำหรับการแจกชุดพารามิเตอร์แบบเดียว แต่ฉันติดอยู่กับการแจกชุดพารามิเตอร์ทั้งสองE[g(T(x))]=0E[g(T(x))]=0\mathbb E[g(T(x))] = 0g(T(x))=0g(T(x))=0g(T(x)) = 0 ฉันลองเล่นกับและใช้การกระจายแบบร่วมของและแต่ฉันไม่แน่ใจว่าถ้าฉันไปในทิศทางที่ถูกต้องเนื่องจากแคลคูลัสกำลังทำให้ฉันสะดุดE[g(Y1,Yn)]E[g(Y1,Yn)]\mathbb E[g(Y_1, Y_n)]Y1Y1Y_1YnYnY_n

1
ค่าเฉลี่ยและความแปรปรวนมีอยู่เสมอสำหรับการแจกแจงแบบครอบครัวชี้แจงหรือไม่?
สมมติว่าตัวแปรสเกลาร์แบบสุ่มเป็นของตระกูลเอ็กซ์โพเนนเชียลที่มีพารามิเตอร์แบบเวกเตอร์พร้อม pdfXXX fX(x|θ)=h(x)exp(∑i=1sηi(θ)Ti(x)−A(θ))fX(x|θ)=h(x)exp⁡(∑i=1sηi(θ)Ti(x)−A(θ)) f_X(x|\boldsymbol \theta) = h(x) \exp\left(\sum_{i=1}^s \eta_i({\boldsymbol \theta}) T_i(x) - A({\boldsymbol \theta}) \right) โดยที่θ=(θ1,θ2,⋯,θs)Tθ=(θ1,θ2,⋯,θs)T{\boldsymbol \theta} = \left(\theta_1, \theta_2, \cdots, \theta_s \right )^Tเป็นเวกเตอร์พารามิเตอร์และT(x)=(T1(x),T2(x),⋯,Ts(x))TT(x)=(T1(x),T2(x),⋯,Ts(x))T\mathbf{T}(x)= \left(T_1(x), T_2(x), \cdots,T_s(x) \right)^Tเป็นสถิติที่เพียงพอร่วม สามารถแสดงให้เห็นว่าค่าเฉลี่ยและความแปรปรวนสำหรับแต่ละTi(x)Ti(x)T_i(x)มีอยู่ อย่างไรก็ตามค่าเฉลี่ยและความแปรปรวนสำหรับXXX (เช่นE(X)E(X)E(X)และVar(X)Var(X)Var(X) ) มีอยู่เสมอเช่นกัน? ถ้าไม่มีมีตัวอย่างของการแจกแจงแบบครอบครัวแทนของรูปแบบนี้ซึ่งไม่มีค่าเฉลี่ยและตัวแปรอยู่หรือไม่? ขอบคุณ.

2
วิธีแก้ปัญหารถถังเยอรมัน
มีข้อพิสูจน์ทางคณิตศาสตร์อย่างเป็นทางการหรือไม่ว่าวิธีแก้ปัญหาของปัญหารถถังเยอรมันนั้นเป็นฟังก์ชั่นเฉพาะพารามิเตอร์k (จำนวนตัวอย่างที่สังเกต) และm (ค่าสูงสุดระหว่างตัวอย่างที่สังเกต) กล่าวอีกนัยหนึ่งสามารถพิสูจน์ได้ว่าวิธีแก้ปัญหาเป็นอิสระจากค่าตัวอย่างอื่นนอกเหนือจากค่าสูงสุดหรือไม่

1
ค้นหา MVUE ที่ไม่เหมือนใคร
คำถามนี้มาจากปัญหาเบื้องต้นทางคณิตศาสตร์รุ่นที่ 6 ของ Robert Hogg 7.4.9 ที่หน้า 388 Let X1,...,XnX1,...,XnX_1,...,X_nจะ IID กับไฟล์ PDF f(x;θ)=1/3θ,−θ&lt;x&lt;2θ,f(x;θ)=1/3θ,−θ&lt;x&lt;2θ,f(x;\theta)=1/3\theta,-\theta0 0 (ก) การค้นหา MLE θของθθ^θ^\hat{\theta}θθ\theta (ข) คือθสถิติเพียงพอสำหรับθ ? ทำไมθ^θ^\hat{\theta}θθ\theta (ค) คือ(n+1)θ^/n(n+1)θ^/n(n+1)\hat{\theta}/n MVUE เอกลักษณ์ของθθ\theta ? ทำไม ฉันคิดว่าฉันสามารถแก้ไข (a) และ (b) ได้ แต่ฉันสับสนโดย (c) สำหรับ): Let Y1&lt;Y2&lt;...YnY1&lt;Y2&lt;...YnY_10, เราจะเห็นอนุพันธ์นี้เป็นลบ, ดังนั้นฟังก์ชันความน่าจะเป็นจึงลดลงL(θ;x)L(θ;x)L(\theta;x) จากและปีn &lt; 2 θ ) , ⇒ ( θ …

1
บทพิสูจน์ทฤษฎีบทพิตแมน –Koopman – Darmois
ฉันจะหาบทพิสูจน์ของทฤษฎีบท Pitman – Koopman – Darmois ได้ที่ไหน ฉัน googled บางครั้ง น่าแปลกที่โน้ตจำนวนมากพูดถึงทฤษฎีบทนี้ แต่ก็ไม่มีใครแสดงหลักฐาน

1
ความพอเพียงหรือไม่เพียงพอ
พิจารณาตัวอย่างที่สุ่มที่มี IID ตัวแปรสุ่มที่(0,1) ตรวจสอบว่า เป็นสถิติที่เพียงพอสำหรับหรือไม่{X1,X2,X3}{X1,X2,X3}\{X_1,X_2,X_3\}XiXiX_iBernoulli(p)Bernoulli(p)Bernoulli(p)p∈(0,1)p∈(0,1)p\in(0,1)T(X)=X1+2X2+X3T(X)=X1+2X2+X3T(X)=X_1+2X_2+X_3ppp ประการแรกเราจะหาการกระจายสำหรับอย่างไร หรือมันควรจะถูกแยกย่อยเป็นแล้วสิ่งนี้จะติดตามหรือไม่ ฉันคิดว่าไม่ใช่เพราะทราบว่าตัวแปรทั้งหมดไม่ได้เป็นอิสระที่นี่(X1+2X2+X3)(X1+2X2+X3)(X_1+2X_2+X_3)X1+X2+X2+X3X1+X2+X2+X3X_1+X_2+X_2+X_3Bin(4,p)Bin(4,p)Bin(4,p) อีกทางหนึ่งถ้าฉันใช้เงื่อนไขการแยกตัวประกอบโดยเพียงพิจารณา PMF ร่วมของดังนั้นโดยที่(x)(X1,X2,X3)(X1,X2,X3)(X_1,X_2,X_3)f(X1,X2,X3)=px1+x2+x3(1−p)3−(x1+x2+x3)=[pt(x)(1−p)3−t(x)]p−x2(1−p)x2f(X1,X2,X3)=px1+x2+x3(1−p)3−(x1+x2+x3)=[pt(x)(1−p)3−t(x)]p−x2(1−p)x2f(X_1,X_2,X_3)=p^{x_1+x_2+x_3}(1-p)^{3-(x_1+x_2+x_3)}=[p^{t(x)}(1-p)^{3-t(x)}]p^{-x_2}(1-p)^{x_2}t(x)=x1+2x2+x3t(x)=x1+2x2+x3t(x)=x_1+2x_2+x_3 นี่แสดงว่าไม่เพียงพอTTT แต่ถ้าฉันต้องการทำตามคำจำกัดความและต้องการใช้เพื่อตรวจสอบว่าอัตราส่วนนี้เป็นอิสระจากหรือไม่ แล้วฉันจะต้องรู้ว่าการกระจายของกรัมแล้วอะไรคือการกระจายตัวของ ?f(X|p)g(T(X)|p)f(X|p)g(T(X)|p)\dfrac{f(X|p)}{g(T(X)|p)}pppgggT(X)=X1+2X2+X3T(X)=X1+2X2+X3T(X)=X_1+2X_2+X_3

1
ครอบครัวเอ็กซ์โพเนนเชียล: พบกับสถิติที่เพียงพอที่คาดหวัง
คำถามของฉันเกิดขึ้นจากการอ่านการอ่านของ Minka "การประมาณการแจกแจงดีริชเลต์"ซึ่งระบุสิ่งต่อไปนี้โดยไม่มีข้อพิสูจน์ในบริบทของการหาตัวประมาณความน่าจะเป็นสูงสุดสำหรับการแจกแจงไดริชเล็ตจากการสังเกตเวกเตอร์สุ่ม เช่นเดียวกับตระกูลเอ็กซ์โพเนนเชียลเมื่อการไล่ระดับสีเป็นศูนย์สถิติเพียงพอที่คาดหวังจะเท่ากับสถิติที่เพียงพอที่สังเกตได้ ฉันไม่เห็นการประเมินความเป็นไปได้สูงสุดในตระกูลเอ็กซ์โปเนนเชียลที่นำเสนอด้วยวิธีนี้และฉันไม่พบคำอธิบายที่เหมาะสมในการค้นหาของฉัน ใครบางคนสามารถให้ข้อมูลเชิงลึกเกี่ยวกับความสัมพันธ์ระหว่างสถิติที่สังเกตและคาดว่าเพียงพอและอาจช่วยให้เข้าใจการประมาณค่าความน่าจะเป็นสูงสุดในการลดความแตกต่างได้

2
ความพอเพียงแบบเบย์เกี่ยวข้องกับความพอเพียงของผู้ถี่บ่อยอย่างไร
ความหมายที่ง่ายที่สุดของสถิติที่เพียงพอในมุมมอง frequentist จะได้รับที่นี่ในวิกิพีเดีย อย่างไรก็ตามเมื่อเร็ว ๆ นี้ฉันเจอหนังสือ Bayesian พร้อมคำจำกัดความP( θ | x , t ) = P( θ | t )P(θ|x,t)=P(θ|t)P(\theta|x,t)=P(\theta|t). มันระบุไว้ในลิงค์ว่าทั้งสองจะเท่ากัน แต่ฉันไม่เห็นว่า นอกจากนี้ในหน้าเดียวกันนั้นในส่วน«ประเภทอื่น ๆ ของความพอเพียง»มันระบุไว้ว่าคำจำกัดความทั้งสองนั้นไม่เท่ากันในช่องว่างมิติ ... นอกจากนี้ความพอเพียงเชิงทำนายยังเกี่ยวข้องกับความพอเพียงแบบดั้งเดิมอย่างไร
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.