คำถามติดแท็ก unbiased-estimator

อ้างถึงตัวประมาณของพารามิเตอร์ประชากรที่ "เข้าถึงค่าจริง" โดยเฉลี่ย นั่นคือฟังก์ชั่นของข้อมูลที่สังเกตได้θ^ เป็นตัวประมาณของพารามิเตอร์แบบไม่เอนเอียง θ ถ้า E(θ^)=θ. ตัวอย่างที่ง่ายที่สุดของตัวประมาณค่าที่เป็นกลางคือค่าเฉลี่ยตัวอย่างเป็นตัวประมาณค่าเฉลี่ยของประชากร

2
ตัวแบบสำหรับการประมาณความหนาแน่นของประชากร
ฐานข้อมูลของ (ประชากรพื้นที่รูปร่าง) สามารถใช้ในการทำแผนที่ความหนาแน่นของประชากรโดยกำหนดค่าคงที่ของประชากร / พื้นที่ให้กับแต่ละรูปร่าง อย่างไรก็ตามประชากรมักไม่กระจายอย่างสม่ำเสมอภายในรูปหลายเหลี่ยม การทำแผนที่ Dasymetricเป็นกระบวนการของการปรับการประเมินความหนาแน่นเหล่านี้โดยใช้ข้อมูลเสริม มันเป็นปัญหาที่สำคัญในสังคมศาสตร์ตามที่รีวิวล่าสุดระบุ สมมติว่าเรามีแผนที่เสริมของที่ดินปกคลุม (หรือปัจจัยอื่นใดที่ไม่ต่อเนื่อง) ในกรณีที่ง่ายที่สุดเราสามารถใช้พื้นที่ที่ไม่สามารถอยู่อาศัยได้อย่างเห็นได้ชัดเช่นแหล่งน้ำเพื่อแยกแยะว่าประชากรไม่ได้อยู่ที่ใดและกำหนดประชากรทั้งหมดให้กับพื้นที่ที่เหลือ โดยทั่วไปแต่ละหน่วยสำรวจสำมะโนประชากรของจะแกะสลักเป็นkส่วนมีพื้นที่ผิวx J ฉัน , ฉัน= 1 , 2 , ... , k ชุดข้อมูลของเราจะถูกเพิ่มเข้าไปในรายการของ tuplesJjjkkkxJ ฉันxjix_{ji}i = 1 , 2 , … , ki=1,2,…,ki = 1, 2, \ldots, k ( yJ, xj 1, xj 2, … , xj k)(yj,xj1,xj2,…,xjk)(y_{j}, …

3
OLS เป็นสีฟ้า แต่ถ้าฉันไม่สนใจเรื่องความเป็นกลางและความเป็นเส้นตรงล่ะ?
ทฤษฎีบทเกาส์ - มาร์คอฟบอกเราว่าตัวประมาณ OLS เป็นตัวประมาณค่าแบบไม่เอนเอียงเชิงเส้นที่ดีที่สุดสำหรับตัวแบบการถดถอยเชิงเส้น แต่สมมติว่าฉันไม่สนใจเรื่องความเป็นเส้นตรงและความเป็นกลาง จากนั้นมีการประมาณค่าอื่น ๆ (แบบไม่เชิงเส้น / ลำเอียง) สำหรับตัวแบบการถดถอยเชิงเส้นซึ่งมีประสิทธิภาพมากที่สุดภายใต้สมมติฐาน Gauss-Markov หรือสมมติฐานทั่วไปอื่น ๆ แน่นอนว่ามีหนึ่งผลลัพธ์มาตรฐาน: OLS เป็นตัวประมาณค่าที่ดีที่สุดหากนอกเหนือไปจากสมมติฐาน Gauss-Markov เรายังสันนิษฐานว่าข้อผิดพลาดนั้นมักจะกระจายออกไป สำหรับการแจกแจงข้อผิดพลาดเฉพาะอื่น ๆ ฉันสามารถคำนวณตัวประมาณโอกาสสูงสุดที่สอดคล้องกันได้ แต่ฉันสงสัยว่ามีตัวประมาณซึ่งดีกว่า OLS ในบางสถานการณ์ที่ค่อนข้างทั่วไปหรือไม่?

4
เข้าใจง่ายถึงความแตกต่างระหว่างความสอดคล้องและไม่เอนเอียง
ฉันพยายามที่จะเข้าใจและรู้สึกถึงความแตกต่างและความแตกต่างระหว่างคำที่สอดคล้องและไม่เอนเอียง ฉันรู้ว่าคำจำกัดความทางคณิตศาสตร์ / สถิติของพวกเขา แต่ฉันกำลังมองหาบางอย่างที่ใช้งานง่าย สำหรับฉันการดูคำจำกัดความของแต่ละคนพวกเขาเกือบจะเหมือนกัน ฉันตระหนักถึงความแตกต่างจะต้องบอบบาง แต่ฉันไม่เห็นมัน ฉันพยายามนึกภาพความแตกต่าง แต่ทำไม่ได้ ใครช่วยได้บ้าง

1
ตัวประมาณแบบเอนเอียงสำหรับการถดถอยบรรลุผลลัพธ์ที่ดีกว่าแบบไม่เอนเอียงในแบบจำลองข้อผิดพลาดในตัวแปร
ฉันกำลังทำงานกับข้อมูล syntatic สำหรับข้อผิดพลาดในตัวแปรแบบจำลองสำหรับการวิจัยบางอย่าง ขณะนี้ฉันมีตัวแปรอิสระเดี่ยวและฉันคาดว่าฉันรู้ถึงความแปรปรวนสำหรับมูลค่าที่แท้จริงของตัวแปรตาม ดังนั้นด้วยข้อมูลนี้ฉันสามารถบรรลุตัวประมาณค่าแบบไม่เอนเอียงสำหรับค่าสัมประสิทธิ์ของตัวแปรตาม นางแบบ: โดยที่: สำหรับบางx~= x + e1x~=x+e1\tilde{x} = x + e_1 e 1 ~ N ( 0 , σ 2 ) σ e 2 ~ N ( 0 , 1 )Y= 0.5 x - 10 + e2y=0.5x−10+e2y = 0.5x -10 + e_2 อี1~ N( 0 , …

1
วิธีการหนึ่งที่แสดงให้เห็นว่าไม่มีความเป็นกลาง estimator ของ
สมมติว่าเป็นตัวแปรสุ่ม IID ที่เป็นไปตามการกระจาย Poisson ที่มีค่าเฉลี่ย\ฉันจะพิสูจน์ได้อย่างไรว่าไม่มีตัวประมาณปริมาณไม่ λ 1X0, X1, … , XnX0,X1,…,Xn X_{0},X_{1},\ldots,X_{n} λλ \lambda 1λ1λ \dfrac{1}{\lambda}

4
ตัวประมาณที่ไม่เอนเอียงสำหรับตัวแปรสุ่มสองตัวที่เล็กกว่า
สมมติว่าและY ∼ N ( μ y , σ 2 y )X∼N(μx,σ2x)X∼N(μx,σx2)X \sim \mathcal{N}(\mu_x, \sigma^2_x)Y∼ N( μY, σ2Y)Y∼N(μy,σy2)Y \sim \mathcal{N}(\mu_y, \sigma^2_y) ฉันสนใจในmu_y) มีตัวประมาณค่าที่เป็นกลางสำหรับzหรือไม่zZ= min ( μx, μY)z=min(μx,μy)z = \min(\mu_x, \mu_y)Zzz ตัวประมาณอย่างง่ายของขั้นต่ำ( x¯, y¯)min(x¯,y¯)\min(\bar{x}, \bar{y})โดยที่x¯x¯\bar{x}และY¯y¯\bar{y}เป็นตัวอย่างค่าเฉลี่ยของXXXและYYYตัวอย่างเช่นมีความเอนเอียง (แม้ว่าจะสอดคล้องกัน) มันมีแนวโน้มที่ undershoot ZZzz ฉันไม่สามารถคิดถึงตัวประมาณค่าที่เป็นกลางสำหรับZzzได้ มีอยู่จริงไหม? ขอบคุณสำหรับความช่วยเหลือ

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
ตัวประมาณค่าเป็นกลางของเลขชี้กำลังของการวัดชุด?
สมมติว่าเรามี (ที่วัดได้และเหมาะสมมีความประพฤติดี) ชุดที่มีขนาดกะทัดรัด นอกจากนี้สมมติว่าเราสามารถวาดตัวอย่างจากการกระจายชุดมากกว่า wrt เกอวัดและที่เรารู้ว่าวัด(B) เช่นบางทีBเป็นกล่อง[ - C , C ] nมีSS⊆B⊂RnS⊆B⊂RnS\subseteq B\subset\mathbb R^nBBBBBBλ(⋅)λ(⋅)\lambda(\cdot)λ(B)λ(B)\lambda(B)BBB[−c,c]n[−c,c]n[-c,c]^nSSS สำหรับการแก้ไขα∈Rα∈R\alpha\in\mathbb Rจะมีวิธีการที่เป็นกลางที่เรียบง่ายในการประมาณการe−αλ(S)e−αλ(S)e^{-\alpha \lambda(S)}โดยสม่ำเสมอสุ่มตัวอย่างในจุดBBBและการตรวจสอบหากพวกเขาเป็นภายในหรือภายนอกของSSS ? เป็นตัวอย่างของบางสิ่งบางอย่างที่ไม่ได้ทำงานค่อนข้างสมมติว่าเราตัวอย่างkkkจุดp1,…,pk∼Uniform(B)p1,…,pk∼Uniform(B)p_1,\ldots,p_k\sim\textrm{Uniform}(B) ) แล้วเราสามารถใช้การประมาณการ Monte Carlo λ(S)≈λ^:=#{pi∈S}kλ(B).λ(S)≈λ^:=#{pi∈S}kλ(B).\lambda(S)\approx \hat\lambda:= \frac{\#\{p_i\in S\}}{k}\lambda(B). แต่ในขณะที่ λเป็นประมาณการที่เป็นกลางของλ(S)ผมไม่คิดว่ามันเป็นกรณีที่อี-อัลฟ่า λเป็นประมาณการที่เป็นกลางของอี-อัลฟ่าλ(S) มีวิธีแก้ไขอัลกอริทึมนี้ไหม?λ^λ^\hat\lambdaλ(S)λ(S)\lambda(S)e−αλ^e−αλ^e^{-\alpha\hat\lambda}e−αλ(S)e−αλ(S)e^{-\alpha\lambda(S)}

1
อะไรคือความแตกต่างระหว่างความเป็นกลางและความสอดคล้องของ asymptotic?
แต่ละคนหมายความถึงกันและกันหรือไม่? ถ้าไม่เป็นเช่นนั้น ทำไม / ทำไมไม่ ปัญหานี้ขึ้นมาเพื่อตอบสนองต่อความคิดเห็นในคำตอบที่ผมโพสต์ที่นี่ แม้ว่า google การค้นหาคำที่เกี่ยวข้องไม่ได้ผลิตอะไรที่ดูเหมือนมีประโยชน์เป็นพิเศษ แต่ฉันก็สังเกตเห็นคำตอบในการคำนวณทางคณิตศาสตร์ อย่างไรก็ตามฉันคิดว่าคำถามนี้เหมาะสำหรับไซต์นี้ด้วย แก้ไขหลังจากอ่านความคิดเห็น เทียบกับคำตอบ math.stackexchange ผมหลังจากที่บางสิ่งบางอย่างเพิ่มเติมในเชิงลึกครอบคลุมบางส่วนของปัญหาการจัดการใน@whuber ด้ายความคิดเห็นที่เชื่อมโยง นอกจากนี้ตามที่ฉันเห็นมันคำถาม math.stackexchange แสดงให้เห็นว่าความสอดคล้องไม่ได้หมายความถึงความเป็นกลางทาง asymptotically แต่ไม่ได้อธิบายอะไรมากหากเกิดอะไรขึ้น OP ที่นั่นยังยอมรับว่าความเป็นกลางทางซีมโทติคนั้นไม่ได้บ่งบอกถึงความมั่นคงและดังนั้นผู้ตอบคำถามเพียงคนเดียวไม่ได้อธิบายว่าทำไมถึงเป็นเช่นนี้

2
ตัวประมาณเบย์นั้นมีภูมิคุ้มกันต่อการเลือกอคติ
ตัวประมาณของ Bayes มีภูมิคุ้มกันต่อการเลือกอคติหรือไม่? เอกสารส่วนใหญ่ที่กล่าวถึงการประมาณค่าในมิติที่สูงเช่นข้อมูลลำดับจีโนมทั้งหมดมักจะทำให้เกิดปัญหาอคติในการคัดเลือก ความลำเอียงที่เลือกเกิดขึ้นจากข้อเท็จจริงที่ว่าแม้ว่าเรามีผู้ทำนายที่มีศักยภาพหลายพันคนเท่านั้นที่จะได้รับการคัดเลือกเพียงไม่กี่คนเท่านั้น ดังนั้นกระบวนการจึงมีสองขั้นตอน: (1) เลือกชุดย่อยของตัวทำนาย (2) ทำการอนุมานบนชุดที่เลือกเช่นประมาณอัตราต่อรอง Dawid ในกระดาษที่ขัดกันในปี 1994 ของเขามุ่งเน้นไปที่ตัวประมาณค่าที่เป็นกลางและตัวประมาณ Bayes เขาลดความยุ่งยากของปัญหาในการเลือกเอฟเฟกต์ที่ใหญ่ที่สุดซึ่งอาจเป็นผลการรักษา จากนั้นเขาก็บอกว่าตัวประมาณที่ไม่เอนเอียงได้รับผลกระทบจากอคติการคัดเลือก เขาใช้ตัวอย่าง: สมมติว่า จากนั้นแต่ละอันZi∼N(δi,1),i=1,…,NZi∼N(δi,1),i=1,…,N Z_i\sim N(\delta_i,1),\quad i=1,\ldots,N ZiZiZ_iเป็นกลางสำหรับ\ปล่อย , ตัวประมาณ อย่างไรก็ตามเอนเอียง ( บวก) สำหรับ\ สูงสุด \ {\ delta_1 \ delta_2 \ ldots \ delta_N \} ข้อความนี้สามารถพิสูจน์ได้อย่างง่ายดายด้วยความไม่เท่าเทียมของ Jensen ดังนั้นหากเรารู้ว่าi _ {\ max}ดัชนีของ\ delta_i ที่ใหญ่ที่สุดเราจะใช้Z_ {i …

2
ทำไมความน่าจะเป็นสูงสุดที่ จำกัด จึงให้ผลต่างประมาณที่ดีขึ้น (ไม่เอนเอียง)?
ฉันกำลังอ่านบทความทฤษฎีของ Doug Bates บนแพ็คเกจ lme4 ของ R เพื่อทำความเข้าใจกับ nitty-gritty ของแบบจำลองที่ผสมกันและพบผลลัพธ์ที่น่าสนใจที่ฉันต้องการทำความเข้าใจให้ดีขึ้นเกี่ยวกับการใช้โอกาสสูงสุดแบบ จำกัด (REML) เพื่อประเมินความแปรปรวน . ในมาตรา 3.3 ในเกณฑ์ REML เขากล่าวว่าการใช้ REML ในการประมาณค่าความแปรปรวนเกี่ยวข้องอย่างใกล้ชิดกับการใช้องศาความเป็นอิสระในการแก้ไขเมื่อประเมินความแปรปรวนจากส่วนเบี่ยงเบนที่เหลืออยู่ในตัวแบบเชิงเส้นพอดี โดยเฉพาะอย่างยิ่ง "แม้ว่าโดยปกติจะไม่ได้มาในลักษณะนี้" องศาของการแก้ไขอิสรภาพสามารถทำได้โดยการประเมินความแปรปรวนผ่านการปรับให้เหมาะสมของ "เกณฑ์ REML" (Eq. (28)) เกณฑ์ REML นั้นมีความเป็นไปได้เพียงอย่างเดียว แต่พารามิเตอร์เชิงเส้นพอดีได้ถูกกำจัดโดยการทำให้เป็นขอบ (แทนที่จะตั้งค่าให้เท่ากับการประมาณแบบพอดีซึ่งจะทำให้ความแปรปรวนตัวอย่างแบบเอนเอียง) ฉันทำคณิตศาสตร์และตรวจสอบผลลัพธ์ที่อ้างสิทธิ์สำหรับโมเดลเชิงเส้นอย่างง่ายที่มีเอฟเฟกต์คงที่เท่านั้น สิ่งที่ฉันกำลังดิ้นรนคือการตีความ มีมุมมองบางอย่างที่เป็นธรรมชาติหรือไม่ที่จะได้รับการประมาณค่าความแปรปรวนโดยการปรับความน่าจะเป็นที่พารามิเตอร์ทางพอดีได้ถูกทำให้ลดลง? มันให้ความรู้สึกเหมือนกับ Bayesian ราวกับว่าฉันกำลังคิดถึงโอกาสที่จะเป็นหลังและปรับพารามิเตอร์ที่เหมาะสมเหมือนพวกมันเป็นตัวแปรสุ่ม หรือเหตุผลหลักเกี่ยวกับคณิตศาสตร์เพียงอย่างเดียว - มันทำงานในกรณีเชิงเส้น แต่ยังเป็น generalizable?

2
ตัวประมาณที่ไม่เอนเอียงสำหรับแบบจำลองAR ( )
พิจารณาโมเดลAR ( ) (สมมติว่าค่าเฉลี่ยเป็นศูนย์สำหรับความเรียบง่าย):ppp xt=φ1xt−1+…+φpxt−p+εtxt=φ1xt−1+…+φpxt−p+εt x_t = \varphi_1 x_{t-1} + \dotsc + \varphi_p x_{t-p} + \varepsilon_t OLS ประมาณการ (เทียบเท่ากับเงื่อนไขประมาณการโอกาสสูงสุด) สำหรับเป็นที่รู้จักกันจะลำเอียงตามที่ระบุไว้ในหัวข้อที่ผ่านมาφ:=(φ1,…,φp)φ:=(φ1,…,φp)\mathbf{\varphi} := (\varphi_1,\dotsc,\varphi_p) (อยากรู้อยากเห็นฉันไม่สามารถหาอคติที่กล่าวถึงในแฮมิลตัน"การวิเคราะห์อนุกรมเวลา"หรือในตำราอนุกรมเวลาอื่น ๆ ไม่กี่อย่างไรก็ตามมันสามารถพบได้ในบันทึกการบรรยายต่างๆและบทความทางวิชาการเช่นนี้ ) ผมไม่สามารถที่จะหาไม่ว่าจะเป็นที่แน่นอนประมาณการความน่าจะเป็นสูงสุดของ AR ( ) จะลำเอียงหรือไม่ ดังนั้นคำถามแรกของฉันppp คำถามที่ 1:เป็นที่แน่นอนประมาณการความน่าจะเป็นสูงสุดของ AR ( ) รูปแบบของพารามิเตอร์อัตลำเอียง? (ให้เราสมมติว่ากระบวนการ AR ( ) เป็นแบบนิ่งมิฉะนั้นตัวประมาณจะไม่สอดคล้องกันเนื่องจากมันถูก จำกัด ในภูมิภาคที่อยู่นิ่ง; ดูเช่น"การวิเคราะห์อนุกรมเวลา"แฮมิลตัน, หน้า 123)pppφ1,…,φpφ1,…,φp\varphi_1,\dotsc,\varphi_pppp นอกจากนี้ คำถามที่ …

4
เราจะอธิบายได้อย่างไรว่าตัวประเมินที่ไม่เอนเอียงคืออะไรสำหรับคนธรรมดา?
สมมติว่าเป็นประมาณการที่เป็นกลางสำหรับ\แล้วแน่นอน\ θE[ θ |θ]=θθ^θ^\hat{\theta}θθ\thetaE[θ^∣θ]=θE[θ^∣θ]=θ\mathbb{E}[\hat{\theta} \mid \theta] = \theta เราอธิบายเรื่องนี้กับคนทั่วไปได้อย่างไร? ในอดีตสิ่งที่ฉันพูดคือถ้าคุณเฉลี่ยค่าของเป็นจำนวนมากเมื่อขนาดตัวอย่างใหญ่ขึ้นคุณจะได้ประมาณดีขึ้น θθ^θ^\hat{\theta}θθ\theta สำหรับฉันแล้วนี่เป็นปัญหา ฉันคิดว่าสิ่งที่ฉันอธิบายจริง ๆ นี่คือปรากฏการณ์ของการเป็นแบบไม่ลำเอียงแบบไม่มีสัญญาณแทนที่จะเป็นแบบไม่เอนเอียงคือ ที่\ hat {\ theta}มีแนวโน้มที่จะขึ้นอยู่กับnlimn→∞E[θ^∣θ]=θ,limn→∞E[θ^∣θ]=θ,\lim_{n \to \infty}\mathbb{E}[\hat{\theta} \mid \theta] = \theta\text{,}θ^θ^\hat{\theta}nnn ดังนั้นเราจะอธิบายได้อย่างไรว่าตัวประมาณที่เป็นกลางคืออะไรกับคนธรรมดา?

1
ความแตกต่างของตัวประมาณค่านี้คืออะไร
ฉันต้องการประเมินค่าเฉลี่ยของฟังก์ชัน f เช่น โดยที่และเป็นตัวแปรสุ่มอิสระ ฉันมีตัวอย่างของ f แต่ไม่ใช่ iid: มีตัวอย่าง iid สำหรับและสำหรับแต่ละมีตัวอย่างจาก :EX,Y[f(X,Y)]EX,Y[f(X,Y)]E_{X,Y}[f(X,Y)]XXXYYYY1,Y2,…YnY1,Y2,…YnY_1,Y_2,\dots Y_nYiYiY_ininin_iXXXXi,1,Xi,2,…,Xi,niXi,1,Xi,2,…,Xi,niX_{i,1},X_{i,2},\dots, X_{i,n_i} โดยรวมแล้วฉันมีตัวอย่างf(X1,1,Y1)…f(X1,n1,Y1)…f(Xi,j,Yi)…f(Xn,nn,Yn)f(X1,1,Y1)…f(X1,n1,Y1)…f(Xi,j,Yi)…f(Xn,nn,Yn)f(X_{1,1},Y_1) \dots f(X_{1,n_1},Y_1 ) \dots f(X_{i,j},Y_i) \dots f(X_{n,n_n},Y_n) ในการประมาณค่าเฉลี่ยฉันคำนวณ เห็นได้ชัดว่าดังนั้นคือตัวประมาณที่ไม่เอนเอียง ตอนนี้ฉันสงสัยว่าคือความแปรปรวนของตัวประมาณμ=∑i=1n1/n∗∑j=1nif(Xi,j,Yi)niμ=∑i=1n1/n∗∑j=1nif(Xi,j,Yi)ni\mu=\sum_{i=1}^n 1/n * \sum_{j=1}^{n_i}\frac{ f(X_{i,j},Y_i)}{n_i}EX,Y[μ]=EX,Y[f(X,Y)]EX,Y[μ]=EX,Y[f(X,Y)]E_{X,Y}[\mu]=E_{X,Y}[f(X,Y)]μμ\muVar(μ)Var(μ)Var(\mu) แก้ไข 2: นี่คือความแปรปรวนที่ถูกต้องหรือไม่? มัน ดูเหมือนว่าจะทำงานในขีด จำกัด คือถ้า n = 1 และความแปรปรวนเพียงกลายเป็นความแปรปรวนของค่าเฉลี่ย และถ้าสูตรจะกลายเป็นสูตรมาตรฐานสำหรับความแปรปรวนของตัวประมาณ ถูกต้องหรือไม่ ฉันจะพิสูจน์ได้ว่ามันคืออะไร? Var(μ)=VarY(μi)n+∑i=1nVarX(f(X,Yi)))ni∗n2Var(μ)=VarY(μi)n+∑i=1nVarX(f(X,Yi)))ni∗n2Var(\mu)=\frac{Var_Y(\mu_i)}{n}+\sum_{i=1}^n \frac{Var_X(f(X,Y_i)))}{n_i*n^2}ni=∞ni=∞n_i=\inftyni=1ni=1n_i=1 แก้ไข (ไม่สนใจสิ่งนี้): ดังนั้นฉันคิดว่าฉันมีความคืบหน้า: ให้เรากำหนดซึ่งเป็นตัวประมาณที่ไม่ลำเอียงY_i)]μi=∑nij=1f(Xi,j,Yi)niμi=∑j=1nif(Xi,j,Yi)ni\mu_i=\sum_{j=1}^{n_i}\frac{ f(X_{i,j},Y_i)}{n_i}EX[f(X,Yi)]EX[f(X,Yi)]E_X[f(X,Y_i)] …

2
ตัวประมาณค่าบวกที่ไม่เอนเอียงสำหรับกำลังสองของค่าเฉลี่ย
สมมติว่าเราสามารถเข้าถึงตัวอย่าง iid จากการแจกแจงด้วยค่าเฉลี่ยและความแปรปรวนจริง (ไม่ทราบ) μ ,σ2μ,σ2\mu, \sigma^2และเราต้องการประมาณ μ2μ2\mu^2. เราจะสร้างตัวประมาณค่าที่เป็นกลางและเป็นบวกของปริมาณนี้ได้อย่างไร? การยกกำลังสองของค่าเฉลี่ยตัวอย่าง μ~2μ~2\tilde{\mu}^2มีอคติและจะประเมินค่าสูงไปตามปริมาณ ถ้าμμ\mu ใกล้กับ 0 และ σ2σ2\sigma^2 มีขนาดใหญ่ นี่อาจเป็นคำถามที่ไม่สำคัญ แต่ความสามารถของ Google ทำให้ฉันผิดหวังเมื่อestimator of mean-squaredกลับมาเท่านั้นmean-squarred-error estimators ถ้ามันทำให้เรื่องง่ายขึ้นการแจกแจงแบบพื้นฐานนั้นสามารถสันนิษฐานว่าเป็นแบบเกาส์เซียน สารละลาย: มันเป็นไปได้ที่จะสร้างการประมาณที่เป็นกลาง μ2μ2\mu^2; ดูคำตอบของ knrumsey ไม่สามารถสร้างการประมาณที่เป็นกลางและเป็นบวกได้เสมอ μ2μ2\mu^2เนื่องจากข้อกำหนดเหล่านี้ขัดแย้งกันเมื่อค่าเฉลี่ยที่แท้จริงคือ 0; เห็นคำตอบของวิงก์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.