คำถามติดแท็ก estimation

แท็กนี้กว้างเกินไป โปรดระบุแท็กที่เฉพาะเจาะจงมากขึ้น สำหรับคำถามเกี่ยวกับคุณสมบัติของตัวประมาณค่าเฉพาะให้ใช้แท็ก [estimators] แทน

3
การประมาณพารามิเตอร์ของการแจกแจงแบบสม่ำเสมอ: ไม่เหมาะสมมาก่อน
เรามีตัวอย่าง Nจากการแจกแจงแบบสม่ำเสมอโดยที่ไม่ทราบประมาณจากข้อมูลXiXiX_i[0,θ][0,θ][0,\theta]θθ\thetaθθ\theta ดังนั้นกฎของเบย์ ... f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)f(\theta | {X_i}) = \frac{f({X_i}|\theta)f(\theta)}{f({X_i})} และโอกาสก็คือ: f(Xi|θ)=∏Ni=11θf(Xi|θ)=∏i=1N1θf({X_i}|\theta) = \prod_{i=1}^N \frac{1}{\theta} (แก้ไข: เมื่อ0≤Xi≤θ0≤Xi≤θ0 \le X_i \le \thetaสำหรับiทั้งหมดiiiและ 0 เป็นอย่างอื่น - ขอบคุณ whuber) แต่ไม่มีข้อมูลอื่น ๆ เกี่ยวกับθθ\thetaดูเหมือนว่าก่อนหน้านี้ควรมีสัดส่วน111 (เช่นรูปแบบเดียวกัน) หรือ1L1L\frac{1}{L} (Jeffreys ก่อนหน้า?) ใน[0,∞][0,∞][0,\infty]แต่อินทิกรัลของฉันไม่ มาบรรจบกันและฉันไม่แน่ใจว่าจะดำเนินการอย่างไร ความคิดใด ๆ


2
เราสามารถปฏิเสธสมมติฐานว่างที่มีช่วงความมั่นใจที่เกิดจากการสุ่มตัวอย่างมากกว่าสมมติฐานว่างได้หรือไม่?
ฉันได้รับการสอนว่าเราสามารถสร้างการประมาณค่าพารามิเตอร์ในรูปแบบของช่วงความมั่นใจหลังจากการสุ่มตัวอย่างจากประชากร ตัวอย่างเช่นช่วงความเชื่อมั่น 95% ที่ไม่มีการละเมิดสมมติฐานควรมีอัตราความสำเร็จ 95% ของการบรรจุสิ่งที่พารามิเตอร์จริงที่เราประเมินอยู่ในประชากร กล่าวคือ สร้างการประมาณจุดจากตัวอย่าง สร้างช่วงของค่าที่ในทางทฤษฎีมีโอกาส 95% ในการเก็บค่าจริงที่เราพยายามประเมิน อย่างไรก็ตามเมื่อหัวข้อได้เปลี่ยนเป็นการทดสอบสมมติฐานขั้นตอนต่าง ๆ ได้อธิบายไว้ดังต่อไปนี้: สมมติว่าพารามิเตอร์บางตัวเป็นสมมติฐานว่าง สร้างการแจกแจงความน่าจะเป็นของความน่าจะเป็นที่จะได้รับการประเมินจุดต่าง ๆ เนื่องจากสมมติฐานว่างนี้เป็นจริง ปฏิเสธสมมติฐานว่างถ้าจุดประเมินที่เราได้รับนั้นจะเกิดขึ้นน้อยกว่า 5% ของเวลาถ้าสมมุติฐานว่างเป็นจริง คำถามของฉันคือ: จำเป็นหรือไม่ที่จะต้องสร้างช่วงความเชื่อมั่นของเราโดยใช้สมมติฐานว่างเพื่อปฏิเสธค่าว่าง? ทำไมไม่เพียงแค่ทำขั้นตอนแรกและรับค่าประมาณของพารามิเตอร์จริง (ไม่ได้ใช้ค่าที่เราตั้งสมมติฐานไว้ในการคำนวณช่วงความเชื่อมั่น) แล้วปฏิเสธสมมติฐานว่างถ้ามันไม่ได้อยู่ในช่วงนี้? ดูเหมือนว่าจะมีเหตุผลเทียบเท่ากับฉันอย่างสังหรณ์ใจ แต่ฉันกลัวว่าฉันขาดอะไรบางอย่างที่เป็นพื้นฐานเพราะอาจมีเหตุผลที่สอนวิธีนี้

2
ย้อนกลับปัญหาวันเกิดที่มีการชนกันหลายครั้ง
สมมติว่าคุณมีปีเอเลี่ยนที่มีความยาวไม่ทราบเอ็นถ้าคุณมีตัวอย่างแบบสุ่มของเอเลี่ยนที่กล่าวมาและบางส่วนแบ่งวันเกิดคุณสามารถใช้ข้อมูลนี้เพื่อประเมินความยาวของปีได้หรือไม่? ตัวอย่างเช่นในตัวอย่าง 100 คุณอาจมีสองสาม (เช่นวันเกิดสองวันที่แต่ละแบ่งปันโดยมนุษย์ต่างดาวสามคน) และห้าคู่และแปดสิบสี่ตันเดี่ยว ในการประมาณ N ต่ำสุดที่แน่นอนคือ 91 และสูงสุดไม่ จำกัด แต่ฉันจะหาค่าที่คาดหวังที่เหมาะสมได้อย่างไร สมมติฐานรวมถึงสิ่งต่าง ๆ เช่น "วันเกิดทั้งหมดมีโอกาสเท่ากัน" ต่างจากคำถามอื่นที่ตอบไว้ที่นี่มีการชนกันในห้อง ปีใดที่ยาวนานพอจะมีความเป็นไปได้สูงที่จะไม่มีการชนกันของห้องมนุษย์ต่างดาว แต่ปีที่ยาวมาก ๆ จะมีอัตราต่อรองที่ต่ำเมื่อเกิดการชนใด ๆ และปีสั้น ๆ จะมีอัตราต่อรองที่ต่ำของการชนกันเล็กน้อยดังนั้นจึงจัดให้มีช่วง

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
ตัวประมาณค่าแบบเป็นกลางของพารามิเตอร์ปัวซอง
จำนวนอุบัติเหตุต่อวันคือตัวแปรแบบสุ่มของปัวซองด้วยพารามิเตอร์ใน 10 วันที่เลือกแบบสุ่มจำนวนการเกิดอุบัติเหตุถูกสังเกตว่าเป็น 1,0,1,1,2,0,2,0,2,0,0,1 อะไรจะเกิดขึ้น เป็นผู้ประมาณค่าที่เป็นกลางของหรือไม่λλ\lambdaeλeλe^{\lambda} ผมพยายามที่จะพยายามในลักษณะนี้: เรารู้ว่าแต่แลมบ์ดา} ถ้าเช่นนั้นจะใช้ตัวประมาณค่าที่เป็นกลางE(x¯)=λ=0.8E(x¯)=λ=0.8E(\bar{x})=\lambda=0.8E(ex¯)≠ eλE(ex¯)≠ eλE(e^{\bar{x}})\neq\ e^{\lambda}

2
การเปรียบเทียบระหว่างตัวประมาณ Bayes
พิจารณาการสูญเสียกำลังสองด้วยก่อนรับที่2) ปล่อยให้ โอกาส ค้นหาประมาณเบส์\L(θ,δ)=(θ−δ)2L(θ,δ)=(θ−δ)2L(\theta,\delta)=(\theta-\delta)^2π(θ)π(θ)\pi(\theta)π(θ)∼U(0,1/2)π(θ)∼U(0,1/2)\pi(\theta)\sim U(0,1/2)f(x|θ)=θxθ−1I[0,1](x),θ>0f(x|θ)=θxθ−1I[0,1](x),θ>0f(x|\theta)=\theta x^{\theta-1}\mathbb{I}_{[0,1]}(x), \theta>0δπδπ\delta^\pi พิจารณาการสูญเสียกำลังสองน้ำหนัก โดยที่ กับก่อน theta) ปล่อยให้เป็นโอกาส ค้นหาประมาณเบส์\Lw(θ,δ)=w(θ)(θ−δ)2Lw(θ,δ)=w(θ)(θ−δ)2L_w(\theta,\delta)=w(\theta)(\theta-\delta)^2w(θ)=I(−∞,1/2)w(θ)=I(−∞,1/2)w(\theta)=\mathbb{I}_{(-\infty,1/2)}π1(θ)=I[0,1](θ)π1(θ)=I[0,1](θ)\pi_1(\theta)=\mathbb{I}_{[0,1]}(\theta)f(x|θ)=θxθ−1I[0,1](x),θ>0f(x|θ)=θxθ−1I[0,1](x),θ>0f(x|\theta)=\theta x^{\theta-1}\mathbb{I}_{[0,1]}(x), \theta>0δπ1δ1π\delta^\pi_1 เปรียบเทียบและδπδπ\delta^\piδπ1δ1π\delta^\pi_1 ครั้งแรกที่ฉันสังเกตเห็นว่าและฉันคิดว่านั่นเป็นโอกาสที่มิฉะนั้นฉันจะไม่ได้รับหลังแล้ว ดังนั้นตัวประมาณค่า Bayes ที่เกี่ยวกับการสูญเสียกำลังสองคือ f(x|θ)∼Beta(θ,1)f(x|θ)∼Beta(θ,1)f(x|\theta)\sim Beta(\theta,1)π(θ|x)∝f(x|θ)π(θ)=θxθ−1I[0,1]∗2I(0,1/2)(θ)∼Beta(θ,1)π(θ|x)∝f(x|θ)π(θ)=θxθ−1I[0,1]∗2I(0,1/2)(θ)∼Beta(θ,1)\pi(\theta|x)\propto f(x|\theta)\pi(\theta)=\theta x^{\theta-1}\mathbb{I}_{[0,1]}*2\mathbb{I}_{(0,1/2)}(\theta)\sim Beta(\theta,1)E[π(θ|x)]=θθ+1E[π(θ|x)]=θθ+1\mathbb{E}[\pi(\theta|x)]=\frac{\theta}{\theta+1} ฉันกำลังดูในหนังสือThe Bayesian Choiceและมีทฤษฎีบทเกี่ยวกับตัวประมาณค่า Bayes ที่เกี่ยวข้องกับการสูญเสียกำลังสองและมันถูกกำหนดโดย δπ(x)=Eπ[w(θ)θ|x]Eπ[w(θ)|x]δπ(x)=Eπ[w(θ)θ|x]Eπ[w(θ)|x]\delta^\pi(x)=\frac{\mathbb{E}^\pi[w(\theta)\theta|x]}{\mathbb{E}^\pi[w(\theta)|x]} บางคนสามารถอธิบายให้ฉันคำนวณได้อย่างไร สิ่งที่ฉันพยายามคือ: δπ(x)=∫θw(θ)f(x|θ)π(θ)dθ∫w(θ)f(x|θ)π(θ)dθ∫f(x|θ)π(θ)dθ∫w(θ)f(xθ)π(θ)dθδπ(x)=∫θw(θ)f(x|θ)π(θ)dθ∫w(θ)f(x|θ)π(θ)dθ∫f(x|θ)π(θ)dθ∫w(θ)f(xθ)π(θ)dθ\delta^\pi(x)=\frac{\frac{\int \theta w(\theta)f(x|\theta)\pi(\theta)d\theta}{\int w(\theta)f(x|\theta)\pi(\theta)d\theta}}{\frac{\int f(x|\theta)\pi(\theta)d\theta}{\int w(\theta)f(x\theta)\pi(\theta)d\theta}} ฉันรู้ว่าการสนับสนุนคือแต่เมื่อฉันพยายามรวมเข้ากับตัวเศษ[0,12][0,12][0,\frac{1}{2}] ∫θw(θ)f(x|θ)π(θ)dθ=∫120θθxθ−1dθ=1x∫120θ2xθdθ∫θw(θ)f(x|θ)π(θ)dθ=∫012θθxθ−1dθ=1x∫012θ2xθdθ\int \theta w(\theta)f(x|\theta)\pi(\theta)d\theta=\int_0^\frac{1}{2}\theta\theta x^{\theta-1}d\theta=\frac{1}{x}\int_0^\frac{1}{2}\theta^2 x^\theta d\theta ฉันไม่ได้ผลลัพธ์ที่ดี

3
ประเมินมวลผลไม้ในถุงจากผลรวมที่เกี่ยวข้องเท่านั้นหรือไม่
อาจารย์ที่มหาวิทยาลัยของฉันตั้งคำถามเช่นนี้ (ไม่ใช่เพื่อทำการบ้านเนื่องจากชั้นเรียนจบแล้วและฉันไม่ได้อยู่ในนั้น) ฉันไม่สามารถหาวิธีเข้าหามันได้ คำถามเกี่ยวกับถุง 2 ใบที่บรรจุผลไม้หลากหลายประเภท: ถุงใบแรกมีผลไม้ที่เลือกแบบสุ่มดังต่อไปนี้: + ------------- + -------- + + --------- | เส้นผ่าศูนย์กลางซม มวล g | เน่าเสีย? | + ------------- + -------- + + --------- | 17.28 | 139.08 | 0 | | 6.57 | 91.48 | 1 | | 7.12 | 74.23 | 1 | | …

4
วิธีสุ่มตัวอย่างเมื่อคุณไม่รู้การกระจาย
ฉันค่อนข้างใหม่กับสถิติ (หยิบของหลักสูตร Uni ระดับเริ่มต้น) และสงสัยเกี่ยวกับการสุ่มตัวอย่างจากการแจกแจงที่ไม่รู้จัก โดยเฉพาะถ้าคุณไม่มีความคิดเกี่ยวกับการแจกแจงพื้นฐานมีวิธีใดที่จะ "รับประกัน" ว่าคุณได้รับตัวอย่างตัวแทนหรือไม่? ตัวอย่างเพื่ออธิบาย: สมมติว่าคุณพยายามเข้าใจการกระจายความมั่งคั่งทั่วโลก สำหรับบุคคลใดก็ตามคุณสามารถค้นหาความมั่งคั่งที่แน่นอนของพวกเขา; แต่คุณไม่สามารถ "ตัวอย่าง" ทุกคนบนโลกนี้ได้ สมมุติว่าคุณสุ่มตัวอย่าง n = 1,000 คนโดยการสุ่ม หากตัวอย่างของคุณไม่รวม Bill Gates คุณอาจคิดว่าไม่มีเศรษฐีพันล้านคน หากคุณมีตัวอย่างรวมถึง Bill Gates คุณอาจคิดว่าเศรษฐีมีเงินมากกว่าที่เป็นอยู่จริง ไม่ว่าในกรณีใดคุณไม่สามารถบอกได้ว่าเศรษฐีทั่วไปหรือหายากเป็นอย่างไร คุณอาจไม่สามารถบอกได้ว่ามีอยู่จริงหรือไม่ มีกลไกการสุ่มตัวอย่างที่ดีกว่าสำหรับกรณีเช่นนี้หรือไม่? คุณจะบอกขั้นตอนเบื้องต้นในการใช้ตัวอย่าง (และจำเป็นต้องมีตัวอย่างจำนวนเท่าใด) ฉันคิดว่าคุณอาจจะต้อง "สุ่มตัวอย่าง" เปอร์เซ็นต์ของประชากรจำนวนมากที่จะรู้ว่ามีอะไรเข้าใกล้ความเชื่อมั่นที่สมเหตุสมผลว่าเศรษฐีทั่วไปหรือหายากอยู่บนโลกและสิ่งนี้เกิดจากการกระจายตัวของพื้นฐานค่อนข้างยาก ที่จะทำงานกับ

1
การประมาณจำนวนลูกโดยการเลือกลูกและทำเครื่องหมายอย่างต่อเนื่อง
ให้บอกว่าฉันมีลูกเอ็นในถุง ในการวาดครั้งแรกของฉันฉันทำเครื่องหมายลูกและแทนที่ในถุง ในการจับครั้งที่สองของฉันหากฉันหยิบลูกบอลที่ทำเครื่องหมายไว้ฉันจะคืนมันลงในกระเป๋า อย่างไรก็ตามหากฉันรับลูกบอลที่ไม่มีการทำเครื่องหมายฉันจะทำเครื่องหมายและส่งกลับไปยังกระเป๋า ฉันทำสิ่งนี้ต่อไปเสมอ จำนวนที่คาดหวังของลูกในถุงที่ได้รับจำนวนการดึงและประวัติของการทำเครื่องหมาย / ไม่ถูกทำเครื่องหมายคืออะไร?

2
การประมาณค่าพารามิเตอร์ด้วยโมเดลเชิงเส้นทั่วไป
โดยค่าเริ่มต้นเมื่อเราใช้glmฟังก์ชั่นใน R มันจะใช้วิธีการวนซ้ำน้อยที่สุดอย่างน้อยสี่เหลี่ยม (IWLS) เพื่อหาโอกาสในการประมาณค่าพารามิเตอร์สูงสุด ตอนนี้ฉันมีสองคำถาม การประมาณค่าของ IWLS รับประกันว่าจะมีฟังก์ชั่นโอกาสสูงสุดในระดับโลก ฉันคิดว่ามันไม่ได้ขึ้นอยู่กับสไลด์สุดท้ายในงานนำเสนอนี้ ! ฉันแค่ต้องการทำให้แน่ใจว่า เราสามารถพูดได้ว่าเหตุผลของคำถามที่ 1 ข้างต้นนั้นเป็นเพราะความจริงที่ว่าวิธีการหาค่าเหมาะที่สุดเชิงตัวเลขเกือบทั้งหมดอาจติดอยู่ที่ค่าสูงสุดในท้องถิ่นมากกว่าค่าสูงสุดทั่วโลก

1
การประมาณความน่าจะเป็นสูงสุดมีการกระจายตัวแบบประมาณโดยประมาณอย่างไร
ฉันได้อ่านเกี่ยวกับ MLE เป็นวิธีการสร้างการกระจายที่เหมาะสม ฉันเจอข้อความที่บอกว่าการประมาณการความเป็นไปได้สูงสุด "มีการแจกแจงแบบปกติโดยประมาณ" นี่หมายความว่าถ้าฉันใช้ MLE ซ้ำหลายครั้งกับข้อมูลของฉันและตระกูลการแจกแจงที่ฉันพยายามจะพอดีโมเดลที่ฉันได้รับจะกระจายตามปกติหรือไม่ ลำดับการแจกแจงมีการกระจายอย่างไร

2
เครื่องแบบก่อนหน้านำไปสู่การประมาณการเดียวกันจากโอกาสสูงสุดและโหมดหลังได้อย่างไร?
ฉันกำลังศึกษาวิธีการประมาณค่าแบบจุดต่าง ๆ และอ่านว่าเมื่อใช้การประมาณค่า MAP กับ ML เมื่อเราใช้ "ชุดรูปแบบก่อนหน้า" ค่าประมาณจะเท่ากัน ใครสามารถอธิบายสิ่งที่ "เหมือนกัน" ก่อนหน้านี้และให้ตัวอย่าง (ง่าย) บางอย่างของเมื่อ MAP และ ML ประมาณจะเหมือนกัน?

1
R-square ที่ปรับปรุงแล้วพยายามหาค่าคะแนนคงที่หรือสุ่มคะแนนประชากร r-squared หรือไม่?
ประชากร r-squareสามารถกำหนดสมมติว่าเป็นคะแนนคงที่หรือคะแนนสุ่ม:ρ2ρ2\rho^2 คะแนนคงที่: ขนาดตัวอย่างและค่าเฉพาะของตัวทำนายจะได้รับการแก้ไข ดังนั้นคือสัดส่วนของความแปรปรวนที่อธิบายในผลลัพธ์โดยสมการการถดถอยของประชากรเมื่อค่าของตัวทำนายคงที่ρ2ฉρฉ2\rho^2_f คะแนนสุ่ม: ค่าเฉพาะของผู้ทำนายนั้นมาจากการแจกแจง ดังนั้นหมายถึงสัดส่วนของความแปรปรวนที่อธิบายในผลลัพธ์ในประชากรที่ค่าของตัวทำนายนั้นสอดคล้องกับการกระจายตัวของประชากรของตัวทำนายρ2RρR2\rho^2_r ผมเคยถามไว้ก่อนหน้านี้เกี่ยวกับการไม่ว่าจะเป็นความแตกต่างนี้ทำให้แตกต่างกันมากการประมาณการของρ2ρ2\rho^2 2 ฉันยังเคยถามทั่วไปเกี่ยวกับวิธีการคำนวณประมาณการเป็นกลางของ ρ2ρ2\rho^2 2 ฉันเห็นได้ว่าเมื่อขนาดตัวอย่างเพิ่มความแตกต่างระหว่างคะแนนคงที่และคะแนนสุ่มก็สำคัญน้อยลง แต่ฉันพยายามที่จะยืนยันว่าการปรับถูกออกแบบมาเพื่อประเมินคะแนนคงที่หรือคะแนนสุ่ม 2R2R2R^2ρ2ρ2\rho^2 คำถาม มีการปรับ เพื่อประเมินคะแนนคงที่หรือคะแนนสุ่มหรือไม่R2R2R^2ρ2ρ2\rho^2 มีคำอธิบายหลักการว่าสูตรสำหรับการปรับ r-square นั้นเกี่ยวข้องกับรูปแบบใดรูปแบบหนึ่งหรือไม่?ρ2ρ2\rho^2 เบื้องหลังความสับสนของฉัน เมื่อฉันอ่าน Yin และ Fan (2001, p.206) พวกเขาเขียน: หนึ่งในข้อสมมติฐานพื้นฐานของตัวแบบการถดถอยพหุคูณก็คือค่าของตัวแปรอิสระเป็นค่าคงที่ที่รู้จักกันและได้รับการแก้ไขโดยนักวิจัยก่อนการทดลอง เฉพาะตัวแปรที่ขึ้นต่อกันเท่านั้นที่มีอิสระในการเปลี่ยนแปลงจากกลุ่มตัวอย่างเป็นกลุ่มตัวอย่าง ตัวแบบการถดถอยที่เรียกว่ารูปแบบการถดถอยเชิงเส้นคงที่ อย่างไรก็ตามในสังคมศาสตร์และพฤติกรรมศาสตร์ค่าของตัวแปรอิสระไม่ค่อยได้รับการแก้ไขโดยนักวิจัยและยังมีข้อผิดพลาดแบบสุ่ม ดังนั้นรูปแบบการถดถอยครั้งที่สองสำหรับแอปพลิเคชันได้รับการแนะนำซึ่งทั้งสองตัวแปรขึ้นอยู่กับและเป็นอิสระได้รับอนุญาตให้แตกต่างกัน (Binder, 1959; Park & ​​Dudycha, 1974) โมเดลนั้นเรียกว่าโมเดลแบบสุ่ม (หรือโมเดลการแก้ไข) แม้ว่าการประมาณค่าความน่าจะเป็นสูงสุดของสัมประสิทธิ์การถดถอยที่ได้จากแบบจำลองแบบสุ่มและแบบคงที่จะเหมือนกันภายใต้สมมติฐานเชิงบรรทัดฐานการแจกแจงของพวกมันนั้นแตกต่างกันมาก แบบจำลองแบบสุ่มนั้นซับซ้อนมากซึ่งจำเป็นต้องทำการวิจัยเพิ่มเติมก่อนจึงจะสามารถใช้แทนแบบจำลองการถดถอยเชิงเส้นคงที่ที่ใช้กันทั่วไป ดังนั้นรูปแบบคงที่จึงมักจะใช้ แม้ในกรณีที่สมมติฐานไม่สมบูรณ์ (Claudy, 1978) แอ็พพลิเคชันของโมเดลการถดถอยแบบคงที่ที่มีการละเมิดสมมติฐานจะทำให้ …

2
การประเมินค่าเฉลี่ยที่แข็งแกร่งด้วย O (1) การปรับปรุงประสิทธิภาพ
ฉันกำลังมองหาการประมาณการที่มีประสิทธิภาพของค่าเฉลี่ยที่มีคุณสมบัติเฉพาะ ฉันมีชุดขององค์ประกอบที่ฉันต้องการคำนวณสถิตินี้ จากนั้นฉันเพิ่มองค์ประกอบใหม่ทีละรายการและสำหรับองค์ประกอบเพิ่มเติมแต่ละรายการที่ฉันต้องการคำนวณสถิติใหม่ (หรือที่เรียกว่าอัลกอริทึมออนไลน์) ฉันต้องการให้การคำนวณการอัปเดตนี้เป็นไปอย่างรวดเร็วโดยเฉพาะอย่างยิ่ง O (1) นั่นคือไม่ขึ้นอยู่กับขนาดของรายการ ค่าเฉลี่ยปกติมีคุณสมบัตินี้ซึ่งสามารถอัปเดตได้อย่างมีประสิทธิภาพ แต่ไม่ทนทานต่อค่าผิดปกติ ตัวประมาณค่าเฉลี่ยที่แข็งแกร่งของค่าเฉลี่ยเช่นค่าเฉลี่ยระหว่างควอไทล์และค่าเฉลี่ยที่ตัดแต่งไม่สามารถอัปเดตได้อย่างมีประสิทธิภาพ (เนื่องจากต้องการการรักษารายการที่เรียงลำดับ) ฉันขอขอบคุณข้อเสนอแนะสำหรับสถิติที่มีประสิทธิภาพซึ่งสามารถคำนวณ / อัปเดตได้อย่างมีประสิทธิภาพ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.