คำถามติดแท็ก point-estimation

3
ค่า p เป็นค่าประมาณหรือไม่?
เนื่องจากสามารถคำนวณช่วงความเชื่อมั่นสำหรับค่า p และเนื่องจากการประมาณช่วงเวลาตรงข้ามคือการประมาณค่าจุด: ค่า p เป็นค่าประมาณจุดหรือไม่

2
วิธีการหาค่าฟังก์ชันความน่าจะเป็นสำหรับการแจกแจงแบบทวินามสำหรับการประมาณค่าพารามิเตอร์
ตามที่มิลเลอร์และ Freund ของความน่าจะเป็นและสถิติสำหรับวิศวกร 8ED (pp.217-218) ฟังก์ชั่นความเป็นไปได้ที่จะขยายใหญ่สุดสำหรับการกระจายทวินาม (Bernoulli ทดลอง) จะได้รับเป็น L ( p ) = ∏ni = 1พีxผม( 1 - p )1 - xผมL(พี)=Πผม=1nพีxผม(1-พี)1-xผมL(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} จะมาถึงสมการนี้ได้อย่างไร ดูเหมือนว่าฉันจะค่อนข้างชัดเจนเกี่ยวกับดิสทริบิวชันอื่น ๆ ปัวซองและเกาส์; L ( θ ) = ∏ni = 1PDF หรือ PMF ของ distL(θ)=Πผม=1nPDF หรือ PMF ของ distL(\theta) = \prod_{i=1}^n \text{PDF or PMF …

2
หด VS เป็นกลาง : ประมาณของ
ในหัวของฉันมีความสับสนเกี่ยวกับตัวประมาณสองประเภทของค่าประชากรของสัมประสิทธิ์สหสัมพันธ์เพียร์สัน A. ฟิชเชอร์ (2458)แสดงให้เห็นว่าสำหรับประชากรปกติ bivariate เชิงประจักษ์คือตัวเอนเอียงของลำเอียงแม้ว่าอคติจะมีจำนวนมากพอสมควรจริงเพียงเล็กน้อยสำหรับกลุ่มตัวอย่างขนาดเล็ก ( ) ตัวอย่างดูถูกในแง่ที่ว่ามันอยู่ใกล้กับกว่า\(ยกเว้นเมื่อสมัยเป็นหรือสำหรับแล้วเป็นกลาง.) หลายเกือบประมาณเป็นกลางของได้รับการเสนอที่ดีที่สุดคนหนึ่งอาจจะเป็นOlkin และแพรตต์ (1958)ρ n &lt; 30 r ρrrrρρ\rhon&lt;30n&lt;30n<30rrrρρ\rhoρ 0 ± 1 r000ρρ\rho000±1±1\pm 1rrrρρ\rhoแก้ไข :rrr runbiased=r[1+1−r22(n−3)]runbiased=r[1+1−r22(n−3)]r_\text{unbiased} = r \left [1+\frac{1-r^2}{2(n-3)} \right ] B.มีการกล่าวกันว่าในการถดถอยพบว่าประเมินค่าประชากร R-square ที่สอดคล้องกัน หรือมีการถดถอยง่ายๆก็คือว่า overestimates 2 จากข้อเท็จจริงนั้นฉันได้เห็นข้อความมากมายที่บอกว่านั้นมีอคติเชิงบวกเมื่อเทียบกับซึ่งหมายถึงค่าสัมบูรณ์:นั้นไกลจากมากกว่า (นั่นเป็นคำสั่งจริงหรือไม่) ข้อความบอกว่ามันเป็นปัญหาเดียวกันกับการประมาณค่าเกินของค่าเบี่ยงเบนมาตรฐานโดยค่าตัวอย่าง มีหลายสูตรที่จะ "ปรับ" สังเกตใกล้กับพารามิเตอร์ประชากรของ Wherry's (1931)r 2 ρ 2 rR2R2R^2r2r2r^2ρ2ρ2\rho^2rrrr 0 ρ …

2
ทฤษฎีของความแปรปรวนขั้นต่ำการประมาณค่าที่ไม่เอนเอียงในโรงเรียนระดับบัณฑิตศึกษามากเกินไปหรือไม่?
เมื่อเร็ว ๆ นี้ฉันรู้สึกเขินอายมากเมื่อฉันให้คำตอบแบบชกมวยเกี่ยวกับการประมาณค่าความแปรปรวนขั้นต่ำที่ไม่เอนเอียงสำหรับพารามิเตอร์ของการแจกแจงแบบสม่ำเสมอที่ผิดอย่างสมบูรณ์ โชคดีที่ฉันได้รับการแก้ไขได้ทันทีโดยพระคาร์ดินัลและเฮนรี่กับเฮนรี่ให้คำตอบที่ถูกต้องสำหรับสหกรณ์ เรื่องนี้ทำให้ฉันคิดว่า ฉันเรียนรู้ทฤษฎีการประมาณค่าที่ไม่เอนเอียงที่ดีที่สุดในวิชาคณิตศาสตร์ระดับบัณฑิตศึกษาของฉันที่ Stanford เมื่อ 37 ปีก่อน ฉันมีความทรงจำเกี่ยวกับทฤษฎีบท Rao-Blackwell, Cramer - Rao ซึ่งเป็นขอบเขตล่างและทฤษฎีบท Lehmann-Scheffe แต่ในฐานะนักสถิติประยุกต์ฉันไม่ได้คิดถึง UMVUE มากนักในชีวิตประจำวันของฉันในขณะที่การประเมินความเป็นไปได้สูงสุดจะเกิดขึ้นมากมาย ทำไมถึงเป็นอย่างนั้น? เราเน้นทฤษฎี UMVUE มากเกินไปในบัณฑิตวิทยาลัยหรือไม่? ฉันคิดอย่างนั้น ประการแรกความเป็นกลางไม่ได้เป็นคุณสมบัติที่สำคัญ MLE ที่ดีอย่างสมบูรณ์แบบหลายลำเอียง ตัวประมาณการหดตัวของสไตน์นั้นมีอคติ แต่มีอิทธิพลเหนือ MLE ที่เป็นกลางในแง่ของการสูญเสียความคลาดเคลื่อนกำลังสองเฉลี่ย มันเป็นทฤษฎีที่สวยงามมาก (การประมาณค่า UMVUE) แต่ไม่สมบูรณ์มากและฉันคิดว่าไม่มีประโยชน์มาก คนอื่นคิดอย่างไร

2
แยกจุดข้อมูลจากค่าเฉลี่ยเคลื่อนที่หรือไม่
เป็นไปได้หรือไม่ที่จะดึงจุดข้อมูลออกจากข้อมูลเฉลี่ยเคลื่อนที่? กล่าวอีกนัยหนึ่งถ้าชุดข้อมูลมีค่าเฉลี่ยเคลื่อนที่อย่างง่ายจาก 30 คะแนนก่อนหน้าเป็นไปได้หรือไม่ที่จะแยกจุดข้อมูลดั้งเดิมออก ถ้าเป็นเช่นนั้นได้อย่างไร

4
การอนุมานสำหรับตัวอ่านที่สงสัย (แต่ไม่ใช่เชิงคณิตศาสตร์)
ฉันเพิ่งดูการบรรยายเรื่องการอนุมานเชิงสถิติ ("การเปรียบเทียบสัดส่วนและความหมาย") ซึ่งเป็นส่วนหนึ่งของคำแนะนำเกี่ยวกับสถิติหลักสูตรออนไลน์ วัสดุที่ทำให้ฉันรู้สึกเหมือนมันเป็นเรื่องเล็กน้อยเสมอ (โดยตอนนี้ฉันต้องเห็นสิ่งนี้หลายสิบครั้งกระจายออกไปในช่วงสามทศวรรษที่ผ่านมา) ฉันกำลังมองหาหนังสือเกี่ยวกับ "basic Stats-101" (การประมาณจุด, การประเมินแบบประเมิน, การอนุมานเชิงสถิติ, การทดสอบสมมติฐาน, การออกแบบการศึกษา) ที่จริงจังกับปัญหาในการโน้มน้าวผู้อ่านที่สงสัย ... ด้านล่างฉันให้ตัวอย่างของ ประเภทของคำถามที่ผู้เขียนที่ฉันค้นหาจะใช้เวลาอย่างจริงจังและรู้วิธีการพูดอย่างมั่นใจ แต่ก่อนอื่นให้ฉันใช้เวลาสักครู่เพื่อเน้นว่าในโพสต์นี้ฉันไม่ได้ถามคำถามเหล่านี้ ได้โปรดอย่าตอบพวกเขา! ฉันให้พวกเขาเป็นเพียงตัวอย่างและผ่าน "การทดสอบสารสีน้ำเงิน" (สำหรับประเภทของผู้แต่งที่กำลังค้นหา) หาก "สัดส่วน" เป็นเพียงค่าเฉลี่ยของตัวแปรบูลีน (เช่นหนึ่งที่รับเฉพาะค่า 0 และ 1) ทำไมโพรซีเดอร์ที่แตกต่างกันจึงสอนให้ทำการอนุมานเชิงสถิติด้วย "สัดส่วน" และกับ "หมายถึง"? หากการแจกแจงแบบปกตินั้นแข็งแกร่งมากซึ่งสมมติว่า normality ให้ผลลัพธ์ที่ดีแม้ในกรณีที่ข้อมูลนั้นไม่ได้ถูกกระจายตามปกติและหากการแจกแจงแบบปกตินั้นดูธรรมดามากทำไมเอะอะทั้งหมดเกี่ยวกับการใช้การแจกแจงแบบ t แทน ปกติ? สิ่งที่ว่าคือ "องศาความเป็นอิสระ" และทำไมเราต้องกังวลเกี่ยวกับพวกเขา? การพูดถึงค่า "จริง" ของพารามิเตอร์หมายความว่าอย่างไรเมื่อเราเพิ่งใช้การแจกแจงที่เกิดขึ้นเพื่อให้ดูเหมือนกับข้อมูล "การวิเคราะห์ข้อมูลเชิงสำรวจ" ทำไมเป็นสิ่งที่ดีในขณะที่ "การสอดแนมข้อมูล" เป็นสิ่งที่ชั่วร้าย? ดังที่ฉันได้กล่าวไปแล้วฉันถูกเลื่อนออกไปจากทัศนคติที่บอกเป็นนัยจากการละเลยคำถามดังกล่าว …

1
ความพอเพียงหรือไม่เพียงพอ
พิจารณาตัวอย่างที่สุ่มที่มี IID ตัวแปรสุ่มที่(0,1) ตรวจสอบว่า เป็นสถิติที่เพียงพอสำหรับหรือไม่{X1,X2,X3}{X1,X2,X3}\{X_1,X_2,X_3\}XiXiX_iBernoulli(p)Bernoulli(p)Bernoulli(p)p∈(0,1)p∈(0,1)p\in(0,1)T(X)=X1+2X2+X3T(X)=X1+2X2+X3T(X)=X_1+2X_2+X_3ppp ประการแรกเราจะหาการกระจายสำหรับอย่างไร หรือมันควรจะถูกแยกย่อยเป็นแล้วสิ่งนี้จะติดตามหรือไม่ ฉันคิดว่าไม่ใช่เพราะทราบว่าตัวแปรทั้งหมดไม่ได้เป็นอิสระที่นี่(X1+2X2+X3)(X1+2X2+X3)(X_1+2X_2+X_3)X1+X2+X2+X3X1+X2+X2+X3X_1+X_2+X_2+X_3Bin(4,p)Bin(4,p)Bin(4,p) อีกทางหนึ่งถ้าฉันใช้เงื่อนไขการแยกตัวประกอบโดยเพียงพิจารณา PMF ร่วมของดังนั้นโดยที่(x)(X1,X2,X3)(X1,X2,X3)(X_1,X_2,X_3)f(X1,X2,X3)=px1+x2+x3(1−p)3−(x1+x2+x3)=[pt(x)(1−p)3−t(x)]p−x2(1−p)x2f(X1,X2,X3)=px1+x2+x3(1−p)3−(x1+x2+x3)=[pt(x)(1−p)3−t(x)]p−x2(1−p)x2f(X_1,X_2,X_3)=p^{x_1+x_2+x_3}(1-p)^{3-(x_1+x_2+x_3)}=[p^{t(x)}(1-p)^{3-t(x)}]p^{-x_2}(1-p)^{x_2}t(x)=x1+2x2+x3t(x)=x1+2x2+x3t(x)=x_1+2x_2+x_3 นี่แสดงว่าไม่เพียงพอTTT แต่ถ้าฉันต้องการทำตามคำจำกัดความและต้องการใช้เพื่อตรวจสอบว่าอัตราส่วนนี้เป็นอิสระจากหรือไม่ แล้วฉันจะต้องรู้ว่าการกระจายของกรัมแล้วอะไรคือการกระจายตัวของ ?f(X|p)g(T(X)|p)f(X|p)g(T(X)|p)\dfrac{f(X|p)}{g(T(X)|p)}pppgggT(X)=X1+2X2+X3T(X)=X1+2X2+X3T(X)=X_1+2X_2+X_3

3
ตัวประมาณค่า Bayes ต้องการให้พารามิเตอร์จริงเป็นค่าแปรปรวนที่เป็นไปได้ของค่าก่อนหน้าหรือไม่?
นี้อาจจะมีบิตของคำถามปรัชญา แต่ที่นี่เราจะไป: ในทางทฤษฎีการตัดสินใจความเสี่ยงของ Bayes ประมาณการสำหรับมีการกำหนดเกี่ยวกับการกระจายก่อนใน\θ^(x)θ^(x)\hat\theta(x)θ∈Θθ∈Θ\theta\in\Thetaππ\piΘΘ\Theta ทีนี้ในแง่หนึ่งสำหรับความจริงจะสร้างข้อมูล (เช่น "มีอยู่"),จะต้องเป็นตัวแปรที่เป็นไปได้ภายใต้ , เช่นมีความน่าจะเป็นที่ไม่ใช่ศูนย์, ความหนาแน่นไม่เป็นศูนย์ ฯลฯ ; ในทางกลับกัน,ไม่เป็นที่รู้จัก, ดังนั้นการเลือกก่อนหน้า, ดังนั้นเราจึงไม่รับประกันว่าจริงเป็นความแปรปรวนที่เป็นไปได้ภายใต้เราเลือกθθ\thetaθθ\thetaππ\piθθ\thetaθθ\thetaππ\pi ตอนนี้ดูเหมือนว่าเราจะต้องเลือกเพื่อที่จะเป็นรูปแบบที่เป็นไปได้ มิฉะนั้นทฤษฎีบทบางอย่างจะไม่ถือ ตัวอย่างเช่นการประมาณค่าขนาดเล็กที่สุดจะไม่เป็นการประมาณค่าแบบเบย์สำหรับสิ่งที่น่าพอใจน้อยที่สุดก่อนเนื่องจากเราสามารถทำให้ค่านั้นไม่ดีตามอำเภอใจก่อนโดยการยกเว้นพื้นที่ขนาดใหญ่รอบ ๆ และรวมถึงจากโดเมน อย่างไรก็ตามการรับประกันว่านั้นอยู่ในโดเมนนั้นอาจทำได้ยากππ\piθθ\thetaθθ\thetaθθ\theta ดังนั้นคำถามของฉันคือ: โดยทั่วไปแล้วสันนิษฐานว่าแท้จริงคือความแปรปรวนของเป็นไปได้หรือไม่?θθ\thetaππ\pi สามารถรับประกันได้หรือไม่ กรณีที่ละเมิดนี้สามารถตรวจพบได้อย่างน้อยดังนั้นจึงไม่เชื่อในทฤษฎีบทเช่น minimax เมื่อเงื่อนไขไม่ได้ถือ? หากไม่จำเป็นต้องทำทำไมมาตรฐานผลลัพธ์ในทฤษฎีการตัดสินใจจึงเป็นเช่นนั้น?

1
กำหนดจำนวนที่ตั้งที่ไม่รู้จักในโลกแห่งความจริงจากรายงานที่อิงกับ GPS
ผมทำงานเกี่ยวกับซอฟแวร์บางอย่างที่ควรตรวจสอบสถานที่โลกแห่งความจริง (fe กล้องความเร็ว) จากหลายรายงานจีพีเอสตาม ผู้ใช้จะขับรถเมื่อรายงานตำแหน่งดังนั้นรายงานจะไม่ถูกต้องมาก เพื่อแก้ปัญหานั้นฉันต้องจัดกลุ่มรายงานเกี่ยวกับสถานที่เดียวกันและคำนวณค่าเฉลี่ย คำถามของฉันเป็นเรื่องเกี่ยวกับวิธีการจัดกลุ่มรายงานเหล่านั้น ฉันอ่านเกี่ยวกับอัลกอริทึมการคาดหวัง - สูงสุดและการจัดกลุ่ม k-meanแต่เท่าที่ฉันเข้าใจฉันจะต้องกำหนดจำนวนสถานที่จริงล่วงหน้า มีอัลกอริธึมอื่น ๆ ซึ่งไม่ต้องการจำนวนตำแหน่งจริงแน่นอน แต่ใช้เงื่อนไขขอบ (แทนระยะทางน้อยที่สุด) แทน รายงานมีเส้นแวง , ละติจูดและความถูกต้อง (เมตร) ไม่มีชื่อหรือสิ่งอื่นใดที่สามารถใช้เพื่อระบุรายการที่ซ้ำกันได้ อุปสรรคอีกประการหนึ่งอาจเป็นเรื่องธรรมดาที่จะมีเพียงรายงานเดียวสำหรับที่ตั้งจริง ทำให้แยกความแตกต่างค่าผิดพลาดกับข้อมูลที่ดีได้ยาก
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.