คำถามติดแท็ก confidence-interval

ช่วงความมั่นใจคือช่วงเวลาที่ครอบคลุมพารามิเตอร์ที่ไม่รู้จักด้วยความมั่นใจ ช่วงความเชื่อมั่นเป็นแนวคิดที่ใช้บ่อย พวกเขามักจะสับสนกับช่วงเวลาที่น่าเชื่อถือซึ่งเป็นแบบอะนาล็อกเบย์ (1α)%

9
ความแตกต่างระหว่างช่วงความมั่นใจกับช่วงเวลาที่เชื่อถือได้คืออะไร
การแลกเปลี่ยนของ Joris และ Srikant ที่นี่ทำให้ฉันสงสัย (อีกครั้ง) ถ้าคำอธิบายภายในของฉันสำหรับความแตกต่างระหว่างช่วงความมั่นใจและช่วงเวลาที่น่าเชื่อถือนั้นเป็นสิ่งที่ถูกต้อง คุณจะอธิบายความแตกต่างอย่างไร

3
ตัวอย่างอะไรบ้างที่“ ไร้เดียงสา bootstrap” ล้มเหลว?
สมมติว่าฉันมีชุดข้อมูลตัวอย่างจากการแจกแจงที่ไม่รู้จักหรือซับซ้อนและฉันต้องการทำการอนุมานบนสถิติTTTของข้อมูล ความโน้มเอียงเริ่มต้นของฉันเป็นเพียงการสร้างพวงของตัวอย่างบูตด้วยการเปลี่ยนและคำนวณสถิติของฉันTTTในแต่ละตัวอย่างบูตเพื่อสร้างการกระจายประมาณสำหรับTTTT ตัวอย่างอะไรที่นี่เป็นความคิดที่ไม่ดี? ตัวอย่างเช่นกรณีหนึ่งที่การทำบูทสแตรปอย่างไร้เดียงสาจะล้มเหลวคือถ้าฉันพยายามใช้ bootstrap ในข้อมูลอนุกรมเวลา (พูดเพื่อทดสอบว่าฉันมีความสัมพันธ์อัตโนมัติที่สำคัญ) bootstrap ไร้เดียงสาที่อธิบายไว้ข้างต้น (การสร้างชุดข้อมูลที่iiiของชุดตัวอย่าง bootstrap ที่ n โดยการสุ่มตัวอย่างด้วยการแทนที่จากชุดเดิมของฉัน) จะ (ฉันคิดว่า) จะไม่ได้รับคำแนะนำเพราะมันละเว้นโครงสร้างในอนุกรมเวลาเดิมของฉัน รับเทคนิค bootstrap ที่นักเล่นชอบมากเช่น bootstrap บล็อก หากต้องการใช้วิธีอื่น Bootstrap จะมีอะไรอีกนอกเหนือจาก "การสุ่มตัวอย่างด้วยการแทนที่"

9
ช่วงเวลาของความมั่นใจคืออะไร
ฉันรู้ว่าช่วงความมั่นใจคืออะไรและอย่างไม่เป็นทางการ อย่างไรก็ตามฉันไม่สามารถคาดศีรษะรายละเอียดสำคัญ ๆ ไว้ได้: อ้างอิงจาก Wikipedia: ช่วงความเชื่อมั่นไม่ได้คาดการณ์ว่ามูลค่าที่แท้จริงของพารามิเตอร์มีความน่าจะเป็นโดยเฉพาะอย่างยิ่งที่จะอยู่ในช่วงความเชื่อมั่นที่ได้รับข้อมูลจริง ฉันเคยเห็นจุดที่คล้ายกันที่เกิดขึ้นในหลายแห่งบนเว็บไซต์นี้ คำจำกัดความที่ถูกต้องมากขึ้นจาก Wikipedia ก็คือ: หากช่วงความมั่นใจถูกสร้างขึ้นในการวิเคราะห์ข้อมูลที่แยกจากกันหลายครั้งของการทดลองซ้ำ (และอาจแตกต่างกัน) การทดลองสัดส่วนของช่วงเวลาดังกล่าวที่มีค่าจริงของพารามิเตอร์จะตรงกับระดับความเชื่อมั่นโดยประมาณ อีกครั้งฉันได้เห็นจุดที่คล้ายกันที่เกิดขึ้นในหลายแห่งบนเว็บไซต์นี้ ฉันไม่เข้าใจ ถ้าภายใต้การทดลองซ้ำส่วนของช่วงความเชื่อมั่นการคำนวณที่มีความจริงพารามิเตอร์คือแล้วว่าน่าจะเป็นที่สามารถอยู่ในช่วงความเชื่อมั่นคำนวณสำหรับการทดลองที่เกิดขึ้นจริงเป็นอะไรอื่นนอกจาก ? ฉันกำลังมองหาคำตอบต่อไปนี้:( 1 - α ) θ ( 1 - α )θθ\theta(1−α)(1−α)(1 - \alpha)θθ\theta(1−α)(1−α)(1 - \alpha) ชี้แจงความแตกต่างระหว่างคำจำกัดความที่ไม่ถูกต้องและคำนิยามที่ถูกต้องด้านบน คำจำกัดความที่เป็นทางการและแม่นยำของช่วงความมั่นใจที่แสดงให้เห็นอย่างชัดเจนว่าเหตุใดคำจำกัดความแรกจึงไม่ถูกต้อง ตัวอย่างที่ชัดเจนของกรณีที่คำจำกัดความแรกผิดอย่างน่าทึ่งแม้ว่าโมเดลต้นแบบนั้นจะถูกต้อง

6
มีตัวอย่างใดบ้างที่ช่วงเวลาที่น่าเชื่อถือของเบย์นั้นต่ำกว่าช่วงความเชื่อมั่นที่ใช้บ่อย
คำถามล่าสุดเกี่ยวกับความแตกต่างระหว่างความมั่นใจและช่วงเวลาที่น่าเชื่อถือทำให้ฉันเริ่มอ่านบทความของ Edwin Jaynes อีกครั้งในหัวข้อนั้น: Jaynes, ET, 1976 `ช่วงเวลาความเชื่อมั่นกับช่วงเวลาแบบเบย์, 'ในรากฐานของทฤษฎีความน่าจะเป็น, การอนุมานเชิงสถิติและทฤษฎีทางสถิติเชิงวิทยาศาสตร์, WL Harper และ CA Hooker (บรรณาธิการ), D. Reidel, Dordrecht, p. 175; ( pdf ) ในนามธรรม Jaynes เขียน: ... เราแสดงวิธีแก้ปัญหาแบบเบย์และออร์โธด็อกซ์ถึงหกปัญหาทางสถิติทั่วไปที่เกี่ยวข้องกับช่วงความเชื่อมั่น (รวมถึงการทดสอบที่สำคัญตามเหตุผลเดียวกัน) ในทุกกรณีเราพบว่าสถานการณ์นั้นตรงกันข้ามกันเช่นวิธีการแบบเบย์นั้นง่ายต่อการใช้และให้ผลลัพธ์ที่เหมือนกันหรือดีกว่า อันที่จริงผลลัพธ์ออร์โธดอกซ์เป็นที่น่าพอใจก็ต่อเมื่อพวกเขาเห็นด้วยอย่างใกล้ชิดกับผลลัพธ์ของเบย์ ยังไม่มีตัวอย่างที่ตรงกันข้าม (เน้นที่เหมือง) กระดาษถูกตีพิมพ์ในปี 1976 ดังนั้นสิ่งที่อาจจะย้ายไป คำถามของฉันคือมีตัวอย่างที่ช่วงความเชื่อมั่นบ่อยกว่าช่วงที่เชื่อถือได้แบบเบย์อย่างชัดเจน (ตามความท้าทายโดยนัยโดย Jaynes) ตัวอย่างที่ใช้สมมติฐานที่ไม่ถูกต้องก่อนหน้านั้นไม่สามารถยอมรับได้เนื่องจากพวกเขาไม่ได้พูดอะไรเกี่ยวกับความสอดคล้องภายในของวิธีการต่าง ๆ

6
ความแตกต่างระหว่างช่วงความมั่นใจและช่วงการทำนาย
สำหรับช่วงเวลาการคาดการณ์ในการถดถอยเชิงเส้นคุณยังคงใช้เพื่อสร้างช่วงเวลา นอกจากนี้คุณยังใช้วิธีนี้ในการสร้างความเชื่อมั่นของx_0] ความแตกต่างระหว่างสองคืออะไรE[Y| x0]E^[ Y| x]= β0^+ β^1xE^[Y|x]=β0^+β^1x\hat{E}[Y|x] = \hat{\beta_0}+\hat{\beta}_{1}xE[ Y| x0]E[Y|x0]E[Y|x_0]

4
วารสารจิตวิทยาห้ามค่า p และช่วงความเชื่อมั่น; ควรหยุดใช้พวกเขาจริง ๆ หรือ?
25 กุมภาพันธ์ 2015 วารสารจิตวิทยาพื้นฐานและประยุกต์ใช้สังคม ออกบทบรรณาธิการห้าม -values และช่วงความเชื่อมั่นจากเอกสารทั้งหมดในอนาคตppp โดยเฉพาะพวกเขากล่าวว่า (การจัดรูปแบบและเน้นเป็นของฉัน): [... ] ก่อนที่จะตีพิมพ์ผู้เขียนจะต้องลบร่องรอยทั้งหมดของ NHSTP [ขั้นตอนการทดสอบนัยสำคัญสมมติฐานที่ว่างเปล่า] ( -values, t -values, F- Values, แถลงการณ์เกี่ยวกับความแตกต่างของ 'นัยสำคัญ' หรือขาด และอื่น ๆ )ppptttFFF คล้ายกับวิธีที่ NHSTP ไม่สามารถให้ความน่าจะเป็นของสมมติฐานว่างซึ่งเป็นสิ่งจำเป็นในการสร้างกรณีที่แข็งแกร่งสำหรับการปฏิเสธช่วงเวลาความเชื่อมั่นไม่ได้ให้กรณีที่แข็งแกร่งสำหรับการสรุปว่าพารามิเตอร์ประชากรที่น่าสนใจน่าจะอยู่ภายในระยะเวลาที่กำหนด ระยะห่าง ดังนั้นช่วงความเชื่อมั่นจึงถูกแบนจาก BASP [... ] ด้วยความเคารพต่อวิธีการแบบเบส์เราขอสงวนสิทธิ์ในการตัดสินเป็นกรณี ๆ ไปและขั้นตอนแบบเบย์นั้นไม่จำเป็นหรือถูกแบนจาก BASP [... ] จำเป็นต้องมีกระบวนการทางสถิติเชิงอนุมานหรือไม่? - ไม่ [... ] อย่างไรก็ตาม BASP จะต้องมีสถิติเชิงพรรณนาที่รัดกุมรวมถึงขนาดผลกระทบ pppppp ppp …

8
สร้างตัวแปรสุ่มที่มีความสัมพันธ์ที่กำหนดไว้กับตัวแปรที่มีอยู่
สำหรับการศึกษาการจำลองฉันต้องสร้างตัวแปรสุ่มที่แสดง prefined (ประชากร) ความสัมพันธ์กับตัวแปรที่มีอยู่YYYY ฉันดูในRแพ็คเกจcopulaและCDVineสามารถสร้างการแจกแจงหลายตัวแปรแบบสุ่มด้วยโครงสร้างการพึ่งพาที่กำหนด อย่างไรก็ตามเป็นไปไม่ได้ที่จะแก้ไขหนึ่งในตัวแปรที่เป็นผลลัพธ์ของตัวแปรที่มีอยู่ ความคิดและลิงก์ไปยังฟังก์ชั่นที่มีอยู่นั้นได้รับการชื่นชม! สรุป: คำตอบที่ถูกต้องสองคำขึ้นมาพร้อมกับโซลูชันที่แตกต่าง: R สคริปต์โดย Caracal ซึ่งจะคำนวณตัวแปรสุ่มกับที่แน่นอน (ตัวอย่าง) ความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า R ฟังก์ชั่นฉันพบตัวเองซึ่งจะคำนวณตัวแปรสุ่มที่มีการกำหนดประชากรความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า [@ttnphns 'นอกจากนี้: ฉันใช้เสรีภาพในการขยายชื่อคำถามจากกรณีตัวแปรคงที่เดียวเป็นจำนวนคงที่ของตัวแปรคงที่; เช่นวิธีการสร้างตัวแปรที่มีคอร์เรชั่นที่กำหนดไว้ล่วงหน้าพร้อมกับตัวแปรคงที่บางตัวที่มีอยู่]

2
รูปร่างของช่วงความมั่นใจสำหรับค่าที่คาดการณ์ไว้ในการถดถอยเชิงเส้น
ฉันสังเกตเห็นว่าช่วงความมั่นใจสำหรับค่าที่ทำนายในการถดถอยเชิงเส้นมีแนวโน้มแคบลงรอบค่าเฉลี่ยของตัวทำนายและไขมันรอบค่าต่ำสุดและค่าสูงสุดของตัวทำนาย สิ่งนี้สามารถเห็นได้ในพล็อตของการถดถอยเชิงเส้น 4 แบบนี้: ตอนแรกฉันคิดว่าเป็นเพราะค่านิยมของผู้ทำนายส่วนใหญ่กระจุกตัวอยู่กับค่าเฉลี่ยของผู้ทำนาย อย่างไรก็ตามฉันสังเกตเห็นว่าช่วงกลางที่แคบของช่วงความมั่นใจจะเกิดขึ้นแม้ว่าค่าจำนวนมากจะกระจุกตัวอยู่รอบสุดขั้วของตัวทำนายเช่นเดียวกับในการถดถอยเชิงเส้นด้านล่างซ้ายซึ่งค่าของตัวทำนายจำนวนมากนั้นมีสมาธิ ผู้ทำนาย ไม่มีใครสามารถอธิบายได้ว่าทำไมช่วงเวลาความเชื่อมั่นสำหรับค่าที่ทำนายไว้ในการถดถอยเชิงเส้นมีแนวโน้มที่จะแคบลงตรงกลางและไขมันที่สุดขั้ว?

3
อธิบายการ์ตูน xkcd jelly bean: อะไรทำให้ตลก?
ฉันเห็นว่าหนึ่งครั้งจากการทดสอบทั้งหมดยี่สิบครั้งที่พวกเขารันดังนั้นพวกเขาจึงคิดผิด ๆ ว่าในช่วงหนึ่งของการทดสอบยี่สิบครั้งผลลัพธ์จะมีนัยสำคัญ ( )0.05 = 1 / 20p &lt; 0.05p&lt;0.05p < 0.050.05 = 1 / 200.05=1/200.05 = 1/20 xkcd jelly bean comic - "สำคัญ" หัวข้อ: สำคัญ ข้อความโฉบ: "'งั้นเอ่อเราได้ทำการศึกษาสีเขียวอีกครั้งและไม่มีการเชื่อมโยงมันอาจเป็น -' 'การวิจัยมีความขัดแย้งกับการเชื่อมโยงสีเขียวของถั่วเขียว / สิว;

4
ค่าทั้งหมดภายในช่วงความมั่นใจ 95% มีโอกาสเท่ากันหรือไม่
ฉันได้พบข้อมูลที่ไม่ลงรอยกันของคำถาม: " ถ้าใครสร้างช่วงความเชื่อมั่น 95% (CI) ของความแตกต่างในวิธีการหรือความแตกต่างของสัดส่วนค่าทั้งหมดภายใน CI มีแนวโน้มเท่ากันหรือไม่หรือเป็นจุดที่มีแนวโน้มมากที่สุด มีค่าใกล้กับ "ก้อย" ของ CI มีโอกาสน้อยกว่าค่าที่อยู่ตรงกลางของ CI หรือไม่ ตัวอย่างเช่นหากรายงานการทดลองทางคลินิกแบบสุ่มระบุว่าความเสี่ยงสัมพัทธ์ของการเสียชีวิตด้วยการรักษาแบบพิเศษคือ 1.06 (95% CI 0.96 ถึง 1.18) ความน่าจะเป็นที่ 0.96 เป็นค่าที่ถูกต้องเหมือนกับ 1.06 หรือไม่? ฉันพบการอ้างอิงจำนวนมากเกี่ยวกับแนวคิดนี้ทางออนไลน์ แต่ตัวอย่างสองตัวอย่างต่อไปนี้สะท้อนถึงความไม่แน่นอนในนั้น: โมดูลของ Lisa Sullivan เกี่ยวกับสถานะConfidence Intervals : ช่วงความเชื่อมั่นสำหรับความแตกต่างหมายถึงให้ช่วงของค่าที่เป็นไปได้สำหรับ ( ) เป็นสิ่งสำคัญที่จะต้องทราบว่าค่าทั้งหมดในช่วงความเชื่อมั่นมีความเป็นไปได้ที่จะประเมินมูลค่าที่แท้จริงเท่ากัน ( μ_1-μ_2 )μ1−μ2μ1−μ2μ_1-μ_2μ1−μ2μ1−μ2μ_1-μ_2 บล็อกนี้มีชื่ออยู่ในส่วนต่างของข้อผิดพลาดระบุ: สิ่งที่ฉันมีในใจเป็นความเข้าใจผิดเกี่ยวกับ“ขอบของข้อผิดพลาด” ที่ถือว่าทุกจุดภายในช่วงความเชื่อมั่นเป็นโอกาสที่เท่าเทียมกันเช่นถ้าทฤษฎีบทขีด จำกัด กลางนัยเครื่องแบบกระจาย bounded แทนทีกระจาย [... …

8
ทำไมต้องสอนและใช้การทดสอบสมมติฐานต่อไป (เมื่อมีช่วงความมั่นใจ)
เหตุใดจึงต้องสอนและใช้การทดสอบสมมติฐาน (ด้วยแนวคิดที่ยากทั้งหมดและเป็นความผิดทางสถิติมากที่สุด) สำหรับปัญหาที่มีการประมาณช่วงเวลา (ความเชื่อมั่น bootstrap ความน่าเชื่อถือหรืออะไรก็ตาม) คำอธิบายที่ดีที่สุด (ถ้ามี) ให้กับนักเรียนคืออะไร? ประเพณีเท่านั้น มุมมองจะได้รับการต้อนรับอย่างมาก

6
การทำนายของแบบจำลองฟอเรสต์มีช่วงเวลาการทำนายหรือไม่?
ถ้าฉันเรียกใช้randomForestแบบจำลองฉันสามารถทำการทำนายตามแบบจำลองได้ มีวิธีใดที่จะได้ช่วงเวลาการทำนายของการทำนายแต่ละครั้งเช่นที่ฉันรู้ว่า "แน่ใจ" โมเดลนั้นเป็นคำตอบของมันหรือไม่ ถ้าเป็นไปได้มันขึ้นอยู่กับความแปรปรวนของตัวแปรตามสำหรับโมเดลทั้งหมดหรือจะมีช่วงกว้างขึ้นและแคบขึ้นอยู่กับแผนผังการตัดสินใจเฉพาะที่ตามมาสำหรับการทำนายโดยเฉพาะ

6
วิธีการกำหนดจุดตัดที่ดีที่สุดและช่วงความมั่นใจโดยใช้เส้นโค้ง ROC ใน R?
ฉันมีข้อมูลการทดสอบที่สามารถใช้แยกแยะเซลล์ปกติและเนื้องอก ตามโค้ง ROC มันดูดีสำหรับจุดประสงค์นี้ (พื้นที่ใต้เส้นโค้งคือ 0.9): คำถามของฉันคือ: จะกำหนดจุดตัดสำหรับการทดสอบนี้และช่วงความมั่นใจได้อย่างไรโดยที่การอ่านควรถูกตัดสินว่าไม่ชัดเจน วิธีที่ดีที่สุดในการมองเห็นภาพนี้ggplot2คืออะไร กราฟแสดงผลโดยใช้ROCRและggplot2แพ็คเกจ: #install.packages("ggplot2","ROCR","verification") #if not installed yet library("ggplot2") library("ROCR") library("verification") d &lt;-read.csv2("data.csv", sep=";") pred &lt;- with(d,prediction(x,test)) perf &lt;- performance(pred,"tpr", "fpr") auc &lt;-performance(pred, measure = "auc")@y.values[[1]] rd &lt;- data.frame(x=perf@x.values[[1]],y=perf@y.values[[1]]) p &lt;- ggplot(rd,aes(x=x,y=y)) + geom_path(size=1) p &lt;- p + geom_segment(aes(x=0,y=0,xend=1,yend=1),colour="black",linetype= 2) p &lt;- p …

1
Bootstrap vs. jackknife
ทั้งวิธี bootstrap และ jackknife สามารถใช้ในการประเมินความลำเอียงและข้อผิดพลาดมาตรฐานของการประมาณและกลไกของวิธีการสุ่มตัวอย่างทั้งสองวิธีนั้นไม่แตกต่างกันมาก: การสุ่มตัวอย่างด้วยการแทนที่และการละครั้ง อย่างไรก็ตาม jackknife ไม่ได้รับความนิยมเท่ากับ bootstrap ในการวิจัยและการปฏิบัติ มีข้อดีที่ชัดเจนของการใช้ bootstrap แทนที่จะใช้ jackknife หรือไม่?

14
ชี้แจงเกี่ยวกับการตีความช่วงความเชื่อมั่นหรือไม่
ความเข้าใจปัจจุบันของฉันเกี่ยวกับแนวคิด "ช่วงความเชื่อมั่นที่มีระดับความเชื่อมั่น " คือถ้าเราพยายามคำนวณช่วงความเชื่อมั่นหลายครั้ง (แต่ละครั้งที่มีตัวอย่างสด) มันจะมีพารามิเตอร์ที่ถูกต้องของ เวลา.1 - α1 - α1−α1 - \alpha1 - α1−α1 - \alpha แม้ว่าฉันจะรู้ว่านี่ไม่เหมือนกับ "ความน่าจะเป็นที่พารามิเตอร์จริงอยู่ในช่วงเวลานี้" แต่มีบางอย่างที่ฉันต้องการชี้แจง [การอัพเดทที่สำคัญ] ก่อนที่เราจะคำนวณช่วงความมั่นใจ 95% มีความน่าจะเป็น 95% ที่ช่วงเวลาที่เราคำนวณจะครอบคลุมพารามิเตอร์จริง หลังจากที่เราคำนวณช่วงความเชื่อมั่นและได้รับช่วงเวลาเฉพาะเราจะไม่สามารถพูดสิ่งนี้ได้อีกต่อไป เราไม่สามารถสร้างข้อโต้แย้งที่ไม่ได้เกิดขึ้นบ่อยนักซึ่งเรามั่นใจได้ว่า 95% ของพารามิเตอร์ที่แท้จริงจะอยู่ใน ; เพราะถ้าเราทำได้มันจะขัดแย้งกับตัวอย่างโต้แย้งเช่นนี้: อะไรคือช่วงความมั่นใจ[ a , b ][ a , b ][a,b][a,b][ a , b ][a,b][a,b] ฉันไม่ต้องการอภิปรายเรื่องปรัชญาของความน่าจะเป็น แต่ฉันกำลังมองหาคำอธิบายทางคณิตศาสตร์ที่แม่นยำว่าทำไมและทำไมถึงเห็นช่วงเวลาเฉพาะการเปลี่ยนแปลง (หรือไม่เปลี่ยน) ความน่าจะเป็น 95% …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.