คำถามติดแท็ก statistical-significance

นัยสำคัญทางสถิติหมายถึงความน่าจะเป็นที่ถ้าในประชากรที่ตัวอย่างนี้ถูกดึงออกมาผลที่แท้จริงคือ 0 (หรือค่าที่ตั้งสมมติฐานไว้บางส่วน) สถิติทดสอบที่มากหรือสุดขั้วเกินกว่าที่จะเกิดขึ้นในกลุ่มตัวอย่าง

2
การจัดประเภทตัวแปรจะเปลี่ยนจากไม่มีนัยสำคัญเป็นสำคัญ
ฉันมีตัวแปรที่เป็นตัวเลขซึ่งไม่มีนัยสำคัญในแบบจำลองการถดถอยโลจิสติกหลายตัวแปร อย่างไรก็ตามเมื่อฉันจัดหมวดหมู่เป็นกลุ่มทันใดนั้นมันก็กลายเป็นสิ่งสำคัญ สิ่งนี้ตอบโต้ฉันได้ง่ายมาก: เมื่อจัดหมวดหมู่ตัวแปรเราจะให้ข้อมูลบางอย่าง สิ่งนี้จะเป็นอย่างไร

6
ฉันสามารถเชื่อถือผลลัพธ์สำคัญของการทดสอบ t ได้ไหมถ้าขนาดตัวอย่างเล็ก?
หากผลการทดสอบการทดสอบด้านเดียวของฉันมีความสำคัญ แต่ขนาดตัวอย่างมีขนาดเล็ก (เช่นต่ำกว่า 20 หรือมากกว่านั้น) ฉันจะยังเชื่อถือได้หรือไม่ ถ้าไม่ฉันจะจัดการและ / หรือตีความผลลัพธ์นี้อย่างไร

2
การทดสอบทางสถิติสามารถคืนค่า p เป็นศูนย์ได้หรือไม่?
ฉันไม่ได้หมายถึงค่าที่ใกล้เคียงกับศูนย์ (ปัดเศษเป็นศูนย์ด้วยซอฟต์แวร์สถิติบางตัว) แต่จะมีค่าเป็นศูนย์อย่างแท้จริง ถ้าเป็นเช่นนั้นหมายความว่าความน่าจะเป็นที่จะได้รับข้อมูลที่สมมติว่าสมมติฐานว่างเป็นจริงหรือไม่เช่นกัน (ตัวอย่างบางส่วน) ของการทดสอบทางสถิติที่สามารถส่งกลับผลลัพธ์ของการเรียงลำดับนี้คืออะไร? แก้ไขประโยคที่สองเพื่อลบวลี "ความน่าจะเป็นของสมมติฐานว่าง"

3
การเปรียบเทียบผลลัพธ์ความแม่นยำของลักษณนามสองตัวสำหรับนัยสำคัญทางสถิติกับการทดสอบ t
ฉันต้องการเปรียบเทียบความแม่นยำของตัวแยกประเภทสองตัวสำหรับนัยสำคัญทางสถิติ ตัวแยกประเภททั้งสองทำงานในชุดข้อมูลเดียวกัน นำไปสู่การนี้ผมที่จะเชื่อว่าฉันควรจะใช้ตัวอย่างหนึ่ง t-test จากสิ่งที่ฉันได้รับการอ่าน ตัวอย่างเช่น: Classifier 1: 51% accuracy Classifier 2: 64% accuracy Dataset size: 78,000 นี่เป็นการทดสอบที่ถูกต้องที่จะใช้หรือไม่? ถ้าเป็นเช่นนั้นฉันจะคำนวณได้อย่างไรว่าความแตกต่างของความแม่นยำระหว่างลักษณนามมีความสำคัญ หรือฉันควรใช้การทดสอบอื่น?

2
อะไรคือความแตกต่างระหว่าง "การทดสอบสมมติฐาน" และ "ทดสอบความสำคัญ"?
วลี "การทดสอบสมมติฐาน" และ "การทดสอบความสำคัญ" มีความแตกต่างหรือไม่หรือไม่ หลังจากคำตอบอย่างละเอียดจาก @Micheal Lew ฉันมีความสับสนอย่างหนึ่งที่ทุกวันนี้สมมติฐาน (เช่น t-test to test mean) เป็นตัวอย่างของ "การทดสอบนัยสำคัญ" หรือ "การทดสอบสมมติฐาน"? หรือเป็นการรวมกันของทั้งคู่? คุณจะแยกแยะพวกเขาด้วยตัวอย่างง่ายๆได้อย่างไร?

2
ความแปรปรวนสูงของการกระจายของค่า p (อาร์กิวเมนต์ใน Taleb 2016)
ฉันพยายามที่จะเข้าใจการเรียกร้องภาพใหญ่ทำในTaleb 2016, The Meta-การแพร่กระจายของมาตรฐาน P-ค่า ในนั้น Taleb ทำให้อาร์กิวเมนต์ต่อไปนี้สำหรับความไม่น่าเชื่อถือของค่า p (ตามที่ฉันเข้าใจ): ขั้นตอนการประเมินดำเนินการกับจุดข้อมูลที่มาจากการแจกจ่ายX outputs ค่า ap หากเราดึงจุด n เพิ่มเติมจากการกระจายนี้และส่งออกค่า p อื่นเราสามารถหาค่า p-values ​​เหล่านี้ที่ได้รับในขีด จำกัด ที่เรียกว่า "ค่า p จริง"nnnXXX "ค่า p จริง" นี้แสดงว่ามีความแปรปรวนสูงรบกวนดังนั้นการแจกแจง + โพรซีเดอร์ที่มี "ค่า p จริง" จะ 60% ของเวลารายงานค่า p-. 05.12.12.12 คำถาม : วิธีนี้จะสามารถคืนดีกับอาร์กิวเมนต์ดั้งเดิมในความโปรดปรานของค่า ดังที่ฉันเข้าใจแล้วค่า p ควรบอกคุณว่าเปอร์เซ็นต์ของเวลาที่กระบวนการของคุณจะให้ช่วงเวลาที่ถูกต้อง (หรืออะไรก็ตาม) อย่างไรก็ตามบทความนี้ดูเหมือนจะโต้แย้งว่าการตีความนี้ทำให้เข้าใจผิดเนื่องจากค่า p จะไม่เหมือนกันถ้าคุณเรียกใช้ขั้นตอนอีกครั้งppp …

1
มีใครนอกเหนือจาก Egon Pearson ที่เข้าถึงกระดาษของ Gosset ในปี 1904?
มีใครนอกเหนือจาก Egon Pearson ที่เข้าถึง 1904 รายงานของ William Sealy Gosset "การประยุกต์ใช้ 'กฎข้อผิดพลาด' ในการทำงานของโรงเบียร์" หรือไม่? ฉันเดาว่ามันเป็นทรัพย์สินของกินเนสส์ แต่ด้วยความสำคัญทางประวัติศาสตร์มันคงเป็นเรื่องที่น่าสนใจมากหากใครบางคนรู้ว่าจะเอามือไปทำอะไร

3
การทดสอบทางสถิติที่ดีที่สุดสำหรับอนุกรมเวลาคืออะไร?
ฉันมีอนุกรมเวลาอย่างง่ายพร้อมจุดข้อมูล 5-10 จุดต่อชุดข้อมูลในช่วงเวลาปกติ ฉันสงสัยว่าอะไรเป็นวิธีที่ดีที่สุดในการพิจารณาว่าชุดข้อมูลสองชุดนั้นแตกต่างกันหรือไม่ ฉันควรลองทดสอบ t บนจุดข้อมูลแต่ละจุดหรือดูบริเวณใต้เส้นโค้งหรือมีตัวแบบหลายตัวแปรหลายตัวที่จะทำงานได้ดีขึ้นหรือไม่

5
การตีความผลลัพธ์ที่ไม่สำคัญว่าเป็น“ แนวโน้ม”
เมื่อเร็ว ๆ นี้เพื่อนร่วมงานสองคนต่างใช้ข้อโต้แย้งเกี่ยวกับความแตกต่างระหว่างเงื่อนไขที่ดูเหมือนว่าไม่ถูกต้องสำหรับฉัน เพื่อนร่วมงานทั้งสองคนนี้ใช้สถิติ แต่พวกเขาไม่ใช่นักสถิติ ฉันเป็นสามเณรในสถิติ ในทั้งสองกรณีฉันเป็นที่ถกเถียงกันอยู่ว่าเนื่องจากไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างสองเงื่อนไขในการทดลองมันไม่ถูกต้องที่จะเรียกร้องทั่วไปเกี่ยวกับกลุ่มเหล่านี้เกี่ยวกับการจัดการ โปรดทราบว่า "การอ้างสิทธิ์ทั่วไป" หมายถึงบางสิ่งบางอย่างเช่นการเขียน: "กลุ่ม A ที่ใช้ X บ่อยกว่ากลุ่ม B" เพื่อนร่วมงานของฉันตอบโต้ด้วย: "แม้ว่าจะไม่มีความแตกต่างอย่างมีนัยสำคัญ แต่แนวโน้มยังคงมีอยู่" และ "แม้ว่าจะไม่มีความแตกต่างอย่างมีนัยสำคัญ แต่ก็ยังคงมีความแตกต่าง" สำหรับฉันเสียงทั้งสองนี้เหมือนกับการพูดกำกวมคือพวกเขาเปลี่ยนความหมายของ "ความแตกต่าง" จาก: "ความแตกต่างที่น่าจะเป็นผลมาจากสิ่งอื่นที่ไม่ใช่โอกาส" (เช่นนัยสำคัญทางสถิติ) เป็น "สิ่งใด ๆ ที่ไม่ใช่ - ศูนย์แตกต่างในการวัดระหว่างกลุ่ม " คำตอบของเพื่อนร่วมงานของฉันถูกต้องหรือไม่? ฉันไม่ได้ใช้มันกับพวกเขาเพราะพวกเขาอยู่เหนือกว่าฉัน

1
การทดสอบสมมติฐานตามลำดับในวิทยาศาสตร์ขั้นพื้นฐาน
ฉันเป็นเภสัชกรและจากประสบการณ์ของฉันเอกสารเกือบทั้งหมดในการวิจัยทางชีวการแพทย์ขั้นพื้นฐานใช้การทดสอบ t ของนักเรียน (เพื่อสนับสนุนการอนุมานหรือเพื่อให้สอดคล้องกับความคาดหวัง ... ) สองสามปีที่ผ่านมาฉันสังเกตเห็นว่าการทดสอบ t ของนักเรียนไม่ใช่การทดสอบที่มีประสิทธิภาพที่สุดที่อาจใช้: การทดสอบตามลำดับให้พลังงานที่มากขึ้นสำหรับขนาดตัวอย่างใด ๆ หรือขนาดตัวอย่างที่เล็กกว่าโดยเฉลี่ยสำหรับพลังงานที่เท่ากัน ขั้นตอนต่อเนื่องของความซับซ้อนที่แตกต่างกันนั้นใช้ในการวิจัยทางคลินิก แต่ฉันไม่เคยทำเห็นวิธีที่ใช้ในงานวิจัยทางชีวการแพทย์ขั้นพื้นฐาน ฉันทราบว่าพวกเขาขาดเรียนจากหนังสือสถิติระดับเบื้องต้นที่ล้วนเป็นสิ่งที่นักวิทยาศาสตร์พื้นฐานส่วนใหญ่น่าจะเห็น คำถามของฉันคือสามเท่า: ด้วยข้อได้เปรียบด้านประสิทธิภาพอย่างมากของการทดสอบตามลำดับเหตุใดจึงไม่ใช้กันอย่างแพร่หลายมากขึ้น มีข้อเสียเปรียบที่เกี่ยวข้องกับการใช้วิธีการตามลำดับซึ่งหมายความว่าการใช้งานโดยผู้ที่ไม่ใช่นักสถิติจะต้องหมดกำลังใจหรือไม่? นักเรียนสถิติสอนเกี่ยวกับขั้นตอนการทดสอบตามลำดับหรือไม่

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

3
คำว่ากำลังสองหรือการปฏิสัมพันธ์มีนัยสำคัญในการแยก แต่ไม่ได้อยู่ด้วยกัน
ในฐานะที่เป็นส่วนหนึ่งของการมอบหมายฉันต้องทำแบบจำลองให้พอดีกับตัวแปรทำนายสองตัว จากนั้นฉันต้องวาดพล็อตของแบบจำลองที่เหลือต่อหนึ่งในตัวทำนายที่รวมไว้และทำการเปลี่ยนแปลงตามนั้น พล็อตแสดงแนวโน้มของเส้นโค้งดังนั้นฉันจึงรวมคำกำลังสองสำหรับตัวทำนายนั้น โมเดลใหม่แสดงคำว่ากำลังสองให้มีนัยสำคัญ ดีมากจนถึงตอนนี้ อย่างไรก็ตามข้อมูลชี้ให้เห็นว่าการโต้ตอบนั้นสมเหตุสมผลเช่นกัน การเพิ่มคำที่ใช้ในการโต้ตอบกับโมเดลดั้งเดิมนั้นยังคงแนวโน้มของ curvilinear และก็มีความสำคัญเช่นกันเมื่อเพิ่มเข้ากับโมเดล ปัญหาคือเมื่อเพิ่มทั้งสองกำลังสองและคำการโต้ตอบในรูปแบบหนึ่งในนั้นไม่สำคัญ ฉันควรรวมคำใด (กำลังสองหรือการโต้ตอบ) ไว้ในโมเดลและทำไม

1
เมื่อไหร่ / ที่ไหนที่จะใช้การวิเคราะห์ข้อมูลการทำงาน?
ฉันมากใหม่เพื่อการวิเคราะห์ข้อมูลการทำงาน (FDA) ฉันกำลังอ่าน: Ramsay, James O. , และ Silverman, Bernard W. (2006), การวิเคราะห์ข้อมูลเชิงหน้าที่, 2 ed., Springer, New York อย่างไรก็ตามฉันยังไม่ชัดเจนว่าจะใช้ FDA ที่ไหนเมื่อไร? ใครช่วยกรุณายกตัวอย่างให้ฉันโดยเฉพาะอย่างยิ่งในการศึกษาทางการแพทย์? ฉันไม่รู้จริง ๆ ว่าที่ไหน / เมื่อไหร่ที่จะใช้ FDA ในการปฏิบัติ สำหรับข้อมูลกราฟการเจริญเติบโตเราสามารถใช้โมเดลผสมแบบไม่เชิงเส้นสำหรับข้อมูลระยะยาวเราสามารถใช้ ANOVA แบบวัดซ้ำได้และสำหรับข้อมูลหลายตัวแปร / ข้อมูลมิติสูงเราสามารถใช้ PCA, FA และอื่น ๆ ดังนั้นเมื่อใด / ที่ไหน / สถานการณ์ที่จะใช้ FDA?

4
ทดสอบความแตกต่างอย่างมีนัยสำคัญทางสถิติในอนุกรมเวลาหรือไม่
ฉันมีอนุกรมเวลาของราคาของหลักทรัพย์สองหลักทรัพย์คือ A และ B ในช่วงเวลาเดียวกันและเก็บตัวอย่างที่ความถี่เดียวกัน ฉันต้องการทดสอบว่ามีความแตกต่างอย่างมีนัยสำคัญทางสถิติในช่วงเวลาระหว่างราคาทั้งสองหรือไม่ (สมมติฐานว่างของฉันคือความแตกต่างนั้นเป็นโมฆะ) โดยเฉพาะฉันใช้ความแตกต่างของราคาเป็นตัวแทนเพื่อประสิทธิภาพของตลาด ลองนึกภาพ A และ B เป็นระบบรักษาความปลอดภัยและการสังเคราะห์ที่เทียบเท่ากัน (นั่นคือทั้งสองอ้างว่ากระแสเงินสดเท่ากันทั้งหมด) หากตลาดมีประสิทธิภาพทั้งคู่ควรมีราคาเท่ากัน (ยกเว้นค่าใช้จ่ายการทำธุรกรรมที่แตกต่างกัน ฯลฯ ) หรือผลต่างราคาเป็นศูนย์ นี่คือสิ่งที่ฉันต้องการทดสอบ วิธีที่ดีที่สุดที่จะทำคืออะไร? ฉันอาจใช้การทดสอบ t-test แบบสองด้านกับอนุกรมเวลา "ความแตกต่าง" เช่นในอนุกรมเวลา AB และทดสอบสำหรับ = 0 อย่างไรก็ตามฉันมีข้อสงสัยว่าอาจมีการทดสอบที่มีประสิทธิภาพมากกว่าซึ่งคำนึงถึงสิ่งต่าง ๆ เช่นข้อผิดพลาด homoskedastic ที่อาจเกิดขึ้นหรือการปรากฏตัวของค่าผิดปกติ โดยทั่วไปมีสิ่งที่ต้องระวังเมื่อทำงานกับราคาหลักทรัพย์หรือไม่μ0μ0\mu_0

5
ฉันสามารถละเว้นค่าสัมประสิทธิ์สำหรับปัจจัยที่ไม่มีนัยสำคัญในแบบจำลองเชิงเส้นได้หรือไม่?
หลังจากหาความกระจ่างเกี่ยวกับสัมประสิทธิ์โมเดลเชิงเส้นตรงนี้ฉันมีคำถามติดตามเกี่ยวกับค่าที่ไม่ลงนาม (ค่า p สูง) สำหรับค่าสัมประสิทธิ์ระดับปัจจัย ตัวอย่าง: หากโมเดลเชิงเส้นของฉันมีปัจจัยที่มี 10 ระดับและมีเพียง 3 ของระดับเหล่านั้นที่มีค่า p สำคัญที่เกี่ยวข้องกับพวกเขาเมื่อใช้แบบจำลองในการทำนาย Y ฉันสามารถเลือกที่จะไม่รวมคำว่าสัมประสิทธิ์ได้ ระดับที่ไม่มีนัยสำคัญ? ยิ่งไปกว่านั้นมันจะผิดหรือไม่ที่จะปั้นก้อนหิน 7 ระดับที่ไม่สำคัญออกเป็นระดับเดียวและวิเคราะห์อีกครั้ง?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.