คำถามติดแท็ก hypothesis-testing

การทดสอบสมมติฐานจะประเมินว่าข้อมูลไม่สอดคล้องกับสมมติฐานที่กำหนดแทนที่จะเป็นผลของความผันผวนแบบสุ่มหรือไม่

3
การเลือกการทดสอบทางสถิติตามผลลัพธ์ของการทดสอบอื่น (เช่นปกติ)
ดังนั้นฉันได้ยินมาว่ามันไม่ใช่ความคิดที่ดีที่จะเลือกการทดสอบทางสถิติหนึ่งอันจากผลการทดสอบอื่น นี่มันดูแปลกสำหรับฉัน ตัวอย่างเช่นคนมักเลือกที่จะใช้การทดสอบแบบไม่มีพารามิเตอร์เมื่อการทดสอบอื่น ๆ แสดงให้เห็นว่าส่วนที่เหลือจะไม่กระจายตามปกติ วิธีการนี้ดูเหมือนจะได้รับการยอมรับอย่างกว้างขวาง แต่ดูเหมือนจะไม่เห็นด้วยกับประโยคแรกในวรรคนี้ ฉันแค่หวังที่จะได้รับการชี้แจงเกี่ยวกับปัญหานี้


3
ความแตกต่างระหว่างการทดสอบแบบทางเดียวและแบบสองด้านใช่หรือไม่
ในขณะที่เรียนหลักสูตรสถิติของฉันฉันพยายามเข้าใจความแตกต่างระหว่างการทดสอบสมมติฐานแบบหนึ่งด้านและสองด้าน ทำไมการทดสอบแบบด้านเดียวจึงปฏิเสธค่า null ในขณะที่แบบทดสอบแบบสองด้านไม่ได้ ตัวอย่าง:

2
วิธีการทดสอบว่าตัวอย่างของข้อมูลที่เหมาะกับครอบครัวของการกระจายแกมม่าหรือไม่?
ฉันมีตัวอย่างของข้อมูลซึ่งสร้างจากตัวแปรสุ่มแบบต่อเนื่อง X และจากฮิสโตแกรมที่ฉันวาดด้วย R ฉันเดาว่าบางทีการกระจายของ X เป็นไปตามการแจกแจงแกมม่าบางอย่าง แต่ฉันไม่รู้พารามิเตอร์ที่แน่นอนของการกระจายแกมม่านี้ คำถามของฉันคือวิธีทดสอบว่าการแจกแจง X เป็นของตระกูลการแจกแจงแกมมาหรือไม่? มีความดีของการทดสอบแบบพอดีเช่นการทดสอบ Kolmogorov-Smirnov การทดสอบ Anderson-Darling และอื่น ๆ แต่ข้อ จำกัด อย่างหนึ่งเมื่อใช้การทดสอบเหล่านี้คือพารามิเตอร์ของการแจกแจงทางทฤษฎีควรทราบล่วงหน้า ใครช่วยกรุณาบอกวิธีแก้ปัญหานี้ได้ไหม

2
ใช้การทดสอบนัยสำคัญทางสถิติเพื่อตรวจสอบความถูกต้องของผลการวิเคราะห์กลุ่ม
ฉันกำลังสำรวจการใช้การทดสอบนัยสำคัญทางสถิติ (SST) เพื่อตรวจสอบผลลัพธ์ของการวิเคราะห์คลัสเตอร์ ฉันพบเอกสารหลายฉบับเกี่ยวกับหัวข้อนี้เช่น "ความสำคัญทางสถิติของการทำคลัสเตอร์สำหรับข้อมูลมิติข้อมูลตัวอย่างขนาดเล็ก " โดยLiu, Yufeng และคณะ (2008) " ในการทดสอบความสำคัญในการวิเคราะห์กลุ่ม " โดยBock (1985) แต่ฉันสนใจที่จะค้นหาวรรณกรรมบางฉบับที่โต้แย้งว่า SST ไม่เหมาะสมที่จะตรวจสอบผลลัพธ์ของการวิเคราะห์กลุ่ม แหล่งเดียวที่ฉันได้พบอ้างว่าเป็นหน้าเว็บของผู้จำหน่ายซอฟต์แวร์ เพื่อชี้แจง: ฉันสนใจที่จะทดสอบว่าโครงสร้างคลัสเตอร์ที่สำคัญพบว่าเป็นผลมาจากการวิเคราะห์กลุ่มหรือไม่ดังนั้นฉันต้องการทราบเอกสารที่สนับสนุนหรือ refuting ข้อกังวล "เกี่ยวกับความเป็นไปได้ของการทดสอบหลังผลของข้อมูลเชิงสำรวจ การวิเคราะห์ที่ใช้ในการค้นหากลุ่ม " ฉันเพิ่งพบกระดาษจากปี 2003 " วิธีการจัดกลุ่มและการจำแนกประเภท " โดยMilligan และ Hirtleกล่าวว่าการใช้ ANOVA นั้นเป็นการวิเคราะห์ที่ไม่ถูกต้องเนื่องจากข้อมูลไม่มีการสุ่มมอบหมายให้กับกลุ่ม

1
การทดสอบความสำคัญกับความแตกต่างของสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน
(ขอบคุณมากสำหรับคำตอบที่รวดเร็วฉันทำงานได้ไม่ดีในการถามคำถามดังนั้นให้ฉันลองอีกครั้ง) ฉันไม่รู้ว่าจะทราบได้อย่างไรว่าความแตกต่างระหว่างสองสเปียร์แมนมีความสัมพันธ์ทางสถิติหรือไม่ ฉันต้องการทราบวิธีค้นหามัน เหตุผลที่ฉันอยากรู้คือในบทความต่อไปนี้: การตีความความหมายตามวิกิพีเดียสำหรับการประมวลผลภาษาธรรมชาติโดย Gabrilovich และ Markovitch ( วารสารวิจัยปัญญาประดิษฐ์ 34 (2009) 443-498) ในตารางที่ 2 (หน้า 457) ผู้เขียนกำลังแสดงให้เห็นว่าวิธีการของพวกเขา (ESA-Wikipedia) ได้รับความสัมพันธ์ของสเปียร์แมนสูงกว่าและมีนัยสำคัญทางสถิติมากกว่าวิธีอื่น ๆ และฉันต้องการทำแบบเดียวกันเพื่อแสดงให้เห็นว่า วิธีการสำหรับปัญหาบางอย่าง ฉันไม่รู้ว่าพวกเขาคำนวณนัยสำคัญทางสถิติอย่างไรและฉันต้องการทราบ ผู้เขียนบทความได้ระบุว่าความสัมพันธ์อันดับของ Spearman นั้นถือว่าเป็นความสัมพันธ์ของ Pearson ฉันไม่แน่ใจว่าเป็นวิธีที่ถูกต้องหรือไม่ ฉันมีความสัมพันธ์ของสเปียร์แมนสองตัวและฉันต้องการทราบว่าความแตกต่างระหว่างพวกเขานั้นมีนัยสำคัญทางสถิติหรือไม่ ฉันทราบว่าเว็บไซต์เช่นhttp://faculty.vassar.edu/lowry/rdiff.htmlให้เครื่องคิดเลขออนไลน์เพื่อรับความแตกต่างระหว่างความสัมพันธ์ของทั้งสองเพียร์สัน ฉันไม่สามารถค้นหาเครื่องคิดเลขออนไลน์ที่คล้ายกันสำหรับความแตกต่างระหว่างความสัมพันธ์ของ Spearman สองอัน ทางออกจากลิงค์ของ Peter Flom หมายเหตุ: กระบวนการสนับสนุนความสัมพันธ์ของ Spearman ที่ต่ำกว่า 0.6 เท่านั้น ให้ = ฟิชเชอร์เปลี่ยนของความสัมพันธ์ที่สังเกตของชุด, = ฟิชเชอร์เปลี่ยนของความสัมพันธ์ที่สังเกตของชุดBzAzAz_AAAAzBzBz_BBBB สำหรับ , …

5
สามารถใช้ไคสแควร์เพื่อเปรียบเทียบสัดส่วนได้หรือไม่?
ฉันได้อ่านว่าการทดสอบไคสแควร์มีประโยชน์เพื่อดูว่าตัวอย่างแตกต่างจากชุดของค่าที่คาดหวังอย่างมีนัยสำคัญหรือไม่ ตัวอย่างเช่นนี่คือตารางผลการสำรวจเกี่ยวกับสีโปรดของผู้คน (n = 15 + 13 + 10 + 17 = 55 ผู้ตอบแบบสอบถามทั้งหมด): red,blue,green,yellow 15,13,10,17 การทดสอบไคสแควร์สามารถบอกฉันได้ว่าตัวอย่างนี้แตกต่างจากสมมุติฐานว่างของความน่าจะเป็นที่เท่ากันของผู้ที่ชื่นชอบแต่ละสีหรือไม่ คำถาม: สามารถทำการทดสอบตามสัดส่วนของผู้ตอบแบบสอบถามทั้งหมดที่ชอบสีที่ต้องการได้หรือไม่? ชอบด้านล่าง: red,blue,green,yellow 0.273,0.236,0.182,0.309 แน่นอนที่ 0.273 + 0.236 + 0.182 + 0.309 = 1 หากการทดสอบไคสแควร์ไม่เหมาะในกรณีนี้การทดสอบแบบใดจะเป็นอย่างไร ขอบคุณ! แก้ไข: ฉันลอง @Roman Luštrikคำตอบด้านล่างและได้ผลลัพธ์ต่อไปนี้เหตุใดฉันจึงไม่ได้รับค่า p และทำไม R บอกว่า "การประมาณ Chi-squared อาจไม่ถูกต้อง"? > chisq.test(c(0,0,0,8,6,2,0,0),p = c(0.406197174,0.088746395,0.025193306,0.42041479,0.03192905,0.018328576,0.009190708,0)) Chi-squared …

1
LARS เทียบกับโคตรของโคตร
ข้อดีและข้อเสียของการใช้ LARS [1] เมื่อเทียบกับการใช้โคตรของพิกัดสำหรับการถดถอยเชิงเส้นแบบ L1 ที่เหมาะสมคืออะไร ฉันสนใจในเรื่องของประสิทธิภาพเป็นหลัก (ปัญหาของฉันมักจะNอยู่ในหลักแสนและp<20) อย่างไรก็ตามข้อมูลเชิงลึกอื่น ๆ ก็จะได้รับการชื่นชมเช่นกัน แก้ไข: เนื่องจากฉันได้โพสต์คำถาม, chl ได้ชี้ให้เห็นกระดาษ [2] โดย Friedman และคณะที่พิกัดโคตรถูกแสดงว่าเร็วกว่าวิธีอื่นมาก หากเป็นกรณีนี้ฉันควรเป็นผู้ประกอบการเพียงแค่ลืมเกี่ยวกับ LARS ในความโปรดปรานของการสืบเชื้อสายมาประสานงาน? [1] Efron, Bradley; Hastie เทรเวอร์; Johnstone, Iain และ Tibshirani, Robert (2004) "การถดถอยมุมน้อยที่สุด" พงศาวดารของสถิติ 32 (2): pp 407–499 [2] Jerome H. Friedman, Trevor Hastie, Rob Tibshirani, "เส้นทางการทำให้เป็นมาตรฐานสำหรับตัวแบบเชิงเส้นทั่วไปผ่านพิกัดโคตร", วารสารซอฟท์แวร์สถิติ, อัตรา …

4
การเปรียบเทียบก้อยของการแจกแจงตัวอย่างสองแบบ
ฉันมีชุดข้อมูลสองชุดที่มีศูนย์กลางอยู่ที่ประมาณศูนย์โดยประมาณ แต่ฉันสงสัยว่ามันมีก้อยต่างกัน ฉันรู้ว่าการทดสอบสองสามข้อเพื่อเปรียบเทียบการกระจายตัวกับการแจกแจงแบบปกติ แต่ฉันต้องการเปรียบเทียบการกระจายสองแบบโดยตรง มีการทดสอบอย่างง่าย ๆ เพื่อเปรียบเทียบความอุดมสมบูรณ์ของหางของการแจกแจง 2 แบบหรือไม่? ขอบคุณ fRed

1
ทดสอบสองตัวอย่างอิสระเพื่อหาค่าความเอียงที่เท่ากันหรือไม่
การทดสอบใดที่มีให้สำหรับการทดสอบสองตัวอย่างอิสระสำหรับสมมติฐานว่างที่มาจากประชากรที่มีความเบ้เท่ากัน? มีการทดสอบแบบคลาสสิก 1 ตัวอย่างว่าค่าความลาดเอียงนั้นมีค่าคงที่หรือไม่ (การทดสอบเกี่ยวข้องกับช่วงเวลาตัวอย่างที่ 6!); มีการแปลแบบตรงไปตรงมาสำหรับการทดสอบ 2 ตัวอย่างหรือไม่? มีเทคนิคที่ไม่เกี่ยวข้องกับช่วงเวลาที่สูงมากของข้อมูลหรือไม่? (ฉันคาดหวังคำตอบของรูปแบบ 'bootstrap it': เป็นเทคนิคการบูตที่ทราบกันว่าเหมาะสมสำหรับปัญหานี้หรือไม่?)

1
แพคเกจ GBM กับ Caret ใช้ GBM
ฉันเคยใช้การจูนโมเดลcaretแต่แล้วก็รันโมเดลอีกครั้งโดยใช้gbmแพ็คเกจ ฉันเข้าใจว่าcaretแพ็กเกจที่ใช้gbmและเอาต์พุตควรเหมือนกัน อย่างไรก็ตามการทดสอบการทำงานอย่างรวดเร็วโดยใช้data(iris)แสดงความแตกต่างในรูปแบบประมาณ 5% โดยใช้ RMSE และ R ^ 2 เป็นตัวชี้วัดการประเมินผล ฉันต้องการค้นหาประสิทธิภาพของแบบจำลองที่ดีที่สุดโดยใช้caretแต่เรียกใช้อีกครั้งgbmเพื่อใช้ประโยชน์จากแผนการพึ่งพาบางส่วน รหัสด้านล่างสำหรับการทำซ้ำ คำถามของฉันจะเป็น: 1) เหตุใดฉันจึงเห็นความแตกต่างระหว่างแพ็คเกจทั้งสองนี้ถึงแม้ว่าพวกเขาจะเหมือนกัน (ฉันเข้าใจว่าพวกมันสุ่ม แต่ 5% ค่อนข้างแตกต่างกันมากโดยเฉพาะอย่างยิ่งเมื่อฉันไม่ได้ใช้ชุดข้อมูลที่ดีirisสำหรับการสร้างแบบจำลองของฉัน) . 2) มีข้อดีหรือข้อเสียในการใช้ทั้งสองแพคเกจหรือไม่ 3) ไม่เกี่ยวข้อง: การใช้irisชุดข้อมูลที่ดีที่สุดinteraction.depthคือ 5 แต่สูงกว่าที่ฉันได้อ่านควรจะใช้สูงสุดfloor(sqrt(ncol(iris)))ซึ่งควรจะเป็น 2 นี่เป็นกฎง่ายๆหรือเข้มงวดหรือไม่? library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric …

2
วิธีการกำหนดเขตการปฏิเสธเมื่อไม่มี UMP
พิจารณาโมเดลการถดถอยเชิงเส้น ,y=Xβ+uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} ,u∼N(0,σ2I)u∼N(0,σ2I)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) 0E( u ∣ X ) = 0E(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} ขอ VS H 1 : σ 2 0 ≠ σ 2H0: σ20= σ2H0:σ02=σ2H_0: \sigma_0^2=\sigma^2H1: σ20≠ σ2H1:σ02≠σ2H_1: \sigma_0^2\neq\sigma^2 เราสามารถอนุมานได้ว่าที่วันที่ฉันm(X)=n×k และเอ็มเอ็กซ์เป็นสัญกรณ์ปกติสำหรับเมทริกซ์สังหาร,MXY= Yที่ YคือตัวแปรYถดถอยบนXYTMXYσ2∼ χ2( n - k )yTMXyσ2∼χ2(n−k)\frac{\mathbf{y}^T\mathbf{M_X}\mathbf{y}}{\sigma^2}\sim \chi^2(n-k)dฉันm ( X ) = n × kdim(X)=n×kdim(\mathbf{X})=n\times kMXMX\mathbf{M_X}MXy = y^MXy=y^\mathbf{M_X}\mathbf{y}=\hat{\mathbf{y}}Y^y^ \hat{\mathbf{y}}Yy\mathbf{y}XX\mathbf{X} หนังสือที่ฉันอ่านระบุดังต่อไปนี้: …

2
คุณสังเกตหัว k จากการโยน n เหรียญยุติธรรมหรือไม่
ฉันถูกถามคำถามนี้ด้วยในการสัมภาษณ์ มีคำตอบ "ถูกต้อง" หรือไม่?( n , k ) = ( 400 , 220 )(n,k)=(400,220)(n, k) = (400, 220) สมมติกลมๆมี IID และความน่าจะเป็นของหัวคือpการกระจายจำนวนหัวในการทอย 400 ครั้งควรใกล้เคียงกับ Normal (200, 10 ^ 2) ดังนั้น 220 หัวเป็น 2 ส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ความน่าจะเป็นของการสังเกตผลลัพธ์ดังกล่าว (เช่น 2 SDs เพิ่มเติมจากค่าเฉลี่ยในทิศทางใดทิศทางหนึ่ง) น้อยกว่า 5% เล็กน้อยp = 0.5p=0.5p=0.5 ผู้สัมภาษณ์บอกฉันว่า "ถ้าฉันสังเกตอะไร> = 2 SDs จากค่าเฉลี่ยฉันสรุปได้ว่ามีบางอย่างเกิดขึ้นฉันจะพนันกับเหรียญที่ยุติธรรม" นั่นคือเหตุผล …

4
จะทำอย่างไรเมื่อค่าเฉลี่ยของสองตัวอย่างแตกต่างกันอย่างมีนัยสำคัญ แต่ความแตกต่างนั้นเล็กเกินไปที่จะสำคัญ
ฉันมีสองตัวอย่าง (ในทั้งสองกรณี) ค่าเฉลี่ยต่างกันประมาณสองเท่าของค่ามาตรฐานรวม dev ส่งผลให้มูลค่าอยู่ที่ประมาณ 10 ขณะที่มันเป็นเรื่องที่ดีที่จะได้รู้ว่าเราได้แสดงให้เห็นแน่ชัดว่าหมายถึงจะไม่เหมือนกันนี้ดูเหมือนว่าฉันจะถูกผลักดันโดย n ขนาดใหญ่ เมื่อดูที่ฮิสโตแกรมของข้อมูลฉันไม่รู้สึกว่าเช่น p-value เล็ก ๆ เป็นตัวแทนของข้อมูลจริงๆและโดยสุจริตไม่รู้สึกสะดวกสบายในการอ้างอิง ฉันอาจถามคำถามผิด สิ่งที่ฉันคิดคือ: ตกลงวิธีการที่แตกต่างกัน แต่ไม่สำคัญว่าในขณะที่การกระจายการแบ่งปันที่ทับซ้อนกันอย่างมีนัยสำคัญ?Tn≈70n≈70n \approx 70TTT นี่คือสิ่งที่การทดสอบแบบเบย์มีประโยชน์หรือไม่ ถ้าเป็นที่ที่เหมาะสำหรับการเริ่มต้น googling สักหน่อยไม่ได้ให้ประโยชน์อะไรเลย แต่ฉันอาจไม่ถามคำถามที่ถูกต้อง หากนี่เป็นสิ่งที่ผิดใครมีคำแนะนำใด ๆ หรือนี่เป็นเพียงจุดสำหรับการอภิปรายซึ่งต่างจากการวิเคราะห์เชิงปริมาณ

3
จะทดสอบว่าเมทริกซ์ความแปรปรวนร่วมมีการเปลี่ยนแปลงในช่วงเวลาสองจุดได้อย่างไร?
งานของฉันคือการทดสอบว่ามีการเปลี่ยนแปลงในเมทริกซ์ความแปรปรวนร่วมของตัวแปร 6 ตัวหรือไม่ ค่าของตัวแปร 6 ตัวจะถูกวัดสองครั้งจากตัวแบบเดียวกัน (3 ปีระหว่างการวัด) ฉันจะทำสิ่งนั้นได้อย่างไร ฉันทำงานส่วนใหญ่ด้วย SAS

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.