คำถามติดแท็ก nonparametric

ใช้แท็กนี้เพื่อสอบถามเกี่ยวกับลักษณะของวิธีการแบบไม่มีพารามิเตอร์หรือแบบพารามิเตอร์หรือความแตกต่างระหว่างทั้งสอง โดยทั่วไปแล้ววิธีการที่ไม่ใช่พารามิเตอร์ขึ้นอยู่กับสมมติฐานบางอย่างเกี่ยวกับการแจกแจงต้นแบบในขณะที่วิธีการพารามิเตอร์ทำสมมติฐานที่ช่วยให้ข้อมูลที่จะอธิบายด้วยพารามิเตอร์จำนวนน้อย

1
สมมติฐานว่างในการทดสอบแมนน์ - วิทนีย์คืออะไร?
ให้เป็นค่าสุ่มจากการกระจาย 1 และให้เป็นค่าสุ่มจากการกระจาย 2. ผมคิดว่าสมมติฐานสำหรับการทดสอบ Mann-Whitney เป็น&lt;X_1)X1X1X_1X2X2X_2P(X1&lt;X2)=P(X2&lt;X1)P(X1&lt;X2)=P(X2&lt;X1)P(X_1 < X_2) = P(X_2 < X_1) ถ้าฉันใช้การจำลองการทดสอบ Mann-Whitney กับข้อมูลจากการแจกแจงแบบปกติที่มีค่าเฉลี่ยเท่ากันและผลต่างที่เท่ากันด้วยฉันจะได้รับอัตราความผิดพลาด Type I ซึ่งใกล้เคียงกับ 0.05 มาก อย่างไรก็ตามถ้าฉันทำให้ความแปรปรวนไม่เท่ากัน (แต่ให้ค่าเฉลี่ยเท่ากัน) สัดส่วนของการจำลองที่สมมติฐานว่างถูกปฏิเสธมีขนาดใหญ่กว่า 0.05 ซึ่งฉันไม่ได้คาดหวังเนื่องจากยังคงอยู่ นี้เกิดขึ้นเมื่อผมใช้ในการวิจัยโดยไม่คำนึงว่าฉันมี, หรือα=0.05α=0.05\alpha=0.05P(X1&lt;X2)=P(X2&lt;X1)P(X1&lt;X2)=P(X2&lt;X1)P(X_1 < X_2) = P(X_2 < X_1)wilcox.testexact=TRUEexact=FALSE, correct=TRUEexact=FALSE, correct=FALSE สมมุติฐานว่างนั้นแตกต่างจากที่ฉันเขียนไว้ข้างต้นหรือว่าการทดสอบนั้นไม่ถูกต้องในแง่ของความผิดพลาดประเภทที่ 1 หากความแปรปรวนไม่เท่ากัน?

2
วิธีที่ดีที่สุดในการเลือกคุณสมบัติสำหรับการถดถอยแบบไม่มีพารามิเตอร์
คำถามใหม่ที่นี่ ขณะนี้ฉันกำลังทำการถดถอยแบบไม่ใช้พารามิเตอร์โดยใช้แพ็คเกจ np ในอาร์ฉันมีฟีเจอร์ 7 อย่างและใช้วิธีการบังคับเดรัจฉานฉันระบุว่าดีที่สุด 3. แต่ไม่นานฉันจะมีฟีเจอร์มากกว่า 7 อย่าง! คำถามของฉันคืออะไรเป็นวิธีที่ดีที่สุดในปัจจุบันสำหรับการเลือกคุณสมบัติสำหรับการถดถอยแบบไม่มีพารามิเตอร์ และถ้าหากแพ็กเกจใด ๆ ใช้วิธีการ ขอบคุณ.

1
กระบวนการ Stochastic เช่นกระบวนการ Gaussian / กระบวนการ Dirichlet มีความหนาแน่นหรือไม่ หากไม่สามารถใช้กฎของเบย์กับพวกเขาได้อย่างไร
กระบวนการ Dirichlet Pocess และ Gaussian นั้นมักเรียกกันว่า ในกรณีนั้นฉันสามารถพูดถึงความหนาแน่นของฟังก์ชั่นภายใต้ GP ได้หรือไม่? นั่นคือกระบวนการ Gaussian หรือกระบวนการ Dirichlet มีแนวคิดเกี่ยวกับความหนาแน่นของความน่าจะเป็นหรือไม่? หากไม่เป็นเช่นนั้นเราจะใช้กฎของเบย์ในการเปลี่ยนจากก่อนหน้าไปยังด้านหลังได้อย่างไรหากความคิดของความน่าจะเป็นก่อนหน้านี้ของฟังก์ชั่นยังไม่ชัดเจน มีสิ่งต่าง ๆ เช่นการประมาณค่า MAP หรือ EAP ในโลกที่ไม่ใช่แบบเบย์ของ Bayesian หรือไม่? ขอบคุณมาก.

3
วิธีการที่ไม่อิงพารามิเตอร์ต่างกันสำหรับการประเมินการแจกแจงความน่าจะเป็นของข้อมูล
ฉันมีข้อมูลบางส่วนและพยายามที่จะทำให้เส้นโค้งเรียบพอดี อย่างไรก็ตามฉันไม่ต้องการบังคับใช้ความเชื่อก่อนหน้านี้มากเกินไปหรือมีแนวคิดรวบยอดที่แข็งแกร่งเกินไป (ยกเว้นสิ่งที่อยู่ในคำถามที่เหลือของฉัน) หรือสิ่งใด ๆ ที่เฉพาะเจาะจง ฉันแค่ต้องการให้มันพอดีกับเส้นโค้งที่เรียบ (หรือมีการกระจายความน่าจะเป็นที่ดีซึ่งมันอาจมาจาก) วิธีเดียวที่ฉันรู้ในการทำเช่นนี้คือการประมาณความหนาแน่นของเคอร์เนล (KDE) ฉันสงสัยว่าถ้าคนรู้วิธีการอื่นในการประเมินสิ่งนั้น ฉันแค่ต้องการรายชื่อของพวกเขาและจากนั้นฉันสามารถทำวิจัยของตัวเองเพื่อค้นหาสิ่งที่ฉันต้องการใช้ ให้การเชื่อมโยงหรือการอ้างอิงที่ดี (หรือสัญชาตญาณที่ดี) ยินดีต้อนรับเสมอ (และได้รับการสนับสนุน)!

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
หนังสือสำหรับสถิติที่ไม่ใช่พารามิเตอร์
สิ่งที่จะเป็นหนังสือที่ดีสำหรับสถิติที่ไม่ใช่พารามิเตอร์ ไม่เพียงแค่การแนะนำ แต่ระดับสูง นอกจากนี้ฉันกำลังมองหาสิ่งที่ฉันสามารถใช้สำหรับการเรียนรู้และไม่ได้สำหรับการอ้างอิง โดยเฉพาะฉันกำลังมองหาหนังสือที่มีพื้นฐานอยู่เบื้องหลังวิธีการที่ไม่ใช้พารามิเตอร์, การอนุมานที่ไม่ใช่พารามิเตอร์, วิธีการประเมิน parametrics ที่ไม่ใช่เช่นการทดสอบ KS, การทดสอบ , ฯลฯ , bootstrapping ....เสื้อtt

1
พลังงานในโปรตีน?
แกรนต์มักต้องการการวิเคราะห์พลังงานเพื่อสนับสนุนขนาดตัวอย่างที่เสนอ ในโปรตีโอมิกส์ (และส่วนใหญ่ -omics) มีคุณลักษณะ / ตัวแปร 100 ถึง 1,000 รายการที่วัดจาก 10 ตัวอย่าง (อาจเป็น 100 แต่ไม่น่าเป็นไปได้) นอกจากนี้เป็นที่ทราบกันว่าหน่วยการวัดเหล่านี้บางส่วน (เช่นจำนวนสเปกตรัมของโปรตีน) ไม่ได้มีการแจกจ่ายตามปกติดังนั้นเราจะใช้การทดสอบแบบไม่มีพารามิเตอร์เพื่อการวิเคราะห์ ฉันเห็นพลังของขนาดตัวอย่างที่กำหนดไว้โดยใช้การวัดเดี่ยวและสมมติว่าเป็นการทดสอบ t แต่ฉันไม่คิดว่าสิ่งนี้จะถูกต้องทั้งหมด ปัญหาอีกประการหนึ่งเกี่ยวกับการนับสเปคตรัมโดยเฉพาะคือแต่ละคุณสมบัติ 100 อยู่ในระดับที่แตกต่างกันมากที่มีข้อผิดพลาดแตกต่างกันอย่างมาก (ค่าที่มากขึ้นมีข้อผิดพลาดน้อยกว่า) [ปัญหานี้ได้รับการอธิบายไว้เป็นอย่างดีในโมเดลการเปลี่ยนแปลงการ จำกัด การพับMutch และคณะ, 2002 ] อะไรจะเป็นวิธีที่เหมาะสมในการกำหนดพลังของขนาดตัวอย่างที่เสนอเนื่องจากสมมติฐานบางอย่างของ FDR และการเปลี่ยนแปลงแบบพับได้ที่ยอมรับได้ การใช้เครื่องมือที่นี่ฉันสามารถระบุได้ดังนี้: 300 ยีน 3 บวกเท็จ 1.4 ความแตกต่างของการพับ 0.8 กำลังที่ต้องการ 0.7 stdev ต้องการขนาดตัวอย่างต่อกลุ่ม 49 สิ่งนี้มีประโยชน์ตั้งแต่ฉันเสนอการออกแบบ 50v50 …

2
ตำราเรียนเบื้องต้นเกี่ยวกับแบบจำลองที่ไม่ใช่พารามิเตอร์แบบเบส์?
ฉันต้องการปิดหัวของฉันในหัวข้อนี้ แต่การเรียนรู้จากเอกสารและแบบฝึกหัดนั้นยากเพราะมีช่องว่างมากมายที่มักจะถูกเติมในตำราเรียน ถ้ามันเป็นสิ่งสำคัญที่ฉันมีพื้นหลังทางคณิตศาสตร์ที่ค่อนข้างแข็งแกร่งเหมือนที่ฉันทำปริญญาเอกของฉัน ในคณิตศาสตร์ประยุกต์ (CFD จะแม่นยำยิ่งขึ้น)

4
ควรใช้การถดถอยแบบไม่อิงพารามิเตอร์เมื่อใด
ฉันใช้ PROC GLM ใน SAS เพื่อให้สมการถดถอยของแบบฟอร์มต่อไปนี้ Y=ข0+ข1X1+ข2X2+ข3X3+ข4เสื้อY=b0+b1X1+b2X2+b3X3+b4t Y = b_0 + b_1X_1 + b_2X_2 + b_3X_3 + b_4t พล็อต QQ ของ redsiduals ที่เกิดขึ้นบ่งบอกถึงการเบี่ยงเบนจากปกติ การเปลี่ยนแปลงของใด ๆจะไม่เป็นประโยชน์ในการทำให้ส่วนที่เหลือเป็นปกติYYY ณ จุดนี้ฉันสามารถเปลี่ยนเป็นวิธีที่ไม่ใช่พารามิเตอร์อย่างปลอดภัยเช่น PROC LOESS ฉันใช้ PROC LOESS แล้วและแบบที่ดูดีกว่า PROC GLM แต่ฉันไม่มีความรู้มากนักในการถดถอยแบบไม่อิงพารามิเตอร์ ฉันไม่ทราบว่าเมื่อใดควรเลือกการถดถอยแบบไม่อิงพารามิเตอร์ในการถดถอยแบบพารามิเตอร์ มีคนช่วยฉันได้ไหม ฉันจะดำเนินการต่อและเพิ่มคำถามอื่น ต่อไปนี้เป็นคำอธิบายของตัวแปรของฉันในรูปแบบ บางครั้งฉันได้รับค่าใช้จ่ายคาดการณ์เชิงลบ สิ่งนี้ไม่สมเหตุสมผล ฉันจะแก้ไขปัญหานี้ได้อย่างไรY= ค่ารักษาพยาบาลX1= จำนวนการฉีดX2= จำนวนการผ่าตัดX3= จำนวนการบำบัดทางกายภาพt = เวลาY=cost of …

1
มี ARMA ที่เทียบเท่ากับอันดับสหสัมพันธ์หรือไม่
ฉันกำลังดูข้อมูลเชิงเส้นที่ไม่มากซึ่งโมเดลของ ARMA / ARIMA ทำงานได้ไม่ดี แม้ว่าฉันจะเห็นความสัมพันธ์อัตโนมัติบางอย่างและฉันหวังว่าจะได้ผลลัพธ์ที่ดีกว่าสำหรับการไม่เกี่ยวข้องกันโดยอัตโนมัติเชิงเส้น 1 / มี PACF ที่เทียบเท่ากับอันดับสหสัมพันธ์หรือไม่ (ใน R?) 2 / มีแบบจำลอง ARMA ที่เทียบเท่าสำหรับความสัมพันธ์เชิงเส้น / อันดับ (ใน R หรือไม่)

3
ผิดหรือไม่ที่จะกระวนกระวายใจก่อนที่จะทำการทดสอบ Wilcoxon?
ฉันเขียนสคริปต์ทดสอบข้อมูลโดยใช้wilcox.testแต่เมื่อฉันได้ผลลัพธ์ผลลัพธ์ค่า p ทั้งหมดที่เท่ากับ 1 ฉันอ่านในบางเว็บไซต์ที่คุณสามารถใช้ jitter ก่อนทดสอบข้อมูล (เพื่อหลีกเลี่ยงความสัมพันธ์ตามที่กล่าวไว้) ฉันทำสิ่งนี้และตอนนี้ฉันมีผลลัพธ์ที่ยอมรับได้ การทำเช่นนี้ผิดหรือเปล่า? test&lt;- function(column,datacol){ library(ggplot2) t=read.table("data.txt", stringsAsFactors=FALSE) uni=unique(c(t$V9)) for (xp in uni) { for(yp in uni) { testx &lt;- subset(t, V9==xp) testy &lt;- subset(t, V9==yp) zz &lt;- wilcox.test(testx[[datacol]],jitter(testy[[datacol]])) p.value &lt;- zz$p.value } } } นี่คือผลลัพธ์ของ dput(head(t)) structure(list(V1 = c(0.268912, 0.314681, 0.347078, 0.286945, …
9 r  nonparametric  ties 

4
มัลติโนวาแบบหลายพารามิเตอร์
ฉันต้องวิเคราะห์การออกแบบแบบแฟกทอเรียลด้วยปัจจัยห้าประการ (หนึ่งในนั้นซ้อนอยู่ในอีกอันหนึ่ง) และการตอบสนองเชิงตัวเลข ฉันต้องการทำการวิเคราะห์ ANOVA แบบไม่ใช้พารามิเตอร์ แต่แน่นอนว่าฉันไม่สามารถใช้การทดสอบ Kruskall Wallis และ Friedman (ฉันใช้มาตรการจำลองแบบ) มีคำสั่งหรือรหัสใน R ที่สามารถช่วยฉันได้ไหม ขอบคุณ! Stefania

7
การบูตสแตรป - คนที่สามารถให้คำอธิบายง่ายๆเพื่อให้ฉันเริ่มต้นได้อย่างไร
แม้จะมีความพยายามหลายครั้งในการอ่านเกี่ยวกับ bootstrapping แต่ดูเหมือนว่าฉันจะชนกำแพงอิฐเสมอ ฉันสงสัยว่าใครสามารถให้คำจำกัดความที่ไม่ใช่ด้านเทคนิคของการบูตสแตรปหรือไม่? ฉันรู้ว่ามันเป็นไปไม่ได้ในฟอรั่มนี้เพื่อให้รายละเอียดมากพอที่จะช่วยให้ฉันเข้าใจมัน แต่การผลักดันอ่อนโยนในทิศทางที่เหมาะสมกับเป้าหมายหลักและกลไกของความร่วมมือจะมากชื่นชม! ขอบคุณ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.