คำถามติดแท็ก nonparametric

ใช้แท็กนี้เพื่อสอบถามเกี่ยวกับลักษณะของวิธีการแบบไม่มีพารามิเตอร์หรือแบบพารามิเตอร์หรือความแตกต่างระหว่างทั้งสอง โดยทั่วไปแล้ววิธีการที่ไม่ใช่พารามิเตอร์ขึ้นอยู่กับสมมติฐานบางอย่างเกี่ยวกับการแจกแจงต้นแบบในขณะที่วิธีการพารามิเตอร์ทำสมมติฐานที่ช่วยให้ข้อมูลที่จะอธิบายด้วยพารามิเตอร์จำนวนน้อย

3
ทำไมการทดสอบ Kolmogorov-Smirnov ถึงใช้งานได้?
ในการอ่านเกี่ยวกับการทดสอบ KS 2 ตัวอย่างผมเข้าใจว่าสิ่งที่ทำแต่ผมไม่เข้าใจว่าทำไมมันทำงาน กล่าวอีกนัยหนึ่งฉันสามารถทำตามทุกขั้นตอนเพื่อคำนวณฟังก์ชันการกระจายเชิงประจักษ์ค้นหาความแตกต่างสูงสุดระหว่างทั้งสองเพื่อค้นหา D-statistic คำนวณค่าวิกฤตเปลี่ยนค่า D-statistic เป็น p-value เป็นต้น แต่ฉันไม่รู้ว่าทำไมสิ่งนี้จริง ๆ บอกอะไรฉันเกี่ยวกับการแจกแจงสองอย่าง บางคนอาจบอกฉันได้อย่างง่ายดายว่าฉันต้องกระโดดข้ามลาและนับว่ามันวิ่งเร็วแค่ไหนและถ้าความเร็วน้อยกว่า 2 กม. / ชม. ฉันก็ปฏิเสธสมมติฐานว่าง แน่ใจว่าฉันสามารถทำสิ่งที่คุณบอกให้ฉันทำ แต่สิ่งใดที่เกี่ยวข้องกับสมมติฐานว่าง? เหตุใดการทดสอบ KS 2 ตัวอย่างทำงาน การคำนวณความแตกต่างสูงสุดระหว่าง ECDF นั้นเกี่ยวข้องกับการแจกแจงสองแบบที่แตกต่างกันอย่างไร ความช่วยเหลือใด ๆ ที่ชื่นชม ฉันไม่ใช่นักสถิติดังนั้นให้สมมติว่าฉันเป็นคนงี่เง่าถ้าเป็นไปได้

4
Tukey HSD มีค่าเทียบเท่าที่ไม่ใช่พารามิเตอร์หรือไม่
ฉันใช้ JMP เพื่อตรวจสอบความแตกต่างในใบพืชในกลุ่มการเจริญเติบโต (ต้นไม้พุ่มไม้ forbs ฯลฯ ) ก่อนและหลังการรักษาสามครั้งด้วยการควบคุม ขนาดตัวอย่างของฉันมีขนาดเล็ก (n = 5) และการแจกแจงส่วนใหญ่ของฉันไม่ได้รับการกระจายตามปกติ สำหรับการแจกแจงแบบปกติฉันใช้ ANOVA เพื่อวิเคราะห์ความแตกต่าง (การเปลี่ยนแปลงเปอร์เซ็นต์) ระหว่างผลลัพธ์ของการรักษาจากนั้นใช้ Tukey HSD เพื่อทดสอบความสำคัญของความแตกต่างระหว่างคู่ของผลลัพธ์ สำหรับข้อมูลที่ไม่กระจายตามปกติฉันใช้การทดสอบ Wilcoxon / Kruskal-Wallis มีค่าเทียบเท่า Tukey HSD ที่ไม่ใช่พารามิเตอร์ที่ฉันสามารถใช้เพื่อตรวจสอบความแตกต่างระหว่างผลลัพธ์เหล่านี้หรือไม่

5
การทดสอบแบบไม่อิงพารามิเตอร์ทำอะไรได้บ้างและคุณทำอะไรกับผลลัพธ์
ฉันรู้สึกว่านี่อาจถูกถามที่อื่น แต่ไม่จริงกับประเภทของคำอธิบายพื้นฐานที่ฉันต้องการ ฉันรู้ว่าไม่ใช่พารามิเตอร์อาศัยค่ามัธยฐานแทนค่าเฉลี่ยเพื่อเปรียบเทียบ ... บางสิ่งบางอย่าง ฉันเชื่อว่ามันต้องอาศัย "องศาอิสระ" (?) แทนที่จะเบี่ยงเบนมาตรฐาน ถูกต้องฉันถ้าฉันผิด ฉันได้ทำการวิจัยที่ดีพอสมควรหรืออย่างนั้นฉันก็คิดว่าพยายามเข้าใจแนวคิดว่าผลงานอยู่เบื้องหลังความหมายของผลการทดสอบจริง ๆ และ / หรือจะทำอย่างไรกับผลการทดสอบ อย่างไรก็ตามดูเหมือนว่าจะไม่มีใครกล้าเข้าไปในพื้นที่นั้น เพื่อความเรียบง่ายลองมากับ Mann-Whitney U-test ซึ่งฉันสังเกตเห็นว่ามันค่อนข้างเป็นที่นิยม หากคุณต้องการอธิบายการทดสอบอื่น ๆ ด้วยเช่นกันแม้ว่าฉันจะรู้สึกว่าเมื่อฉันเข้าใจแล้วฉันก็สามารถเข้าใจการทดสอบอื่น ๆ ในลักษณะที่คล้ายคลึงกับการทดสอบ t แบบต่างๆเป็นต้น สมมติว่าฉันทำการทดสอบที่ไม่ใช่พารามิเตอร์กับข้อมูลของฉันและฉันได้รับผลลัพธ์กลับมา: 2 Sample Mann-Whitney - Customer Type Test Information H0: Median Difference = 0 Ha: Median Difference ≠ 0 Size of Customer Large …

1
อะไรคือความเท่าเทียมแบบไม่อิงพารามิเตอร์ของ ANOVA สองทางที่สามารถรวมการโต้ตอบได้?
สวัสดีฉันกำลังพยายามที่จะหาค่าเทียบเท่าที่ไม่ใช่พารามิเตอร์ของ ANOVA สองทาง (การออกแบบ 3x4) ซึ่งมีความสามารถในการรวมการโต้ตอบ จากการอ่านของฉันใน Zar 1984 "การวิเคราะห์ชีวสถิติ" นี่เป็นไปได้โดยใช้วิธีการที่วางไว้ใน Scheirer, Ray, และ Hare (1976) อย่างไรก็ตามจากการโพสต์อื่น ๆ ทางออนไลน์มันถูกอนุมานว่าวิธีนี้ไม่เหมาะสมอีกต่อไป ถูก) ไม่มีใครรู้วิธีการที่เหมาะสมสำหรับการทำเช่นนั้นและถ้าเป็นเช่นนั้นฟังก์ชั่นที่สอดคล้องกันใน R หรือ Stata?

4
มีการทดสอบสถิติใด ๆ ที่เป็นพารามิเตอร์และไม่ใช่พารามิเตอร์
มีการทดสอบสถิติใด ๆ ที่เป็นพารามิเตอร์และไม่ใช่พารามิเตอร์ คำถามนี้ถูกถามโดยคณะผู้สัมภาษณ์ เป็นคำถามที่ถูกต้องหรือไม่

3
อัลกอริทึม MIC สำหรับตรวจจับความสัมพันธ์ที่ไม่ใช่เชิงเส้นสามารถอธิบายได้อย่างง่ายดายหรือไม่?
อีกไม่นานฉันอ่านบทความสองเรื่อง อย่างแรกคือเกี่ยวกับประวัติของสหสัมพันธ์และที่สองเกี่ยวกับวิธีการใหม่ที่เรียกว่า Maximal Information Coefficient (MIC) ฉันต้องการความช่วยเหลือของคุณเกี่ยวกับการทำความเข้าใจกับวิธี MIC เพื่อประเมินความสัมพันธ์แบบไม่เป็นเชิงเส้นระหว่างตัวแปร นอกจากนี้คำแนะนำสำหรับการใช้งานใน R สามารถพบได้บนเว็บไซต์ของผู้เขียน (ภายใต้ดาวน์โหลด ): ฉันหวังว่านี่จะเป็นแพลตฟอร์มที่ดีในการพูดคุยและเข้าใจวิธีการนี้ ความสนใจของฉันที่จะหารือเกี่ยวกับสัญชาตญาณเบื้องหลังวิธีนี้และสามารถขยายออกไปได้อย่างไรตามที่ผู้เขียนกล่าว " ... เราต้องการส่วนขยายของ MIC (X, Y) ถึง MIC (X, Y | Z) เราจะต้องการทราบว่าต้องใช้ข้อมูลจำนวนเท่าใดในการประมาณค่า MIC ที่มีเสถียรภาพและมีความอ่อนไหวต่อค่าผิดปกติอย่างไร - หรือความสัมพันธ์ที่สูงขึ้นมิติมันจะพลาดและอื่น ๆ MIC เป็นขั้นตอนที่ดีข้างหน้า แต่มีขั้นตอนอื่น ๆ อีกมากมายที่จะใช้.. "

1
การทดสอบแบบไม่อิงพารามิเตอร์หากดึงตัวอย่างสองตัวอย่างจากการแจกแจงแบบเดียวกัน
ฉันต้องการทดสอบสมมติฐานว่ามีตัวอย่างสองตัวอย่างมาจากประชากรเดียวกันโดยไม่มีการตั้งสมมติฐานใด ๆ เกี่ยวกับการกระจายตัวของกลุ่มตัวอย่างหรือประชากร ฉันจะทำสิ่งนี้ได้อย่างไร จากวิกิพีเดียความประทับใจของฉันคือการทดสอบ Mann Whitney U ควรเหมาะสม แต่ดูเหมือนจะไม่เหมาะสำหรับฉันในทางปฏิบัติ สำหรับ concreteness ฉันได้สร้างชุดข้อมูลที่มีสองตัวอย่าง (a, b) ที่มีขนาดใหญ่ (n = 10,000) และดึงมาจากประชากรสองกลุ่มที่ไม่ปกติ (bimodal) มีความคล้ายคลึงกัน (ค่าเฉลี่ยเดียวกัน) แตกต่างกัน (ค่าเบี่ยงเบนมาตรฐาน รอบ "humps.") ฉันกำลังมองหาการทดสอบที่จะรับรู้ว่าตัวอย่างเหล่านี้ไม่ได้มาจากประชากรเดียวกัน มุมมองฮิสโตแกรม: รหัส R: a <- tibble(group = "a", n = c(rnorm(1e4, mean=50, sd=10), rnorm(1e4, mean=100, sd=10))) b <- tibble(group = "b", n …

3
เพียร์สันเป็นพารามิเตอร์ทำไมและ Spearman ไม่ใช่พารามิเตอร์
เห็นได้ชัดว่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันเป็นพารามิเตอร์และโรของสเปียร์แมนไม่ใช่พารามิเตอร์ ฉันมีปัญหาในการเข้าใจสิ่งนี้ ตามที่ฉันเข้าใจแล้ว Pearson คำนวณเป็น และคำนวณ Spearman ด้วยวิธีเดียวกันยกเว้นเราแทนที่ค่าทั้งหมดด้วยอันดับของพวกเขาrxy=cov(X,Y)σxσyrxy=cov(X,Y)σxσy r_{xy} = \frac{cov(X,Y)}{\sigma_x\sigma_y} Wikipedia พูดว่า ความแตกต่างระหว่างโมเดลพารามิเตอร์และโมเดลที่ไม่ใช่พารามิเตอร์คืออดีตมีพารามิเตอร์จำนวนคงที่ในขณะที่รุ่นหลังจะเพิ่มจำนวนพารามิเตอร์ด้วยจำนวนข้อมูลการฝึกอบรม แต่ฉันไม่เห็นพารามิเตอร์ใด ๆ ยกเว้นกลุ่มตัวอย่างเอง บางคนบอกว่าการทดสอบพาราเมทริกถือว่าการแจกแจงแบบปกติและบอกต่อไปว่าเพียร์สันถือว่าข้อมูลการแจกแจงแบบปกติ แต่ฉันล้มเหลวที่จะดูว่าทำไมเพียร์สันถึงต้องการ ดังนั้นคำถามของฉันคืออะไรที่ทำให้พารามิเตอร์และไม่ใช่พารามิเตอร์ในบริบทของสถิติ? เพียร์สันกับสเปียร์แมนพอดีกันยังไง

2
โมเดลสารเติมแต่งทั่วไป - ใครทำการวิจัยกับพวกเขานอกเหนือจาก Simon Wood
ฉันใช้เกมมากขึ้นเรื่อย ๆ เมื่อฉันไปเพื่อให้การอ้างอิงสำหรับส่วนประกอบต่าง ๆ ของพวกเขา (การเลือกพารามิเตอร์ให้เรียบฐาน spline ต่างๆ p-values ​​ของคำศัพท์ที่ราบเรียบ) พวกเขาทั้งหมดมาจากนักวิจัยคนหนึ่ง - Simon Wood ที่ University of Bath ในอังกฤษ เขายังเป็นผู้ดูแลmgcvใน R ซึ่งใช้ร่างกายของเขาในการทำงาน mgcvมีความซับซ้อนอย่างมาก แต่ทำงานได้ดีอย่างน่าทึ่ง มีสิ่งที่มีอายุมากกว่าแน่นอน แนวความคิดดั้งเดิมนั้นให้เครดิตกับ Hastie & Tibshirani และตำราเก่าที่ยิ่งใหญ่เขียนโดย Ruppert et al ในปี 2003 ในฐานะที่เป็นคนสมัครฉันไม่ค่อยมีความรู้สึกกับนัก Zeitgeist ในหมู่นักสถิติ งานของเขาได้รับการยกย่องอย่างไร เป็นเรื่องแปลกไหมที่นักวิจัยคนหนึ่งทำได้มากในพื้นที่หนึ่ง? หรือมีงานอื่นที่ไม่ได้สังเกตมากเพราะมันไม่ได้อยู่ข้างในmgcv? ฉันไม่เห็นว่ามีการใช้เกมมากนักแม้ว่าเนื้อหาจะสามารถเข้าถึงได้โดยผู้ใช้ที่มีการฝึกอบรมทางสถิติและซอฟต์แวร์ได้รับการพัฒนาค่อนข้างดี มี "เรื่องย้อนหลัง" มากมายหรือไม่? คำแนะนำของมุมมองชิ้นและสิ่งที่คล้ายกันอื่น ๆ จากวารสารสถิติจะได้รับการชื่นชม

3
ฉันจะคำนวณช่วงความมั่นใจของค่าเฉลี่ยในตัวอย่างที่ไม่ได้กระจายแบบทั่วไปได้อย่างไร
ฉันจะคำนวณช่วงความมั่นใจของค่าเฉลี่ยในตัวอย่างที่ไม่ได้กระจายแบบทั่วไปได้อย่างไร ฉันเข้าใจว่าวิธีการ bootstrap มักใช้ที่นี่ แต่ฉันเปิดให้ตัวเลือกอื่น ๆ ในขณะที่ฉันกำลังมองหาตัวเลือกที่ไม่ใช่พารามิเตอร์หากใครบางคนสามารถโน้มน้าวใจฉันได้ว่าการแก้ปัญหาแบบพารามิเตอร์นั้นใช้ได้อย่างถูกต้อง ขนาดตัวอย่างคือ> 400 ถ้าใครสามารถให้ตัวอย่างใน R มันจะได้รับการชื่นชมมาก

3
มีการทดสอบ Kruskal Wallis ทางเดียวสำหรับแบบจำลองสองทางหรือไม่?
หากแบบจำลองนั้นไม่เป็นไปตามสมมติฐานของ ANOVA (โดยเฉพาะในภาวะปกติ) หากเป็นแบบทางเดียวแนะนำให้ทำการทดสอบแบบไม่ใช้พารามิเตอร์ของ Kruskal-Wallis แต่ถ้าคุณมีหลายปัจจัย

2
หากเคอร์เนล Epanechnikov เหมาะสมที่สุดในทางทฤษฎีเมื่อทำการประมาณค่าความหนาแน่นเคอร์เนลทำไมจึงไม่ใช้บ่อยกว่านี้
ฉันได้อ่าน (เช่นที่นี่ ) ว่าเคอร์เนล Epanechnikov เหมาะสมที่สุดอย่างน้อยก็ในทางทฤษฎีเมื่อทำการประมาณความหนาแน่นของเคอร์เนล หากเป็นจริงแล้วทำไมเกาส์เซียนถึงปรากฏบ่อยขึ้นในฐานะเคอร์เนลเริ่มต้นหรือในหลาย ๆ กรณีเป็นเคอร์เนลเพียงตัวเดียวในไลบรารีการประเมินความหนาแน่น


3
การทดสอบทางสถิติสำหรับการแจกแจงสองแบบที่ทราบเพียงการสรุป 5 หมายเลข
ฉันมีการแจกแจงสองแบบที่รู้จักกันเพียงการสรุป 5 หมายเลข (ขั้นต่ำ, ควอไทล์อันดับ 1, ค่ามัธยฐาน, ควอไทล์อันดับที่ 3, สูงสุด) และขนาดตัวอย่าง หาคำถามที่นี่ไม่ได้มีจุดข้อมูลทั้งหมด มีการทดสอบทางสถิติที่ไม่ใช่พารามิเตอร์ซึ่งช่วยให้ฉันตรวจสอบว่าการแจกแจงพื้นฐานของทั้งสองนั้นแตกต่างกันหรือไม่? ขอบคุณ!

4
หนึ่งกราฟจะแสดงผลลัพธ์ของการจัดอันดับแบบอัตนัยได้อย่างไร
ฉันกำลังมองหาวิธีที่จะเห็นภาพการจัดอันดับอัตนัยแยกจากการทดสอบที่ไม่ใช่พารามิเตอร์ของฉัน ฉันขอให้ผู้เข้าร่วม 12 คนจัดอันดับ 8 รายการที่แตกต่างกันตามเกณฑ์ความรู้สึกส่วนตัวที่แตกต่างกัน (จัดอันดับแยกกันสำหรับแต่ละรายการ) สำหรับการจัดอันดับชุดใด ๆ ฉันกำลังมองหาวิธีที่ดีในการมองเห็นแนวโน้มระดับสูงของการจัดอันดับ ฉันได้ลองทั้งบาร์และเรดาร์ในการจัดอันดับโดยเฉลี่ยและฉันเห็นคนอีกคนหนึ่งใช้พล็อตกระจาย / บอลลูนมากกว่าจำนวนการตอบสนองต่ออันดับ แต่ฉันไม่แน่ใจว่าสิ่งใดที่สื่อถึงภาพรวมที่ดีที่สุด ฉันสามารถใช้การจัดอันดับค่าเฉลี่ย 8 หรือการนับ 8 ของการจัดอันดับต่อรายการ แก้ไข: ตัวอย่างเช่น: แต่ละคอลัมน์เป็นรายการแต่ละแถวเป็นการจัดอันดับของแต่ละคนในแปดรายการ ไม่ใช่ข้อตกลงที่แข็งแกร่งเป็นพิเศษในตัวอย่างนี้ แต่โดยทั่วไปต้องการเข้าใจวิธีที่ดีที่สุดในการถ่ายทอดแนวโน้มโดยรวม Item: A B C D E F G H Rater: 1 6 8 1 7 3 4 2 5 2 1 3 8 7 6 5 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.