คำถามติดแท็ก f-test

2
วิธีการทดสอบความแตกต่างของความแปรปรวนร่วมกับข้อมูลวงกลม
ฉันสนใจที่จะเปรียบเทียบจำนวนความแปรปรวนภายใน 8 ตัวอย่างที่แตกต่างกัน (แต่ละอันจากประชากรที่แตกต่างกัน) ฉันทราบว่าสามารถทำได้หลายวิธีด้วยข้อมูลอัตราส่วน: ความเท่าเทียมกันของการทดสอบความแปรปรวนของ F-test, การทดสอบ Levene เป็นต้น อย่างไรก็ตามข้อมูลของฉันเป็นแบบวงกลม / ทิศทาง (เช่นข้อมูลที่แสดงช่วงเวลาเช่นทิศทางลมและข้อมูลเชิงมุมทั่วไปหรือเวลาของวัน) ฉันได้ทำการวิจัยและพบหนึ่งการทดสอบในแพ็คเกจ "CircStats" ใน R - "การทดสอบของ Watson สำหรับความเป็นเนื้อเดียวกัน" ข้อบกพร่องอย่างหนึ่งคือการทดสอบนี้เปรียบเทียบเพียงสองตัวอย่างซึ่งหมายความว่าฉันจะต้องทำการเปรียบเทียบหลายรายการกับตัวอย่าง 8 รายการของฉัน (แล้วใช้การแก้ไข Bonferonni) นี่คือคำถามของฉัน: 1) มีการทดสอบที่ดีกว่าที่ฉันสามารถใช้ได้หรือไม่? 2) ถ้าไม่สมมติฐานของการทดสอบของ Watson คืออะไร มันเป็นพารามิเตอร์ / ไม่ใช่พารามิเตอร์? 3) อัลกอริทึมที่ฉันสามารถทำการทดสอบนี้คืออะไร? ข้อมูลของฉันอยู่ใน Matlab และฉันไม่ต้องการโอนไปยัง R เพื่อทำการทดสอบ ฉันอยากเขียนฟังก์ชั่นของตัวเอง

2
ทำไมการทดสอบ F ถึงมีความละเอียดอ่อนมากสำหรับการสันนิษฐานของภาวะปกติ?
ทำไมเป็นF -test สำหรับความแตกต่างในความแปรปรวนเพื่อให้มีความไวต่อสมมติฐานของการกระจายปกติแม้สำหรับขนาดใหญ่NNN ? ฉันพยายามค้นหาเว็บและเยี่ยมชมห้องสมุด แต่ก็ไม่มีคำตอบที่ดีเลย มันบอกว่าการทดสอบมีความละเอียดอ่อนมากสำหรับการละเมิดสมมติฐานสำหรับการแจกแจงแบบปกติ แต่ฉันไม่เข้าใจว่าทำไม ใครบ้างมีคำตอบที่ดีสำหรับเรื่องนี้?

2
ความแตกต่างระหว่างการเลือกคุณสมบัติตาม“ F ถดถอย” และขึ้นอยู่กับค่า ?
การเปรียบเทียบคุณสมบัติต่าง ๆ โดยใช้คุณลักษณะF-regressionเดียวกับการเชื่อมโยงคุณสมบัติกับฉลากแต่ละรายการและการสังเกตค่าหรือไม่R2R2R^2 ฉันมักจะเห็นเพื่อนร่วมงานของฉันใช้F regressionสำหรับการเลือกคุณสมบัติในการเรียนรู้ของเครื่องจากsklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` บางคนบอกฉัน - ทำไมมันให้ผลลัพธ์เช่นเดียวกับที่สัมพันธ์กับตัวแปรฉลาก / depedendent? ข้อได้เปรียบของการใช้งานF_regressionในการเลือกคุณสมบัติ ไม่ชัดเจนสำหรับฉัน นี่คือรหัสของฉัน: ฉันใช้mtcarsชุดข้อมูลจากR: import pandas as pd import numpy as np from sklearn import feature_selection from sklearn.linear_model import LinearRegression #....load mtcars dataset into a pandas dataframe called "df", not shown here for conciseness # only using these numerical …

3
เหตุใดเราจึงใช้การทดสอบ F-test แบบหางเดียวในการวิเคราะห์ความแปรปรวน (ANOVA)
คุณสามารถให้เหตุผลในการใช้การทดสอบแบบหางเดียวในการวิเคราะห์การทดสอบความแปรปรวนได้หรือไม่? เหตุใดเราจึงใช้การทดสอบแบบหางเดียว - การทดสอบ F - ใน ANOVA

1
สูตรขนาดตัวอย่างสำหรับการทดสอบ F หรือไม่
ฉันสงสัยว่ามีสูตรขนาดตัวอย่างเช่นสูตรของ Lehr ที่ใช้กับการทดสอบ F หรือไม่ สูตรของ Lehr สำหรับการทดสอบ t คือโดยที่คือขนาดของเอฟเฟกต์ ( เช่น ) สิ่งนี้สามารถทำให้เป็นปกติได้ถึงโดยที่เป็นค่าคงที่ที่ขึ้นอยู่กับอัตราของประเภทพลังงานที่ต้องการและไม่ว่าจะทำการทดสอบด้านเดียวหรือสองด้านn=16/Δ2n=16/Δ2n = 16 / \Delta^2ΔΔ\Delta Δ=(μ1−μ2)/σΔ=(μ1−μ2)/σ\Delta = (\mu_1 - \mu_2) / \sigman=c/Δ2n=c/Δ2n = c / \Delta^2ccc ฉันกำลังมองหาสูตรที่คล้ายกันสำหรับการทดสอบ F สถิติการทดสอบของฉันได้รับการแจกจ่ายภายใต้ทางเลือกเนื่องจากไม่ใช่ F กลางที่มีองศาอิสระและพารามิเตอร์ที่ไม่ใช่ศูนย์กลางโดยที่ขึ้นอยู่กับพารามิเตอร์ประชากรเท่านั้นซึ่งไม่เป็นที่รู้จัก . พารามิเตอร์ได้รับการแก้ไขโดยการทดลองและคือขนาดตัวอย่าง เป็นการดีที่ฉันกำลังมองหาสูตร (รูปแบบที่รู้จักกันดี) ของรูปแบบ โดยที่ขึ้นอยู่กับอัตราของฉันและพลังเท่านั้นk,nk,nk,nnλnλn \lambdaλλ\lambdakkknnnn=cg(k,λ)n=cg(k,λ)n = \frac{c}{g(k,\lambda)}ccc ขนาดตัวอย่างควรเป็นไปตาม ที่คือ CDF ของ F ที่ไม่ได้เป็นศูนย์กลางพร้อมพารามิเตอร์ dof …

4
ความสัมพันธ์ระหว่าง ANOVA เพื่อเปรียบเทียบวิธีการของหลายกลุ่มและ ANOVA เพื่อเปรียบเทียบแบบจำลองที่ซ้อนกันคืออะไร?
ฉันเคยเห็น ANOVA ใช้สองวิธี: อันดับแรกในข้อความสถิติเบื้องต้นของฉัน ANOVA ถูกนำมาใช้เป็นวิธีเปรียบเทียบกลุ่มสามกลุ่มหรือมากกว่านั้นเพื่อปรับปรุงมากกว่าการเปรียบเทียบแบบคู่เพื่อที่จะตัดสินว่าหนึ่งในวิธีนั้นมีความแตกต่างอย่างมีนัยสำคัญทางสถิติหรือไม่ ประการที่สองในข้อความการเรียนรู้เชิงสถิติของฉันฉันเคยเห็น ANOVA เคยใช้แบบจำลองซ้อนกันสอง (หรือมากกว่า) เพื่อตรวจสอบว่าแบบจำลอง 1 ซึ่งใช้ชุดย่อยของตัวทำนายรุ่น 2 เหมาะกับข้อมูลเท่ากันหรือเต็ม รุ่น 2 ยอดเยี่ยม ตอนนี้ฉันคิดว่าในทางใดทางหนึ่งหรือทั้งสองสิ่งนี้คล้ายกันจริง ๆ เพราะพวกเขาทั้งสองใช้การทดสอบ ANOVA แต่บนพื้นผิวพวกเขาดูเหมือนจะแตกต่างกันมากสำหรับฉัน สำหรับหนึ่งการใช้งานครั้งแรกเปรียบเทียบสามกลุ่มขึ้นไปในขณะที่วิธีที่สองสามารถใช้เพื่อเปรียบเทียบเพียงสองรุ่น มีใครบ้างที่โปรดอธิบายการเชื่อมต่อระหว่างการใช้งานทั้งสองนี้
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.