เมื่อใดการแปลง z ของฟิชเชอร์จึงเหมาะสม?


13

ฉันต้องการทดสอบความสัมพันธ์ตัวอย่างเพื่อความสำคัญโดยใช้ค่า p นั่นคือr

H0:ρ=0,H1:ρ0.

ฉันเข้าใจว่าฉันสามารถใช้การแปลง z ของฟิชเชอร์เพื่อคำนวณสิ่งนี้ด้วย

zobs=n32ln(1+r1r)

และหาค่า p โดย

p=2P(Z>zobs)

ใช้การแจกแจงแบบปกติมาตรฐาน

คำถามของฉันคือวิธีที่มีขนาดใหญ่ควรจะให้นี้จะมีการเปลี่ยนแปลงที่เหมาะสมหรือไม่ เห็นได้ชัดว่าจะต้องมีขนาดใหญ่กว่า 3. ตำราเรียนของฉันไม่ได้พูดถึงข้อ จำกัด ใด ๆ แต่ในสไลด์ 29 ของงานนำเสนอนี้มันบอกว่าจะต้องมีขนาดใหญ่กว่า 10 สำหรับข้อมูลที่ฉันจะได้รับการพิจารณาผมจะมีบางอย่างเช่น10n n 5 n 10nnn5n10


2
วิกิพีเดียหน้ารายการข้อผิดพลาดมาตรฐานของซึ่งจะได้รับโดยที่คือขนาดของกลุ่มตัวอย่าง ดังนั้นคุณต้องมีคู่ที่สมบูรณ์อย่างน้อย 4 คู่ ฉันไม่ได้ตระหนักถึงข้อ จำกัด ใด ๆ นอกเหนือจากที่เกี่ยวกับขนาดตัวอย่าง 1 / zobs N1/N3N
COOLSerdash

8
ไม่แน่ใจว่าเชื่อถืองานนำเสนอจากใครบางคนที่ไม่สามารถสะกดชื่อมหาวิทยาลัยของตนเองได้ อย่างจริงจังยิ่งขึ้นระวังคำแนะนำทั้งหมดที่บอกเป็นนัยว่าสิ่งนั้นดีกว่าขนาดตัวอย่างที่แน่นอนและน่ากลัว มันเป็นเรื่องของการประมาณคุณภาพที่เพิ่มขึ้นอย่างราบรื่นด้วยขนาดตัวอย่างและยังขึ้นอยู่กับการกระจายของข้อมูล คำแนะนำง่ายๆคือให้ระมัดระวังการวางแผนทุกอย่างและตรวจสอบอย่างมีช่วงเวลาที่มั่นใจ
Nick Cox

1
สไลด์ 17 อธิบาย t-test สำหรับกรณีพิเศษ 0 ρ=0
whuber

คำตอบ:


8

สำหรับคำถามเช่นนี้ฉันจะทำการจำลองสถานการณ์และดูว่าค่าทำงานตามที่คาดหวังหรือไม่ -value คือน่าจะเป็นของการวาดภาพแบบสุ่มตัวอย่างที่เบี่ยงเบนอย่างน้อยเท่าจากค่า null สมมติฐานเป็นข้อมูลที่คุณสังเกตถ้าโมฆะเป็นสมมติฐานที่แท้จริง ดังนั้นถ้าเรามีตัวอย่างหลายตัวอย่างและหนึ่งในนั้นมีเป็น 04 ดังนั้นเราคาดว่า 4% ของตัวอย่างเหล่านั้นจะมีค่าน้อยกว่า. 04 เดียวกันเป็นจริงสำหรับทุกความเป็นไปได้อื่น ๆ -valuesพีพีพีpppp

ด้านล่างนี้เป็นการจำลองสถานการณ์ใน Stata กราฟตรวจสอบว่าค่าวัดสิ่งที่พวกเขาควรจะวัดนั่นคือพวกเขาแสดงให้เห็นว่าสัดส่วนของกลุ่มตัวอย่างที่มีค่าน้อยกว่าค่าเล็กน้อยค่าเบี่ยงเบนจากค่าเล็กน้อยค่า คุณจะเห็นว่าการทดสอบนั้นค่อนข้างมีปัญหากับการสังเกตจำนวนเล็กน้อย ไม่ว่าจะเป็นปัญหาหรือไม่สำหรับการวิจัยของคุณก็คือการตัดสินใจของคุณพีพีพีpppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

ป้อนคำอธิบายรูปภาพที่นี่

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

ป้อนคำอธิบายรูปภาพที่นี่


1
ลองลบ 2.5 แทน 3 จาก :-) n
whuber

5

FWIW ฉันเห็นคำแนะนำใน Myers & Well (การออกแบบการวิจัยและการวิเคราะห์เชิงสถิติ, รุ่นที่สอง, 2003, หน้า 492) เชิงอรรถระบุว่า:N10

พูดอย่างเคร่งครัดการแปลงจะเอนเอียงโดยจำนวน : ดู Pearson และ Hartley (1954, p. 29) โดยทั่วไปความลำเอียงนี้จะเล็กน้อยมากยกเว้นมีขนาดเล็กและมีขนาดใหญ่และเราไม่สนใจมันที่นี่Zr/(2(N1))Nρ


3
ดูเหมือนว่านี่เป็นคำตอบสำหรับฉัน
gung - Reinstate Monica

1

ไม่แน่ใจว่าการแปลงของ Fisher เหมาะสมหรือไม่ สำหรับ (หมายเหตุ: สมมติฐานสำหรับประชากรไม่ตัวอย่าง ), การกระจายตัวอย่างของค่าสัมประสิทธิ์สหสัมพันธ์เป็นสมมาตรอยู่แล้วจึงไม่จำเป็นต้องลดเบ้ซึ่งเป็นสิ่งที่ฟิชเชอร์จุดมุ่งหมายที่จะทำ และคุณสามารถใช้การประมาณzH0:ρ=0ρrzt

สมมติว่าคุณหมายถึงแล้วเบ้ของ PDF ที่จะขึ้นอยู่กับค่าที่เสนอของจึงมีก็จะไม่มีคำตอบทั่วไปของวิธีการที่มีขนาดใหญ่ควรจะเป็น นอกจากนี้ค่าต่ำสุดของจะขึ้นอยู่กับระดับนัยสำคัญที่คุณกำลังดำเนินการ คุณไม่ได้ระบุค่าของมันH0:ρ=ρ00ρ0nnα

ประเด็นของ Nick นั้นยุติธรรม: การประมาณและข้อเสนอแนะมักปฏิบัติการในพื้นที่สีเทาบางแห่ง

หากจากนั้นการประมาณฟิชเชอร์ของคุณดีพอ (= สมมาตร) พอฉันจะใช้ขอบเขตใช้กับ -distribution โดยที่คือมาตรฐานตัวอย่าง การเบี่ยงเบน ถ้ามันเป็นพอที่ใกล้เคียงกับปกตินี้จะกลาย 2n(tα/2s/ϵ)2tsn(1.96s/ϵ)2


4
ผมคิดว่า oversimplifies นี้ "มุ่งมั่น" ของฟิชเชอร์ซึ่งเป็นส่วนหนึ่งเรื่องของวัตถุประสงค์เช่นเดียวกับคณิตศาสตร์ ความเบ้หรือไม่เป็นเพียงส่วนหนึ่งของภาพ แปลงการกระจายแบบมีขอบเขตเป็นแบบไม่มีขอบเขตซึ่งมีความสำคัญต่อช่วงความมั่นใจ ในความเป็นจริงฉันจะโต้แย้งว่าถ้าสมมติฐานว่างเปล่าของความสัมพันธ์เป็นศูนย์คือคำถามทางวิทยาศาสตร์เช่นกันการใช้ Fisher'sสำหรับช่วงความมั่นใจนั้นมีผลมากกว่าการพยายามให้ได้ค่า P zzz
Nick Cox

1
ฉันขอโทษฉันยังใหม่กับ Fisher's -transform ฉันควรใช้เฉพาะเมื่อฉันต้องการทดสอบหรือไม่ เหตุผลในการคำนวณค่า P คือฉันต้องการใช้วิธีการ Holm-Bonferroni เพื่อควบคุมอัตราความผิดพลาดที่เหมาะกับครอบครัวเมื่อทำการเปรียบเทียบหลาย ๆ อย่าง ฉันควรจะค่อนข้างคำนวณค่า P-จากนักเรียนกระจาย? H 0 : ρ = ρ 00 tzH0:ρ=ρ00t
Gunnhild

3
คำถามคือทางที่ผิดฉันคิดว่า Fisher'sเป็นวิธีที่ดีกว่าสำหรับช่วงความเชื่อมั่นและการอนุมานทั่วไป ซอฟต์แวร์ส่วนใหญ่ผมว่าใช้คำนวณชั่นสำหรับการทดสอบ0 หากมีข้อสงสัยอาจเป็นเรื่องสำคัญที่จะต้องแสดงว่าการใช้วิธีการหนึ่งสร้างความแตกต่างให้กับข้อมูลของคุณ ดังนั้นหากวิธีการเห็นด้วยไม่มีปัญหา t ρ = 0ztρ=0
Nick Cox

1
z

ϵn
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.