คำนวณเปอร์เซ็นต์ไทล์ของการแจกแจงแบบปกติ


9

ดูหน้า Wikipedia นี้:

http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Agresti-Coull_Interval

ที่จะได้รับอาเกรสติ-Coull ช่วงเวลาหนึ่งความต้องการในการคำนวณเปอร์เซ็นต์ของการกระจายปกติที่เรียกว่าZฉันจะคำนวณเปอร์เซ็นต์ไทล์ได้อย่างไร มีฟังก์ชั่นสำเร็จรูปที่ใช้ใน Wolfram Mathematica และ / หรือ Python / NumPy / SciPy หรือไม่?z


1
การแสดงออกหนึ่งใน "CDF ปกติผมได้ตรงจากวิกิพีเดีย" เป็นที่น่าเสียดายปิดโดยปัจจัยของปี่} ไม่มีสูตรที่แน่นอนที่แน่นอนสำหรับ cdf ปกติหรือค่าผกผันโดยใช้จำนวน จำกัด ของคำที่เกี่ยวข้องกับฟังก์ชันมาตรฐาน (ฯลฯ ) แต่ทั้ง cdf ปกติและค่าผกผันได้รับการศึกษามากมายและโดยประมาณ สูตรสำหรับทั้งสองโปรแกรมในเครื่องคิดเลขหลายสเปรดชีตไม่พูดถึงแพคเกจทางสถิติ ฉันไม่คุ้นเคยกับ R แต่ฉันจะประหลาดใจถ้ามันไม่มีสิ่งที่คุณกำลังมองหาอยู่แล้ว 1/πexp,log,sincos
Dilip Sarwate

@DilipSarwate มันได้รับการแก้ไข! ฉันกำลังทำสิ่งนี้โดยใช้การแปรปรวนแบบผกผันและ "ไม่อนุญาต" ให้ใช้สิ่งที่มีอยู่ภายในมากเกินไปเพื่อประโยชน์ในการเรียนรู้ที่ฉันคิด
user1061210

1
@Dilip: ไม่เพียง แต่จะไม่มีสูตรที่แน่นอนที่รู้จักกันดีกว่า แต่ก็เป็นที่รู้จักกันดีว่าไม่มีสูตรดังกล่าว!
พระคาร์ดินัล

1
กระบวนการ Box-Muller สร้างตัวอย่างจากการแจกแจงร่วมของตัวแปรสุ่มมาตรฐานแบบอิสระ ดังนั้นฮิสโทแกรมของค่าที่สร้างจะคล้ายกับการแจกแจงแบบปกติมาตรฐาน แต่วิธี Box-Muller ไม่ใช่วิธีการคำนวณค่าของยกเว้นโดยบังเอิญใน "ฉันสร้างตัวอย่างปกติมาตรฐานซึ่งมีค่าหรือน้อยกว่าและและ .Φ(x)10484011Φ(1)0.8401Φ1(0.8401)1
ดิลลิป Sarwate

1
ฉันเลือกเป็นตัวอย่างของตัวเลขที่คุณอาจคาดหวัง และดังนั้นถ้าคุณสร้างตัวอย่างของการแจกแจงแบบปกติมาตรฐานคุณควรคาดหวังว่าใกล้จะของตัวอย่างจะมีค่า1 คุณกำลังใช้วิธี Box-Muller อย่างถูกต้อง แต่ไม่เข้าใจผลลัพธ์ที่คุณได้รับและไม่เกี่ยวข้องกับ cdf และอื่น ๆ8401Φ(1)=0.84131048413100001
Dilip Sarwate

คำตอบ:


3

สำหรับMathematica $VersionNumber > 5คุณสามารถใช้

Quantile[NormalDistribution[μ, σ], 100 q]

สำหรับqเปอร์เซ็นต์ไทล์ -th

มิฉะนั้นคุณจะต้องโหลดแพ็คเกจสถิติที่เหมาะสมก่อน


(ฉันมีเวอร์ชั่น 7) ฉันไม่มีปัญหาในการโหลดแพ็คเกจสถิติ แต่ฟังก์ชั่นในนั้นเรียกว่าอะไร? เพราะฉันได้รับความประทับใจว่าQuantileบรรทัดนี้จะทำการคำนวณด้วยตนเองแทนการใช้สูตร
Ram Rachum

ประเมินผลด้วยพารามิเตอร์สัญลักษณ์ (เช่นทำค่าไม่ได้กำหนดที่จะmu, sigmaและq); คุณควรได้รับการแสดงออกที่เกี่ยวข้องกับฟังก์ชั่นข้อผิดพลาดผกผัน
JM ไม่ใช่นักสถิติเมื่อ


4

คุณไม่ได้ถามเกี่ยวกับ R แต่ใน R คุณใช้ใช่หรือไม่ qnorm

(อันที่จริงแล้วมันเป็นควอนตัมไม่ใช่เปอร์เซ็นไทล์หรืออย่างนั้นฉันก็เชื่อ)

> qnorm(.5)
[1] 0
> qnorm(.95)
[1] 1.644854

1
quantile เทียบเปอร์เซ็นต์ (มันเป็นเพียงเรื่องของคำศัพท์) j.mp/dsYz9z
chl

1
ในขณะที่เราอยู่ใน CIs ที่ปรับ R Wald (เช่น Agresti-Coull) มีอยู่ในPropCIsแพ็คเกจ วิธีการของวิลสันเป็นค่าเริ่มต้นในHmisc::binconf(ตามที่แนะนำโดย Agresti และ Coull)
chl


0

คุณสามารถใช้ฟังก์ชัน inverse erfซึ่งมีอยู่ใน MatLab และ Mathematica เป็นต้น

สำหรับ CDF ปกติให้เริ่มจาก

y=Φ(x)=12[1+erf(x2)]

เราได้รับ

x=2 erf1(2y1)

สำหรับ CDF บันทึกปกติเริ่มต้นจาก

y=Fx(x;μ,σ)=12erfc(logxμσ2)

เราได้รับ

log(x)=μ+σ2 erfc1(2y)

2
นี่ไม่ใช่ความคิดเห็นมากกว่าคำตอบใช่ไหม
มาโคร

ความคิดของฉันคือว่าถ้าคุณมีฟังก์ชัน inverses สำหรับ erf และ erfc ปัญหาจะได้รับการแก้ไข ตัวอย่างเช่น MatLab มีฟังก์ชั่น preprogrammed ดังกล่าว
Jean-Victor Côté

@ Jean-VictorCôtéได้โปรดพัฒนาความคิดของคุณในการตอบกลับของคุณ มิฉะนั้นจะดูเหมือนความคิดเห็นตามที่แนะนำไว้ข้างต้น
chl

การคำนวณ logn ปกติดูไม่ถูกต้อง หลังจากที่ทุก CDF ตรงกันข้ามควรจะเหมือนกันกับ CDF ผกผันสำหรับปกติออกจากกันสำหรับการใช้งานของแทนxlog(x)x
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.