ตรวจสอบว่าสองตัวอย่างปัวซองมีค่าเฉลี่ยเดียวกัน


30

นี่เป็นคำถามเบื้องต้น แต่ฉันไม่สามารถหาคำตอบได้ ฉันมีการวัดสองรายการ: เหตุการณ์ n1 ในเวลา t1 และเหตุการณ์ n2 ในเวลา t2 ทั้งคู่ผลิต (พูด) โดยกระบวนการปัวซงด้วยค่าแลมบ์ดาที่แตกต่างกัน

อันนี้มาจากบทความข่าวซึ่งอ้างว่าตั้งแต่ที่ทั้งสองแตกต่างกัน แต่ฉันไม่แน่ใจว่าการอ้างสิทธิ์นั้นถูกต้อง สมมติว่าช่วงเวลาไม่ได้ถูกเลือกอย่างมีเจตนาร้าย (เพื่อเพิ่มเหตุการณ์ให้ใหญ่ที่สุดอย่างใดอย่างหนึ่ง)n1/เสื้อ1n2/เสื้อ2

ฉันสามารถเพียงแค่ทำT -test หรือจะว่าไม่เหมาะสม? จำนวนเหตุการณ์น้อยเกินไปสำหรับฉันที่จะโทรหาการแจกแจงแบบปกติโดยประมาณ



1
ตัวอย่างที่ดีของการสื่อสารมวลชนวิทยาศาสตร์มี ...
แมตต์ปาร์กเกอร์

1
ใช่ ... คุณสามารถเห็นว่าทำไมฉันถึงต้องการตรวจสอบสถิติที่ใช้
ชาร์ลส์

คำตอบ:


25

เพื่อทดสอบค่าเฉลี่ยปัวซองวิธีการตามเงื่อนไขถูกเสนอโดย Przyborowski และ Wilenski (1940) การแจกแจงแบบมีเงื่อนไขของ X1 ที่ให้ X1 + X2 เป็นไปตามการแจกแจงทวินาม ดังนั้นการทดสอบสมมติฐานและขั้นตอนการประมาณช่วงเวลาสามารถพัฒนาได้อย่างง่ายดายจากวิธีการที่แน่นอนสำหรับการอนุมานเกี่ยวกับความน่าจะเป็นของความสำเร็จทวินาม โดยปกติจะมีวิธีพิจารณาสองวิธีเพื่อจุดประสงค์นี้

  1. C-ทดสอบ
  2. E-ทดสอบ

คุณสามารถหารายละเอียดเกี่ยวกับการทดสอบทั้งสองนี้ในบทความนี้ การทดสอบที่มีประสิทธิภาพยิ่งขึ้นสำหรับการเปรียบเทียบค่าเฉลี่ยของสองปัวซอง


4
+1 อ้างอิงดีขอบคุณ การทดสอบ C เป็นเวอร์ชันที่เข้มงวดยิ่งขึ้นของรุ่นที่ฉันวาดไว้ดังนั้นมันจึงคุ้มค่าที่จะพิจารณา การทดสอบ E เกี่ยวข้องกับสถิติ t กับการแจกแจงที่เหมาะสม การคำนวณการแจกแจงนั้นเกี่ยวข้องกับผลรวมอนันต์สองเท่าที่จะใช้การคำนวณเพื่อมาบรรจบกัน: รหัสค่อนข้างง่ายรหัสอาจ overkill สำหรับการตรวจสอบหนังสือพิมพ์! O(n1n2)
whuber

1
ผู้เขียนบทความ E-test ได้เขียนการประยุกต์ใช้ Fortran อย่างง่าย ๆ เพื่อคำนวณค่า p สำหรับสองปัวซองหมายความว่าที่นี่: ucs.louisiana.edu/~kxk4695 ฉันส่งportranของพวกเขาไปที่ MATLAB ที่นี่git.io/vNP86
AndyL

11

เกี่ยวกับ:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

นี่คือการทดสอบที่เปรียบเทียบอัตราปัวซองที่ 1 และ 2 กับแต่ละอื่น ๆ และให้ทั้งค่า ap และช่วงความมั่นใจ 95%


ควรสังเกตว่าสำหรับปัญหาที่มีสองตัวอย่างนี้ใช้การทดสอบแบบทวินามเพื่อเปรียบเทียบอัตรา
Jon

10

คุณกำลังมองหาการตรวจสอบที่ง่ายและรวดเร็ว

λเสื้อ=เสื้อ1+เสื้อ2[0,เสื้อ1]n1[เสื้อ1,เสื้อ1+เสื้อ2]n2

λ^=n1+n2เสื้อ1+เสื้อ2

nผมเสื้อผมλ^nผม


1
ขอบคุณ (+1) นั่นเป็นเพียงการตรวจสอบที่ถูกต้องสำหรับสิ่งผิดปกติประเภทนี้ มันจบลงอย่างมีนัยสำคัญสูง (p = 0.005) ดังนั้นบทความก็ดี ฉันหวังว่าคุณจะไม่รังเกียจ แต่ฉันยอมรับคำตอบอื่น ๆ - เป็นเรื่องดีที่ได้รู้ว่า 'จริง' เป็นวิธีที่จะทำเมื่อมีความสำคัญ
ชาร์ลส์

5

ฉันจะสนใจในช่วงความมั่นใจมากกว่าค่า ap นี่คือการประมาณ bootstrap

การคำนวณความยาวของช่วงเวลาก่อนและตรวจสอบ:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

การตรวจสอบนี้ให้ผลแตกต่างกันเล็กน้อย (เพิ่มขึ้น 100.03%) จากผลงานตีพิมพ์หนึ่งเล่ม (เพิ่มขึ้น 101%) ไปที่ bootstrap (ทำสองครั้ง):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

ช่วงความมั่นใจ 95% ของการเพิ่มขึ้นคือ 31% ถึง 202%

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.