การเลือกทางเลือกในการถดถอยแบบปัวซองสำหรับข้อมูลการนับจำนวนมาก


12

ขณะนี้ฉันกำลังวิเคราะห์ข้อมูลจากชุดการทดลองเชิงพฤติกรรมที่ทุกคนใช้มาตรการต่อไปนี้ ผู้เข้าร่วมในการทดลองนี้ถูกขอให้เลือกเบาะแสที่ผู้อื่นสามารถใช้เพื่อช่วยแก้ปัญหา 10 ชุด ผู้เข้าร่วมจะถูกนำไปสู่การเชื่อว่าคนอื่น ๆ เหล่านี้จะได้รับหรือสูญเสียเงินขึ้นอยู่กับประสิทธิภาพของพวกเขาในการแก้ anagrams เบาะแสแตกต่างกันไปในการช่วยเหลือพวกเขา ตัวอย่างเช่นสำหรับแอนนาแกรม NUNGRIN แอนนาแกรมของ RUNNING อาจมีสามปม:

  1. ย้ายอย่างรวดเร็ว (ไม่ช่วยเหลือ)
  2. สิ่งที่คุณทำในการแข่งขันมาราธอน (มีประโยชน์)
  3. ไม่ได้เป็นงานอดิเรกที่ดีต่อสุขภาพเสมอไป (ไม่ช่วยเหลือ)

ในการจัดทำมาตรการฉันนับจำนวนครั้ง (จาก 10) ที่ผู้เข้าร่วมเลือกเบาะแสที่ไม่ช่วยเหลือคนอื่น ในการทดลองฉันใช้ความหลากหลายที่แตกต่างกันเพื่อส่งผลต่อความช่วยเหลือของเบาะแสที่ผู้คนเลือก

เนื่องจากการวัดความเอื้ออาทรและความช่วยเหลือไม่ดีค่อนข้างเบาบางลงอย่างมาก (คนส่วนใหญ่เลือกเบาะแสที่เป็นประโยชน์ 10 ข้อ) และเนื่องจากการวัดเป็นตัวแปรนับฉันจึงใช้ Poisson Generalized Linear Model เพื่อวิเคราะห์ข้อมูลเหล่านี้ อย่างไรก็ตามเมื่อฉันอ่านเพิ่มเติมเกี่ยวกับการถดถอยของปัวซองฉันพบว่าเนื่องจากปัวซงถดถอยไม่ได้ประเมินค่าเฉลี่ยและความแปรปรวนของการแจกแจงอย่างอิสระมันมักประเมินค่าความแปรปรวนในชุดข้อมูลต่ำกว่า ฉันเริ่มตรวจสอบทางเลือกในการถดถอยของปัวซองเช่นการถดถอยแบบ quasipoisson หรือการถดถอยแบบทวินามลบ อย่างไรก็ตามฉันยอมรับว่าฉันค่อนข้างใหม่สำหรับโมเดลเหล่านี้ดังนั้นฉันมาที่นี่เพื่อขอคำแนะนำ

ใครบ้างมีคำแนะนำเกี่ยวกับรูปแบบที่จะใช้สำหรับข้อมูลประเภทนี้? มีข้อควรพิจารณาอื่น ๆ อีกหรือไม่ที่ฉันควรระวัง (เช่นเป็นรุ่นหนึ่งที่มีประสิทธิภาพมากกว่าอีกรุ่นหนึ่งหรือไม่) ฉันควรพิจารณาการวินิจฉัยประเภทใดเพื่อพิจารณาว่ารูปแบบที่ฉันเลือกจัดการข้อมูลของฉันอย่างเหมาะสมหรือไม่


แล้วตัวประมาณความแปรปรวน / ความแปรปรวนร่วมที่มีประสิทธิภาพเพื่อผ่อนคลายสมมติฐานที่ว่าความแปรปรวนเท่ากับค่าเฉลี่ยคืออะไร?
boscovich

2
เนื่องจากเป็นข้อมูลที่นับและไม่เป็นลบสิ่งที่เกี่ยวกับ quassi-poisson หรือรูปแบบการถดถอยแบบทวินามลบที่บัญชีสำหรับการกระจาย
อรุณ

1
ฉันคิดเกี่ยวกับการใช้แบบจำลองกึ่งปัวซองหรือโมเดลทวินามลบ แต่สิ่งที่ฉันไม่เข้าใจคือประเภทของมุมมองที่จะรับรองตัวเองว่าฉันกำลังสร้างแบบจำลองข้อมูลของฉันอย่างเหมาะสม เนื่องจากมีหลายทางเลือก (แบบกึ่งปัวซอง, ทวินามลบ, และโมเดล "zero-augmented") ฉันยังสงสัยว่ามีวิธีที่ดีในการเลือกระหว่างตัวเลือกเหล่านี้หรือไม่ ตัวอย่างเช่นวิธีหนึ่งโดยทั่วไปมีประสิทธิภาพมากกว่าวิธีอื่นหรือไม่
Patrick S. Forscher

1
ขึ้นอยู่กับข้อมูล ทำไมไม่เหมาะกับข้อมูลทั้งหมดของคุณ (Poisson, Negative Binomial, Poisson zero-inflated และแบบจำลอง binomial เชิงลบ, เครื่องกีดขวางสำหรับผู้ที่มีปัญหา) และเปรียบเทียบพวกเขาผ่านการพูด AIC หรือ BIC ดูcran.r-project.org/web/packages/pscl/vignettes/countreg.pdfจากนั้นเลือกอันที่เหมาะสมที่สุดสำหรับข้อมูลของคุณ คุณอาจใช้แบบจำลองความเป็นไปได้กึ่งสำเร็จรูป แต่นั่นเป็นเรื่องของรสนิยมฉันไม่ชอบพวกเขามากนัก
Momo

1
เมื่อต้องการตรวจสอบว่าการกระจายใดอาจเป็นแบบจำลองที่ดีสำหรับการตอบสนองของคุณคุณสามารถใช้ฟังก์ชัน vcd :: distplot
Momo

คำตอบ:


12

ผลลัพธ์ของคุณคือจำนวนเบาะแสที่เป็นประโยชน์จาก 10 ซึ่งเป็นตัวแปรสุ่มแบบทวินาม ดังนั้นคุณควรวิเคราะห์ด้วยการถดถอยแบบทวินามบางอย่างอาจจะเป็นแบบกึ่งทวินาม โปรดทราบว่าปัวซองและการแจกแจงลบแบบทวินามลบชื่อที่เข้าใจผิดนั้นเหมาะสมสำหรับข้อมูลการนับที่ไม่ได้ จำกัด


2
ฉันพูดถึงทวินามลบเพราะมันเป็นทางเลือกแทนที่ปัวซองซึ่งเป็นตัวแก้ปัญหาที่แนะนำในตอนแรก เนื่องจากผู้ตอบแต่ละคนมีเบาะแส x / 10 มันอาจเป็นแบบทวินาม แต่สำหรับแต่ละ 10 เบาะแสมีความน่าจะเป็นคงที่ pi สำหรับผู้ตอบที่ ith และการเกิดขึ้นนั้นเป็นอิสระ นั่นอาจเป็นเรื่องเล็กน้อย
Michael R. Chernick

2
เบต้า - ทวินามก็เป็นไปได้อีกอย่างหนึ่ง (เบต้า - ทวินามก็คือทวินามขณะที่ลบทวินามคือปัวซอง) betabinในaodแพคเกจจะทำมัน
Ben Bolker

5

ฉันก็จะแนะนำให้ดูที่ทวินามลบถ้าผลลัพธ์ที่เป็นไปได้ไม่มีที่สิ้นสุดเช่นปัวซอง คุณอาจต้องการศึกษาหนังสือของ Joe Hilbe หนึ่งเล่ม เขามีหนึ่งใน GEE และหนึ่งในการถดถอยทวินามลบซึ่งเขาขัดแย้งกับปัวซองถดถอย แต่ตามที่ Aniko ชี้ให้เห็นมีเพียง 10 เงื่อนงำดังนั้นผู้ตอบแต่ละคนสามารถมี 0, 1, 2, 3, ... , 10 และดังนั้นปัวซองหรือเลขชี้กำลังเชิงลบจึงไม่เหมาะสม


4

จุดดีโดย @Aniko อีกทางเลือกหนึ่งคือการถดถอยเบต้า มีกระดาษที่มีชื่อว่า"A Better Lemon Squeezer"ที่ให้ข้อมูลมากมายเกี่ยวกับวิธีนี้


2
แต่เบต้าจะถูกใช้เพื่อสร้างแบบจำลองสัดส่วนและไม่นับตัวแปรในชุดจำนวนเต็ม จำกัด
Michael R. Chernick

มันมีการใช้งานที่กว้างขึ้น @MichaelChernick ดูบทความซึ่งค่อนข้างดี
Peter Flom - Reinstate Monica

@PeterFlom นอกจากนี้ยังไม่สามารถจัดการข้อมูลในช่วงเวลา [0,1] เท่านั้น (0,1)
ลิน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.