ฉันมีคำถามเกี่ยวกับการแจกจ่ายที่ถูกต้องเพื่อใช้สำหรับการสร้างแบบจำลองด้วยข้อมูลของฉัน ฉันจัดทำรายการป่าไม้ที่มี 50 แปลงแต่ละแปลงมีขนาด 20 ม. x 50 ม. ในแต่ละแปลงนั้นฉันประมาณเปอร์เซ็นต์ของต้นไม้ที่บังแสง แต่ละพล็อตมีหนึ่งค่าเป็นเปอร์เซ็นต์สำหรับฝาครอบหลังคา เปอร์เซ็นต์มีตั้งแต่ 0 ถึง 0.95 ฉันกำลังสร้างแบบจำลองของร้อยละต้นไม้ปกคลุมหลังคา ( ตัวแปรY ) ด้วยเมทริกซ์ของตัวแปรXอิสระจากภาพถ่ายดาวเทียมและข้อมูลด้านสิ่งแวดล้อม
ฉันไม่แน่ใจว่าฉันควรใช้การแจกแจงทวินามหรือไม่เนื่องจากตัวแปรสุ่มแบบทวินามคือผลรวมของการทดลองอิสระn ครั้ง (เช่นตัวแปรสุ่มของเบอร์นูลลี) ค่าเปอร์เซ็นต์ไม่ใช่ผลรวมของการทดลอง เป็นเปอร์เซ็นต์ที่แท้จริง ฉันควรใช้แกมมาแม้ว่าจะไม่มีขีด จำกัด บน ฉันควรแปลงเปอร์เซ็นต์เป็นจำนวนเต็มและใช้ปัวซองเป็นค่าหรือไม่ ฉันควรจะอยู่กับเกาส์เซียนหรือไม่ ฉันไม่พบตัวอย่างมากมายในวรรณคดีหรือในตำราที่พยายามจำลองเปอร์เซ็นต์ด้วยวิธีนี้ คำแนะนำหรือข้อมูลเชิงลึกใด ๆ ที่ชื่นชม
ขอบคุณสำหรับคำตอบ ในความเป็นจริงการกระจายเบต้าเป็นสิ่งที่ฉันต้องการและมีการพูดคุยอย่างละเอียดในบทความนี้:
Eskelson, BN, Madsen, L. , Hagar, JC, & Temesgen, H. (2011) การประมาณพืชพรรณที่เข้าใจได้ของชายฝั่ง Riparian ด้วยแบบจำลองการถดถอยแบบเบตาและโคคูล่า วิทยาศาสตร์ป่าไม้, 57 (3), 212-221
ผู้เขียนเหล่านี้ใช้แพ็คเกจ betareg ใน R โดย Cribari-Neto และ Zeileis
บทความต่อไปนี้กล่าวถึงวิธีที่ดีในการแปลงตัวแปรการตอบสนองแบบกระจายเบต้าเมื่อรวมค่าจริง 0 และ / หรือ 1 ในช่วงเปอร์เซ็นต์:
- Smithson, M. , และ J. Verkuilen, 2006. คั้นมะนาวที่ดีกว่า? การถดถอยความน่าจะเป็นสูงสุดกับตัวแปรตามการกระจายเบต้า , วิธีการทางจิตวิทยา, 11 (1): 54–71