การใช้งานและการตีความที่เหมาะสมของตัวแบบแกมม่าที่ไม่พองตัว


11

ข้อมูลประกอบ:ฉันเป็นนักชีวสถิติกำลังต่อสู้กับชุดข้อมูลของอัตราการแสดงออกของเซลล์ การศึกษาเปิดเผยโฮสต์ของเซลล์ที่รวบรวมในกลุ่มจากผู้บริจาคต่าง ๆ เพื่อเปปไทด์บางอย่าง เซลล์อาจแสดงตัวบ่งชี้ทางชีวภาพบางอย่างเพื่อตอบสนองหรือไม่ทำเช่นนั้น อัตราการตอบกลับจะถูกบันทึกไว้สำหรับผู้บริจาคแต่ละกลุ่ม อัตราการตอบสนอง (แสดงเป็นเปอร์เซ็นต์) เป็นผลลัพธ์ของดอกเบี้ยและการได้รับเปปไทด์เป็นตัวทำนาย

โปรดสังเกตว่าการสังเกตนั้นมีการรวมกลุ่มกันภายในผู้บริจาค

เนื่องจากฉันมีข้อมูลสรุปเท่านั้นฉันจึงยังคงรักษาอัตราการตอบกลับของผู้บริจาคให้เป็นข้อมูลต่อเนื่อง (อย่างน้อยตอนนี้)

ภาวะแทรกซ้อนเกิดจากความจริงที่ว่าฉันมีเลขศูนย์ในข้อมูลของฉัน มากเกินไปที่จะเพิกเฉย ฉันกำลังพิจารณารูปแบบแกมม่าที่ไม่พองตัวเพื่อจัดการกับความจริงที่ว่าฉันได้บิดเบือนข้อมูลอย่างต่อเนื่องควบคู่กับการมีศูนย์รวมเกินศูนย์ ฉันได้พิจารณาแบบจำลอง Tobit ด้วยเช่นกัน แต่สิ่งนี้ดูด้อยกว่าเพราะถือว่าการเซ็นเซอร์ในขอบเขตที่ต่ำกว่าเมื่อเทียบกับศูนย์ของแท้ (นักเศรษฐศาสตร์อาจบอกว่า

คำถาม:โดยทั่วไปแล้วการใช้แบบจำลองแกมม่าที่ไม่ต้องพองเมื่อใดจึงเหมาะสมที่จะใช้? นั่นคืออะไรคือสมมติฐาน? และคนเราตีความการอนุมานได้อย่างไร? ฉันจะขอบคุณสำหรับการเชื่อมโยงไปยังเอกสารที่กล่าวถึงเรื่องนี้ถ้าคุณมี

ฉันได้พบลิงก์ใน SAS-Lซึ่ง Dale McLerran ให้รหัส NLMIXED สำหรับแบบจำลองแกมม่าที่ไม่มีการพองตัวดังนั้นมันจึงเป็นไปได้ อย่างไรก็ตามฉันจะเกลียดที่จะเรียกเก็บเงินจากคนตาบอด

คำตอบ:


5

ก่อนอื่นคุณจะไม่เห็นค่าศูนย์ของแท้ในข้อมูลนิพจน์ นักชีววิทยาของคุณบอกว่าเหมือนกับที่นักชีววิทยาทุกคนทำ แต่เมื่อนักชีววิทยาบอกว่า "มันเป็นศูนย์" จริงๆแล้วมันหมายถึง "มันต่ำกว่าเกณฑ์การตรวจจับของฉันดังนั้นจึงไม่มีตัวตน" มันเป็นปัญหาทางภาษาเนื่องจากการขาดความซับซ้อนทางคณิตศาสตร์ในสาขา ฉันพูดจากประสบการณ์ส่วนตัวที่นี่

คำอธิบายของแกมม่าพองเกินศูนย์ในลิงก์ที่คุณให้นั้นยอดเยี่ยม กระบวนการทางกายภาพที่นำไปสู่ข้อมูลของคุณคือถ้าฉันเข้าใจผู้บริจาคจะถูกเลือกจากนั้นจะทำการบำบัดด้วยเปปไทด์และการตอบสนองนั้นวัดจากเซลล์ของผู้บริจาครายนั้น มีสองชั้นอยู่ที่นี่ หนึ่งคือความแข็งแรงโดยรวมของการตอบสนองของผู้บริจาคซึ่งฟีดในระดับการแสดงออกของแต่ละเซลล์ที่ถูกวัด หากคุณตีความตัวแปร Bernoulli ของคุณใน Gamma ที่สูงเกินจริงเนื่องจาก "การตอบสนองของผู้บริจาคนั้นแข็งแกร่งพอที่จะวัดได้" ก็อาจจะใช้ได้ เพียงแค่ทราบว่าในกรณีนี้คุณกำลังส่งเสียงการแสดงออกของแต่ละเซลล์ด้วยความผันแปรระหว่างผู้บริจาคที่ตอบสนองอย่างมาก เนื่องจากเสียงรบกวนในการแสดงออกในเซลล์เดียวมีการกระจายแกมมาประมาณ

หากความแตกต่างเพิ่มเติมจากผู้บริจาคกับเซลล์ไม่ทำให้แกมมาฟิตและคุณแค่พยายามที่จะแสดงออกถึงเปปไทด์ที่ใช้แล้วก็ไม่มีเหตุผลว่าทำไมสิ่งนี้ถึงไม่ควรเป็นไร

หากการวิเคราะห์รายละเอียดเป็นไปตามลำดับฉันขอแนะนำให้สร้างแบบจำลองลำดับชั้นแบบกำหนดเองเพื่อให้ตรงกับกระบวนการที่นำไปสู่การวัดของคุณ


3

ฉันได้พบวิธีแก้ปัญหาที่ฉันพบว่าค่อนข้างหรูหรา มีบทความที่ยอดเยี่ยมในวรรณคดีเรื่อง"การวิเคราะห์ข้อมูลการวัดซ้ำด้วยการจับกลุ่มที่ศูนย์"ซึ่งแสดงให้เห็นถึงรูปแบบ lognormal zero-inflated สำหรับข้อมูลที่มีความสัมพันธ์ ผู้เขียนให้มาโคร SAS ซึ่งใช้ PROC NLMIXED และใช้งานง่าย ข่าวดีก็คือว่าสิ่งนี้สามารถลดความซับซ้อนให้กับกรณีโดยไม่ต้องสังเกตกลุ่มโดยการละเว้นrepeatedคำสั่งในแมโคร ข่าวร้ายคือ NLMIXED ยังไม่ได้มีโครงสร้างความสัมพันธ์มากมายที่เราต้องการบ่อยเช่น autoregressive

แมโครเป็นชื่อ MIXCORR และมีหน้าวิกิพีเดียมีประโยชน์มากที่คุณสามารถหาได้ที่นี่ แมโครตัวเองสามารถดาวน์โหลดได้ที่นี่

ฉันขอแนะนำลิงก์เหล่านี้ทั้งหมด หวังว่าคุณจะพบว่ามันมีประโยชน์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.