การเปรียบเทียบตามยาวของการแจกแจงสองแบบ


10

ฉันมีผลการตรวจเลือดที่ให้กับคน 2,500 คนสี่ครั้งในช่วงเวลาหกเดือน ผลลัพธ์ส่วนใหญ่ประกอบด้วยสองมาตรการของการตอบสนองของภูมิคุ้มกัน - หนึ่งในการปรากฏตัวของแอนติเจนวัณโรคบางอย่างหนึ่งในกรณีที่ไม่มี ขณะนี้การทดสอบแต่ละครั้งประเมินว่าเป็นบวกหรือลบตามความแตกต่างระหว่างการตอบสนองของแอนติเจนและการตอบสนองแบบไม่มีศูนย์ (ด้วยแนวคิดที่ว่าถ้าระบบภูมิคุ้มกันของคุณตอบสนองต่อแอนติเจนของวัณโรคคุณอาจมีโอกาสสัมผัสกับแบคทีเรียในบางจุด ) ในสาระสำคัญการทดสอบสมมติว่าการแจกแจงแบบไม่มีการเปิดเผยของแต่ละบุคคลและการตอบสนองของวัณโรคควรเหมือนกันโดยทั่วไปในขณะที่คนที่สัมผัสกับวัณโรคจะได้รับการตอบสนองจากการกระจายวัณโรคที่แตกต่างกัน ข้อแม้: การตอบสนองเป็นอย่างมากไม่ธรรมดามากและให้คุณค่าเป็นก้อนที่พื้นธรรมชาติและเพดานที่ถูกตัดทอน

อย่างไรก็ตามดูเหมือนว่าจะค่อนข้างชัดเจนในการตั้งค่าระยะยาวนี้ว่าเราได้รับ "ผลบวกปลอม" (ไม่มีมาตรฐานทองคำจริงสำหรับวัณโรคแฝงฉันกลัว) ที่เกิดจากความผันผวนของแอนติเจนและไม่มีการตอบสนอง แม้ว่านี่อาจเป็นเรื่องยากที่จะหลีกเลี่ยงในบางสถานการณ์ (คุณอาจมีโอกาสเพียงครั้งเดียวในการทดสอบใครบางคน) แต่ก็มีหลายสถานการณ์ที่ผู้คนได้รับการทดสอบวัณโรคเป็นประจำทุกปีหรือมากกว่านั้น - ในสหรัฐอเมริกา ทหารคนไร้ที่อยู่อาศัยที่พักพิงและอื่น ๆ ดูเหมือนว่าเป็นเรื่องน่าละอายที่จะเพิกเฉยต่อผลการทดสอบก่อนหน้านี้

ฉันคิดว่าสิ่งที่ฉันต้องการจะทำคือสิ่งที่ฉันคิดว่าเป็นการวิเคราะห์ส่วนผสมตามยาว เช่นเดียวกับเกณฑ์ตัดขวางฉันต้องการประเมินความน่าจะเป็นที่การตอบสนองวัณโรคและศูนย์ของแต่ละบุคคลมาจากการแจกแจงแบบเดียวกัน - แต่การประมาณนั้นรวมเอาผลการทดสอบก่อนหน้ารวมทั้งข้อมูลจากตัวอย่างเป็น ภาพรวมทั้งหมด (เช่นฉันสามารถใช้การกระจายแบบกว้างของความแปรปรวนภายในบุคคลเพื่อปรับปรุงการประมาณการของฉันเกี่ยวกับการกระจายตัวของศูนย์หรือวัณโรคที่เฉพาะเจาะจงของแต่ละบุคคลได้หรือไม่) แน่นอนว่าความน่าจะเป็นโดยประมาณนั้นจะต้องสามารถเปลี่ยนแปลงได้ตลอดเวลาเพื่อพิจารณาความเป็นไปได้ของการติดเชื้อใหม่

ฉันบิดตัวเองโดยสิ้นเชิงเมื่อพยายามคิดเกี่ยวกับสิ่งนี้ในรูปแบบที่ผิดปกติ แต่ฉันรู้สึกว่าแนวคิดนี้ดีพอ ๆ กับที่ฉันจะเกิดขึ้น หากบางสิ่งไม่สมเหตุสมผลโปรดขอคำชี้แจง หากความเข้าใจของฉันเกี่ยวกับสถานการณ์ดูเหมือนจะผิดโปรดบอกฉัน ขอบคุณมากสำหรับความช่วยเหลือของคุณ.

ในการตอบสนองต่อ Srikant: เป็นกรณีของการจำแนกประเภทแฝง (ติดเชื้อวัณโรคหรือไม่) โดยใช้ผลการทดสอบสองอย่างต่อเนื่อง (แต่ไม่ใช่แบบปกติและแบบตัดปลาย) ตอนนี้การจัดหมวดหมู่นั้นทำได้โดยใช้ cutoff (ในรูปแบบที่เรียบง่าย TB - nil> .35 -> เป็นบวก) ด้วยผลการทดสอบแสดงเป็น (ไม่มี, TB, ผลลัพธ์), archetypes พื้นฐาน * คือ:

ค่าลบที่เป็นไปได้: (0.06, 0.15, -) (0.24, 0.23, -) (0.09, 0.11, -) (0.16, 0.15, -) ค่า
บวกที่เป็นไปได้: (0.05, 3.75, +) (0.05, 1.56, +) (0.06 , 5.02, +) (0.08, 4.43, +)
Wobbler: (0.05, 0.29, -) (0.09, 0.68, +) (0.08, 0.31, -) (0.07, 0.28, -)

ผลบวกของการทดสอบครั้งที่สองสำหรับ Wobbler นั้นค่อนข้างผิดปกติ แต่คุณจะทำแบบนั้นอย่างไร ในขณะที่ความคิดของฉันบรรทัดหนึ่งคือการประเมิน "ความแตกต่างที่แท้จริง" ระหว่างวัณโรคและศูนย์ ณ จุดแต่ละครั้งโดยใช้แบบจำลองหลายระดับซ้ำหลายครั้งมันเกิดขึ้นกับฉันว่าสิ่งที่ฉันต้องการทราบจริงๆคือถ้าการตอบสนองของบุคคลนั้น ถูกดึงมาจากการกระจายตัวแบบเดียวกันหรือหากระบบภูมิคุ้มกันของพวกมันรู้จักแอนติเจนและเปิดใช้งานวัณโรค

สำหรับสิ่งที่อาจทำให้เกิดการทดสอบในเชิงบวกนอกเหนือจากการติดเชื้อ: ฉันไม่แน่ใจ ฉันคิดว่ามันเป็นเพียงการแปรผันของผลลัพธ์ แต่มีความเป็นไปได้ที่ปัจจัยอื่นจะเกิดขึ้น เรามีแบบสอบถามจากจุดแต่ละครั้ง แต่ฉันยังไม่ได้ดูมากเกินไป

* ข้อมูลประดิษฐ์ แต่เป็นตัวอย่าง


โอ้และอย่าลังเลที่จะติดแท็กใหม่ - เบราว์เซอร์ของฉันไม่ทำงานกับการแนะนำอัตโนมัติดังนั้นฉันจึงมีเวลาลำบากในการดูว่ามีอะไรเกิดขึ้นที่นั่น
Matt Parker

ตัวแปรตามของคุณต่อเนื่องหรือไม่ต่อเนื่องหรือไม่? หรือบางทีผลการทดสอบพื้นฐานนั้นต่อเนื่องและถูกแปลงเป็นคำตอบแบบไม่ต่อเนื่อง (เช่น 'บวก', 'ลบ') ขึ้นอยู่กับการตัดบางส่วน? คุณสามารถอธิบายได้หรือไม่ว่าเหตุใดแต่ละคนจึงเปลี่ยนจากแง่ลบเป็นบวกแม้ว่าจะไม่ได้รับเชื้อวัณโรค ตัวอย่างที่เฉพาะเจาะจง (ที่มีตัวเลขบางตัวโยน) ของการพลิกอาจช่วยได้

1
ตัวอย่างมีประโยชน์จริง ๆ เพื่อแสดงข้อมูล คำถามอีกข้อเกี่ยวกับข้อแม้ของคุณ: "ค่ากลุ่มที่พื้นและเพดานและข้อมูลไม่ปกติ" คุณสามารถบอกฉันได้หรือไม่ว่า (a) ข้อมูลด้านล่างของเครื่องชั่งดูเป็นปกติและ (b) ข้อมูลที่ปลายด้านบนของเครื่องชั่งดูเป็นปกติหรือไม่?

หมายเหตุ: เห็นได้ชัดว่าฉันพลาดกำหนดเวลาเพื่อมอบรางวัลจริงดังนั้นฉันจึงตั้งค่าอื่นเพื่อที่ฉันจะได้รับรางวัลศรีกานต์สำหรับความช่วยเหลือของเขา คำตอบเพิ่มเติมยินดีต้อนรับเสมอ แต่เงินรางวัลสำหรับเขา
Matt Parker

คำตอบ:


2

นี่ไม่ใช่คำตอบที่สมบูรณ์ แต่ฉันหวังว่ามันจะช่วยให้คุณมีความคิดเกี่ยวกับวิธีจำลองสถานการณ์ในลักษณะที่สอดคล้องกัน

สมมติฐาน

  1. ค่าที่ด้านล่างสุดของสเกลจะเป็นไปตามการแจกแจงแบบปกติที่ถูกตัดทอนจากด้านล่าง

  2. ค่าที่ปลายด้านบนของสเกลจะเป็นไปตามการแจกแจงแบบปกติที่ถูกตัดทอนจากด้านบน

    (หมายเหตุ: ฉันรู้ว่าคุณบอกว่าข้อมูลนั้นไม่ปกติ แต่ฉันสมมติว่าคุณกำลังอ้างถึงการกระจายของค่าทั้งหมดในขณะที่ข้อสมมติฐานข้างต้นเกี่ยวข้องกับค่าที่ระดับล่างและส่วนบนของมาตราส่วน)

  3. สถานะพื้นฐานของบุคคล (ไม่ว่าจะเป็นวัณโรคหรือไม่ก็ตาม) จะเป็นไปตามห่วงโซ่มาร์คอฟอันดับหนึ่ง

แบบ

ปล่อย:

  1. Dผม(เสื้อ)เป็น 1 ถ้าในเวลาคนที่คนมีวัณโรคและ 0 มิฉะนั้นเสื้อผมTH

  2. RTBผม(เสื้อ)จะมีการตอบสนองต่อการทดสอบเพื่อทดสอบวัณโรคในเวลาที่ของคนเสื้อผมTH

  3. Rยังไม่มีข้อความผม(เสื้อ)เป็นการตอบสนองการทดสอบต่อการทดสอบ NILL ในเวลาของคนเสื้อผมTH

  4. (Rยังไม่มีข้อความผม(เสื้อ)|Dผม(เสื้อ)=0)~ยังไม่มีข้อความ(μล.,σล.2)ผม(Rยังไม่มีข้อความผม(เสื้อ)>Rล.)

  5. (Rยังไม่มีข้อความผม(เสื้อ)|Dผม(เสื้อ)=1)~ยังไม่มีข้อความ(μล.,σล.2)ผม(Rยังไม่มีข้อความผม(เสื้อ)>Rล.)

    คะแนน 4 และ 5 จับภาพความคิดที่ว่าการตอบสนองของบุคคลต่อการทดสอบ NILL นั้นไม่ได้ขึ้นอยู่กับสถานะของโรค

  6. (RTBผม(เสื้อ)|Dผม(เสื้อ)=0)~ยังไม่มีข้อความ(μล.,σล.2)ผม(RTBผม(เสื้อ)>Rล.)

  7. (RTBผม(เสื้อ)|Dผม(เสื้อ)=1)~ยังไม่มีข้อความ(μยู,σยู2)ผม(RTBผม(เสื้อ)<Rยู)

  8. μยู>μล.

    คะแนน 6, 7 และ 8 จับภาพความคิดที่ว่าการตอบสนองของบุคคลต่อการทดสอบวัณโรคขึ้นอยู่กับสถานะของโรค

  9. พี(เสื้อ)จะเป็นน่าจะเป็นที่ของคนจับวัณโรคในช่วง 6 เดือนก่อนหน้านี้เวลากำหนดว่าพวกเขาเป็นโรคฟรีในช่วงระยะเวลาการทดสอบก่อนหน้านี้ ดังนั้นเมทริกซ์การเปลี่ยนสถานะจึงต้องการหนึ่งรายการด้านล่าง:เสื้อ

    [1-พี(เสื้อ)พี(เสื้อ)01]

    ในคำอื่น ๆ

    PRโอ(Dผม(เสื้อ)=1|Dผม(เสื้อ-1)=0)=พี(เสื้อ)

    PRโอ(Dผม(เสื้อ)=0|Dผม(เสื้อ-1)=0)=1-พี(เสื้อ)

    PRโอ(Dผม(เสื้อ)=1|Dผม(เสื้อ-1)=1)=1

    PRโอ(Dผม(เสื้อ)=0|Dผม(เสื้อ-1)=1)=0

เกณฑ์การทดสอบของคุณระบุว่า:

D^ผม(เสื้อ)={1,RTBผม(เสื้อ)-Rยังไม่มีข้อความผม(เสื้อ)0.350,โอเสื้อชั่วโมงอีRWผมsอี

อย่างไรก็ตามตามที่คุณเห็นจากโครงสร้างของแบบจำลองคุณสามารถกำหนดพารามิเตอร์การตัดและเปลี่ยนปัญหาทั้งหมดเป็นสิ่งที่ควรตัดการวินิจฉัยโรคของคุณอย่างถูกต้อง ดังนั้นปัญหาโมโหดูเหมือนว่าจะมีปัญหามากขึ้นกับการเลือกของคุณตัดมากกว่าสิ่งอื่นใด

ในการเลือกตัด 'ถูกต้อง' คุณสามารถใช้ข้อมูลประวัติเกี่ยวกับผู้ป่วยที่ระบุอย่างชัดเจนว่ามีวัณโรคและประเมินพารามิเตอร์ผลลัพธ์ของการตั้งค่าข้างต้น คุณสามารถใช้เกณฑ์บางอย่างเช่นจำนวนผู้ป่วยที่จำแนกอย่างถูกต้องว่ามีวัณโรคหรือไม่เป็นตัวชี้วัดเพื่อระบุรูปแบบที่ดีที่สุด เพื่อความง่ายคุณสามารถสมมติว่าเป็นพารามิเตอร์ที่ไม่แปรเปลี่ยนเวลาซึ่งดูเหมือนสมเหตุสมผลในกรณีที่ไม่มีโรคระบาด ฯลฯพี(เสื้อ)

หวังว่ามีประโยชน์


ขอบคุณศรีกันต์! ขออภัยฉันคิดถึงความเห็นของคุณก่อนหน้านี้ กระจุกดาวบนนั้นเป็นแค่เข็มที่อยู่บนเพดาน - มันไม่มีความแปรปรวนเลยยกเว้นความยาวที่สม่ำเสมอซึ่งเชื่อมโยงมันกับการกระจายที่ต่ำกว่าซึ่งโดยพื้นฐานแล้วคุณอธิบายไว้ ฉันจะใช้เวลาสักครู่ในการแยกคำตอบของคุณ (โดยเฉพาะอย่างยิ่งเมื่อฉันติดอยู่ใน IE และไม่สามารถมองเห็น LaTeX ได้อย่างเหมาะสมในตอนนี้) แต่ฉันขอขอบคุณที่คุณทุ่มเทให้กับคำถามเล็ก ๆ น้อย ๆ นี้
Matt Parker

3

Tricky Matt ปัญหาสถิติโลกแห่งความจริงเป็นจำนวนมาก!

ฉันจะเริ่มกำหนดเป้าหมาย / วัตถุประสงค์การศึกษาของคุณ

มันจะยากที่จะกำหนดการแจกแจงความน่าจะเป็นสำหรับการทดสอบวัณโรคและวัณโรค คุณมีแบบสอบถามเกี่ยวกับการติดเชื้อวัณโรคก่อนหน้า (หรือดีกว่าประวัติทางการแพทย์) ฉันยังคงทำการทดสอบ TB + เนื่องจากการฉีดวัคซีนในวัยเด็ก - หลายทศวรรษที่ผ่านมา - ก่อนหน้านี้จึงต้องพิจารณาการฉีดวัคซีน

ดูเหมือนว่าคำถามที่แท้จริงของคุณคือ: การทดสอบวัณโรคซ้ำ ๆ มีผลต่อผลการทดสอบหรือไม่?

มันจะคุ้มค่าที่ได้รับสำเนาของการวิเคราะห์ปีเตอร์ดิ๊กเกิ้ลของข้อมูลระยะยาว

ทำการวิเคราะห์ข้อมูลเชิงสำรวจโดยเฉพาะอย่างยิ่งเมทริกซ์พล็อตการกระจายของผลการทดสอบไม่มีในแต่ละครั้งเมื่อเทียบกับแต่ละอื่น ๆ และผลการทดสอบวัณโรคในแต่ละครั้งเมื่อเทียบกับแต่ละอื่น ๆ ; และแผนการแพร่กระจายของ TB vs nil (ในแต่ละครั้ง) ใช้ความแตกต่าง (ทดสอบ TB - ทดสอบ Nil) และทำเมทริกซ์พล็อตกระจาย ลองแปลงข้อมูลและทำซ้ำสิ่งเหล่านี้ - ฉันจินตนาการ log (TB) - log (Nil) อาจช่วยได้ถ้าผลลัพธ์ TB มีขนาดใหญ่มากเมื่อเทียบกับ Nil ค้นหาความสัมพันธ์เชิงเส้นในโครงสร้างความสัมพันธ์

อีกวิธีหนึ่งคือการใช้ผลการทดสอบที่กำหนด (บวก / ลบ) และสร้างแบบจำลองเชิงตรรกะนี้โดยใช้รูปแบบเอฟเฟกต์ที่ไม่เป็นเชิงเส้น (ลิงค์ลิท) บุคคลบางคนพลิกระหว่างการทดสอบ TB + เป็น TB- และสิ่งนี้เกี่ยวข้องกับการทดสอบ Nil, การทดสอบ TB, TB - Nil หรือการแปลงผลการทดสอบบางส่วนหรือไม่?


ขอบคุณสำหรับคำตอบ. เกี่ยวกับการไม่ทราบสถานะที่แท้จริง: เรามีแบบสอบถามจำนวนมากและตระหนักดีถึงปัญหาวัคซีน BCG จากการทดสอบผิวหนัง - ในความเป็นจริงการทดสอบเลือดเหล่านี้ควรจะแก้ไขปัญหานั้นเพราะพวกเขาใช้แอนติเจนที่แตกต่างจาก PPD คุณ เคยชิน นั่นเป็นคำถามที่แยกจากกันและเรากำลังจะดำเนินการในภายหลัง - ตอนนี้ความสนใจของฉันคือการทำให้การทดสอบนี้ 'ตระหนักถึงระยะยาว'
Matt Parker

... โดยเฉพาะอย่างยิ่งเนื่องจากบุคคลบางคนพลิกจากเชิงลบเป็นบวกและนั่นมักเป็นผลมาจากผลของศูนย์และวัณโรคทั่วไปที่ทำให้เกิดความผันผวนเล็กน้อย - ลดลงเล็กน้อย, TB เพิ่มขึ้นเล็กน้อยและทันใดนั้นพวกเขาก็เป็นบวก การทดสอบถัดไปพวกเขากลับไปเป็นลบ ฉันเห็นได้ว่าเมื่อฉันตรวจสอบผลลัพธ์แต่ละรายการ แต่ฉันไม่แน่ใจว่าจะรวมสัญชาตญาณของฉันเข้ากับแบบจำลองได้อย่างไร
Matt Parker

ในที่สุดในขณะที่ฉันพยายามบันทึกผลลัพธ์ แต่ดูเหมือนว่ายังไม่เพียงพอที่จะทำให้พวกเขาใกล้เคียงกับมาตรฐาน พวกมันบิดเบี้ยวมากและการตัดปลายที่สูงขึ้นทำให้ซับซ้อนมากขึ้นโดยการเพิ่มความหนาแน่นที่เห็นได้ชัดเจนบนเพดาน อย่างไรก็ตามสิ่งที่น่าสนใจตัวอย่างการกระจายตัวของผลรวมวัณโรคและวัณโรคนั้นมีความคล้ายคลึงกันโดยมีความแตกต่างเพียงอย่างเดียวคือหยดนั้นบนเพดานมีขนาดใหญ่กว่าสำหรับผลวัณโรค
Matt Parker

ขอบคุณที่สละเวลาอ่านและตอบคำถามสัตว์ร้ายนี้!
Matt Parker
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.