คำถามติดแท็ก propensity-scores

ความน่าจะเป็นของการได้รับการรักษาด้วยชุดของตัวแปรที่สังเกตได้

5
คะแนนความชอบต่างจากการเพิ่ม covariates ในการถดถอยอย่างไรและเมื่อใดที่พวกเขาต้องการคะแนนหลัง
ฉันยอมรับว่าฉันค่อนข้างใหม่กับคะแนนความชอบและการวิเคราะห์เชิงสาเหตุ สิ่งหนึ่งที่ไม่ชัดเจนสำหรับฉันในฐานะผู้มาใหม่คือ "การปรับสมดุล" โดยใช้คะแนนความชอบมีความแตกต่างทางคณิตศาสตร์จากสิ่งที่เกิดขึ้นเมื่อเราเพิ่ม covariates ลงในการถดถอย มีอะไรแตกต่างกันเกี่ยวกับการผ่าตัดและทำไมมันถึงดีกว่าการเพิ่มประชากรย่อยในการถดถอย ฉันเคยเห็นการศึกษาบางอย่างที่ทำการเปรียบเทียบเชิงประจักษ์ของวิธีการ แต่ฉันไม่เคยเห็นการสนทนาที่ดีเกี่ยวกับคุณสมบัติทางคณิตศาสตร์ของทั้งสองวิธีและทำไม PSM ให้ยืมตัวเองไปสู่การตีความเชิงสาเหตุ ดูเหมือนจะมีความสับสนและการโต้เถียงกันมากมายในสาขานี้ซึ่งทำให้สิ่งต่าง ๆ ยากขึ้น ความคิดใด ๆ เกี่ยวกับสิ่งนี้หรือตัวชี้ไปยังแหล่งข้อมูลที่ดี / กระดาษเพื่อทำความเข้าใจความแตกต่าง? (ฉันค่อย ๆ เดินผ่านหนังสือเวรกรรมของจูเดียเพิร์ลดังนั้นไม่จำเป็นต้องชี้ให้ฉันเห็น)

3
การจับคู่คะแนนความโน้มเอียงหลังจากการใส่หลายครั้ง
ฉันอ้างถึงเอกสารนี้ : Hayes JR, Groner JI "การใช้คะแนนความชอบและคะแนนความชอบหลายระดับเพื่อทดสอบผลกระทบของเบาะรถยนต์และการใช้เข็มขัดนิรภัยต่อความรุนแรงของการบาดเจ็บจากข้อมูลทะเบียนอุบัติเหตุ" J Pediatr Surg. 2008 พฤษภาคม; 43 (5): 924-7 ในการศึกษานี้ได้ทำการใส่ข้อมูลหลายชุดเพื่อรับชุดข้อมูลที่สมบูรณ์ 15 ชุด คะแนนความน่าเชื่อถือถูกคำนวณแล้วสำหรับแต่ละชุดข้อมูล จากนั้นสำหรับแต่ละหน่วยสังเกตการณ์บันทึกถูกเลือกแบบสุ่มจากหนึ่งใน 15 ชุดข้อมูลที่เสร็จสมบูรณ์ (รวมถึงคะแนนความชอบที่เกี่ยวข้อง) ดังนั้นการสร้างชุดข้อมูลสุดท้ายเดียวซึ่งถูกวิเคราะห์โดยการจับคู่คะแนนความชอบ คำถามของฉันคือ: นี่เป็นวิธีที่ถูกต้องหรือไม่ที่จะทำการจับคู่คะแนนความชอบหลังจากการใส่หลายครั้ง มีวิธีอื่นในการทำหรือไม่? สำหรับบริบท: ในโครงการใหม่ของฉันฉันมุ่งมั่นที่จะเปรียบเทียบผลของวิธีการรักษา 2 วิธีโดยใช้การจับคู่คะแนนความชอบ มีข้อมูลที่ขาดหายไปและฉันตั้งใจจะใช้MICEแพ็กเกจใน R เพื่อใส่ค่าที่หายไปจากนั้นtwangทำการจับคู่คะแนนความชอบและlme4วิเคราะห์ข้อมูลที่ตรงกัน Update1: ฉันได้พบบทความนี้ซึ่งใช้แนวทางที่แตกต่าง: Mitra, Robin และ Reiter, Jerome P. (2011) คะแนนความตรงกับการหายไปของโควาเรียผ่านการใส่ซ้ำหลายครั้งตามลำดับ [Working Paper] ในบทความนี้ผู้เขียนคำนวณคะแนนความน่าเชื่อถือในชุดข้อมูลที่กำหนดทั้งหมดแล้วรวมค่าเฉลี่ยด้วยการหาค่าเฉลี่ยซึ่งอยู่ในจิตวิญญาณของการใส่ความคิดหลายครั้งโดยใช้กฎของ Rubin สำหรับการประเมินจุด - …

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

5
จากมุมมองทางสถิติเราสามารถอนุมานสาเหตุของการใช้คะแนนความชอบด้วยการศึกษาเชิงสังเกตการณ์ได้หรือไม่?
คำถาม:จากมุมมองของนักสถิติ (หรือผู้ประกอบการ) เราสามารถอนุมานสาเหตุที่เป็นเหตุเป็นผลโดยใช้คะแนนความชอบด้วยการศึกษาเชิงสังเกตการณ์ ( ไม่ใช่การทดลอง ) ได้หรือไม่ กรุณาอย่าต้องการที่จะเริ่มสงครามเปลวไฟหรือการอภิปรายที่คลั่ง ที่มา:ภายในโปรแกรมปริญญาเอกสถิติของเราเราได้เพียงสัมผัสในการอนุมานสาเหตุผ่านกลุ่มการทำงานและช่วงหัวข้อไม่กี่ อย่างไรก็ตามมีนักวิจัยที่โดดเด่นบางคนในแผนกอื่น ๆ (เช่น HDFS, สังคมวิทยา) ที่ใช้งานพวกเขาอย่างแข็งขัน ฉันได้เห็นการถกเถียงที่ค่อนข้างร้อนแรงในเรื่องนี้ ฉันไม่ได้ตั้งใจที่จะเริ่มที่นี่ ที่กล่าวว่าสิ่งที่คุณได้พบอ้างอิง? คุณมีมุมมองอะไร ตัวอย่างเช่นข้อโต้แย้งหนึ่งที่ฉันเคยได้ยินเกี่ยวกับคะแนนความชอบในฐานะที่เป็นเทคนิคการอนุมานเชิงสาเหตุคือไม่มีใครสามารถอนุมานสาเหตุเวรกรรมได้เนื่องจากการละเว้นตัวแปรอคติ - ถ้าคุณทิ้งอะไรที่สำคัญไปคุณก็เลิกโซ่สาเหตุ นี่เป็นปัญหาที่แก้ไขไม่ได้หรือไม่ ข้อความปฏิเสธความรับผิดชอบ:คำถามนี้อาจไม่มีคำตอบที่ถูกต้อง - เจ๋งมากเมื่อคลิก cw แต่โดยส่วนตัวแล้วฉันสนใจในการตอบกลับมากและจะมีความสุขกับการอ้างอิงที่ดีเพียงไม่กี่ข้อซึ่งรวมถึงตัวอย่างจริง

1
ความแตกต่างระหว่างค่าเฉลี่ยและผลการรักษาชายขอบ
ฉันอ่านบทความมาแล้วและฉันไม่แน่ใจเกี่ยวกับคำจำกัดความเฉพาะของ Average Treatment Effect (ATE) และ Marginal Treatment Effect (MTE) พวกเขาเหมือนกันหรือไม่ ตามที่ออสติน ... ผลตามเงื่อนไขคือผลกระทบโดยเฉลี่ยที่ระดับตัวแบบในการย้ายตัวแบบจากไม่ถูกรักษาไปสู่การรักษา สัมประสิทธิ์การถดถอยสำหรับตัวแปรตัวบ่งชี้การกำหนดการรักษาจากตัวแบบการถดถอยหลายตัวแปรคือการประมาณของผลตามเงื่อนไขหรือปรับ ในทางตรงกันข้ามผลกระทบส่วนเพิ่มคือผลเฉลี่ยในระดับประชากรในการเคลื่อนย้ายประชากรทั้งหมดจากการไม่ได้รับการรักษาไปยังการรักษา [10]ผลการรักษาเชิงเส้น (ความแตกต่างของค่าเฉลี่ยและความแตกต่างของสัดส่วน) นั้นสามารถยุบได้: ผลการรักษาแบบมีเงื่อนไขและส่วนเพิ่มจะตรงกัน อย่างไรก็ตามเมื่อผลลัพธ์เป็นแบบไบนารีหรือเวลาต่อเหตุการณ์โดยธรรมชาติอัตราส่วนอัตราต่อรองและอัตราส่วนความเป็นอันตรายจะไม่สามารถยุบได้ [11] Rosenbaum ตั้งข้อสังเกตว่าวิธีการให้คะแนนความชอบอนุญาตให้หนึ่งในการประเมินผลกระทบมากกว่าเงื่อนไขเงื่อนไข [12] มีความขัดสนของการวิจัยเกี่ยวกับประสิทธิภาพของวิธีคะแนนความชอบที่แตกต่างกันเพื่อประเมินผลการรักษาชายขอบ แต่ในอีกกระดาษออสตินเขาพูดว่า Yผม( 1 ) - Yผม( 0 )Yผม(1)-Yผม(0)Y_i(1)- Y_i(0)E[ Yผม( 1 ) - Yผม( 0 ) ]E[Yผม(1)-Yผม(0)]E[Y_i(1)- Y_i(0)] ดังนั้นคำถามที่ฉันมีคือ ... อะไรคือความแตกต่างระหว่างผลการรักษาโดยเฉลี่ยกับผลการรักษาเล็กน้อย? เช่นกันฉันจะจำแนกการประมาณค่าของฉันได้อย่างไร ฉันมีคะแนนความชอบ (IPTW) …

4
จับคู่คะแนนความน่าเชื่อถือกับข้อมูลพาเนล
ฉันมีชุดข้อมูลระยะยาวของแต่ละบุคคลและบางคนก็อยู่ภายใต้การรักษาและคนอื่นไม่ได้ บุคคลทุกคนอยู่ในกลุ่มตัวอย่างตั้งแต่แรกเกิดจนถึงอายุ 18 ปีและการรักษาเกิดขึ้นในบางช่วงอายุ อายุของการรักษาอาจแตกต่างกันในแต่ละกรณี การใช้การจับคู่คะแนนความชอบฉันต้องการจับคู่หน่วยที่ได้รับการรักษาและควบคุมเป็นคู่กับการจับคู่ที่แน่นอนในปีเกิดซึ่งฉันสามารถติดตามแต่ละคู่ตั้งแต่วันเกิดของพวกเขาจนถึงอายุ 18 ทั้งหมดมีทั้งหมด 150 คนและ 4000 คนที่ไม่ผ่านการรักษา หลังจากการจับคู่ความคิดคือการใช้กลยุทธ์ที่แตกต่างในความแตกต่างในการประเมินผลของการรักษา ปัญหาที่ฉันเผชิญในขณะนี้คือทำการจับคู่กับข้อมูลพาเนล ฉันกำลังใช้psmatch2คำสั่งของ Stata และฉันจับคู่กับลักษณะครัวเรือนและส่วนบุคคลโดยใช้การจับคู่คะแนนความชอบ โดยทั่วไปกับข้อมูลพาเนลจะมีการจับคู่ที่เหมาะสมที่สุดในแต่ละช่วงอายุ เป็นตัวอย่าง: ถ้าได้รับการปฏิบัติ B และ C เป็นตัวควบคุมและพวกเขาทั้งหมดเกิดในปี 1980 ดังนั้น A และ B อาจถูกจับคู่ในปี 1980 ที่อายุ 0 ขณะที่ A และ C ถูกจับคู่ในปี 1981 ที่อายุ 1 และอื่น ๆ . นอกจากนี้ A อาจถูกจับคู่กับค่าการรักษาล่วงหน้าของตัวเองจากปีก่อนหน้า เพื่อที่จะแก้ไขปัญหานี้ฉันใช้ค่าเฉลี่ยของตัวแปรที่แปรผันตามเวลาทั้งหมดซึ่งการจับคู่สามารถระบุบุคคลที่มีค่าเฉลี่ยที่คล้ายกันมากที่สุดในช่วงระยะเวลาของตัวอย่างและฉันทำการจับคู่แยกต่างหากสำหรับแต่ละกลุ่มอายุ 0 ถึง …

4
ทำไมการจับคู่คะแนนความชอบมีเหตุผลสำหรับการอนุมานสาเหตุ
การจับคู่คะแนนความชอบใช้สำหรับการหาสาเหตุในการศึกษาเชิงสังเกตการณ์ (ดูที่กระดาษ Rosenbaum / Rubin ) สัญชาตญาณง่าย ๆ ของเบื้องหลังทำไมมันทำงาน อีกนัยหนึ่งทำไมถ้าเราแน่ใจว่าความน่าจะเป็นของการมีส่วนร่วมในการรักษานั้นเท่ากันทั้งสองกลุ่มผลข้างเคียงที่หายไปและเราสามารถใช้ผลลัพธ์เพื่อสรุปข้อสรุปเกี่ยวกับการรักษาได้?

2
น้ำหนักคะแนนความชอบในการวิเคราะห์ค่า Cox และการเลือกค่าความแปรปรวนร่วม
เกี่ยวกับการให้คะแนนความชอบ (IPTW) เมื่อทำแบบจำลองความเป็นอันตรายตามสัดส่วนของ Cox ของข้อมูลการรอดชีวิตแบบเวลาต่อเหตุการณ์: ฉันมีข้อมูลรีจิสทรีในอนาคตที่เราสนใจที่จะดูผลการรักษาของยาซึ่งโดยส่วนใหญ่แล้วผู้ป่วยจะได้รับข้อมูลพื้นฐาน ฉันไม่แน่ใจว่าจะวิเคราะห์ข้อมูลได้ดีที่สุดอย่างไร อาจเป็นไปได้ว่าตัวแปรพื้นฐานบางตัวมีระดับที่ได้รับอิทธิพลจากการรักษาและไม่ใช่วิธีอื่น ๆ (เช่นผู้ให้บริการชีวภาพบางราย) ฉันหลงทางนิดหน่อยว่า covariates ใดที่ฉันควรรวมไว้ในแบบจำลองคะแนนความชอบสำหรับการประเมินน้ำหนักและสิ่งที่ฉันควรจะรวมเป็น covariates ในcoxphรูปแบบ (ถ้ามี) คำแนะนำในทิศทางที่ถูกต้องจะเป็นประโยชน์! ฉันยังไม่สามารถค้นหาวรรณกรรมเกี่ยวกับเรื่องนี้ในการสร้างแบบจำลองของ CoxPh ได้ในตอนนี้ ฉันคิดว่าโควาเรียที่เป็นตัวแทนของการรักษาที่มีพื้นฐานที่ว่า (อาจ) มีอิทธิพลต่อผลลัพธ์ควรรวมอยู่ใน Cox PH covariates แต่ฉันไม่แน่ใจในเรื่องนี้ ฉันจะทราบได้อย่างไรว่าควรรวมตัวแปรตัวใดเป็นโควาเรียต์ในโมเดล Cox แทนที่จะใช้ในการคำนวณน้ำหนักคะแนนความชอบ? คำถามติดตาม ฉันเข้าใจปัญหาที่สืบทอดมาของการประเมินผลการรักษาของการแทรกแซงบางอย่างที่ได้เริ่มขึ้นแล้ว - นั่นคือแพร่หลายในหมู่ผู้ป่วยก่อนที่จะเริ่มการสังเกต ทั้งในเรื่องที่เกี่ยวกับการแนะนำอคติที่เกี่ยวข้องกับการเปลี่ยนแปลงเวลาของความเสี่ยง (เช่นผลข้างเคียงที่พบบ่อยในปีแรกของการบำบัด) และเพื่อนร่วมทุนที่ได้รับผลกระทบจากการรักษา หากฉันไม่เข้าใจผิดนี่เป็นข้อเสนอที่เป็นสาเหตุของความคลาดเคลื่อนระหว่างการสังเกตและการสุ่มว่าเกี่ยวกับหัวใจและหลอดเลือดและการบำบัดทดแทนฮอร์โมน ในชุดข้อมูลของฉันในอีกทางหนึ่งเราสนใจที่จะดูผลกระทบที่อาจเกิดขึ้นจากการรักษา ถ้าฉันใช้การปรับคะแนนความชอบเพื่อตรวจสอบผลการรักษาในหมู่ผู้ใช้ที่แพร่หลายเช่นการใช้ยาก่อนการสังเกตในข้อมูลกลุ่มและเราสังเกตเห็นผลข้างเคียงของการรักษาด้วยยา (และนี่คือสิ่งที่เรากำลังมองหา) ฉันสามารถแยกแยะความเป็นไปได้ที่จะประเมินความเสี่ยงที่เกี่ยวข้องกับการรักษามากเกินไปได้หรือไม่? คือตราบใดที่ความเสี่ยงนั้นเพิ่มขึ้นอย่างมีนัยสำคัญมันเป็น "แน่นอน" ที่สุดที่ไม่ได้ป้องกัน? ฉันไม่สามารถจินตนาการถึงตัวอย่างที่ความลำเอียงชนิดนี้สามารถแนะนำการประเมินค่าความเสี่ยงสูงเกินไปของการเชื่อมโยงความเสี่ยงที่ผิดพลาดในบริบทนี้

1
คำอธิบายที่ใช้งานง่ายสำหรับความน่าจะเป็นค่าผกผันของน้ำหนักการรักษา (IPTWs) ในการให้คะแนนความชอบ?
ฉันเข้าใจกลไกของการคำนวณน้ำหนักโดยใช้คะแนนความชอบ : แล้วนำน้ำหนักไปใช้ในการวิเคราะห์การถดถอยและให้น้ำหนักกับ "การควบคุมสำหรับ" หรือยกเลิกการเชื่อมโยงผลกระทบของโควาเรียตในประชากรกลุ่มการรักษาและกลุ่มควบคุมด้วยตัวแปรผลลัพธ์หน้า( xผม)พี(xผม)p(x_i)Wi , j = t r e a tWi , j = c o n t r o l= 1หน้า( xผม)= 11 - p ( xผม)Wผม,J=เสื้อRอีaเสื้อ=1พี(xผม)Wผม,J=คโอnเสื้อRโอล.=11-พี(xผม)\begin{align} w_{i, j={\rm treat}} &= \frac{1}{p(x_i)} \\[5pt] w_{i, j={\rm control}} &= \frac{1}{1-p(x_i)} \end{align} อย่างไรก็ตามในระดับลำไส้ฉันไม่เข้าใจว่าน้ำหนักบรรลุเป้าหมายนี้อย่างไรและทำไมจึงสร้างสมการดังกล่าว

1
ช่วงความเชื่อมั่นสำหรับผลการรักษาโดยเฉลี่ยจากน้ำหนักคะแนนความชอบ?
ฉันพยายามที่จะประเมินผลการรักษาโดยเฉลี่ยจากข้อมูลการสังเกตโดยใช้น้ำหนักคะแนนความชอบ (โดยเฉพาะ IPTW) ฉันคิดว่าฉันคำนวณ ATE อย่างถูกต้อง แต่ฉันไม่ทราบวิธีคำนวณช่วงความมั่นใจของ ATE ในขณะที่คำนึงถึงน้ำหนักความชอบแบบผกผัน นี่คือสมการที่ฉันใช้ในการคำนวณผลการรักษาโดยเฉลี่ย (อ้างอิง Med Med. 10 ก.ย. 2010; 29 (20): 2137–2148): โดยที่จำนวนวิชาทั้งหมด,สถานะการรักษา,สถานะผลลัพธ์และคะแนนความชอบTE=1ยังไม่มีข้อความΣ1ยังไม่มีข้อความZผมYผมพีผม-1ยังไม่มีข้อความΣ1ยังไม่มีข้อความ( 1 -Zผม)Yผม1 -พีผมATE=1ยังไม่มีข้อความΣ1ยังไม่มีข้อความZผมYผมพีผม-1ยังไม่มีข้อความΣ1ยังไม่มีข้อความ(1-Zผม)Yผม1-พีผมATE=\frac1N\sum_1^N\frac{Z_iY_i}{p_i}-\frac1N\sum_1^N\frac{(1-Z_i)Y_i}{1-p_i}ยังไม่มีข้อความ=ยังไม่มีข้อความ=N=Zผม=Zผม=Z_i=Yผม=Yผม=Y_i=พีผม=พีผม=p_i= ไม่มีใครทราบแพ็คเกจ R ที่จะคำนวณช่วงความมั่นใจของผลการรักษาโดยเฉลี่ยโดยคำนึงถึงน้ำหนักหรือไม่ สามารถระบุsurveyความช่วยเหลือในแพคเกจที่นี่? ฉันสงสัยว่าสิ่งนี้จะได้ผลหรือไม่: library(survey) sampsvy=svydesign(id=~1,weights=~iptw,data=df) svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta') #which produces this result: treatment surgery == "lump" ci_l ci_u No 0.1644043 0.1480568 0.1817876 Yes 0.2433215 0.2262039 0.2610724 ฉันไม่รู้ว่าจะไปจากที่นี่เพื่อหาช่วงความมั่นใจของความแตกต่างระหว่างสัดส่วน …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.