คำถามติดแท็ก paired-data

ข้อมูลที่จับคู่เกิดขึ้นเมื่อการออกแบบการศึกษาเชิงทดลองหรือเชิงสังเกตจงใจสุ่มตัวอย่างสองหน่วยเป็น dyad เพื่อสร้างพื้นฐานของการเปรียบเทียบ ใช้แท็กนี้สำหรับคำถามเกี่ยวกับข้อมูลที่จับคู่หรือการวิเคราะห์

6
t-test สำหรับข้อมูลที่จับคู่บางส่วนและไม่ได้คู่บางส่วน
นักวิจัยต้องการสร้างการวิเคราะห์รวมของชุดข้อมูลหลายชุด ในชุดข้อมูลบางชุดมีการสังเกตแบบคู่สำหรับการรักษา A และ B ในชุดข้อมูลอื่น ๆ มีข้อมูล A และ / หรือ B ที่ไม่ได้รับการจับคู่ ฉันกำลังมองหาข้อมูลอ้างอิงสำหรับการปรับตัวของการทดสอบ t-test หรือการทดสอบอัตราส่วนความน่าจะเป็นสำหรับข้อมูลที่จับคู่บางส่วนเช่นนั้น ฉันยินดี (ตอนนี้) ที่จะยอมรับความเป็นมาตรฐานที่มีความแปรปรวนเท่ากันและประชากรมีความหมายสำหรับ A นั้นเท่ากันสำหรับการศึกษาแต่ละครั้ง (และเช่นเดียวกันสำหรับ B)

2
ความแตกต่างระหว่างการทดสอบผลรวมของอันดับ Wilcoxon กับการทดสอบอันดับของ Wilcoxon
ฉันสงสัยว่าความแตกต่างทางทฤษฎีคืออะไรระหว่างการทดสอบ Wilcoxon Rank-Sum Test และ Wilcoxon Signed-Rank Test โดยใช้การสังเกตแบบคู่ ฉันรู้ว่าการทดสอบระดับผลรวมของ Wilcoxon ช่วยให้การสังเกตแตกต่างกันในสองตัวอย่างที่แตกต่างกันในขณะที่การทดสอบการลงนามอันดับสำหรับตัวอย่างที่จับคู่ไม่อนุญาตให้ทำได้อย่างไรก็ตามพวกเขาทั้งคู่ดูเหมือนจะทดสอบแบบเดียวกัน ใครสามารถให้ข้อมูลพื้นฐาน / ทฤษฎีเพิ่มเติมแก่ฉันได้บ้างเมื่อฉันควรใช้การทดสอบผลรวมลำดับของ Wilcoxon และเมื่อใดที่ควรใช้การทดสอบการลงนามระดับ Wilcoxon โดยใช้การสังเกตแบบคู่

5
จับคู่กับการทดสอบ t แบบไม่จับคู่
สมมติว่าฉันมีหนู 20 ตัว ฉันจับคู่เมาส์ด้วยวิธีใดวิธีหนึ่งเพื่อให้ได้ 10 คู่ สำหรับจุดประสงค์ของคำถามนี้อาจเป็นการจับคู่แบบสุ่มหรืออาจเป็นการจับคู่ที่เหมาะสมเช่นพยายามจับคู่หนูจากครอกเดียวกันที่มีเพศเดียวกันมีน้ำหนักเท่ากันหรืออาจเป็นการจับคู่ที่โง่อย่างจงใจ พยายามจับคู่หนูด้วยน้ำหนักที่ไม่เท่าที่ควรจะเป็น จากนั้นฉันใช้ตัวเลขสุ่มเพื่อกำหนดเมาส์หนึ่งตัวในแต่ละคู่ให้กับกลุ่มควบคุมและอีกเมาส์หนึ่งไปยังกลุ่มที่ต้องปฏิบัติ ตอนนี้ฉันทำการทดลองโดยรักษาเฉพาะหนูที่จะได้รับการรักษา แต่อย่างอื่นก็ไม่ได้สนใจว่าจะมีการเตรียมการอะไรก็ตาม เมื่อมีใครมาวิเคราะห์ผลลัพธ์คนหนึ่งอาจใช้การทดสอบ t แบบไม่คู่หรือการทดสอบแบบจับคู่ ถ้ามีคำตอบจะแตกต่างกันอย่างไร? (โดยทั่วไปฉันสนใจในความแตกต่างอย่างเป็นระบบของพารามิเตอร์ทางสถิติใด ๆ ที่จำเป็นต้องมีการประมาณ) เหตุผลที่ฉันถามสิ่งนี้คือกระดาษที่ฉันเพิ่งมีส่วนร่วมถูกวิพากษ์วิจารณ์จากนักชีววิทยาในการใช้การทดสอบแบบจับคู่ t-test มากกว่าการทดสอบแบบไม่มีคู่ แน่นอนในการทดลองจริงสถานการณ์ไม่ได้รุนแรงอย่างที่สถานการณ์ฉันร่างไว้และในความคิดของฉันเหตุผลที่ดีสำหรับการจับคู่ แต่นักชีววิทยาไม่เห็นด้วย ฉันคิดว่ามันเป็นไปไม่ได้ที่จะปรับปรุงนัยสำคัญทางสถิติอย่างไม่ถูกต้อง (ลดค่า p) ในสถานการณ์ที่ฉันร่างโดยใช้การทดสอบแบบจับคู่ t- การทดสอบมากกว่าการทดสอบแบบไม่มีคู่แม้ว่ามันจะไม่เหมาะสมในการจับคู่ อย่างไรก็ตามมันอาจแย่ลงอย่างมีนัยสำคัญทางสถิติถ้าหนูถูกจับคู่ไม่ดี ถูกต้องหรือไม่

5
วิธีการแสดงแถบข้อผิดพลาดสำหรับการทดลองข้ามคู่
สถานการณ์ต่อไปนี้ได้กลายเป็นคำถามที่พบบ่อยที่สุดในสามผู้ตรวจสอบ (I) ผู้ตรวจสอบ / บรรณาธิการ (R ไม่เกี่ยวข้องกับ CRAN) และฉัน (M) ในฐานะผู้สร้างพล็อต เราสามารถสรุปได้ว่า (R) เป็นผู้ตรวจทานบอสใหญ่ทางการแพทย์โดยทั่วไปที่รู้ว่าแต่ละพล็อตต้องมีแถบข้อผิดพลาดมิฉะนั้นจะผิด เมื่อผู้ตรวจทานเชิงสถิติเข้ามาเกี่ยวข้องปัญหาก็สำคัญน้อยกว่ามาก สถานการณ์ ในการศึกษาทางเภสัชวิทยาทั่วไปพบว่ามีการทดสอบยา A และ B สองตัวเพื่อดูผลของระดับน้ำตาลในเลือด ผู้ป่วยแต่ละรายจะถูกทดสอบสองครั้งตามลำดับแบบสุ่มและอยู่ภายใต้ข้อสมมติว่าไม่มีการพกพา จุดสิ้นสุดหลักคือความแตกต่างระหว่างกลูโคส (BA) และเราคิดว่าการทดสอบแบบจับคู่นั้นเพียงพอแล้ว (I) ต้องการพล็อตที่แสดงระดับน้ำตาลที่แน่นอนในทั้งสองกรณี เขากลัวความต้องการของแถบข้อผิดพลาดและขอข้อผิดพลาดมาตรฐานในกราฟแท่ง อย่าเริ่มสงครามกราฟแท่งที่นี่เลย) (I): นั่นไม่เป็นความจริง แท่งมีการทับซ้อนกันและเรามี p = 0.03? นั่นไม่ใช่สิ่งที่ฉันได้เรียนรู้ในโรงเรียนมัธยม (M): เรามีการออกแบบที่จับคู่ที่นี่ แถบข้อผิดพลาดที่ร้องขอนั้นไม่เกี่ยวข้องทั้งหมดสิ่งที่นับคือ SE / CI ของความแตกต่างที่จับคู่ซึ่งไม่ได้แสดงในพล็อต ถ้าฉันมีตัวเลือกและมีข้อมูลไม่มากเกินไปฉันจะชอบพล็อตต่อไปนี้ เพิ่ม 1:นี่คือพล็อตพิกัดขนานที่กล่าวถึงในหลายคำตอบ (M): เส้นแสดงการจับคู่และเส้นส่วนใหญ่ขึ้นไปและนั่นคือความประทับใจที่ถูกต้องเพราะความลาดชันคือสิ่งที่นับได้ (ตกลงนี่คือการจัดหมวดหมู่ แต่อย่างไรก็ตาม) …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
เปรียบเทียบเส้นโค้งการอยู่รอดสองเส้นสำหรับข้อมูลที่จับคู่
ฉันต้องการเปรียบเทียบสองวิธีที่แตกต่างกันในการตรวจจับการเปลี่ยนแปลงสถานะในการวิเคราะห์การรอดชีวิต มีการติดตามกลุ่มวิชาเป็นเวลานาน (หลายปี) และใช้วิธีการตรวจสอบสองวิธีเพื่อตรวจสอบว่ามีการเปลี่ยนแปลงสถานะหรือไม่ วิธีหนึ่งใช้ในการตรวจสอบแต่ละวิชาปีละสองครั้งและใช้วิธีที่สองเพื่อตรวจสอบแต่ละวิชาปีละครั้ง คำถามคือถ้าทั้งสองวิธีต่างกันอย่างเป็นระบบในความสามารถในการตรวจจับการเปลี่ยนแปลงสถานะ การทดสอบที่ฉันคิดว่าเป็นการทดสอบระดับล็อกเพื่อดูว่าเส้นโค้ง Kaplan-Meier ของทั้งสองวิธีนั้นแตกต่างกันหรือไม่ ฉันสงสัยว่ามันเป็นปัญหาหรือไม่ที่เส้นโค้งการอยู่รอดเป็น“ คู่” (เช่นใช้สองวิธีในวิชาเดียวกัน) เมื่อทำการทดสอบระดับบันทึก มันเป็นการละเมิดสมมติฐานในการทดสอบ log-rank หรืออาจเป็นเพียงการทดสอบที่ไม่มีประสิทธิภาพเพราะมันไม่ได้อธิบายว่าเส้นโค้งทั้งสองนั้นเกี่ยวข้องกันหรือไม่ ไม่มีใครมีข้อเสนอแนะสำหรับการวิเคราะห์ทางเลือกที่ทำบัญชีสำหรับการพึ่งพาอาศัยอยู่ในการสังเกต? บางทีนี่อาจไม่ใช่ปัญหาบางทีฉันอาจจะคิดมากไป ฉันไม่ทราบว่าเวลาที่แท้จริงของการเปลี่ยนแปลงสถานะเพียงจุดเวลาเมื่อวิธีการตรวจพบการเปลี่ยนแปลงสถานะ หนึ่งคิดว่าฉันต้องตั้งเวลาการเอาตัวรอดให้เป็นจุดกึ่งกลางของช่วงเวลาระหว่างการตรวจสอบครั้งล่าสุดเมื่อไม่ได้ตรวจพบการเปลี่ยนสถานะและการตรวจสอบเมื่อตรวจพบการเปลี่ยนสถานะ ที่สามารถชดเชยข้อเสียของวิธีการที่ใช้สำหรับการตรวจสอบวิชาเพียงปีละครั้งในทางตรงกันข้ามกับวิธีการที่ใช้สองครั้งต่อปี จากนั้นสร้างเส้นโค้งการอยู่รอดจากข้อมูลเหล่านี้

1
จะเลือกระหว่างการทดสอบการลงชื่อกับการทดสอบการจัดอันดับของวิลคอกซันได้อย่างไร
ฉันพยายามเลือกหนึ่งจากการทดสอบทั้งสองนี้เพื่อวิเคราะห์ข้อมูลที่จับคู่ ไม่มีใครรู้กฎของหัวแม่มือเกี่ยวกับที่จะเลือกโดยทั่วไป?

2
ความแตกต่างในความหมายกับความแตกต่างเฉลี่ย
เมื่อศึกษาวิธีการสองตัวอย่างที่เป็นอิสระเราจะบอกว่าเรากำลังดูที่ "ความแตกต่างของสองวิธี" นี่หมายความว่าเราใช้ค่าเฉลี่ยจากประชากร 1 ( ) และลบออกจากค่าเฉลี่ยจากประชากร 2 ( ) ดังนั้น "ความแตกต่างของสองวิธี" ของเราคือ ( - )y¯1y¯1\bar y_1y¯2y¯2\bar y_2y¯1y¯1\bar y_1y¯2y¯2\bar y_2 เมื่อศึกษาตัวอย่างที่จับคู่หมายถึงเราจะบอกเรากำลังมองหาที่ "หมายถึงความแตกต่าง"d สิ่งนี้คำนวณจากการใช้ความแตกต่างระหว่างแต่ละคู่แล้วทำการหาค่าเฉลี่ยของความแตกต่างเหล่านั้นทั้งหมดd¯d¯\bar d คำถามของฉันคือ: เราได้รับเหมือนกัน ( - ) เมื่อเทียบกับถ้าเราคำนวณพวกเขาจากคอลัมน์ข้อมูลสองคอลัมน์และครั้งแรกที่พิจารณามันเป็นสองตัวอย่างอิสระและครั้งที่สองถือว่าเป็นคู่ ข้อมูล? ฉันได้เล่นกับข้อมูลสองคอลัมน์และดูเหมือนว่าค่าเหมือนกัน! ในกรณีนั้นสามารถพูดได้หรือไม่ว่ามีการใช้ชื่อที่ต่างกันด้วยเหตุผลที่ไม่ใช่เชิงปริมาณ?y¯1y¯1\bar y_1y¯2y¯2\bar y_2d¯d¯\bar d

1
การทดสอบ Signed-Rank Test ของ Wilcoxon จะดีกว่าแบบทดสอบ t-Test หรือ Sign Test อย่างไร
หลังจากการสนทนาบางส่วน (ด้านล่าง) ตอนนี้ฉันมีภาพที่ชัดเจนของคำถามที่มุ่งเน้นดังนั้นนี่คือคำถามที่ได้รับการแก้ไขแม้ว่าความคิดเห็นบางส่วนอาจดูเหมือนไม่เกี่ยวข้องกับคำถามเดิม ดูเหมือนว่าการทดสอบแบบ t- มาบรรจบกันอย่างรวดเร็วสำหรับการแจกแจงแบบสมมาตรซึ่งการทดสอบแบบลงนามจะถือว่าสมมาตรและสำหรับการกระจายแบบสมมาตรนั้นไม่แตกต่างกันระหว่างค่าเฉลี่ย / pseudomedians / ค่ามัธยฐาน ถ้าเป็นเช่นนั้นภายใต้สถานการณ์ใดนักสถิติที่ไม่มีประสบการณ์ค่อนข้างจะพบว่าการทดสอบแบบมีลายเซ็นมีประโยชน์เมื่อเขา / เธอมีทั้งแบบทดสอบ t-test และทดสอบแบบลงชื่อ? หากหนึ่งในนักเรียนของฉัน (เช่นสังคมศาสตร์) กำลังพยายามทดสอบว่าการรักษาหนึ่งทำได้ดีกว่าอีกหรือไม่ (โดยการวัดที่ค่อนข้างง่ายตีความเช่นความคิดของความแตกต่าง "เฉลี่ย") ฉันกำลังดิ้นรนเพื่อหาสถานที่สำหรับการเซ็นชื่อ - การทดสอบยศแม้ว่าโดยทั่วไปแล้วดูเหมือนว่าจะได้รับการสอนและการทดสอบการลงชื่อก็ไม่สนใจในมหาวิทยาลัยของฉัน

4
การทดสอบ t จะมีนัยสำคัญทางสถิติได้อย่างไรหากความแตกต่างเฉลี่ยเกือบ 0
ฉันกำลังพยายามเปรียบเทียบข้อมูลจากประชากร 2 คนเพื่อบอกว่าความแตกต่างระหว่างการรักษานั้นมีนัยสำคัญทางสถิติหรือไม่ ดูเหมือนว่าชุดข้อมูลจะกระจายตามปกติโดยมีความแตกต่างน้อยมากระหว่างสองชุด ความแตกต่างเฉลี่ยคือ 0.00017 ฉันทำการทดสอบแบบจับคู่โดยคาดหวังว่าฉันจะไม่ปฏิเสธสมมติฐานว่างที่ไม่ต่างกันระหว่างค่าเฉลี่ยอย่างไรก็ตามค่า t ที่คำนวณได้ของฉันนั้นสูงกว่าค่า t วิกฤตมาก

1
การเลือกน้ำหนักของเส้นทางในโมเดลแนวคิดเชิง SEM สำหรับฝาแฝดที่เหมือนกันและเป็นพี่น้องโดยใช้ openMx
ฉันกำลังทบทวนแพคเกจ R OpenMx สำหรับการวิเคราะห์ทางระบาดวิทยาทางพันธุกรรมเพื่อเรียนรู้วิธีการระบุและเหมาะสมกับแบบจำลอง SEM ฉันยังใหม่กับสิ่งนี้ดังนั้นทนกับฉัน ฉันกำลังตัวอย่างต่อไปนี้ในหน้า 59 ของคู่มือการใช้งาน OpenMx ที่นี่พวกเขาวาดโมเดลแนวคิดต่อไปนี้: และในการระบุเส้นทางพวกเขาตั้งค่าน้ำหนักของโหนด "หนึ่ง" แฝงไปยังโหนด bmi "T1" และ "T2" ที่ประจักษ์เป็น 0.6 เพราะ: เส้นทางหลักที่น่าสนใจคือจากตัวแปรแฝงแต่ละตัวไปยังตัวแปรที่สังเกตได้ สิ่งเหล่านี้ได้รับการประเมิน (ซึ่งทั้งหมดถูกตั้งค่าไว้ฟรี) รับค่าเริ่มต้น 0.6 และป้ายกำกับที่เหมาะสม # path coefficients for twin 1 mxPath( from=c("A1","C1","E1"), to="bmi1", arrows=1, free=TRUE, values=0.6, label=c("a","c","e") ), # path coefficients for twin 2 mxPath( from=c("A2","C2","E2"), to="bmi2", …

5
เป็นวิธีที่ดีของกราฟิกที่แสดงจำนวนดาต้าพอยน์ที่จับคู่จำนวนมากคืออะไร?
ในเขตข้อมูลของฉันวิธีปกติในการพล็อตข้อมูลที่จับคู่นั้นเป็นชุดของส่วนของเส้นที่ลาดเอียงบาง ๆ ซ้อนทับมันด้วยค่ามัธยฐานและ CI ของค่ามัธยฐานของทั้งสองกลุ่ม: อย่างไรก็ตามพล็อตประเภทนี้กลายเป็นเรื่องยากที่จะอ่านเนื่องจากจำนวนดาต้าพอยน์มีขนาดใหญ่มาก (ในกรณีของฉันฉันมีตามลำดับ 10,000 คู่): การลดอัลฟ่าช่วยได้บ้าง แต่ก็ยังไม่ดีนัก ในขณะที่ค้นหาวิธีแก้ปัญหาฉันพบบทความนี้และตัดสินใจลองใช้ 'เส้นคู่ขนานพล็อต' อีกครั้งมันทำงานได้ดีมากสำหรับดาต้าพอยน์จำนวนน้อย: แต่มันก็ยิ่งยากที่จะทำให้เรื่องแบบนี้ดูดีเมื่อมีขนาดใหญ่มาก:ยังไม่มีข้อความยังไม่มีข้อความN ฉันคิดว่าฉันสามารถแสดงการแจกแจงของทั้งสองกลุ่มแยกต่างหากเช่นกับบ็อกซ์พล็อตหรือไวโอลินและพล็อตบรรทัดที่มีแถบข้อผิดพลาดด้านบนแสดงสองค่ามัธยฐาน / CIs แต่ฉันไม่ชอบความคิดนั้น ลักษณะการจับคู่ของข้อมูล ฉันยังไม่กระตือรือร้นในความคิดของพล็อตกระจาย 2D: ฉันต้องการการเป็นตัวแทนที่กะทัดรัดกว่าและเป็นแนวคิดหนึ่งที่ค่าของทั้งสองกลุ่มถูกพล็อตตามแกนเดียวกัน เพื่อความสมบูรณ์นี่คือข้อมูลที่มีลักษณะเหมือนการกระจายแบบสองมิติ: ไม่มีใครรู้วิธีที่ดีกว่าในการแสดงข้อมูลที่จับคู่กับขนาดตัวอย่างที่มีขนาดใหญ่มาก? คุณสามารถเชื่อมโยงฉันกับตัวอย่างได้ไหม แก้ไข ขออภัยฉันชัดเจนว่าไม่ได้ทำงานได้ดีพอที่จะอธิบายสิ่งที่ฉันกำลังมองหา ใช่พล็อตกระจายแบบ 2D ทำงานได้และมีหลายวิธีที่สามารถปรับปรุงให้ดีขึ้นเพื่อถ่ายทอดความหนาแน่นของคะแนนได้ดีขึ้น - ฉันสามารถกำหนดรหัสจุดตามการประมาณความหนาแน่นของเคอร์เนลได้ฉันสามารถสร้างฮิสโตแกรม 2D ได้ ฉันสามารถพล็อตรูปทรงที่ด้านบนของจุดเป็นต้น ฯลฯ ... อย่างไรก็ตามฉันคิดว่านี่เกินความจริงสำหรับข้อความที่ฉันพยายามสื่อ ฉันไม่สนใจเกี่ยวกับการแสดงความหนาแน่นของคะแนน 2 มิติต่อ se - ทั้งหมดที่ฉันต้องทำคือการแสดงให้เห็นว่าค่าสำหรับ 'บาร์' โดยทั่วไปมีขนาดใหญ่กว่าที่สำหรับ 'จุด' ในวิธีที่ง่ายและชัดเจนที่สุดเท่าที่จะทำได้ และโดยไม่สูญเสียธรรมชาติของข้อมูลที่จับคู่ …

4
ฟิชเชอร์ทดสอบที่ถูกต้องกับข้อมูลที่จับคู่
ป.ร. ให้ไว้ 404040 ผู้ป่วยมะเร็งปอดและ 404040การควบคุมที่จับคู่ (ไม่มีมะเร็งปอด) (การจับคู่ขึ้นอยู่กับอายุเพศ ฯลฯ ) เพื่อพยายามหาหลักฐานระหว่างผลของการสูบบุหรี่ต่อโรคมะเร็งปอดฉันใช้การทดสอบที่แน่นอนของฟิชเชอร์ในตารางฉุกเฉิน อย่างไรก็ตามเรื่องนี้ไม่ได้คำนึงถึงว่าการควบคุมและกรณีถูกจับคู่ ดังนั้นฉันสงสัยว่ามีวิธีใช้การทดสอบที่แน่นอนของฟิชเชอร์ที่คำนึงถึงการจับคู่ระหว่างสองกลุ่มหรือไม่?

1
ทำอย่างไรจึงจะพอดีกับแบรดลีย์ - เทอร์รี่ - ลูซใน R โดยไม่มีสูตรที่ซับซ้อน?
แบรดลีย์ - เทอร์รี่ – ลูซ (BTL) โมเดลกล่าวว่าโดยที่คือความน่าจะเป็นที่วัตถุถูกตัดสินให้เป็น "ดีกว่า", ที่หนักกว่า ฯลฯ กว่า objectและและเป็นพารามิเตอร์พีJฉัน= l o gผมเสื้อ- 1(δJ-δผม)พีJผม=ล.โอก.ผมเสื้อ-1(δJ-δผม)p_{ji} = logit^{-1}(\delta_j - \delta_i)พีฉันเจพีผมJp_{ij}JJjผมผมiδผมδผม\delta_iδJδJ\delta_j ดูเหมือนว่าจะเป็นตัวเลือกสำหรับฟังก์ชัน glm โดยมี family = binomial อย่างไรก็ตามสูตรจะคล้ายกับ "ความสำเร็จ ~ S1 + S2 + S3 + S4 + ... " โดยที่ Sn เป็นตัวแปรจำลองนั่นคือ 1 ถ้าวัตถุ n เป็นวัตถุแรกในการเปรียบเทียบ -1 ถ้าเป็น วินาทีและ 0 …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.