คำถามติดแท็ก hazard

อัตราอันตรายคืออัตราทันทีที่หน่วยที่มีชีวิตรอดจนถึงเวลา t ตายที่ t. อัตราส่วนอันตรายคืออัตราส่วน 2 อันตรายที่ระบุ

1
อันตรายพื้นฐานของ Cox
สมมติว่าฉันมีชุดข้อมูล "สายสวนไต" ฉันกำลังพยายามสร้างโมเดลกราฟความอยู่รอดโดยใช้โมเดล Cox หากฉันพิจารณาโมเดล Cox:ฉันต้องมีการประเมินความเป็นอันตรายพื้นฐาน ด้วยการใช้ฟังก์ชั่นแพคเกจ R ฉันสามารถทำสิ่งนี้ได้อย่างง่ายดาย:h ( t , Z)) = h0ประสบการณ์( b'Z) ,ชั่วโมง(เสื้อ,Z)=ชั่วโมง0ประสบการณ์⁡(ข'Z),h(t,Z) = h_0 \exp(b'Z),survivalbasehaz() library(survival) data(kidney) fit <- coxph(Surv(time, status) ~ age , kidney) basehaz(fit) แต่ถ้าฉันต้องการเขียนฟังก์ชันทีละขั้นตอนของอันตรายพื้นฐานสำหรับการประมาณค่าพารามิเตอร์ที่กำหนดbฉันจะดำเนินการต่อได้อย่างไร ฉันเหนื่อย: bhaz <- function(beta, time, status, x) { data <- data.frame(time,status,x) data <- data[order(data$time), ] dt <- data$time …
20 r  cox-model  hazard 

1
คำถามพื้นฐานเกี่ยวกับการวิเคราะห์การเอาชีวิตรอดแบบไม่ต่อเนื่อง
ฉันพยายามวิเคราะห์การรอดชีวิตแบบไม่ต่อเนื่องโดยใช้แบบจำลองการถดถอยแบบโลจิสติกส์และฉันไม่แน่ใจว่าฉันเข้าใจกระบวนการทั้งหมดอย่างสมบูรณ์ ฉันขอขอบคุณสำหรับความช่วยเหลืออย่างมากกับคำถามพื้นฐานสองสามข้อ นี่คือการตั้งค่า: ฉันกำลังดูสมาชิกในกลุ่มภายในหน้าต่างเวลาห้าปี สมาชิกแต่ละคนมีบันทึกการเป็นสมาชิกรายเดือนสำหรับแต่ละเดือนที่สมาชิกอยู่ในกลุ่ม ฉันกำลังพิจารณาสมาชิกทั้งหมดที่สมาชิกเริ่มขึ้นในช่วงห้าปี (เพื่อหลีกเลี่ยงปัญหา "การเซ็นเซอร์ซ้าย" กับสมาชิกที่เข้าร่วมก่อนหน้านี้) แต่ละเร็กคอร์ดจะถูกทำดัชนีตามเวลาโดยเวลาหนึ่งคือเดือนที่สมาชิกเข้าร่วม ดังนั้นสมาชิกที่อยู่สองปีครึ่งจะมีบันทึกรายเดือนสามสิบหมายเลขจากหนึ่งถึงสามสิบ แต่ละเร็กคอร์ดจะได้รับตัวแปรไบนารีซึ่งจะมีค่าหนึ่งสำหรับเดือนสุดท้ายของการเป็นสมาชิกและเป็นศูนย์มิฉะนั้น ค่าหนึ่งสำหรับตัวแปรไบนารีทำเครื่องหมายเหตุการณ์ที่สมาชิกออกจากกลุ่ม สำหรับสมาชิกแต่ละคนที่ยังคงเป็นสมาชิกเกินกว่าหน้าต่างการวิเคราะห์ห้าปี ดังนั้นรูปแบบการถดถอยโลจิสติกถูกสร้างขึ้นเพื่อทำนายค่าของตัวแปรเหตุการณ์ไบนารี จนถึงตอนนี้ดีมาก หนึ่งในวิธีทั่วไปในการประเมินรูปแบบการทำนายแบบไบนารี่คือการวัดการยกของตัวอย่างโฮลด์ สำหรับโมเดลการถดถอยโลจิสติกที่ฉันสร้างขึ้นเพื่อทำนายเหตุการณ์สิ้นสุดการเป็นสมาชิกฉันได้คำนวณการยกชุดข้อมูลที่เก็บไว้พร้อมกับอัตราส่วนห้าต่อหนึ่งของการไม่เกิดเหตุการณ์ต่อเหตุการณ์ ฉันจัดอันดับค่าที่ทำนายไว้เป็น deciles ช่วงทศวรรษที่มีค่าที่คาดการณ์ไว้สูงที่สุดนั้นมีค่าเจ็ดสิบเปอร์เซ็นต์ decile สองตัวแรกรวมกันมีหกสิบห้าเปอร์เซ็นต์ของทั้งหมดใน holdout ในบริบทบางอย่างนี้จะถือว่าเป็นรูปแบบการทำนายที่ค่อนข้างดี แต่ฉันสงสัยว่ามันดีพอที่จะทำการวิเคราะห์การอยู่รอด Let h[j,k]h[j,k]h[j,k]เป็นฟังก์ชั่นอันตรายสำหรับบุคคลjjjในเดือนkkkและให้S[j,k]S[j,k]S[j,k]จะเป็นไปได้ว่าบุคคลjjjรอดผ่านเดือนkkkk นี่คือคำถามพื้นฐานของฉัน: ฟังก์ชั่นอันตรายแบบไม่ต่อเนื่อง, h[j,k]h[j,k]h[j,k] , ความน่าจะเป็นแบบมีเงื่อนไขของการไม่รอด (ออกจากกลุ่ม) ในแต่ละเดือนหรือไม่? ค่าที่ทำนายจากการประมาณค่าแบบจำลองการถดถอยโลจิสติกส์ของฟังก์ชันอันตรายหรือไม่? (กล่าวคือเท่ากับแบบจำลองที่ทำนายค่าสำหรับjแต่ละตัวในเดือนkหรือทำอะไรมากกว่านี้ที่ต้องทำเพื่อให้ได้ค่าประมาณฟังก์ชันอันตราย?)h[j,k]h[j,k]h[j,k]jjjkkk ความน่าจะเป็นของการอยู่รอดถึงเดือน q สำหรับแต่ละเท่ากับผลิตภัณฑ์ของหนึ่งลบฟังก์ชันอันตรายจากเดือนหนึ่งถึงqนั่นคือ S [ j , q ] = ( 1 - …

2
ฉันจะตีความ Exp (B) ในการถดถอยแบบ Cox ได้อย่างไร
ฉันเป็นนักศึกษาแพทย์ที่พยายามทำความเข้าใจกับสถิติ (!) - ดังนั้นขอให้สุภาพ! ;) ฉันกำลังเขียนเรียงความที่ประกอบด้วยการวิเคราะห์ทางสถิติในจำนวนที่เหมาะสมรวมถึงการวิเคราะห์การอยู่รอด (Kaplan-Meier, Log-Rank และ Cox regression) ฉันใช้ Cox regression กับข้อมูลของฉันพยายามค้นหาว่าฉันสามารถค้นหาความแตกต่างที่สำคัญระหว่างการเสียชีวิตของผู้ป่วยในสองกลุ่ม (ผู้ป่วยที่มีความเสี่ยงสูงหรือผู้ที่มีความเสี่ยงต่ำ) ฉันได้เพิ่ม covariates หลายตัวลงใน Cox regression เพื่อควบคุมอิทธิพลของพวกเขา Risk (Dichotomous) Gender (Dichotomous) Age at operation (Integer level) Artery occlusion (Dichotomous) Artery stenosis (Dichotomous) Shunt used in operation (Dichotomous) ฉันลบ Artery occlusion ออกจากรายการ covariates เนื่องจาก SE มีค่าสูงมาก …

4
ข้อดีและข้อเสียของการใช้ logrank กับวิธี Mantel-Haenszel สำหรับการคำนวณอัตราส่วนความเป็นอันตรายในการวิเคราะห์การอยู่รอดคืออะไร
วิธีหนึ่งในการสรุปการเปรียบเทียบเส้นโค้งการอยู่รอดสองเส้นคือการคำนวณอัตราส่วนความเป็นอันตราย (HR) มีอย่างน้อยสองวิธีในการคำนวณค่านี้ วิธีการ Logrank เป็นส่วนหนึ่งของการคำนวณ Kaplan-Meier ให้คำนวณจำนวนของเหตุการณ์ที่สังเกต (ตายโดยปกติ) ในแต่ละกลุ่ม ( และO b ) และจำนวนของเหตุการณ์ที่คาดหวังซึ่งสมมติว่าสมมติฐานว่างจากการอยู่รอดไม่แตกต่างกัน ( E aและE b ) อัตราส่วนความเป็นอันตรายนั้นคือ: H R = ( O a / E a )OaOaOaObObObEaEaEaEbEbEbHR=(Oa/Ea)(Ob/Eb)HR=(Oa/Ea)(Ob/Eb) HR= \frac{(Oa/Ea)}{(Ob/Eb)} HR=exp((Oa−Ea)V)HR=exp⁡((Oa−Ea)V) HR= \exp\left(\frac{(Oa-Ea)}{V}\right) มีคนส่งตัวอย่างที่ทั้งสองวิธีแตกต่างกันโดยปัจจัยที่สาม ในตัวอย่างนี้เป็นที่ชัดเจนว่าการประมาณ logrank นั้นสมเหตุสมผลและการประมาณการ Mantel-Haenszel นั้นอยู่ไกลมาก คำถามของฉันคือถ้าใครมีคำแนะนำทั่วไปสำหรับเมื่อมันเป็นการดีที่สุดที่จะเลือกการประมาณ logrank ของอัตราส่วนความเป็นอันตรายและเมื่อมันจะดีที่สุดในการเลือกประมาณการ Mantel-Haenszel? มันต้องทำกับขนาดตัวอย่างหรือไม่? จำนวนความสัมพันธ์? อัตราส่วนขนาดตัวอย่าง?
17 survival  hazard 

4
ปรีชาสำหรับฟังก์ชันอันตรายสะสม (การวิเคราะห์การอยู่รอด)
ฉันกำลังพยายามที่จะรับสัญชาติญาณสำหรับแต่ละหน้าที่หลักในวิทยาศาสตร์คณิตศาสตร์ประกันภัย (โดยเฉพาะสำหรับ Cox Proportional Hazards Model) นี่คือสิ่งที่ฉันมี: f(x)ฉ(x)f(x) : เริ่มตั้งแต่เวลาเริ่มต้นการกระจายความน่าจะเป็นของเวลาที่คุณจะตาย F(x)F(x)F(x) : แค่การแจกแจงสะสม ในช่วงเวลาประชากร% ใดที่จะตาย?TTT S(x)S(x)S(x) :(x) ในช่วงเวลา % ของประชากรจะมีชีวิตอยู่เท่าไหร่?1−F(x)1−F(x)1-F(x)TTT h(x)h(x)h(x) : ฟังก์ชั่นอันตราย ในช่วงเวลาที่กำหนดของผู้คนยังมีชีวิตอยู่สิ่งนี้สามารถใช้เพื่อประเมินว่ามีกี่คนที่จะตายในช่วงเวลาถัดไปหรือถ้าช่วงเวลา -> 0, ความน่าจะเป็นของการเสียชีวิตแบบ 'ทันที'TTT H(x)H(x)H(x) : อันตรายที่สะสม ไม่มีความเห็น. แนวคิดเบื้องหลังการรวมค่าอันตรายโดยเฉพาะเมื่อต่อเนื่องคืออะไร หากเราใช้ตัวอย่างแบบไม่ต่อเนื่องที่มีอัตราการตายตลอดสี่ฤดูกาลและฟังก์ชั่นอันตรายมีดังนี้: เริ่มต้นที่ Spring ทุกคนยังมีชีวิตอยู่และ 20% จะตาย ตอนนี้ในฤดูร้อนของเหลือ 50% จะตาย ตอนนี้ในฤดูใบไม้ร่วงของที่เหลืออยู่ 75% จะตาย ฤดูกาลสุดท้ายคือฤดูหนาว ของที่เหลืออยู่ 100% จะตาย จากนั้นอันตรายสะสมคือ …

3
สัญชาตญาณเบื้องหลังอัตราอันตราย
ฉันสับสนเกี่ยวกับสมการที่ทำหน้าที่เป็นคำจำกัดความของอัตราอันตราย ฉันเข้าใจว่าอัตราอันตรายนั้นเป็นอย่างไร แต่ฉันไม่เห็นว่าสมการแสดงความรู้สึกนั้น ถ้าxxxเป็นตัวแปรสุ่มซึ่งหมายถึงจุดของเวลาของการตายของคนในช่วงเวลา[ 0 , T][0,T][0,T] ] ดังนั้นอัตราความเสี่ยงคือ: h ( x ) = f( x )1 - ฟ( x )ชั่วโมง(x)=ฉ(x)1-F(x)h(x)=\frac{f(x)}{1-F(x)} ที่ไหนF( x )F(x)F(x)แสดงให้เห็นถึงความน่าจะเป็นของการเสียชีวิตจนถึงจุดเวลาx ∈ [ 0 , T]x∈[0,T]x\in[0,T] , 1 - ฟ( x )1-F(x)1-F(x)แสดงให้เห็นถึงความน่าจะเป็นของการมีชีวิตรอดจนถึงจุดเวลาx ∈ [ 0 , T]x∈[0,T]x\in[0,T] , และฉ( x )ฉ(x)f(x)ความน่าจะเป็นของการเสียชีวิตที่จุดxxxx วิธีการที่ไม่หารโดยอัตราการรอดตายอธิบายสัญชาตญาณของความน่าจะเป็นของการเสียชีวิตทันทีในที่อยู่ถัดΔ ที ? ไม่ควรเป็นแค่f ( x …

1
อัตราส่วนความเป็นอันตรายสามารถแปลเป็นอัตราส่วนของค่ามัธยฐานของเวลารอดหรือไม่
ในบทความหนึ่งที่อธิบายผลลัพธ์ของการวิเคราะห์การอยู่รอดฉันได้อ่านข้อความที่บอกเป็นนัยว่าสามารถแปลอัตราส่วนอันตราย (HR) เป็นอัตราส่วนของเวลาเฉลี่ยการเอาตัวรอด (และ ) โดยใช้สูตร:M1M1M_1M2M2M_2 HR=M1M2HR=M1M2HR = \frac{M_1}{M_2} ฉันแน่ใจว่ามันไม่ถือเมื่อไม่มีใครสามารถคิดแบบจำลองความเป็นอันตรายตามสัดส่วนได้ แต่ฉันสงสัยว่าถึงอย่างนั้นมันก็ไม่ได้ผลกับการแจกแจงการอยู่รอดยกเว้นการยกกำลัง สัญชาตญาณของฉันถูกต้องหรือไม่
15 survival  hazard 

3
ตัวเลือกในรูปแบบการถดถอยความเป็นอันตรายแบบสัดส่วนเมื่อส่วนที่เหลือของ Schoenfeld ไม่ดีมีอะไรบ้าง
ฉันกำลังทำการถดถอยแบบอันตรายตามสัดส่วนของ Cox ในการใช้ R coxphซึ่งรวมถึงตัวแปรจำนวนมาก ส่วนที่เหลือ Martingale ดูดีและส่วนที่เหลือ Schoenfeld นั้นยอดเยี่ยมสำหรับเกือบทุกตัวแปร มีสามตัวแปรที่มี Schoenfeld ส่วนที่เหลือไม่แบนและลักษณะของตัวแปรนั้นมันทำให้รู้สึกว่าพวกเขาอาจแตกต่างกันไปตามเวลา นี่คือตัวแปรที่ฉันไม่สนใจจริง ๆ ดังนั้นการทำให้เป็นชั้นจะดี อย่างไรก็ตามพวกเขาทั้งหมดเป็นตัวแปรต่อเนื่องไม่ใช่ตัวแปรเด็ดขาด ดังนั้นฉันจึงเข้าใจชั้นที่จะไม่เป็นเส้นทาง * ฉันได้ลองสร้างปฏิสัมพันธ์ระหว่างตัวแปรและเวลาตามที่อธิบายไว้ที่นี่แต่เราได้รับข้อผิดพลาด: In fitter(X, Y, strats, offset, init, control, weights = weights, : Ran out of iterations and did not converge ฉันทำงานกับจุดข้อมูลเกือบ 1,000 จุดและทำงานกับตัวแปรครึ่งโหลด้วยหลาย ๆ ปัจจัยแต่ละตัวดังนั้นจึงรู้สึกเหมือนว่าเรากำลังผลักดันขีด จำกัด ของวิธีที่ข้อมูลนี้จะถูกหั่นและหั่นเป็นลูกเต๋า โชคไม่ดีโมเดลที่เรียบง่ายทั้งหมดที่ฉันได้ลองด้วยตัวแปรที่รวมอยู่น้อยกว่านั้นแย่ลงอย่างชัดเจน ตัวเลือกของฉันคืออะไร? เนื่องจากฉันไม่สนใจเกี่ยวกับตัวแปรที่มีพฤติกรรมแย่ ๆ …

1
ความแตกต่างระหว่างค่าเฉลี่ยและผลการรักษาชายขอบ
ฉันอ่านบทความมาแล้วและฉันไม่แน่ใจเกี่ยวกับคำจำกัดความเฉพาะของ Average Treatment Effect (ATE) และ Marginal Treatment Effect (MTE) พวกเขาเหมือนกันหรือไม่ ตามที่ออสติน ... ผลตามเงื่อนไขคือผลกระทบโดยเฉลี่ยที่ระดับตัวแบบในการย้ายตัวแบบจากไม่ถูกรักษาไปสู่การรักษา สัมประสิทธิ์การถดถอยสำหรับตัวแปรตัวบ่งชี้การกำหนดการรักษาจากตัวแบบการถดถอยหลายตัวแปรคือการประมาณของผลตามเงื่อนไขหรือปรับ ในทางตรงกันข้ามผลกระทบส่วนเพิ่มคือผลเฉลี่ยในระดับประชากรในการเคลื่อนย้ายประชากรทั้งหมดจากการไม่ได้รับการรักษาไปยังการรักษา [10]ผลการรักษาเชิงเส้น (ความแตกต่างของค่าเฉลี่ยและความแตกต่างของสัดส่วน) นั้นสามารถยุบได้: ผลการรักษาแบบมีเงื่อนไขและส่วนเพิ่มจะตรงกัน อย่างไรก็ตามเมื่อผลลัพธ์เป็นแบบไบนารีหรือเวลาต่อเหตุการณ์โดยธรรมชาติอัตราส่วนอัตราต่อรองและอัตราส่วนความเป็นอันตรายจะไม่สามารถยุบได้ [11] Rosenbaum ตั้งข้อสังเกตว่าวิธีการให้คะแนนความชอบอนุญาตให้หนึ่งในการประเมินผลกระทบมากกว่าเงื่อนไขเงื่อนไข [12] มีความขัดสนของการวิจัยเกี่ยวกับประสิทธิภาพของวิธีคะแนนความชอบที่แตกต่างกันเพื่อประเมินผลการรักษาชายขอบ แต่ในอีกกระดาษออสตินเขาพูดว่า Yผม( 1 ) - Yผม( 0 )Yผม(1)-Yผม(0)Y_i(1)- Y_i(0)E[ Yผม( 1 ) - Yผม( 0 ) ]E[Yผม(1)-Yผม(0)]E[Y_i(1)- Y_i(0)] ดังนั้นคำถามที่ฉันมีคือ ... อะไรคือความแตกต่างระหว่างผลการรักษาโดยเฉลี่ยกับผลการรักษาเล็กน้อย? เช่นกันฉันจะจำแนกการประมาณค่าของฉันได้อย่างไร ฉันมีคะแนนความชอบ (IPTW) …

1
อะไรคือความแตกต่างระหว่างการวิเคราะห์การอยู่รอดและการถดถอยปัวซอง?
ฉันกำลังทำงานกับปัญหาการทำนายการปั่นแบบดั้งเดิมโดยใช้จำนวนการเข้าชมของผู้ใช้ที่กำหนดให้กับไซต์หนึ่งและฉันคิดว่า Poisson Regression เป็นเครื่องมือที่เหมาะสมสำหรับการสร้างแบบจำลองการมีส่วนร่วมในอนาคตของผู้ใช้นั้น เมื่อนั้นฉันเจอหนังสือเกี่ยวกับการวิเคราะห์การอยู่รอดและการจำลองแบบอันตรายและฉันไม่รู้ว่าเทคนิคใดดีที่สุด ฉันไม่ต้องการทำการค้นคว้าทั้งสองหัวข้อในเวลาเดียวกันดังนั้นสิ่งที่ดีที่สุดสำหรับการสร้างแบบจำลองการมีส่วนร่วมของผู้ใช้โดยใช้ข้อมูลในอดีตและข้อมูลประชากร

2
จะคำนวณอัตราอันตรายที่คาดการณ์จากแบบจำลอง Cox PH ได้อย่างไร
ฉันมีโมเดล Cox PH ต่อไปนี้: (เวลา, กิจกรรม) ~ X + Y + Z ฉันต้องการที่จะได้รับอันตรายจากการคาดการณ์อัตรา (ฉันพูดคุยเกี่ยวกับอัตราการเกิดอันตรายไม่อัตราส่วนอันตราย) ได้รับค่าเฉพาะของX, ,Y Zฉันรู้ว่าแพ็คเกจ muhaz Rสามารถคำนวณอัตราอันตรายที่สังเกตได้ แต่ฉันสนใจในแบบจำลองที่ทำนายไว้ มีวิธีทำเช่นนี้ใน R หรือไม่?
11 r  survival  hazard  cox-model 

3
จะตีความอัตราส่วนอันตรายจากตัวแปรต่อเนื่อง - หน่วยของความแตกต่างได้อย่างไร?
ฉันกำลังอ่านบทความที่แสดงอัตราส่วนอันตรายสำหรับตัวแปรต่อเนื่อง แต่ฉันไม่แน่ใจว่าจะตีความค่าที่กำหนดได้อย่างไร ความเข้าใจปัจจุบันของฉันเกี่ยวกับอัตราส่วนความเป็นอันตรายคือตัวเลขแสดงถึงโอกาสที่สัมพันธ์กันของ [เหตุการณ์] ตามเงื่อนไขบางประการ เช่น: หากอัตราส่วนความเสี่ยงต่อการเสียชีวิตจากมะเร็งปอดที่ได้รับจากการสูบบุหรี่ (เหตุการณ์แบบไบนารี) เท่ากับ 2 แสดงว่าผู้สูบบุหรี่มีโอกาสเสียชีวิตเป็นสองเท่าในช่วงเวลาที่ได้รับการตรวจสอบมากกว่าผู้ไม่สูบบุหรี่ เมื่อมองถึงวิกิพีเดียการตีความตัวแปรต่อเนื่องคืออัตราส่วนความเป็นอันตรายนั้นมีผลกับหน่วยของความแตกต่าง สิ่งนี้สมเหตุสมผลสำหรับฉันสำหรับตัวแปรลำดับ (เช่นจำนวนบุหรี่ที่สูบต่อวัน) แต่ฉันไม่รู้ว่าจะใช้แนวคิดนี้กับตัวแปรต่อเนื่องได้อย่างไร (เช่นกรัมของนิโคตินที่สูบต่อวัน)

2
มีความแตกต่างในการทำงานระหว่างอัตราต่อรองและอัตราส่วนอันตรายหรือไม่?
ในการถดถอยโลจิสติกอัตราต่อรองที่ 2 หมายถึงเหตุการณ์นั้นมีความเป็นไปได้ที่จะมีโอกาสมากขึ้น 2 เท่าเมื่อเพิ่มการทำนายหนึ่งหน่วย ในการถดถอยแบบค็อกซ์อัตราส่วนความอันตรายที่ 2 หมายถึงเหตุการณ์จะเกิดขึ้นสองครั้งบ่อยครั้งในแต่ละช่วงเวลาที่มีการเพิ่มขึ้นหนึ่งหน่วยในตัวทำนาย สิ่งเหล่านี้ไม่เหมือนกันจริงหรือ อะไรคือข้อได้เปรียบในการทำ Cox Regression และการได้รับอัตราส่วนอันตรายหากเราสามารถได้รับข้อมูลที่เหมือนกันจากอัตราต่อรองของ Logistic Regression

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.