สถิติและข้อมูลขนาดใหญ่

ถามตอบสำหรับผู้ที่สนใจในสถิติการเรียนรู้ของเครื่องจักรการวิเคราะห์ข้อมูลการขุดข้อมูล

3
พื้นที่ใต้เส้นโค้ง ROC หรือพื้นที่ใต้เส้นโค้ง PR สำหรับข้อมูลที่ไม่สมดุล?
ฉันมีข้อสงสัยเกี่ยวกับการวัดประสิทธิภาพที่จะใช้พื้นที่ภายใต้เส้นโค้ง ROC (TPR เป็นฟังก์ชันของ FPR) หรือพื้นที่ใต้เส้นโค้งความแม่นยำ - การเรียกคืน (ความแม่นยำเป็นฟังก์ชันการเรียกคืน) ข้อมูลของฉันไม่สมดุลนั่นคือจำนวนอินสแตนซ์เชิงลบมีขนาดใหญ่กว่าอินสแตนซ์บวกมาก ฉันกำลังใช้การทำนายผลลัพธ์ของ weka ตัวอย่างคือ: inst#,actual,predicted,prediction 1,2:0,2:0,0.873 2,2:0,2:0,0.972 3,2:0,2:0,0.97 4,2:0,2:0,0.97 5,2:0,2:0,0.97 6,2:0,2:0,0.896 7,2:0,2:0,0.973 และฉันใช้ห้องสมุด pROC และ ROCR

1
ความหมายของคำเตือนการบรรจบกันใน Glmer
ฉันใช้glmerฟังก์ชันจากlme4แพ็คเกจใน R และฉันใช้bobyqaเครื่องมือเพิ่มประสิทธิภาพ (เช่นค่าเริ่มต้นในกรณีของฉัน) ฉันได้รับคำเตือนและฉันสงสัยว่ามันหมายถึงอะไร Warning message: In optwrap(optimizer, devfun, start, rho$lower, control = control, : convergence code 3 from bobyqa: bobyqa -- a trust region step failed to reduce q ฉันค้นหา "ขั้นตอนภูมิภาคที่เชื่อถือได้ล้มเหลวในการลด q" พบข้อมูลบางอย่างในแพ็คเกจ minqaซึ่งพูดว่า "Consult Powell สำหรับคำอธิบาย" ฉันทำ (คุณสามารถทำได้เช่นกันหากคุณต้องการ! ดูการอ้างอิงและลิงก์ไปยังพวกเขาด้านล่าง) แต่ฉันไม่เข้าใจ ที่จริงแล้วฉันไม่พบสิ่งใดเกี่ยวกับการลด q MJD Powell (2007) "การพัฒนา NEWUOA …

1
ฝึกพื้นฐานการสุ่มมาร์คอฟสำหรับการจำแนกพิกเซลในรูปภาพ
ฉันพยายามเรียนรู้วิธีใช้ Markov Random Fields เพื่อแบ่งส่วนพื้นที่ในรูปภาพ ฉันไม่เข้าใจพารามิเตอร์บางอย่างใน MRF หรือเหตุใดการเพิ่มความคาดหวังสูงสุดที่ฉันดำเนินการจึงล้มเหลวในการรวมเข้ากับโซลูชันในบางครั้ง เริ่มต้นจากทฤษฎีบทของเบย์ฉันมีp(x|y)=p(y|x)p(x)/p(y)p(x|y)=p(y|x)p(x)/p(y)p(x|y) = p(y|x) p(x) / p(y)โดยที่yyyคือค่าระดับสีเทาของพิกเซลและxxxเป็นป้ายกำกับคลาส ฉันเลือกที่จะใช้การแจกแจงแบบเกาส์สำหรับp(y|x)p(y|x)p(y|x)ในขณะที่p(x)p(x)p(x)เป็นแบบจำลองโดยใช้ MRF ฉันใช้ฟังก์ชันที่เป็นไปได้สำหรับ MRF ที่มีทั้งศักยภาพ clique pairwise และค่าที่เป็นไปได้สำหรับเลเบลคลาสของพิกเซลที่ถูกจัดประเภท ค่าพิกเซลที่อาจเกิดขึ้นเพียงครั้งเดียวเป็นบางส่วนคงที่αα\alphaที่ขึ้นอยู่บนฉลากระดับxxxxฟังก์ชันที่มีโอกาสเป็นคู่ได้รับการประเมินสำหรับเพื่อนบ้านที่เชื่อมต่อกัน 4 รายการและส่งกลับค่าบวกββ\betaหากเพื่อนบ้านมีป้ายกำกับคลาสเดียวกันกับพิกเซลนี้และ−β−β-\betaหากป้ายกำกับแตกต่างกัน ที่จุดในการขยายความคาดหวังสูงสุดที่ฉันต้องค้นหาค่าของα(x)α(x)\alpha(x)และββ\betaที่เพิ่มค่าที่คาดหวังของความเป็นไปได้สูงสุดที่บันทึกไว้ฉันใช้วิธีการหาค่าเหมาะที่สุดเชิงตัวเลข พบว่าค่าของββ\betaจะกลายเป็นลบจะเพิ่มขึ้นอย่างมากและการวนซ้ำหรือสองครั้งหลังจากนั้นภาพทั้งหมดจะถูกกำหนดให้กับหนึ่งป้ายเท่านั้นเท่านั้น (พื้นหลัง: การกำหนดป้ายชื่อชั้นเรียนโดยใช้พารามิเตอร์ MRF นั้นใช้ ICM) หากฉันลบอัลฟ่านั่นคือการใช้ศักยภาพของกลุ่มคู่เท่านั้นแล้วการเพิ่มความคาดหวังจะทำได้ดีαα\alpha โปรดอธิบายจุดประสงค์ของอัลฟ่าสำหรับแต่ละชั้นเรียนคืออะไร? ฉันคิดว่าพวกเขาจะเกี่ยวข้องกับจำนวนของคลาสนั้นที่ปรากฏในรูปภาพ แต่ไม่ปรากฏ เมื่อฉันได้ MRF ทำงานด้วยศักยภาพแบบคู่เท่านั้นฉันเปรียบเทียบมันกับแบบจำลองส่วนผสมแบบเกาส์ตรงไปข้างหน้าและพบว่าพวกมันให้ผลลัพธ์ที่เหมือนกันเกือบทั้งหมด ฉันคาดหวังว่าศักยภาพในการจับคู่จะทำให้ชั้นเรียนราบรื่นขึ้นเล็กน้อย แต่นั่นไม่ได้เกิดขึ้น กรุณาแนะนำที่ฉันผิด

4
ค่าที่คาดหวังของค่ามัธยฐานตัวอย่างให้ค่าเฉลี่ยตัวอย่าง
Let YYYแสดงค่ามัธยฐานและให้ˉ XX¯\bar{X}หมายถึงค่าเฉลี่ยของตัวอย่างที่สุ่มจากขนาดn = 2 k + 1n=2k+1n=2k+1จากการจัดจำหน่ายที่เป็นN ( μ , σ 2N(μ,σ2)N(\mu,\sigma^2) ) ฉันจะคำนวณE ( Y | ˉ X = ˉ x ) ได้E(Y|X¯=x¯)E(Y|\bar{X}=\bar{x})อย่างไร สังหรณ์ใจเพราะสมมติฐานปกติก็จะทำให้ความรู้สึกที่จะอ้างว่าE ( Y | ˉ X = ˉ x ) = ˉ xE(Y|X¯=x¯)=x¯E(Y|\bar{X}=\bar{x})=\bar{x}และแน่นอนว่าเป็นคำตอบที่ถูกต้อง สามารถที่จะแสดงอย่างจริงจังว่า? ความคิดเริ่มต้นของฉันคือการเข้าถึงปัญหานี้โดยใช้การแจกแจงแบบปกติตามเงื่อนไขซึ่งโดยทั่วไปแล้วจะเป็นผลลัพธ์ที่ทราบ ปัญหาคือว่าเนื่องจากฉันไม่ทราบค่าที่คาดหวังและดังนั้นความแปรปรวนของค่ามัธยฐานฉันจะต้องคำนวณค่าเหล่านั้นโดยใช้สถิติลำดับk + 1 k+1k+1แต่นั่นซับซ้อนมากและฉันจะไม่ไปที่นั่นเว้นแต่ฉันจะต้องทำอย่างแน่นอน

4
ซึ่งเชื่อว่า: ทดสอบ Kolmogorov-Smirnov หรือพล็อต QQ?
ฉันพยายามที่จะตรวจสอบว่าชุดข้อมูลของฉันของข้อมูลอย่างต่อเนื่องเป็นไปตามการกระจายแกมม่าที่มีพารามิเตอร์รูปร่าง 1.7 และอัตรา= 0.000063====== ปัญหาคือเมื่อฉันใช้ R เพื่อสร้างพล็อต QQ ของชุดข้อมูลของฉันกับแกมมาทฤษฎีการกระจาย (1.7 0.000063) ผมได้รับการพล็อตที่แสดงให้เห็นว่าข้อมูลเชิงประจักษ์ ๆ เห็นด้วยกับการกระจายรังสีแกมมาที่ สิ่งเดียวกันนี้เกิดขึ้นกับพล็อต ECDFxxx แต่เมื่อฉันเรียกใช้การทดสอบ Kolmogorov-Smirnov มันทำให้ฉันมีขนาดเล็กเกินสมควร -value ของ\%&lt; 1 %ppp&lt;1%&lt;1%<1\% ฉันควรเลือกที่จะเชื่อ เอาต์พุตกราฟิกหรือผลลัพธ์จากการทดสอบ KS หรือไม่

1
สถิติเพียงพอปัญหาเฉพาะ / ปรีชาญาณ
ฉันสอนตัวเองสถิติบางอย่างเพื่อความสนุกสนานและฉันมีความสับสนบางอย่างเกี่ยวกับสถิติที่เพียงพอ ฉันจะเขียนความสับสนในรูปแบบรายการ: หากการจัดจำหน่ายที่มีพารามิเตอร์แล้วมันจะมีnสถิติเพียงพอ?nnnnnn มีการติดต่อโดยตรงใด ๆ ระหว่างสถิติที่เพียงพอและพารามิเตอร์หรือไม่? หรือทำสถิติที่เพียงพอเพียงทำหน้าที่เป็นแหล่งรวมของ "ข้อมูล" เพื่อให้เราสามารถสร้างการตั้งค่าใหม่เพื่อให้เราสามารถคำนวณค่าประมาณเดียวกันสำหรับพารามิเตอร์ของการแจกแจงต้นแบบ การแจกแจงทั้งหมดมีสถิติเพียงพอหรือไม่ กล่าวคือ ทฤษฎีการแยกตัวประกอบสามารถล้มเหลวได้หรือไม่? การใช้ตัวอย่างข้อมูลของเราเราถือว่าการแจกแจงว่าข้อมูลน่าจะมาจากและสามารถคำนวณการประมาณ (เช่น MLE) สำหรับพารามิเตอร์สำหรับการแจกแจง สถิติที่เพียงพอก็เป็นวิธีที่สามารถคำนวณค่าประมาณเดียวกันสำหรับพารามิเตอร์โดยไม่ต้องพึ่งพาข้อมูลเองใช่ไหม ชุดของสถิติที่เพียงพอทั้งหมดจะมีสถิติที่น้อยที่สุดหรือไม่ นี่คือเนื้อหาที่ฉันใช้เพื่อพยายามทำความเข้าใจกับหัวข้อ: https://onlinecourses.science.psu.edu/stat414/node/283 จากสิ่งที่ฉันเข้าใจว่าเรามีทฤษฎีการแยกตัวประกอบที่แยกการกระจายตัวของข้อต่อออกเป็นสองหน้าที่ แต่ฉันไม่เข้าใจว่าเราสามารถแยกสถิติที่เพียงพอได้อย่างไรหลังจากแยกตัวประกอบการกระจายออกเป็นฟังก์ชันของเรา คำถามปัวซองที่ให้ไว้ในตัวอย่างนี้มีการแยกตัวประกอบที่ชัดเจน แต่แล้วมันก็ระบุว่าสถิติที่เพียงพอคือค่าเฉลี่ยตัวอย่างและผลรวมตัวอย่าง เรารู้ได้อย่างไรว่าสิ่งเหล่านั้นเป็นสถิติที่เพียงพอเพียงแค่ดูที่รูปแบบของสมการแรก มันเป็นวิธีการที่เป็นไปได้ที่จะดำเนินการ MLE เดียวกันประมาณการโดยใช้สถิติเพียงพอถ้าสมการที่สองของผลตีนเป็ดบางครั้งจะขึ้นอยู่กับค่าของข้อมูลXiXiX_iเอง? ตัวอย่างเช่นในกรณีปัวซองฟังก์ชันที่สองขึ้นอยู่กับการผกผันของผลคูณของแฟคทอเรียลของข้อมูลและเราจะไม่มีข้อมูลอีกต่อไป! ทำไมจะขนาดตัวอย่างไม่เป็นสถิติที่เพียงพอในความสัมพันธ์กับตัวอย่าง Poisson บนหน้าเว็บ ? เราต้องการให้nสร้างบางส่วนของฟังก์ชั่นแรกอีกครั้งดังนั้นทำไมมันถึงมีสถิติไม่เพียงพอเช่นกัน?nnnnnn

2
แสดงความสัมพันธ์เชิงพื้นที่และเชิงเวลาบนแผนที่
ฉันมีข้อมูลสำหรับเครือข่ายสถานีตรวจอากาศทั่วสหรัฐอเมริกา สิ่งนี้ทำให้ฉันมีกรอบข้อมูลที่ประกอบด้วยวันที่ละติจูดลองจิจูดและค่าที่วัดได้บางส่วน สมมติว่ามีการรวบรวมข้อมูลวันละครั้งและขับเคลื่อนด้วยสภาพอากาศระดับภูมิภาค (ไม่เราจะไม่เข้าร่วมการสนทนานั้น) ฉันต้องการแสดงให้เห็นชัดเจนว่าค่าที่วัดได้พร้อมกันนั้นมีความสัมพันธ์กันตลอดเวลาและพื้นที่อย่างไร เป้าหมายของฉันคือการแสดงให้เห็นถึงความเป็นเนื้อเดียวกันในภูมิภาค (หรือไม่มีในนั้น) ของค่าที่จะถูกตรวจสอบ ชุดข้อมูล เริ่มต้นด้วยฉันเอากลุ่มของสถานีในแมสซาชูเซตส์และเมน ฉันเลือกไซต์ตามละติจูดและลองจิจูดจากไฟล์ดัชนีที่มีอยู่ในไซต์ FTP ของ NOAA ทันทีที่คุณเห็นปัญหาหนึ่ง: มีเว็บไซต์จำนวนมากที่มีตัวระบุที่คล้ายกันหรือใกล้เคียงกันมาก FWIW ฉันระบุว่าพวกเขาใช้ทั้งรหัส USAF และ WBAN เมื่อมองลึกลงไปที่เมทาดาทาฉันเห็นว่าพวกเขามีพิกัดและระดับความสูงต่างกันและข้อมูลหยุดที่ไซต์หนึ่งจากนั้นเริ่มที่อีกไซต์หนึ่ง ดังนั้นเนื่องจากฉันไม่รู้อะไรเลยฉันจึงต้องปฏิบัติต่อพวกเขาเป็นสถานีแยก ซึ่งหมายความว่าข้อมูลมีคู่สถานีที่ใกล้กันมาก การวิเคราะห์เบื้องต้น ฉันพยายามจัดกลุ่มข้อมูลตามเดือนปฏิทินจากนั้นคำนวณการถดถอยกำลังสองน้อยสุดธรรมดาระหว่างข้อมูลที่แตกต่างกัน จากนั้นฉันวางแผนความสัมพันธ์ระหว่างคู่ทั้งหมดเป็นเส้นเชื่อมต่อสถานี (ด้านล่าง) สีเส้นแสดงค่า R2 จาก OLS พอดี จากนั้นตัวเลขแสดงให้เห็นว่าจุดข้อมูล 30+ จุดตั้งแต่เดือนมกราคมกุมภาพันธ์เป็นต้นไปมีความสัมพันธ์กันอย่างไรระหว่างสถานีต่างๆในพื้นที่ที่น่าสนใจ ฉันได้เขียนโค้ดที่สำคัญเพื่อที่ค่าเฉลี่ยรายวันจะถูกคำนวณเฉพาะในกรณีที่มีจุดข้อมูลทุก 6 ชั่วโมงดังนั้นข้อมูลควรเปรียบเทียบได้ในทุกไซต์ ปัญหาที่เกิดขึ้น น่าเสียดายที่มีข้อมูลมากเกินไปที่จะเข้าใจในหนึ่งพล็อต ไม่สามารถแก้ไขได้ด้วยการลดขนาดของเส้น kkk เครือข่ายดูเหมือนจะซับซ้อนเกินไปดังนั้นฉันคิดว่าฉันต้องหาวิธีที่จะลดความซับซ้อนหรือใช้เคอร์เนลเชิงพื้นที่บางประเภท ฉันไม่แน่ใจว่าสิ่งที่เป็นตัวชี้วัดที่เหมาะสมที่สุดในการแสดงความสัมพันธ์ แต่สำหรับผู้ชมที่ตั้งใจ (ไม่ใช่ด้านเทคนิค) สัมประสิทธิ์สหสัมพันธ์จาก OLS อาจเป็นวิธีที่ง่ายที่สุดในการอธิบาย …

1
ปัญหาในการกำหนดลำดับ ARIMA
นี่คือการโพสต์ยาวดังนั้นฉันหวังว่าคุณจะสามารถทนกับฉันและโปรดแก้ไขฉันในที่ที่ฉันผิด เป้าหมายของฉันคือการสร้างการคาดการณ์รายวันโดยใช้ข้อมูลย้อนหลัง 3 หรือ 4 สัปดาห์ ข้อมูลนี้เป็นข้อมูล 15 นาทีของภาระในท้องถิ่นของหนึ่งในสายหม้อแปลง ฉันมีปัญหาในการค้นหาลำดับโมเดลของกระบวนการ ARIMA ตามฤดูกาล พิจารณาอนุกรมเวลาความต้องการไฟฟ้า: ซีรี่ส์เวลาดั้งเดิม http://i.share.pho.to/80d86574_l.png เมื่อ 3 สัปดาห์แรกจะถูกนำมาเป็นส่วนย่อยและทำการแปลงแปลง follwing ACF / PACF ที่แตกต่างกัน: เซตย่อย http://i.share.pho.to/5c165aef_l.png ความแตกต่างแรก http://i.share.pho.to/b7300cc2_l.png ความแตกต่างของฤดูกาลและครั้งแรก http://i.share.pho.to/570c5397_l.png ดูเหมือนว่าซีรีส์นี้จะหยุดนิ่ง แต่ฤดูกาลอาจเป็นรายสัปดาห์ (ดูสัปดาห์ที่แตกต่างตามฤดูกาลและลำดับที่สอง [ที่นี่] http://share.pho.to/3owoqคุณคิดอย่างไร) A R IMA ( p , 1 , q) ( P, 1 , Q )96ARผมMA(พี,1,Q)(P,1,Q)96 ARIMA(p,1,q)(P,1,Q)_{96} …

2
การเลือกคุณสมบัติพร้อมป่าสุ่ม
ฉันมีชุดข้อมูลที่มีตัวแปรทางการเงินเป็นส่วนใหญ่ (คุณสมบัติ 120 ตัวอย่าง 4k) ซึ่งส่วนใหญ่มีความสัมพันธ์สูงและมีเสียงดังมาก (ตัวชี้วัดทางเทคนิคเป็นต้น) ดังนั้นฉันต้องการเลือกสูงสุด 20-30 สำหรับใช้ในภายหลังกับการฝึกอบรมแบบจำลอง - เพิ่ม / ลด) ฉันกำลังคิดเกี่ยวกับการใช้ฟอเรสต์แบบสุ่มเพื่อจัดอันดับคุณลักษณะ มันเป็นความคิดที่ดีไหมที่จะใช้มันซ้ำ ๆ ? ตัวอย่างเช่นสมมติว่าในรอบแรกฉันลดระดับที่แย่ที่สุด 20% ที่สองเช่นกันไปเรื่อย ๆ จนกว่าฉันจะได้รับคุณสมบัติตามที่ต้องการ ฉันควรใช้การตรวจสอบข้ามกับ RF หรือไม่ (เป็นเรื่องง่ายสำหรับฉันที่จะไม่ใช้ CV เพราะมันเป็นสิ่งที่ RF ทำอยู่แล้ว) นอกจากนี้ถ้าฉันใช้ฟอเรสต์แบบสุ่มฉันควรใช้มันเป็นตัวแยกประเภทสำหรับไบนารี่หรือรีจิสเตอร์สำหรับการเพิ่ม / ลดจริง ๆ เพื่อรับการนำเข้าคุณลักษณะ? ยังไงก็ตามแบบจำลองที่ฉันต้องการลองหลังจากการเลือกคุณสมบัติคือ: SVM, ตาข่ายประสาท, การถดถอยแบบถ่วงน้ำหนักในพื้นที่และฟอเรสต์แบบสุ่ม ฉันทำงานเป็นหลักใน Python

1
ทำความเข้าใจกับความแปรปรวนของเอฟเฟกต์แบบสุ่มในโมเดล lmer ()
ฉันมีปัญหาในการเข้าใจผลลัพธ์ของlmer()แบบจำลองของฉัน มันเป็นรูปแบบที่เรียบง่ายของตัวแปรผลลัพธ์ (สนับสนุน) ที่มีการสกัดกั้นรัฐที่แตกต่างกัน / ผลกระทบแบบสุ่มรัฐ: mlm1 &lt;- lmer(Support ~ (1 | State)) ผลลัพธ์ของsummary(mlm1)คือ: Linear mixed model fit by REML Formula: Support ~ (1 | State) AIC BIC logLik deviance REMLdev 12088 12107 -6041 12076 12082 Random effects: Groups Name Variance Std.Dev. State (Intercept) 0.0063695 0.079809 Residual 1.1114756 1.054265 Number …

4
มีกฎหมายหรือไม่ที่บอกว่าถ้าคุณทดลองมากพอจะเกิดเรื่องหายาก?
ฉันกำลังพยายามสร้างวิดีโอเกี่ยวกับลูกเต๋าที่บรรจุอยู่และในจุดหนึ่งในวิดีโอที่เราหมุนประมาณ 200 ลูกเต๋าใช้เวลาทั้งหมดหกแต้มหมุนมันอีกครั้ง เรามีคนตายหนึ่งคนที่เกิดขึ้น 6 ครั้งติดต่อกันซึ่งเห็นได้ชัดว่าไม่ผิดปกติเพราะน่าจะเกิดขึ้น 1/216 ครั้งและเรามีลูกเต๋าประมาณ 200 ตัว ดังนั้นฉันจะอธิบายได้อย่างไรว่ามันไม่แปลก ดูเหมือนจะไม่เหมือนกฎของคนจำนวนมาก ฉันต้องการพูดบางอย่างเช่น "ถ้าคุณทำแบบทดสอบมากพอแม้กระทั่งสิ่งที่ไม่น่าจะเกิดขึ้น" แต่คู่หูของฉันบอกว่าผู้คนอาจมีปัญหากับคำศัพท์ "ผูกพันกับ" มีวิธีมาตรฐานในการระบุแนวคิดนี้หรือไม่?

2
เครื่องเพิ่มระดับความลาดชันมีเงื่อนไขใดที่มีประสิทธิภาพเหนือกว่าป่าสุ่ม
เครื่องจักรเพิ่มระดับความลาดชันของ Friedmanสามารถทำงานได้ดีกว่าป่าสุ่มของ Breimanหรือไม่? ถ้าเป็นเช่นนั้นเงื่อนไขหรือชุดข้อมูลใดที่สามารถทำให้ gbm ดีขึ้นได้?

2
SVM แบบชั้นเดียวกับแบบ SVM
ฉันเข้าใจว่ามีการเสนอ SVM ชั้นหนึ่ง (OSVMs) โดยไม่มีข้อมูลเชิงลบในใจและพวกเขาพยายามค้นหาขอบเขตการตัดสินใจที่แยกชุดบวกและจุดยึดเชิงลบออก งานในปี 2011 เสนอExemplar SVMs (ESVMs) ซึ่งฝึกอบรม "ลักษณนามเดี่ยวต่อหมวดหมู่" ซึ่งอ้างว่าแตกต่างจาก OSVM ใน ESVM นั้นไม่จำเป็นต้องทำการแมป exemplars ในพื้นที่คุณลักษณะทั่วไปซึ่งเคอร์เนลที่คล้ายคลึงกันสามารถ คำนวณ" ฉันไม่เข้าใจความหมายของสิ่งนี้และความแตกต่างของ ESVM จาก OSVM แล้วพวกมันต่างกันอย่างไร และการคำนวณเคอร์เนลความคล้ายคลึงกันนี้จะหลีกเลี่ยงใน ESVM อย่างไร

3
Cholesky กับ eigendecomposition สำหรับการวาดตัวอย่างจากการแจกแจงปกติหลายตัวแปร
ผมอยากจะวาดตัวอย่าง ) วิกิพีเดียแสดงให้เห็นว่าจะใช้CholeskyหรือEigendecompositionคือ Σ = D 1 D T 1 หรือ Σ = Q Λ Q Tx∼N(0,Σ)x∼N(0,Σ)\mathbf{x} \sim N\left(\mathbf{0}, \mathbf{\Sigma} \right)Σ=D1DT1Σ=D1D1T \mathbf{\Sigma} = \mathbf{D}_1\mathbf{D}_1^T Σ=QΛQTΣ=QΛQT \mathbf{\Sigma} = \mathbf{Q}\mathbf{\Lambda}\mathbf{Q}^T และด้วยเหตุนี้ตัวอย่างสามารถวาดผ่าน: หรือ x = Q √x=D1vx=D1v \mathbf{x} = \mathbf{D}_1 \mathbf{v} โดยที่ v∼N(0,I)x=QΛ−−√vx=QΛv \mathbf{x} = \mathbf{Q}\sqrt{\mathbf{\Lambda}} \mathbf{v} v∼N(0,I)v∼N(0,I) \mathbf{v} \sim N\left(\mathbf{0}, \mathbf{I} \right) …

3
วิธีการแบ่ง r-squared ระหว่างตัวแปรทำนายในการถดถอยหลายครั้ง?
ฉันเพิ่งอ่านกระดาษที่ผู้เขียนดำเนินการถดถอยหลายครั้งพร้อมตัวทำนายสองตัว ค่า r-squared โดยรวมคือ 0.65 พวกเขาจัดทำตารางที่แบ่ง r-squared ระหว่างตัวทำนายสองตัว ตารางมีลักษณะดังนี้: rsquared beta df pvalue whole model 0.65 NA 2, 9 0.008 predictor 1 0.38 1.01 1, 10 0.002 predictor 2 0.27 0.65 1, 10 0.030 ในรุ่นนี้วิ่งRโดยใช้mtcarsชุดข้อมูลค่า r-squared โดยรวมคือ 0.76 summary(lm(mpg ~ drat + wt, mtcars)) Call: lm(formula = mpg ~ drat …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.