คำถามติดแท็ก data-mining

การขุดข้อมูลใช้วิธีการจากปัญญาประดิษฐ์ในบริบทฐานข้อมูลเพื่อค้นหารูปแบบที่ไม่รู้จักก่อนหน้านี้ ดังนั้นวิธีการดังกล่าวมักจะไม่ได้รับการดูแล มันเกี่ยวข้องอย่างใกล้ชิด แต่ไม่เหมือนกับการเรียนรู้ของเครื่อง งานที่สำคัญของการขุดข้อมูลคือการวิเคราะห์กลุ่มการตรวจหานอกและกฎการเชื่อมโยง

4
จะเริ่มอ่านเกี่ยวกับ data mining ได้อย่างไร?
ฉันเป็นสามเณรที่จะเริ่มอ่านเกี่ยวกับการขุดข้อมูล ฉันมีความรู้พื้นฐานเกี่ยวกับ AI และสถิติ เนื่องจากหลายคนกล่าวว่าการเรียนรู้ของเครื่องจักรก็มีบทบาทสำคัญในการขุดข้อมูลด้วยเช่นกันจำเป็นต้องอ่านเกี่ยวกับการเรียนรู้ของเครื่องก่อนที่ฉันจะสามารถทำการขุดข้อมูลได้หรือไม่?

3
ฉันต้องลดตัวแปรที่มีความสัมพันธ์ / collinear ก่อนเรียกใช้ kmeans หรือไม่
ฉันกำลังเรียกใช้ kmeans เพื่อระบุกลุ่มลูกค้า ฉันมีตัวแปรประมาณ 100 ตัวเพื่อระบุกลุ่ม ตัวแปรแต่ละตัวเหล่านี้แสดงถึง% ของการใช้จ่ายของลูกค้าในหมวดหมู่ ดังนั้นถ้าฉันมี 100 หมวดหมู่ฉันมีตัวแปร 100 ตัวดังกล่าวผลรวมของตัวแปรเหล่านี้คือ 100% สำหรับลูกค้าแต่ละราย ตอนนี้ตัวแปรเหล่านี้มีความสัมพันธ์กันอย่างมาก ฉันต้องลบสิ่งเหล่านี้บางส่วนเพื่อลบ collinearity ก่อนที่จะเรียกใช้ kmeans หรือไม่ นี่คือข้อมูลตัวอย่าง ในความเป็นจริงฉันมี 100 ตัวแปรและ 10 ล้านลูกค้า Customer CatA CatB CatC 1 10% 70% 20% 2 15% 60% 25%

2
SVM ชั้นหนึ่งคืออะไรและทำงานอย่างไร
ฉันใช้SVM ชั้นเดียวซึ่งถูกนำไปใช้ใน scikit-Learn สำหรับงานวิจัยของฉัน แต่ฉันไม่มีความเข้าใจในเรื่องนี้ ใครช่วยอธิบายคำอธิบายง่ายๆของSVM ชั้นเดียวได้ไหม?

2
สิ่งที่เป็นที่รู้จักและใช้งานอยู่ในปัจจุบันของทฤษฎีความโกลาหลในการขุดข้อมูล?
ในขณะที่การอ่านตลาดมวลชนบางงานเกี่ยวกับทฤษฎีความโกลาหลในช่วงไม่กี่ปีที่ผ่านมาฉันเริ่มสงสัยว่ามันสามารถนำไปประยุกต์ใช้กับการทำเหมืองข้อมูลและด้านอื่น ๆ ที่เกี่ยวข้องได้อย่างไรเช่นตาข่ายประสาทการจดจำรูปแบบการจัดการความไม่แน่นอน ฯลฯ มีตัวอย่างน้อยมากของแอปพลิเคชั่นดังกล่าวในการวิจัยที่ตีพิมพ์ซึ่งฉันสงสัยว่าก) พวกเขาได้นำไปใช้จริงในการทดลองและโครงการที่เผยแพร่แล้วและข) ถ้าไม่ทำไมพวกเขาถึงใช้น้อยมากในความสัมพันธ์เหล่านี้ สาขา? การอภิปรายส่วนใหญ่เกี่ยวกับทฤษฎีความโกลาหลที่ฉันเคยเห็นมาในปัจจุบันเกี่ยวข้องกับแอปพลิเคชั่นทางวิทยาศาสตร์ที่มีประโยชน์โดยสิ้นเชิง แต่ไม่ค่อยมีส่วนเกี่ยวข้องกับการทำเหมืองข้อมูล หนึ่งในตัวอย่างต้นแบบคือปัญหาสามตัวจากฟิสิกส์ ฉันต้องการนำการอภิปรายเกี่ยวกับการใช้งานทางวิทยาศาสตร์ทั่วไปประเภทนี้และ จำกัด คำถามเฉพาะแอปพลิเคชันที่เกี่ยวข้องกับการทำเหมืองข้อมูลและสาขาที่เกี่ยวข้องซึ่งเห็นได้ชัดว่ามีอยู่น้อยมากในวรรณกรรม รายการแอปพลิเคชันที่มีศักยภาพด้านล่างนี้สามารถใช้เป็นจุดเริ่มต้นของการค้นหางานวิจัยที่ตีพิมพ์ แต่ฉันสนใจเฉพาะแอปพลิเคชันเหล่านั้นที่ได้นำไปใช้จริง สิ่งที่ฉันกำลังมองหานั้นเป็นที่ทราบกันดีว่าการใช้ทฤษฎีความโกลาหลกับการขุดข้อมูล ขัดแย้งกับรายการแอพพลิเคชั่นที่มีศักยภาพซึ่งกว้างกว่ามาก นี่คือตัวอย่างเล็ก ๆ ของแนวคิดนอกคอกสำหรับแอปพลิเคชันการขุดข้อมูลที่เกิดขึ้นกับฉันขณะอ่าน อาจจะไม่มีพวกมันในทางปฏิบัติบางทีบางคนอาจถูกนำไปใช้จริงในขณะที่เราพูด แต่ไปตามเงื่อนไขที่ฉันยังไม่คุ้นเคย: การระบุโครงสร้างที่คล้ายกันของตัวเองในการจดจำรูปแบบดังที่ Mandelbrot ทำในทางปฏิบัติในกรณีที่เกิดข้อผิดพลาดเกิดขึ้นในสายโทรศัพท์อะนาล็อกเมื่อสองสามทศวรรษที่แล้ว การเผชิญหน้ากับผลการขุดของ Feigenbaum อย่างต่อเนื่อง (อาจเป็นในลักษณะที่คล้ายคลึงกับที่นักทฤษฎีสตริงถูกทำให้ตกใจเพื่อดูสมการของ Maxwell ปรากฏขึ้นในสถานที่ที่ไม่คาดคิดในระหว่างการวิจัย) การระบุความลึกของบิตที่เหมาะสมที่สุดสำหรับตุ้มน้ำหนักโครงข่ายประสาทและการทดสอบการขุดต่างๆ ฉันสงสัยเกี่ยวกับอันนี้เนื่องจากสเกลตัวเลขขนาดเล็กที่หายตัวไปซึ่งความไวต่อเงื่อนไขเริ่มต้นเข้ามามีบทบาทซึ่งบางส่วนมีส่วนรับผิดชอบต่อความไม่แน่นอนของฟังก์ชั่นที่เกี่ยวข้องกับความโกลาหล การใช้ความคิดของมิติเศษส่วนในรูปแบบอื่น ๆ ที่ไม่จำเป็นต้องเกี่ยวข้องกับความอยากรู้อยากเห็นเศษส่วนที่น่าสนใจเช่น Menger Sponges, Koch Curves หรือ Sierpinski Carpets บางทีแนวคิดนี้สามารถนำไปใช้กับมิติของแบบจำลองการทำเหมืองในบางวิธีที่เป็นประโยชน์โดยการทำให้มันเป็นเศษส่วน? ได้รับกฎหมายพลังงานเช่นเดียวกับที่เข้ามาเป็นเศษส่วน เนื่องจากฟังก์ชั่นที่พบในแฟร็กทัลไม่ใช่แบบไม่เชิงเส้นฉันจึงสงสัยว่ามีแอปพลิเคชันบางอย่างในการประยุกต์กับการถดถอยแบบไม่เชิงเส้น ทฤษฎีความโกลาหลมีความสัมพันธ์วง (และบางครั้งคุยโว) กับเอนโทรปีดังนั้นฉันจึงสงสัยว่ามีวิธีการคำนวณเอนโทรปีของแชนนอน …

3
ป่าสุ่มและการส่งเสริมพารามิเตอร์หรือไม่ใช่พารามิเตอร์หรือไม่
จากการอ่านการสร้างแบบจำลองทางสถิติที่ยอดเยี่ยม: ทั้งสองวัฒนธรรม (Breiman 2001)เราสามารถยึดความแตกต่างทั้งหมดระหว่างแบบจำลองทางสถิติแบบดั้งเดิม (เช่นการถดถอยเชิงเส้น) และอัลกอริทึมการเรียนรู้ของเครื่องจักร (เช่นการห่อป่าแบบสุ่ม Breiman วิพากษ์วิจารณ์แบบจำลองข้อมูล (พารามิเตอร์) เพราะพวกเขาอยู่บนพื้นฐานของข้อสันนิษฐานว่าการสังเกตนั้นถูกสร้างขึ้นโดยแบบจำลองที่เป็นทางการซึ่งเป็นที่รู้จักซึ่งกำหนดโดยนักสถิติซึ่งอาจเลียนแบบธรรมชาติได้ไม่ดี ในทางตรงกันข้าม ML algos จะไม่ถือว่าแบบจำลองที่เป็นทางการใด ๆ และเรียนรู้การเชื่อมโยงโดยตรงระหว่างตัวแปรอินพุตและเอาต์พุตจากข้อมูล ฉันตระหนักว่าบรรจุถุง / RF และการส่งเสริมการนอกจากนี้ยังมีการจัดเรียงของพารา: ยกตัวอย่างเช่นntree , mtryใน RF, อัตราการเรียนรู้ , ส่วนถุง , ซับซ้อนต้นไม้ใน Stochastic ไล่โทนสีต้นไม้เพิ่มขึ้นมีการปรับจูนทุกพารามิเตอร์ นอกจากนี้เรายังประมาณค่าพารามิเตอร์เหล่านี้จากข้อมูลเนื่องจากเราใช้ข้อมูลเพื่อค้นหาค่าที่ดีที่สุดของพารามิเตอร์เหล่านี้ ดังนั้นความแตกต่างคืออะไร? RF และ Boosted Trees เป็นโมเดลพาราเมตริกหรือไม่?

2
การศึกษาด้วยตนเองจะได้รับไกลแค่ไหน
ฉันไม่เคยมีส่วนร่วมในการวิเคราะห์ข้อมูลอย่างเป็นทางการหรือมีโครงสร้างหรือหลักสูตรการเรียนรู้ด้วยเครื่อง (นอกเหนือจากข้อเสนอออนไลน์ล่าสุด) และได้เรียนรู้สิ่งที่ฉันรู้จากการอ่านและทดลองใช้มากที่สุด ฉันรู้ว่าฉันอยู่ห่างไกลจากความสามารถในการหางาน คำถามของฉันไม่ใช่สิ่งที่ดีกว่า ( เช่นคำถามนี้ ) แต่ฉันสามารถไปถึงระดับที่ฉันสามารถสมัครงานและมีโอกาสเรียนรู้ด้วยตนเองได้หรือไม่ นอกจากนี้เป็นไปได้ไหมที่จะทำสิ่งนี้ภายในกรอบเวลาที่เหมาะสม (อาจจะเป็น 10 ปีหรือไม่ตอนนี้ฉันอายุ 31 แล้ว ... )? หรือฉันจะต้องไปหาวิธีที่จะเข้าร่วมการจัดเรียงของวิทยาลัย / สถาบันการบางอย่าง?

2
การบรรจุด้วยการสุ่มตัวอย่างมากเกินไปสำหรับโมเดลการทำนายเหตุการณ์ที่หายาก
ไม่มีใครรู้ว่าสิ่งต่อไปนี้ได้รับการอธิบายและ (อย่างใดอย่างหนึ่ง) ถ้ามันดูเหมือนเป็นวิธีที่เป็นไปได้สำหรับการเรียนรู้รูปแบบการทำนายที่มีตัวแปรเป้าหมายที่ไม่สมดุลมาก? บ่อยครั้งในการใช้งาน CRM ของการขุดข้อมูลเราจะหารูปแบบที่เหตุการณ์เชิงบวก (ความสำเร็จ) นั้นหายากมากเมื่อเทียบกับคนส่วนใหญ่ (ระดับลบ) ตัวอย่างเช่นฉันอาจมี 500,000 อินสแตนซ์ที่มีเพียง 0.1% ของระดับความสนใจเชิงบวก (เช่นลูกค้าที่ซื้อ) ดังนั้นเพื่อสร้างแบบจำลองการทำนายวิธีการหนึ่งคือการสุ่มตัวอย่างข้อมูลโดยที่คุณเก็บอินสแตนซ์ของคลาสที่เป็นบวกทั้งหมดและมีเพียงตัวอย่างของอินสแตนซ์คลาสที่เป็นค่าลบเพื่อให้อัตราส่วนของ 75% เป็นบวกถึงลบ) การสุ่มตัวอย่างการ Undersampling, SMOTE และอื่น ๆ เป็นวิธีการทั้งหมดในวรรณคดี สิ่งที่ฉันอยากรู้คือการรวมกลยุทธ์การสุ่มตัวอย่างพื้นฐานด้านบน แต่กับการบรรจุของคลาสลบ รักษาอินสแตนซ์ของคลาสที่เป็นบวกทั้งหมด (เช่น 1,000) ตัวอย่างอินสแตนซ์คลาสเชิงลบเพื่อสร้างตัวอย่างที่สมดุล (เช่น 1,000) พอดีกับรุ่น ทำซ้ำ ใครเคยได้ยินเรื่องนี้มาก่อน ปัญหาที่ดูเหมือนว่าไม่มีการบรรจุหีบห่อคือการสุ่มตัวอย่างคลาสเชิงลบเพียง 1,000 ครั้งเมื่อมี 500,000 คือพื้นที่ของตัวทำนายจะเบาบางและคุณอาจไม่ได้แสดงถึงค่า / รูปแบบของตัวทำนายที่เป็นไปได้ การบรรจุถุงดูเหมือนจะช่วยได้ ฉันดูที่ rpart และไม่มีสิ่งใด "หยุด" เมื่อตัวอย่างอย่างใดอย่างหนึ่งไม่มีค่าทั้งหมดสำหรับตัวทำนาย (ไม่แตกเมื่อทำนายอินสแตนซ์ด้วยค่าตัวทำนายเหล่านั้น: library(rpart) …

2
การวิเคราะห์เชิงสำรวจของข้อผิดพลาดการพยากรณ์เชิงพื้นที่
ข้อมูล:ฉันทำงานเมื่อเร็ว ๆ นี้ในการวิเคราะห์คุณสมบัติสุ่มของเขตข้อมูลเชิงพื้นที่ของข้อผิดพลาดการคาดการณ์การผลิตพลังงานลม อย่างเป็นทางการอาจกล่าวได้ว่าเป็นกระบวนการ จัดทำดัชนีสองครั้งในเวลา (ด้วยและ ) และหนึ่งครั้งในอวกาศ ( ) โดยที่เป็นจำนวนของการมองไปข้างหน้าครั้ง (เท่ากับบางสิ่งรอบตัว , สุ่มตัวอย่างอย่างสม่ำเสมอ),คือจำนวน "เวลาคาดการณ์" (เช่นเวลาที่มีการออกการคาดการณ์ประมาณ 30,000 ในกรณีของฉันสุ่มตัวอย่างเป็นประจำ) และ thpH24Tn( ϵพีt + h | เสื้อ)t = 1 … , T;h = 1 , … , H,p = p1, … , pn(ϵt+h|tp)t=1…,T;h=1,…,H,p=p1,…,pn \left (\epsilon^p_{t+h|t} \right )_{t=1\dots,T;\; h=1,\dots,H,\;p=p_1,\dots,p_n}เสื้อttชั่วโมงhhพีppHHH242424TTTnnnเป็นจำนวนตำแหน่งเชิงพื้นที่ (ไม่ gridded ประมาณ 300 …

4
วิธีที่ดีที่สุดในการรวบรวมและวิเคราะห์ข้อมูล
เมื่อไม่นานมานี้เริ่มสอนตนเองเกี่ยวกับการเรียนรู้ของเครื่องจักรและการวิเคราะห์ข้อมูลฉันพบว่าตัวเองชนกำแพงอิฐที่ต้องการสร้างและค้นหาชุดข้อมูลขนาดใหญ่ ฉันต้องการใช้ข้อมูลที่รวบรวมไว้ในชีวิตการงานและชีวิตส่วนตัวของฉันแล้ววิเคราะห์ แต่ฉันไม่แน่ใจว่าจะทำสิ่งต่อไปนี้ได้ดีที่สุด: ฉันจะเก็บข้อมูลนี้ได้อย่างไร Excel? SQL? ?? เป็นวิธีที่ดีสำหรับผู้เริ่มต้นในการเริ่มพยายามวิเคราะห์ข้อมูลนี้อย่างไร ฉันเป็นโปรแกรมเมอร์คอมพิวเตอร์มืออาชีพดังนั้นความซับซ้อนไม่ได้อยู่ในการเขียนโปรแกรม แต่เฉพาะเจาะจงมากขึ้นหรือน้อยลงในโดเมนของการวิเคราะห์ข้อมูล แก้ไข: ขอโทษสำหรับความคลุมเครือของฉันเมื่อคุณเริ่มเรียนรู้เกี่ยวกับบางสิ่งบางอย่างมันยากที่จะรู้ว่าสิ่งที่คุณไม่รู้ไม่รู้ใช่มั้ย ;) ต้องบอกว่าจุดมุ่งหมายของฉันคือการใช้สิ่งนี้กับสองหัวข้อหลัก: การวัดทีมงานซอฟแวร์ (คิดว่าความเร็ว Agile, ความเสี่ยงเชิงปริมาณ, ความน่าจะเป็นของการทำซ้ำที่เสร็จสมบูรณ์ได้รับ x จำนวนเรื่องคะแนน) การเรียนรู้ของเครื่อง (ข้อยกเว้นของระบบได้เกิดขึ้นในชุดของโมดูลที่กำหนดความน่าจะเป็นที่โมดูลจะโยนข้อยกเว้นในฟิลด์จะมีค่าใช้จ่ายเท่าไหร่ข้อมูลจะบอกฉันเกี่ยวกับโมดูลหลักเพื่อปรับปรุงที่จะได้รับ คาดเดาได้ว่าส่วนใดของระบบที่ผู้ใช้จะต้องการใช้ต่อไปเพื่อเริ่มการโหลดข้อมูล ฯลฯ )

3
แนวคิดในการทำข้อมูลมีค่าศูนย์
ฉันมักจะเห็นคนสร้างมิติ / คุณสมบัติของชุดข้อมูลให้มีค่าเป็นศูนย์โดยการลบค่าเฉลี่ยจากองค์ประกอบทั้งหมด แต่ฉันไม่เคยเข้าใจเลยว่าทำไมต้องทำเช่นนั้น? ผลของการทำเช่นนั้นเป็นขั้นตอน preprocessing คืออะไร มันปรับปรุงประสิทธิภาพการจำแนกประเภทหรือไม่? ช่วยตอบบางอย่างเกี่ยวกับชุดข้อมูลหรือไม่ มันช่วยได้หรือไม่เมื่อสร้างภาพข้อมูลเพื่อทำความเข้าใจกับข้อมูล?

5
ความถี่ระยะ / ความถี่เอกสารผกผัน (TF / IDF): น้ำหนัก
ฉันมีชุดข้อมูลที่แสดงถึง 1,000 เอกสารและคำทั้งหมดที่ปรากฏในนั้น ดังนั้นแถวแสดงถึงเอกสารและคอลัมน์เป็นตัวแทนของคำ ดังนั้นสำหรับตัวอย่างเช่นค่าในเซลล์ย่อมาจากคำว่าครั้งญเกิดขึ้นในเอกสารฉัน ตอนนี้ฉันต้องค้นหา 'น้ำหนัก' ของคำโดยใช้วิธี tf / idf แต่จริง ๆ แล้วฉันไม่รู้วิธีการทำสิ่งนี้ มีคนช่วยฉันออกได้ไหม(i,j)(i,j)(i,j)jjjiii

3
ฐานคณิตศาสตร์สำหรับการขุดข้อมูลและอัลกอริทึมปัญญาประดิษฐ์
คุณช่วยอธิบายเกี่ยวกับการขุดข้อมูลและอัลกอริทึมปัญญาประดิษฐ์ให้ฉันได้ไหม พวกเขาใช้คณิตศาสตร์อะไร คุณช่วยบอกจุดเริ่มต้นในคณิตศาสตร์ให้ฉันเข้าใจอัลกอริธึมเหล่านี้ได้ไหม

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
วิธีสร้างเส้นโค้ง Precision-Recall เมื่อฉันมีเพียงค่าเดียวสำหรับ PR?
ฉันมีการกำหนด data mining ที่ฉันทำระบบดึงภาพตามเนื้อหา ฉันมี 20 ภาพจาก 5 สัตว์ ดังนั้นทั้งหมด 100 ภาพ ระบบของฉันคืนค่า 10 ภาพที่เกี่ยวข้องมากที่สุดไปยังภาพอินพุต ตอนนี้ฉันต้องประเมินประสิทธิภาพของระบบของฉันด้วยเส้นโค้ง Precision-Recall อย่างไรก็ตามฉันไม่เข้าใจแนวคิดของเส้นโค้ง Precision-Recall สมมติว่าระบบของฉันส่งคืนรูปภาพ 10 ภาพสำหรับภาพลิงกอริลลา แต่มี 4 ภาพเท่านั้นเป็นภาพลิงกอริลลา อีก 6 รูปที่ส่งคืนเป็นสัตว์อื่น ' ดังนั้น, ความแม่นยำคือ4/10 = 0.4(กลับมาที่เกี่ยวข้อง) / (คืนทั้งหมด) การเรียกคืนคือ4/20 = 0.2(คืนที่เกี่ยวข้อง) / (ที่เกี่ยวข้องทั้งหมด) ดังนั้นฉันจึงมีเพียงจุด<0.2,0.4>ไม่ใช่เส้นโค้ง ฉันจะมีเส้นโค้งอย่างไร (เช่นชุดของคะแนน) ฉันควรเปลี่ยนจำนวนภาพที่ส่งคืน (กรณีนี้กำหนดไว้ที่ 10 ในกรณีของฉัน) หรือไม่

1
ความสัมพันธ์ระหว่าง Hessian Matrix และ Covariance Matrix
ในขณะที่ฉันกำลังศึกษาการประมาณความเป็นไปได้สูงสุดเพื่อทำการอนุมานในการประมาณความน่าจะเป็นสูงสุดเราจำเป็นต้องทราบความแปรปรวน หากต้องการทราบความแปรปรวนฉันต้องรู้ว่า Rao Lower Bound ของแครเมอร์ซึ่งดูเหมือนเมทริกซ์ของ Hessian ที่มีอนุพันธ์อันดับสองเกี่ยวกับความโค้ง ฉันสับสนในการกำหนดความสัมพันธ์ระหว่างเมทริกซ์ความแปรปรวนร่วมกับเมทริกซ์แบบเฮสเซียน หวังว่าจะได้ยินคำอธิบายบางอย่างเกี่ยวกับคำถาม ตัวอย่างง่ายๆจะได้รับการชื่นชม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.