การใช้ทฤษฎีสารสนเทศในศาสตร์ข้อมูลประยุกต์


9

วันนี้ฉันวิ่งข้ามหนังสือ"ทฤษฎีข้อมูล: บทแนะนำการสอน"โดย James Stone และคิดสักครู่หรือสองครั้งเกี่ยวกับขอบเขตของการใช้ทฤษฎีข้อมูลในวิทยาศาสตร์ข้อมูลประยุกต์ (ถ้าคุณไม่พอใจกับคำนี้ค่อนข้างคลุมเครือ คิดว่าการวิเคราะห์ข้อมูลซึ่งวิทยาศาสตร์ข้อมูลของ IMHO เป็นรุ่นที่ได้รับเกียรติ) ฉันตระหนักดีถึงการใช้งานที่สำคัญของทฤษฎีสารสนเทศ -based วิธี , วิธีการและมาตรการโดยเฉพาะอย่างยิ่งเอนโทรปี , ภายใต้ประทุนเทคนิคทางสถิติและวิธีการต่างๆในการวิเคราะห์ข้อมูล

อย่างไรก็ตามฉันอยากรู้เกี่ยวกับขอบเขต / ระดับความรู้ที่จำเป็นสำหรับนักวิทยาศาสตร์สังคมประยุกต์ที่ประสบความสำเร็จในการเลือกและใช้แนวคิดมาตรการและเครื่องมือเหล่านั้นโดยไม่ต้องดำลึกเข้าไปในจุดกำเนิดทางคณิตศาสตร์ของทฤษฎี ฉันหวังว่าจะได้คำตอบของคุณซึ่งอาจกล่าวถึงข้อกังวลของฉันภายในบริบทของหนังสือที่กล่าวถึงข้างต้น (หรือหนังสือที่คล้ายคลึงกันอื่น ๆ - อย่าลังเลที่จะแนะนำ) หรือโดยทั่วไป

ฉันขอขอบคุณข้อเสนอแนะบางอย่างสำหรับแหล่งข้อมูลการพิมพ์หรือออนไลน์ที่กล่าวถึงทฤษฎีข้อมูลและแนวคิดแนวทางวิธีการและมาตรการในบริบทของ ( เปรียบเทียบกับ) วิธีการทางสถิติแบบดั้งเดิมอื่น ๆ (เพิ่มเติม) (ผู้ใช้บ่อยและBayesian )


2
บางทีหนึ่งในกรณีที่รู้จักกันมากที่สุดและ "สมัคร" ของการใช้เอนโทรปีเกิดขึ้นเมื่อสร้างต้นไม้ หนึ่งในความเป็นไปได้เมื่ออัลกอริธึมแยกคือการใช้มาตรวัดการรับข้อมูลซึ่งเป็นความแตกต่างระหว่างเอนโทรปีระหว่างระดับบนและระดับล่าง คุณมีข้อมูลเพิ่มเติมที่นี่en.wikipedia.org/wiki/Information_gain_in_decision_trees
D.Castro

@ D.Castro: ขอบคุณสำหรับความคิดเห็นของคุณ - ฉันตระหนักถึงกรณีนี้ (และได้โพสต์คำตอบในหัวข้อที่แน่นอนนี้ที่นี่ในการตรวจสอบข้ามหรือบนเว็บไซต์วิทยาศาสตร์ข้อมูล SE) ฉันหวังว่าจะได้รับความคุ้มครอง / การอภิปรายที่ครอบคลุมมากขึ้นในเรื่องนี้
Aleksandr Blekh

1
สำหรับฉันและส่วนใหญ่มันเป็นเรื่องของวินัยหรือสาขาวิชาที่ได้รับการฝึกฝนเช่นเดียวกับทวีปทางภูมิศาสตร์ ในมุมมองของฉันนักฟิสิกส์คณิตศาสตร์และผู้ปฏิบัติงานของการเรียนรู้ด้วยเครื่องจักรบริสุทธิ์มีแนวโน้มที่จะได้รับการเปิดเผยข้อมูลเชิงลึกมากกว่าทฤษฎีข้อมูลมากกว่าที่จะพูดนักสถิตินักเศรษฐศาสตร์หรือนักวิเคราะห์ทางการเงินเชิงปริมาณ นอกจากนี้ฉันจะทำสองสิ่งนี้สำหรับผู้ที่ผ่านการฝึกอบรมในยุโรปเช่นชาวยุโรปมีแนวโน้มที่จะคุ้นเคยกับไอที อย่างไรก็ตามการถือกำเนิดของแบบจำลองสำหรับการเรียนรู้ทางสถิติกำลังเปลี่ยนแปลงสิ่งนั้นสำหรับนักวิทยาศาสตร์ด้านข้อมูลในสหรัฐอเมริกา
Mike Hunter

@Dohnson Minutest ของจุดนาที แต่ในสหราชอาณาจักรและที่อื่น ๆ == เทคโนโลยีสารสนเทศ มิฉะนั้นการแสดงผลของคุณคล้ายกับของฉัน
Nick Cox

@ NickCox ขอบคุณจุดของคุณถือเป็นรัฐเช่นกัน มันเป็นการแสดงความคิดเห็นที่ยาวนานและหากฉันอนุญาตให้เว้นวรรคฉันจะสะกดคำหรือดีกว่านั้นได้แนะนำความหมายของคำย่อในตอนต้น
Mike Hunter

คำตอบ:


4

ดังนั้นส่วนแรกของคำถาม: นักวิทยาศาสตร์ด้านข้อมูลจำเป็นต้องรู้ทฤษฎีข้อมูลหรือไม่? ฉันคิดว่าคำตอบคือไม่นานมาก เหตุผลที่ฉันเปลี่ยนใจเป็นองค์ประกอบที่สำคัญอย่างหนึ่ง: เสียงรบกวน

โมเดลการเรียนรู้ของเครื่องจำนวนมาก (ทั้งสุ่มหรือไม่) ใช้เสียงเป็นส่วนหนึ่งของกระบวนการเข้ารหัสและการแปลงของพวกเขาและในหลาย ๆ โมเดลคุณจำเป็นต้องสรุปความน่าจะเป็นที่เสียงดังกระทบหลังจากถอดรหัสเอาท์พุทที่แปลงแล้วของแบบจำลอง ฉันคิดว่านี่เป็นส่วนสำคัญของทฤษฎีข้อมูล ไม่เพียงแค่นั้นในการเรียนรู้อย่างลึกล้ำ KL แตกต่างเป็นมาตรการที่สำคัญมากที่ใช้ซึ่งมาจากทฤษฎีข้อมูล

ส่วนที่สองของคำถาม: ผมคิดว่าแหล่งที่ดีที่สุดคือเดวิดแมคเคย์ของข้อมูลทฤษฎีการอนุมานและการเรียนรู้ขั้นตอนวิธี เขาเริ่มต้นด้วยทฤษฎีข้อมูลและนำแนวคิดเหล่านั้นไปใช้ในการอนุมานและแม้แต่โครงข่ายประสาทเทียม Pdf นั้นฟรีบนเว็บไซต์ของ Daveและการบรรยายออนไลน์ซึ่งยอดเยี่ยม


3
มันเป็นหนังสือที่ยอดเยี่ยม ทุกคนที่สนใจควรเหลียวดู
Nick Cox

ขอบคุณสำหรับคำตอบของคุณ (+1 และโอกาสที่จะได้รับถ้าไม่มีคำตอบที่ครอบคลุมจะปรากฏขึ้นเร็วพอ) ขอบคุณเป็นพิเศษสำหรับการอ้างอิง ฉันประหลาดใจที่คุณพบเจอปัญหาที่เกือบจะลืมเลือนไป แต่สิ่งสำคัญสำหรับฉัน :-)
Aleksandr Blekh

ใช่มันน่าสนใจ คุณไม่ควรละทิ้งคำถาม มาหาฉันหลังจากฉันเข้าร่วม NIPS2016 และฉันเห็นการพูดคุยทั้งหมดเกี่ยวกับความแตกต่างของ KL และผลกระทบด้านเสียงต่อเครื่องเข้ารหัส
Ambodi
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.