สถิติและข้อมูลขนาดใหญ่

ถามตอบสำหรับผู้ที่สนใจในสถิติการเรียนรู้ของเครื่องจักรการวิเคราะห์ข้อมูลการขุดข้อมูล


5
ฉันเรียนรู้จากการจดจำรูปแบบและการเรียนรู้ของเครื่องจักร Chris Bishop เป็นแหล่งข้อมูลที่ดีใช่หรือไม่
มีวิดีโอหรือหนังสือ / บันทึกอื่น ๆ ที่ทุกคนเคยพบเจอตามการจดจำรูปแบบและการเรียนรู้ของ Machine โดย Chris Bishop หรือไม่ ฉันซื้อหนังสือเล่มนี้เพื่อเรียนรู้การเรียนรู้ของเครื่องและฉันประสบปัญหาในการผ่านมัน

2
เป็นวิธีปฏิบัติทั่วไปหรือไม่ที่จะลดความสูญเสียเฉลี่ยให้น้อยที่สุดแทนที่จะเป็นผลรวม?
Tensorflow มีตัวอย่างที่สอนเกี่ยวกับการจำแนกCIFAR-10 ในบทช่วยสอนการลดการสูญเสียเอนโทรปีโดยเฉลี่ยในชุดการสอนจะลดลง def loss(logits, labels): """Add L2Loss to all the trainable variables. Add summary for for "Loss" and "Loss/avg". Args: logits: Logits from inference(). labels: Labels from distorted_inputs or inputs(). 1-D tensor of shape [batch_size] Returns: Loss tensor of type float. """ # Calculate the average cross entropy loss …

4
การตีความความเหมือนโคไซน์เชิงลบ
คำถามของฉันอาจจะโง่ ดังนั้นฉันจะขออภัยล่วงหน้า ฉันพยายามใช้แบบจำลอง GLOVE ที่ผ่านการฝึกอบรมโดยกลุ่ม Stanford NLP ( ลิงก์ ) อย่างไรก็ตามฉันสังเกตเห็นว่าผลลัพธ์ที่คล้ายคลึงกันของฉันแสดงจำนวนลบ นั่นทำให้ฉันดูไฟล์ข้อมูล word-vector ทันที เห็นได้ชัดว่าค่าในคำว่าเวกเตอร์ได้รับอนุญาตให้เป็นค่าลบ นั่นอธิบายว่าทำไมฉันเห็นความเหมือนโคไซน์ลบ ฉันคุ้นเคยกับแนวคิดของความเหมือนโคไซน์ของความถี่เวกเตอร์ซึ่งค่าถูก จำกัด อยู่ใน [0, 1] ฉันรู้สำหรับความจริงที่ว่าดอทโปรดัคและฟังก์ชันโคไซน์สามารถเป็นบวกหรือลบได้ขึ้นอยู่กับมุมระหว่างเวกเตอร์ แต่ฉันมีความเข้าใจยากมากและตีความความคล้ายคลึงเชิงลบโคไซน์นี้ ตัวอย่างเช่นถ้าฉันมีคู่ของคำที่ให้ความเหมือนกันของ -0.1 พวกเขาจะคล้ายกันน้อยกว่าคู่อื่นที่มีความคล้ายคลึงกันคือ 0.05? วิธีการเปรียบเทียบความคล้ายคลึงกันของ -0.9 ถึง 0.8? หรือฉันควรดูที่ค่าสัมบูรณ์ของความแตกต่างมุมน้อยที่สุดจาก ? ค่าสัมบูรณ์ของคะแนน?n πnπn\pi ขอบคุณมาก ๆ

4
เป็นไปได้หรือไม่ที่จะให้ภาพที่มีขนาดต่างกันเป็นข้อมูลเข้าสู่โครงข่ายประสาทเทียม?
เราสามารถให้ภาพที่มีขนาดตัวแปรเป็นอินพุตสำหรับเครือข่ายประสาทเทียมสำหรับการตรวจจับวัตถุได้หรือไม่? ถ้าเป็นไปได้เราจะทำอย่างไร แต่ถ้าเราพยายามที่จะครอบตัดภาพเราจะสูญเสียบางส่วนของภาพและถ้าเราพยายามที่จะปรับขนาดแล้วความคมชัดของภาพจะหายไป หมายความว่าการใช้คุณสมบัติเครือข่ายโดยธรรมชาติดีที่สุดถ้าความคมชัดของภาพเป็นประเด็นหลักในการพิจารณา?


4
ทำไมความเป็นอิสระหมายถึงความสัมพันธ์เป็นศูนย์?
ก่อนอื่นฉันไม่ได้ถามสิ่งนี้: ทำไมความสัมพันธ์แบบศูนย์ไม่มีนัยถึงความเป็นอิสระ? นี่คือที่อยู่(ค่อนข้างดี)ที่นี่: /math/444408/why-does-zero-correlation-not-imply-independence สิ่งที่ฉันถามอยู่ตรงข้าม ... บอกว่าตัวแปรสองตัวเป็นอิสระจากกัน พวกเขาไม่สามารถมีความสัมพันธ์กันเล็กน้อยโดยไม่ได้ตั้งใจหรือไม่? มันไม่ควรจะเป็น ... ความเป็นอิสระหมายถึงสหสัมพันธ์น้อยมาก?

4
บนกล่องจอร์จ Galit Shmueli และวิธีการทางวิทยาศาสตร์?
(คำถามนี้ดูเหมือนว่าจะเหมาะกว่าสำหรับปรัชญา SE ฉันหวังว่านักสถิติสามารถอธิบายความเข้าใจที่คลาดเคลื่อนเกี่ยวกับคำแถลงของ Box และ Shmueli ได้ดังนั้นฉันจึงโพสต์ไว้ที่นี่) George Box (จากชื่อเสียงของ ARIMA) กล่าวว่า: "ทุกรุ่นผิด แต่บางรุ่นก็มีประโยชน์" Galit Shmueli ในกระดาษชื่อดังของเธอ"เพื่ออธิบายหรือทำนาย" , (และอ้างอิงคนอื่นที่เห็นด้วยกับเธอ) ระบุว่า: การอธิบายและการทำนายไม่เหมือนกันและบางรุ่นทำหน้าที่อธิบายได้ดีถึงแม้ว่าพวกเขาจะทำงานได้ดีในการทำนาย ฉันรู้สึกว่าหลักการเหล่านี้ขัดแย้งกับสิ่งใด หากแบบจำลองไม่สามารถคาดเดาได้ดีจะเป็นประโยชน์หรือไม่ ที่สำคัญกว่านั้นถ้าแบบจำลองอธิบายได้ดี (แต่ไม่จำเป็นต้องคาดเดาได้ดี) มันจะต้องเป็นจริง (เช่นไม่ผิด) ไม่ทางใดก็ทางหนึ่ง แล้วตาข่ายกับกล่องของ "ทุกรุ่นผิด" อย่างไร ท้ายที่สุดถ้าแบบจำลองอธิบายได้ดี แต่ไม่คาดการณ์ได้ดีมันจะเป็นไปได้อย่างไรทางวิทยาศาสตร์? เกณฑ์การแบ่งเขตทางวิทยาศาสตร์ส่วนใหญ่ (การตรวจสอบยืนยันการปลอมแปลง ฯลฯ ) หมายถึงว่าคำสั่งทางวิทยาศาสตร์จะต้องมีอำนาจการทำนายหรือเรียกขาน: ทฤษฎีหรือรูปแบบที่ถูกต้องเฉพาะถ้ามันสามารถทดสอบเชิงประจักษ์ (หรือเท็จ) ซึ่งหมายความว่ามัน ต้องทำนายผลลัพธ์ในอนาคต คำถามของฉัน: คำแถลงของ Box และความคิดของ Shmueli ขัดแย้งหรือไม่หรือฉันขาดบางสิ่งบางอย่างเช่นแบบจำลองไม่มีพลังการทำนาย แต่ยังคงมีประโยชน์หรือไม่? หากคำแถลงของ …

3
สาเหตุที่กำหนดทางคณิตศาสตร์เป็นอย่างไร?
คำจำกัดความทางคณิตศาสตร์ของความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรสุ่มสองตัวคืออะไร ได้รับตัวอย่างจากการจัดจำหน่ายร่วมกันของสองตัวแปรสุ่มและเมื่อเราจะพูดทำให้เกิด ?XXXYYYXXXYYY สำหรับบริบทฉันกำลังอ่านบทความนี้เกี่ยวกับการค้นพบสาเหตุ

1
การเรียนรู้แบบมีผู้สอนเป็นส่วนหนึ่งของการเรียนรู้เสริมหรือไม่?
ดูเหมือนว่าคำจำกัดความของการเรียนรู้แบบมีผู้เรียนเป็นส่วนหนึ่งของการเรียนรู้การเสริมแรงโดยมีฟังก์ชั่นการให้รางวัลประเภทหนึ่งซึ่งอยู่บนพื้นฐานของข้อมูลที่ติดฉลาก (ตรงข้ามกับข้อมูลอื่น ๆ ในสภาพแวดล้อม) นี่เป็นภาพที่ถูกต้องหรือไม่?

3
มีสูตร“ มัธยฐาน” มากกว่าหนึ่งสูตรหรือไม่?
ในงานของฉันเมื่อบุคคลอ้างถึงค่า "หมายถึง" ของชุดข้อมูลพวกเขามักจะอ้างถึงค่าเฉลี่ยเลขคณิต (เช่น "เฉลี่ย" หรือ "คาดหวังค่า") ถ้าฉันให้ค่าเฉลี่ยทางเรขาคณิตคนอาจจะคิดว่าฉันกำลังหยามหรือไม่เป็นประโยชน์เนื่องจากคำจำกัดความของ "หมายถึง" เป็นที่รู้จักกันล่วงหน้า ฉันพยายามที่จะตรวจสอบว่ามีคำจำกัดความของ "ค่ามัธยฐาน" หลายชุดของข้อมูลหรือไม่ ตัวอย่างเช่นหนึ่งในคำจำกัดความที่จัดทำโดยเพื่อนร่วมงานสำหรับการค้นหาค่ามัธยฐานของชุดข้อมูลที่มีองค์ประกอบจำนวนคู่จะเป็น: อัลกอริทึม 'A' หารจำนวนขององค์ประกอบสองปัดเศษลง ค่านั้นคือดัชนีของค่ามัธยฐาน 5คือสำหรับชุดต่อไปนี้เฉลี่ยจะเป็น [4, 5, 6, 7] สิ่งนี้ดูเหมือนจะสมเหตุสมผลแม้ว่าลักษณะการปัดเศษลงจะดูเป็นเรื่องเล็กน้อย อัลกอริทึม 'B' ไม่ว่าในกรณีใดเพื่อนร่วมงานคนอื่นได้เสนออัลกอริทึมแยกต่างหากซึ่งอยู่ในหนังสือเรียนสถิติของเขา (ต้องได้รับชื่อและผู้แต่ง): หารจำนวนองค์ประกอบด้วย 2 และเก็บสำเนาของเลขจำนวนเต็มที่ปัดเศษขึ้นและปัดเศษลง ชื่อพวกเขาและn_lon_hi ใช้ค่าเฉลี่ยขององค์ประกอบที่และn_lon_hi (5+6)/2 = 5.5คือสำหรับชุดต่อไปนี้เฉลี่ยจะเป็น [4, 5, 6, 7] ดูเหมือนว่าผิด5.5ในกรณีนี้ค่ามัธยฐานในกรณีนี้จริง ๆ แล้วไม่ได้อยู่ในชุดข้อมูลดั้งเดิม เมื่อเราสลับอัลกอริทึม 'A' สำหรับ 'B' ในโค้ดทดสอบบางอันมันก็แย่มาก คำถาม มี …

1
มันหมายความว่า AUC เป็นกฎการให้คะแนนแบบครึ่งหรือไม่?
กฎการให้คะแนนที่เหมาะสมคือกฎที่ขยายให้ใหญ่ที่สุดโดยโมเดล 'ของจริง' และไม่อนุญาตให้ 'ป้องกันความเสี่ยง' หรือเล่นเกมในระบบ (จงใจรายงานผลลัพธ์ที่แตกต่างกันเช่นความเชื่อที่แท้จริงของแบบจำลองเพื่อปรับปรุงคะแนน) คะแนน Brier นั้นถูกต้องความแม่นยำ (สัดส่วนจำแนกอย่างถูกต้อง) นั้นไม่เหมาะสมและมักท้อ บางครั้งฉันเห็นว่า AUC เรียกว่าเกณฑ์การให้คะแนนแบบกึ่งที่ทำให้ไม่แม่นยำอย่างสมบูรณ์ แต่มีความอ่อนไหวน้อยกว่ากฎที่เหมาะสม (ตัวอย่างเช่นที่นี่/stats//a/90705/53084 ) กฎการให้คะแนนแบบกึ่งถูกต้องหมายความว่าอย่างไร มันกำหนดไว้ที่ไหนสักแห่ง?

2
รูปแบบการกระจายแบบใดที่ให้“ ความคาดหวังของพีทาโกรัส”?
ให้X∼ Dist ( θX)X~อ.(θX)X \sim \text{Dist}(\theta_X)และY∼ Dist ( θY)Y~อ.(θY)Y \sim \text{Dist}(\theta_Y)เป็นตัวแปรสุ่มแบบอิสระอย่างต่อเนื่องที่สร้างจากรูปแบบการกระจายที่ไม่ระบุรายละเอียดเดียวกัน แต่มีค่าเผื่อสำหรับค่าพารามิเตอร์ที่แตกต่างกัน ฉันสนใจที่จะหารูปแบบการแจกแจงพารามิเตอร์ซึ่งมีความน่าจะเป็นการสุ่มตัวอย่างต่อไปนี้สำหรับค่าพารามิเตอร์ที่อนุญาตทั้งหมด: P(X>Y|θX,θY)=θ2Xθ2X+θ2Y.P(X>Y|θX,θY)=θX2θX2+θY2.\mathbb{P}(X > Y| \theta_X, \theta_Y) = \frac{\theta_X^2}{\theta_X^2 + \theta_Y^2}. คำถามของฉัน:ใครสามารถบอกฉันแบบฟอร์มการกระจายอย่างต่อเนื่องซึ่งสิ่งนี้ถือ? มีเงื่อนไขทั่วไป (ไม่สำคัญ) ที่นำไปสู่สิ่งนี้หรือไม่? ความคิดเบื้องต้นของฉัน:หากคุณคูณพารามิเตอร์ทั้งสองด้วยค่าคงที่ที่ไม่เป็นศูนย์ใด ๆ ความน่าจะเป็นยังคงไม่เปลี่ยนแปลงดังนั้นจึงเหมาะสมที่จะเป็นพารามิเตอร์มาตราส่วนบางชนิดθθ\theta

4
สถิติแบบเบย์จัดการกับการไม่มีตัวตนอย่างไร
คำถามนี้ได้รับแรงบันดาลใจจากการโต้ตอบสองครั้งล่าสุดที่ฉันมีหนึ่งที่นี่ในประวัติย่อส่วนอีกเรื่องที่economics.se ที่นั่นผมได้โพสต์คำตอบไปที่รู้จักกันดี "ซองจดหมาย Paradox" (ใจคุณไม่เป็น"คำตอบที่ถูกต้อง" แต่เป็นคำตอบที่ไหลออกมาจากสมมติฐานที่เฉพาะเจาะจงเกี่ยวกับโครงสร้างของสถานการณ์) หลังจากนั้นสักครู่ผู้ใช้โพสต์ความคิดเห็นที่สำคัญและฉันมีส่วนร่วมในการสนทนาพยายามที่จะเข้าใจประเด็นของเขา มันก็เห็นได้ชัดว่าเขาคิดวิธีคชกรรมและเก็บไว้พูดคุยเกี่ยวกับไพรเออร์และอื่นแล้วมัน dawned กับฉันและผมพูดกับตัวเอง: "รอนาทีที่บอกอะไรเกี่ยวกับเรื่องใดก่อน?ในทางที่ผมได้สูตร ปัญหาไม่มีนักบวชอยู่ที่นี่พวกเขาแค่ไม่ป้อนรูปภาพและไม่จำเป็นต้อง " เมื่อเร็ว ๆ นี้ฉันเห็นคำตอบนี้ในประวัติย่อเกี่ยวกับความหมายของความเป็นอิสระทางสถิติ ฉันให้ความเห็นกับผู้เขียนว่าประโยคของเขา "... ถ้าเหตุการณ์มีความเป็นอิสระทางสถิติแล้ว (โดยคำจำกัดความ) เราไม่สามารถเรียนรู้เกี่ยวกับสิ่งหนึ่งจากการสังเกตอื่น ๆ " ผิดอย่างโจ๋งครึ่ม ในการแลกเปลี่ยนความคิดเห็นเขายังคงกลับไปที่ปัญหาของ (คำพูดของเขา) "การเรียนรู้" จะไม่หมายถึงการเปลี่ยนความเชื่อของเราเกี่ยวกับสิ่งที่อยู่บนพื้นฐานของการสังเกตของผู้อื่นหรือไม่ถ้าเป็นเช่นนั้นไม่เป็นอิสระ (นิยาม) แยกแยะเรื่องนี้? อีกครั้งเห็นได้ชัดว่าเขาคิดแบบเบย์และเขาคิดว่าตนเองชัดเจนว่าเราเริ่มต้นด้วยความเชื่อบางอย่าง (เช่นก่อนหน้า)แล้วปัญหาคือวิธีที่เราสามารถเปลี่ยน / อัปเดตพวกเขา แต่ความเชื่อครั้งแรกเกิดขึ้นได้อย่างไร? เนื่องจากวิทยาศาสตร์จะต้องสอดคล้องกับความเป็นจริงฉันทราบว่าสถานการณ์มีอยู่ว่ามนุษย์มีส่วนเกี่ยวข้องไม่มีนักบวช (ฉันมีสิ่งหนึ่งที่เดินเข้าสู่สถานการณ์โดยไม่เคยมีมาก่อน - และโปรดอย่าเถียงว่าฉันมีนักบวช แต่ฉัน เพียงแค่ไม่ได้ตระหนักถึงมันขอให้ตัวเองจิตปลอมที่นี่) เนื่องจากฉันเคยได้ยินคำว่า "นักบวชที่ไม่รู้เรื่อง" ฉันจึงแบ่งคำถามของฉันออกเป็นสองส่วนและฉันค่อนข้างมั่นใจว่าผู้ใช้ที่นี่ที่เข้าใจในทฤษฎี Bayesian รู้ว่าฉันกำลังจะถามอะไร: คำถามที่ 1: การไม่มีตัวตนที่เทียบเท่าก่อนหน้านี้ (ในแง่ทฤษฎีที่เข้มงวด) …

4
เป็นไปได้ไหมที่เวกเตอร์ 3 ตัวนั้นมีความสัมพันธ์เชิงลบแบบคู่ทั้งหมด
ให้เวกเตอร์สามตัว ,และเป็นไปได้หรือไม่ที่สหสัมพันธ์ระหว่างและ ,และและและนั้นเป็นลบทั้งหมด? นั่นเป็นไปได้ไหมaaabbbcccaaabbbaaacccbbbccc corr(a,b)&lt;0corr(a,c)&lt;0corr(b,c)&lt;0corr(a,b)&lt;0corr(a,c)&lt;0corr(b,c)&lt;0\begin{align} \text{corr}(a,b) < 0\\ \text{corr}(a,c) < 0 \\ \text{corr}(b,c) < 0\\ \end{align}

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.