คำถามติดแท็ก terminology

การใช้และความหมายของคำศัพท์ / แนวคิดทางเทคนิคที่เฉพาะเจาะจงในสถิติ

10
ทำไมการรวมตัวกันของตัวแปรสุ่มสองตัวจึงทำให้เกิดการโน้มน้าว?
เป็นเวลานานฉันไม่เข้าใจว่าทำไม "ผลรวม" ของตัวแปรสุ่มสองตัวคือการบิดของพวกเขาในขณะที่ผลรวมความหนาแน่นของฟังก์ชั่นการผสมของและคือf(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); ผลรวมเลขคณิตและไม่ใช่การแปลง วลีที่ถูกต้อง "ผลรวมของตัวแปรสุ่มสองตัว" ปรากฏใน google 146,000 ครั้งและเป็นรูปไข่ดังนี้ ถ้าใครคิดว่า RV ให้ผลเป็นค่าเดียวก็สามารถเพิ่มค่าเดียวให้กับค่า RV เดี่ยวอีกค่าหนึ่งซึ่งไม่มีส่วนเกี่ยวข้องกับการโน้มน้าวใจอย่างน้อยก็ไม่ใช่โดยตรงสิ่งที่เป็นผลรวมของตัวเลขสองจำนวน ผลลัพธ์ของสถิติใน RV นั้นเป็นชุดของค่าและดังนั้นวลีที่แน่นอนยิ่งกว่าจะเป็นอะไรบางอย่างเช่น "ชุดของผลรวมของคู่ของค่าของแต่ละบุคคลที่เชื่อมโยงกันจากสอง RV's คือความไม่ต่อเนื่องของพวกเขา" ... และสามารถประมาณโดย ความหนาแน่นของฟังก์ชั่นความหนาแน่นสอดคล้องกับ RV เหล่านั้น ภาษาที่เรียบง่ายยิ่งขึ้น: 2 RV's ofnnnตัวอย่างอยู่ในผลเวกเตอร์สองมิติ n ที่เพิ่มเป็นผลรวมเวกเตอร์ โปรดแสดงรายละเอียดว่าผลรวมของตัวแปรสุ่มสองตัวนั้นเป็นรูปแบบ convolution และผลรวมอย่างไร

2
การทำให้เป็นมาตรฐานของ Tikhonov เหมือนกับการถดถอยของสันเขาหรือไม่?
การทำให้เป็นมาตรฐาน Tikhonov และการถดถอยสันเป็นคำที่มักใช้ราวกับว่าพวกเขาเหมือนกัน เป็นไปได้หรือไม่ที่จะระบุอย่างชัดเจนว่าความแตกต่างคืออะไร?

5
ทำไมถึงมีการสะกดสองแบบของ "heteroskedastic" หรือ "heteroscedastic"?
ฉันมักจะเห็นทั้งการสะกดคำ "heteroskedastic" และ "heteroscedastic" และในทำนองเดียวกันสำหรับ "homoscedastic" และ "homoskedastic" ดูเหมือนว่าจะไม่มีความแตกต่างในความหมายระหว่าง "c" และ "k" หลากหลายรูปแบบเพียงความแตกต่างที่เกี่ยวข้องกับออโธกราฟกรีกนิรุกติศาสตร์ของคำ ต้นกำเนิดของการสะกดที่แตกต่างกันสองอย่างคืออะไร การใช้งานครั้งเดียวมีความธรรมดามากกว่าอีกการใช้งานหนึ่ง ๆ และพวกเขาสะท้อนให้เห็นถึงการเปลี่ยนแปลงระหว่างภูมิภาคหรือเขตข้อมูลการวิจัยหรือไม่มากกว่าการตั้งค่าที่เป็นทางการ ในขณะที่ภาษาอื่นมีนโยบายที่แตกต่างกันในการแปลภาษากรีกเป็นภาษาละติน: ฉันทราบว่าในภาษาฝรั่งเศสฉันคิดว่า "hétéroscédasticité" เสมอในขณะที่ภาษาเยอรมันจะเป็น "Heteroskedastizität" เสมอ ดังนั้นฉันจะไม่แปลกใจถ้าผู้เขียนที่มีภาษาอังกฤษเป็นภาษาที่สองอาจมีการตั้งค่าสำหรับการสะกดคำภาษาอังกฤษที่สอดคล้องกับภาษาแม่ของพวกเขา บางทีการทดสอบที่แท้จริงคือสิ่งที่นักสถิติชาวกรีกเรียกมันว่าเมื่อเขียนเป็นภาษาอังกฤษ!

5
ทำความเข้าใจกับหน่วย LSTM เทียบกับเซลล์
ฉันเรียน LSTM มาระยะหนึ่งแล้ว ฉันเข้าใจในระดับสูงว่าทุกอย่างทำงานอย่างไร อย่างไรก็ตามจะใช้พวกเขาโดยใช้ Tensorflow ฉันสังเกตเห็นว่าBasicLSTMCellต้องการพารามิเตอร์จำนวนหน่วย (เช่นnum_units) จากนี้คำอธิบายอย่างละเอียดมาก LSTMs ผมได้รวบรวมที่เดียวหน่วย LSTMเป็นหนึ่งดังต่อไปนี้ ซึ่งเป็นหน่วย GRU ฉันสันนิษฐานว่าพารามิเตอร์num_unitsของการBasicLSTMCellอ้างอิงถึงจำนวนเหล่านี้เราต้องการเชื่อมต่อซึ่งกันและกันในชั้น ที่ทิ้งคำถาม - "เซลล์" ในบริบทนี้คืออะไร? "เซลล์" เทียบเท่ากับเลเยอร์ในเครือข่ายประสาทส่งต่อปกติหรือไม่

7
ในการวิเคราะห์การถดถอยทำไมเราจึงเรียกตัวแปรอิสระว่า "อิสระ"
ฉันหมายถึงตัวแปรบางตัวนั้นมีความสัมพันธ์กันอย่างมาก เรานิยามว่ามันเป็นตัวแปรอิสระอย่างไร / ทำไม / ในบริบทใด

6
เหตุใดค่าที่คาดหมายจึงตั้งชื่อเช่นนั้น
ฉันเข้าใจว่าเราได้ 3.5 เป็นค่าที่คาดไว้สำหรับการรีดแม่พิมพ์ 6 ด้านที่ยุติธรรม แต่โดยสัญชาตญาณฉันสามารถคาดหวังให้แต่ละหน้ามีโอกาสเท่ากันที่ 1/6 ดังนั้นค่าที่คาดหวังของการรีดตายไม่ควรเป็นหนึ่งในจำนวนระหว่าง 1-6 ด้วยความน่าจะเป็นที่เท่ากันหรือ กล่าวอีกนัยหนึ่งเมื่อถามคำถามว่าอะไรคือค่าคาดหวังของการขว้างปา 6-fair ที่ยุติธรรม? ใครควรตอบว่า 'โอ้มันอาจเป็นอะไรก็ได้ระหว่าง 1-6 โดยมีโอกาสเท่ากัน' แทนที่จะเป็น 3.5 ในสังหรณ์โลกแห่งความเป็นจริงมีใครสามารถอธิบายได้ว่าคุณค่าที่ฉันควรคาดหวังในการขว้างปา 3.5 นั้นมีค่าอย่างไร? อีกครั้งฉันไม่ต้องการสูตรหรือแหล่งที่มาสำหรับความคาดหวัง

7
การอนุมานกับการประมาณค่า?
อะไรคือความแตกต่างระหว่าง "การอนุมาน" และ "การประมาณค่า" ภายใต้บริบทของการเรียนรู้ของเครื่อง ? ในฐานะมือใหม่ฉันรู้สึกว่าเราอนุมานตัวแปรแบบสุ่มและประเมินพารามิเตอร์โมเดล ความเข้าใจนี้ถูกต้องหรือไม่ ถ้าไม่สิ่งที่แตกต่างกันคืออะไรและเมื่อใดที่ฉันควรใช้ นอกจากนี้คำพ้องความหมายของคำว่า "เรียนรู้" คืออะไร?

9
ความแตกต่างระหว่างตัวประมาณและสถิติคืออะไร?
ฉันได้เรียนรู้ว่าสถิติเป็นคุณลักษณะที่คุณสามารถหาได้จากกลุ่มตัวอย่างจากการทดลองขนาดที่มีขนาดเดียวกันจำนวนมากการคำนวณคุณลักษณะนี้สำหรับพวกเขาทั้งหมดและพล็อตไฟล์ pdf เราได้การกระจายของแอตทริบิวต์ที่เกี่ยวข้องหรือการกระจายของสถิติที่เกี่ยวข้อง ฉันยังได้ยินด้วยว่าสถิติถูกสร้างขึ้นเพื่อเป็นตัวประมาณสองแนวคิดนี้แตกต่างกันอย่างไร

2
คำที่ไม่อิ่มตัวเชิงเส้นที่มีความหมายถึงอะไร?
ฉันอ่านเอกสารการจำแนกประเภทของ ImageNet ด้วย Deep Convolutional Neural Networksและในส่วนที่ 3 พวกเขาอธิบายสถาปัตยกรรมของโครงข่ายประสาทเทียมของพวกเขาพวกเขาอธิบายว่าพวกเขาต้องการใช้อย่างไร: ไม่ใช่พอดิบพอดีไม่เป็นเชิงเส้นf(x)=max(0,x).f(x)=max(0,x).f(x) = max(0, x). เพราะมันเร็วกว่าในการฝึก ในกระดาษพวกนั้นดูเหมือนว่าจะหมายถึง saturating nonlinearities เป็นฟังก์ชันดั้งเดิมที่ใช้ใน CNNs, sigmoid และฟังก์ชันไฮเพอร์โบลิกแทนเจนต์ (เช่นและเป็น saturating)f(x)=tanh(x)f(x)=tanh(x)f(x) = tanh(x)f(x)=11+e−x=(1+e−x)−1f(x)=11+e−x=(1+e−x)−1f(x) = \frac{1}{1 + e^{-x}} = (1 + e^{-x})^{-1} ทำไมพวกเขาอ้างถึงฟังก์ชั่นเหล่านี้ว่า "saturating" หรือ "non-saturating"? ฟังก์ชันเหล่านี้มีความหมายว่าอะไร "saturating" หรือ "non-saturating"? คำเหล่านั้นมีความหมายอย่างไรในบริบทของโครงข่ายประสาทเทียม พวกเขาใช้ในด้านอื่น ๆ ของการเรียนรู้ของเครื่อง (และสถิติ) หรือไม่?

4
การประมาณค่าโวลต์การประมาณค่า
อะไรคือความแตกต่างระหว่างการประมาณและการประมาณและวิธีที่แม่นยำที่สุดในการใช้คำเหล่านี้คืออะไร? ตัวอย่างเช่นฉันได้เห็นคำสั่งในกระดาษโดยใช้การแก้ไขเป็น: "ขั้นตอน interpolates รูปร่างของฟังก์ชั่นโดยประมาณระหว่างจุดถังขยะ" ประโยคที่ใช้ทั้งการคาดการณ์และการแก้ไขคือตัวอย่างเช่น: ขั้นตอนก่อนหน้านี้ที่เราประมาณค่าฟังก์ชันสอดแทรกโดยใช้วิธีเคอร์เนลไปทางด้านซ้ายและด้านขวาของอุณหภูมิ ใครสามารถให้วิธีที่ชัดเจนและง่ายต่อการแยกแยะพวกเขาและแนะนำวิธีการใช้คำเหล่านี้อย่างถูกต้องด้วยตัวอย่าง?

3
นานาคืออะไร?
ในเทคนิคการลดขนาดเช่นการวิเคราะห์องค์ประกอบหลัก LDA ฯลฯ มักใช้คำที่หลากหลาย นานาในระยะที่ไม่ใช่ด้านเทคนิคคืออะไร? หากจุดเป็นของทรงกลมที่มีมิติที่ฉันต้องการลดและหากมีจุดรบกวนและและไม่เกี่ยวข้องกันแล้วจุดที่แท้จริงจะถูกแยกออกจากกันเนื่องจากเสียงรบกวน ดังนั้นจึงจำเป็นต้องมีการกรองสัญญาณรบกวน ดังนั้นการลดมิติจะได้รับการดำเนินการเกี่ยวกับ y ที่ ดังนั้นและเป็นของแมนิโฟลด์ที่ต่างกันหรือไม่?y x z = x + y x yxxxyyyxxxyyyxxxz=x+yz=x+yz = x+yxxxyyy ฉันกำลังทำงานกับข้อมูลจุดเมฆที่มักใช้ในการมองเห็นหุ่นยนต์ เมฆจุดนั้นเสียงดังเนื่องจากเสียงรบกวนในการได้มาและฉันต้องลดเสียงก่อนที่จะลดขนาด มิฉะนั้นฉันจะได้รับการลดขนาดที่ไม่ถูกต้อง ดังนั้นนานาคืออะไรที่นี่และเสียงรบกวนเป็นส่วนหนึ่งของ manifold เดียวกันกับที่เป็นเจ้าของ?xxx

5
การวัด "ระยะทาง" ระหว่างการแจกแจงหลายตัวแปรสองค่า
ฉันกำลังมองหาคำศัพท์ที่ดีเพื่ออธิบายสิ่งที่ฉันพยายามทำเพื่อให้ง่ายต่อการค้นหาแหล่งข้อมูล ดังนั้นบอกว่าฉันมีสองกลุ่มของจุด A และ B แต่ละคนที่เกี่ยวข้องกับสองค่า X และ Y และฉันต้องการวัด "ระยะทาง" ระหว่าง A และ B - นั่นคือโอกาสที่พวกเขาถูกสุ่มตัวอย่างจากการกระจายเดียวกัน (ฉันสามารถสันนิษฐานได้ว่าการแจกแจงเป็นเรื่องปกติ) ตัวอย่างเช่นถ้า X และ Y มีความสัมพันธ์ใน A แต่ไม่ใช่ใน B การแจกแจงจะแตกต่างกัน โดยสังหรณ์ใจฉันจะได้เมทริกซ์ความแปรปรวนร่วมของ A แล้วดูว่าแต่ละจุดใน B น่าจะพอดีกับที่นั่นและในทางกลับกัน (อาจใช้ Someting เหมือนระยะทาง Mahalanobis) แต่นั่นเป็นบิต "ad-hoc" และอาจมีวิธีการอธิบายที่เข้มงวดกว่านี้ (แน่นอนในทางปฏิบัติฉันมีชุดข้อมูลมากกว่าสองชุดที่มีตัวแปรมากกว่าสองตัว - ฉันพยายามระบุว่าชุดข้อมูลชุดใดของฉัน เป็นค่าผิดปกติ) ขอบคุณ!

6
ในแง่ของคนธรรมดาอะไรคือความแตกต่างระหว่างแบบจำลองและการแจกแจง?
คำตอบ (คำจำกัดความ) ที่กำหนดไว้ใน Wikipedia นั้นค่อนข้างเป็นความลับเล็กน้อยสำหรับผู้ที่ไม่คุ้นเคยกับคณิตศาสตร์ / สถิติที่สูงขึ้น ในแง่คณิตศาสตร์แบบจำลองทางสถิติมักจะคิดว่าเป็นคู่ ( ) โดยที่คือชุดของการสังเกตที่เป็นไปได้เช่นพื้นที่ตัวอย่างและคือชุดของการแจกแจงความน่าจะเป็น ในSS,PS,PS, \mathcal{P}SSSPP\mathcal{P}SSS ในความน่าจะเป็นและสถิติการกระจายความน่าจะเป็นจะกำหนดความน่าจะเป็นให้แต่ละชุดย่อยที่วัดได้ของผลลัพธ์ที่เป็นไปได้ของการทดลองแบบสุ่มการสำรวจหรือขั้นตอนของการอนุมานทางสถิติ พบตัวอย่างที่มีพื้นที่ตัวอย่างไม่ใช่ตัวเลขซึ่งการแจกแจงจะเป็นการแจกแจงเชิงหมวดหมู่ ฉันเป็นนักเรียนมัธยมปลายที่สนใจงานด้านนี้มากเป็นงานอดิเรกและกำลังดิ้นรนกับความแตกต่างระหว่างสิ่งที่เป็นstatistical modelและprobability distribution ความเข้าใจที่เป็นอยู่ในปัจจุบันและพื้นฐานมากของฉันคือ: ตัวแบบเชิงสถิติคือความพยายามทางคณิตศาสตร์เพื่อประมาณการกระจายตัวที่วัด การแจกแจงความน่าจะเป็นคำอธิบายที่วัดได้จากการทดสอบที่กำหนดความน่าจะเป็นให้กับผลลัพธ์ที่เป็นไปได้ของเหตุการณ์สุ่ม ความสับสนจะเพิ่มขึ้นอีกโดยแนวโน้มในวรรณคดีเพื่อดูคำว่า "การกระจาย" และ "แบบจำลอง" ใช้แทนกันได้ - หรืออย่างน้อยในสถานการณ์ที่คล้ายกันมาก (เช่นการแจกแจงทวินามเทียบกับแบบจำลองทวินาม) ใครบางคนสามารถยืนยัน / แก้ไขคำจำกัดความของฉันและอาจเสนอวิธีการที่เป็นทางการมากขึ้น

3
ที่มาของคำว่า "การทำให้เป็นมาตรฐาน"
เมื่อฉันแนะนำแนวคิดให้กับนักเรียนของฉันฉันมักจะพบว่ามันสนุกที่จะบอกพวกเขาว่าคำศัพท์มาจากที่ไหน (ตัวอย่างเช่น "การถดถอย" เป็นคำที่มีต้นกำเนิดที่น่าสนใจ) ฉันไม่สามารถเปลี่ยนประวัติ / พื้นหลังของคำว่า "การทำให้เป็นมาตรฐาน" ในการเรียนรู้ทางสถิติ / เครื่อง ดังนั้นสิ่งที่เป็นที่มาของคำว่ากู ?

6
'ไม่มีเส้นตรงสูง' หมายถึงอะไร
ฉันมักจะอ่านเกี่ยวกับฟังก์ชั่นที่ว่า ในความเข้าใจของฉันมี "เส้นตรง" และ "ไม่ใช่เชิงเส้น" ดังนั้นสิ่งนี้ 'สูง' เกี่ยวกับอะไร มีความแตกต่างอย่างเป็นทางการจากไม่ใช่เชิงเส้นหรือไม่? มันถูกกำหนดอย่างไร?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.