คำถามติดแท็ก terminology

การใช้และความหมายของคำศัพท์ / แนวคิดทางเทคนิคที่เฉพาะเจาะจงในสถิติ

1
อะไรคือความแตกต่างระหว่างการเรียนรู้ที่หลากหลายและการลดมิติที่ไม่ใช่เชิงเส้น?
อะไรคือความแตกต่างระหว่างการเรียนรู้ที่หลากหลายและการลดมิติที่ไม่ใช่เชิงเส้น ? ฉันได้เห็นคำสองคำนี้ถูกใช้แทนกันได้ ตัวอย่างเช่น: http://www.cs.cornell.edu/~kilian/research/manifold/manifold.html : การเรียนรู้ Manifold (มักเรียกว่าการลดมิติที่ไม่เป็นเชิงเส้น) แสวงหาเป้าหมายเพื่อฝังข้อมูลที่เดิมอยู่ในพื้นที่มิติสูงในพื้นที่มิติต่ำกว่าในขณะที่รักษาคุณสมบัติของลักษณะ http://www.stat.washington.edu/courses/stat539/spring14/Resources/tutorial_nonlin-dim-red.pdf : ในบทช่วยสอนนี้ 'การเรียนรู้ที่หลากหลาย' และ 'การลดมิติ' ที่ใช้แทนกันได้ https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3337666/ : วิธีการลดขนาดเป็นคลาสของอัลกอริทึมที่ใช้ทางคณิตศาสตร์ที่กำหนดไว้สำหรับการสุ่มตัวอย่างทางสถิติของคลาสหลายมิติเพื่อสร้างกฎการเลือกปฏิบัติที่รับประกันความถูกต้องทางสถิติ อย่างไรก็ตามhttp://scikit-learn.org/stable/modules/manifold.htmlมีความเหมาะสมยิ่งขึ้น: การเรียนรู้ที่หลากหลายเป็นวิธีการลดมิติที่ไม่เป็นเชิงเส้น หนึ่งความแตกต่างครั้งแรกที่ฉันสามารถดูว่าท่อสามารถเป็นเชิงเส้นหนึ่งจึงควรเปรียบเทียบที่ไม่ใช่เชิงเส้นการเรียนรู้ต่าง ๆ นานาและการลดมิติที่ไม่ใช่เชิงเส้น

1
“ การสูญเสียบันทึก” หมายถึงการสูญเสียลอการิทึมหรือการสูญเสียโลจิสติกส์หรือไม่?
ฉันรู้ว่าฉันเห็นมันทั้งสองวิธีดังนั้นจึงมีความแตกต่างระหว่างทั้งสองและที่หนึ่งที่ถูกเรียกโดยทั่วไปมากกว่า?

1
ธรรมดาในช่องสี่เหลี่ยมน้อยที่สุดคืออะไร?
เมื่อเร็ว ๆ นี้เพื่อนของฉันคนหนึ่งถามว่าอะไรที่ธรรมดามาก ๆ ดูเหมือนว่าเราจะไม่ได้อยู่ที่ใดในการสนทนา เราทั้งสองตกลงกันว่า OLS เป็นกรณีพิเศษของโมเดลเชิงเส้นมีประโยชน์หลายอย่างรู้กันดีและเป็นกรณีพิเศษของรุ่นอื่น ๆ แต่ทั้งหมดนี้จริงเหรอ? ดังนั้นฉันต้องการทราบ: ชื่อมาจากไหนจริงๆ ใครเป็นคนแรกที่ใช้ชื่อ?

1
พื้นที่ข้อมูลพื้นที่ผันแปรพื้นที่สังเกตพื้นที่จำลอง (เช่นในการถดถอยเชิงเส้น)
สมมติว่าเรามี data matrixซึ่งก็คือ -by-และ label vectorซึ่งก็คือ -by-one ที่นี่แต่ละแถวของเมทริกซ์คือการสังเกตและแต่ละคอลัมน์สอดคล้องกับมิติ / ตัวแปร (สมมติ )XX\mathbf{X}nnnpppYYYnnnn>pn>pn>p แล้วสิ่งที่ไม่data space, variable space, observation space, model spaceหมายความว่าอย่างไร พื้นที่ที่ถูกขยายโดยเวกเตอร์คอลัมน์, ช่องว่าง(ลดลง) -D เนื่องจากมันมีพิกัดในขณะที่อยู่ในอันดับซึ่งเรียกว่าพื้นที่ว่างเนื่องจากมันถูกขยายโดยตัวแปร-เวกเตอร์? หรือเรียกว่าพื้นที่สังเกตการณ์เนื่องจากแต่ละมิติ / พิกัดสอดคล้องกับการสังเกต?nnnnnnppp แล้วเวกเตอร์แถวที่ถูกขยายออกมาล่ะ?

2
สาขาวิทยาศาสตร์ใดที่ศึกษาว่าผู้คนตีความข้อมูลสรุปเชิงปริมาณและการสร้างภาพข้อมูลได้อย่างไร
มีแหล่งข้อมูลที่รู้จักกันดีมากมายซึ่งให้คำแนะนำเกี่ยวกับการสร้างภาพข้อมูล (เช่น Tufte, Stephen Few และ al , Nathan Yau .) แต่สำหรับสาขาใดที่เราอาจหันไปหาคำตอบของคำถามเช่นนี้ การวิจารณ์แผนภูมิวงกลมเกี่ยวข้องกับการปฏิบัติจริงหรือไม่? คนที่ตีความความยาวสเกลเชิงเส้นได้ดีกว่าความยาวส่วนโค้งมากหรือไม่? ว่าฉันสร้างสรุปดัชนีของชุดของตัวแปรพื้นฐานและอธิบายให้ผู้ชมทั่วไปทราบว่าสหรัฐอเมริกามีค่า 100 ในปี 2010 และ 110 ในปี 2015 คนส่วนใหญ่จะตีความตัวเลขเหล่านี้ได้อย่างไร มีนิสัยทางความคิดตามธรรมชาติที่ฉันควรพิจารณาเมื่อฉันนำเสนอตัวชี้วัดนี้เพื่อยกระดับคำอธิบายที่ดีขึ้นหรือเพื่อป้องกันการตีความที่ผิด? กล่าวอีกนัยหนึ่งว่าเขตข้อมูลทางวิทยาศาสตร์ใดที่สามารถนำเสนอข้อมูลเชิงปริมาณเพื่อค้นหาหลักการที่ชัดเจนและผ่านการทดสอบซึ่งช่วยในการจัดเรียงภาพข้อมูลและคำแนะนำการออกแบบที่มีอยู่มากมายในปัจจุบัน จุดมุ่งหมายไม่ใช่เพื่อหาคำแนะนำความคิดหรือฉันทามติในปัจจุบันเกี่ยวกับวิธีที่ดีที่สุดในการมองเห็นข้อมูลหรือเข้าหาปัญหาการสร้างภาพข้อมูลใหม่ แต่เพื่อเรียนรู้ที่จะมองหาวิทยาศาสตร์ของวิธีการที่คนตีความข้อมูลเชิงปริมาณและ / หรือภาพ (เครดิตพิเศษสำหรับการอ้างอิงวารสารการประชุมและนักวิชาการของสาขา)

1
อะไรคือความแตกต่างระหว่าง "การทดสอบสมมติฐานทางสถิติที่ไม่มีสมมติฐาน" และแบบทดสอบอื่น ๆ
หัวข้อร้อนแรงล่าสุดของการอภิปรายเกี่ยวข้องกับวารสารห้ามการใช้ "ขั้นตอนการทดสอบทางสถิติสมมติฐานว่าง (NHSTPs)" จากบทความที่ส่งไปยังวารสาร ฉันเห็นคำนี้ที่นักเขียนบางคนใช้ แต่ฉันไม่เข้าใจว่าพวกเขากำลังพยายามสร้างความแตกต่างอะไร NHSTP นั้นแตกต่างจาก "การทดสอบสมมติฐาน" หรือ "การทดสอบนัยสำคัญ" หรือไม่?

1
มันยุติธรรมแค่ไหนที่จะใช้คำว่า "ทำนาย" สำหรับการถดถอย (โลจิสติก)?
ความเข้าใจของฉันคือว่าแม้การถดถอยไม่ได้ก่อให้เกิดเวรกรรม มันสามารถให้ความสัมพันธ์ระหว่างตัวแปร y และตัวแปร x และทิศทางที่เป็นไปได้ ฉันถูกไหม? ฉันมักพบวลีที่คล้ายกับ "x ทำนาย y" แม้ในตำราเรียนส่วนใหญ่และในหน้าหลักสูตรออนไลน์ต่างๆ และคุณมักจะเรียก regressors เป็นตัวทำนายและ y เป็นคำตอบ มันยุติธรรมแค่ไหนที่จะใช้กับการถดถอยเชิงเส้น? วิธีการเกี่ยวกับการถดถอยโลจิสติก? (ถ้าฉันมีเกณฑ์ t ซึ่งฉันสามารถเปรียบเทียบความน่าจะเป็นได้หรือไม่)

3
RMSE คืออะไรที่ทำให้เป็นมาตรฐานด้วยค่าเฉลี่ยที่สังเกตได้ที่เรียกว่า
ฉันใช้Root Mean Squared Error(RMSE) เพื่อวัดความแม่นยำของค่าที่ทำนายโดยใช้แบบจำลอง ฉันเข้าใจว่าค่าที่ส่งคืนใช้หน่วยวัดของฉัน (แทนที่จะเป็นเปอร์เซ็นต์) อย่างไรก็ตามฉันต้องการเสนอราคาเป็นเปอร์เซ็นต์ วิธีการที่ฉันใช้คือการทำให้RMSEค่าเฉลี่ยของการสังเกตของฉันเป็นมาตรฐาน มีคำศัพท์RMSE/meanหรือไม่?

2
การวิเคราะห์ข้อมูลภาษาฝรั่งเศสคืออะไร
วิธีการทางสถิติบางอย่าง - ฉันจำไม่ได้ว่ามันเป็นการวิเคราะห์องค์ประกอบหลักหรืออะไรทำนองนั้น - บางครั้งเรียกว่า "การวิเคราะห์ข้อมูลภาษาฝรั่งเศส" มันคืออะไรกันแน่? และบางคนบอกว่าชื่อนี้เป็นเรื่องน่าขันจริงหรือไม่และทำไม?

1
วิธีกำหนด“ ตัวอย่าง” คืออะไร?
หากฉันให้คุณสามตัวเลขที่เป็นอิสระและเหมือนกันจากการแจกแจงแบบปกติมาตรฐานจากนั้นฉันจะให้คุณสามตัวอย่างหรือหนึ่งตัวอย่าง? หากคำตอบคือตัวอย่างหนึ่งก็มีชื่อสั้น ๆ สำหรับสิ่งที่ฉันให้คุณสามข้อ?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.