คำถามติดแท็ก distance-covariance

2
เมื่อความแปรปรวนทางไกลมีความเหมาะสมน้อยกว่าความแปรปรวนเชิงเส้นตรงหรือไม่
ฉันได้รับการแนะนำเพียง (ราง) เพื่อBrownian / ระยะทางแปรปรวน ดูเหมือนว่ามีประโยชน์โดยเฉพาะอย่างยิ่งในสถานการณ์ที่ไม่ใช่เชิงเส้นเมื่อทำการทดสอบเพื่อการพึ่งพา แต่ดูเหมือนว่าจะไม่ได้ใช้บ่อยนักถึงแม้ว่าความแปรปรวนร่วม / ความสัมพันธ์มักใช้กับข้อมูลที่ไม่เป็นเชิงเส้น / ไม่เป็นระเบียบ ฉันคิดว่าอาจมีข้อเสียเปรียบในการแปรปรวนระยะทาง แล้วพวกมันคืออะไรและทำไมทุกคนไม่ใช้ความแปรปรวนแบบระยะทางเสมอ

2
ทำความเข้าใจเกี่ยวกับการคำนวณความสัมพันธ์ระยะทาง
เท่าที่ฉันเข้าใจความสัมพันธ์ของระยะทางเป็นวิธีที่มีประสิทธิภาพและเป็นสากลในการตรวจสอบว่ามีความสัมพันธ์ระหว่างตัวแปรตัวเลขสองตัวหรือไม่ ตัวอย่างเช่นหากเรามีชุดจำนวนคู่: (x1, y1) (x2, y2) ... (xn, yn) เราสามารถใช้ความสัมพันธ์ของระยะทางเพื่อตรวจสอบว่ามีความสัมพันธ์ใด ๆ (ไม่จำเป็นต้องเป็นเชิงเส้น) ระหว่างตัวแปรสองตัว ( xและy) ยิ่งกว่านั้นxและyสามารถเป็นเวกเตอร์ที่มีขนาดต่างกัน มันค่อนข้างง่ายในการคำนวณความสัมพันธ์ของระยะทาง ก่อนอื่นเราใช้xixผมx_iในการคำนวณระยะทางเมทริกซ์ จากนั้นเราจะคำนวณเมทริกซ์ระยะทางโดยใช้yผมyผมy_iฉัน เมทริกซ์ระยะทางทั้งสองจะมีขนาดเท่ากันเนื่องจากจำนวนxผมxผมx_iและYผมyผมy_iเท่ากัน (เพราะมาเป็นคู่) ตอนนี้เรามีระยะทางมากมายที่สามารถจับคู่ได้ ตัวอย่างเช่นองค์ประกอบ(2,3)จากเมทริกซ์ระยะทางแรกถูกจับคู่กับองค์ประกอบ(2,3)จากเมทริกซ์ระยะทางที่สอง ดังนั้นเรามีชุดของระยะทางคู่หนึ่งและเราสามารถใช้มันเพื่อคำนวณความสัมพันธ์ (ความสัมพันธ์ระหว่างระยะทาง) หากระยะทางสองประเภทนั้นมีความสัมพันธ์กันมากกว่าที่หมายความว่า close Xs มักจะหมายถึง close Ys ตัวอย่างเช่นถ้าใกล้เคียงกับx 13มากกว่านั่นหมายความว่าy 7น่าจะใกล้เคียงกับy 13x7x7x_7x13x13x_{13}Y7Y7y_7Y13Y13y_{13} 13ดังนั้นเราสามารถสรุปได้ว่า Xs และ Ys ขึ้นอยู่กับ ฟังดูสมเหตุสมผล แต่มีสองด้านที่ผมไม่เข้าใจ อันดับแรกเพื่อคำนวณความสัมพันธ์ของระยะทางเราไม่ได้ใช้เมทริกซ์ระยะทางสองตัวโดยตรง เราใช้กับพวกเขาสองขั้นตอนกลาง (เพื่อให้ผลรวมขององค์ประกอบทั้งหมดในแถวใด ๆ (หรือคอลัมน์) เท่ากับศูนย์) ฉันไม่เข้าใจว่าทำไมเราต้องทำ ตรรกะ …

1
ความสัมพันธ์ของระยะทางกับข้อมูลร่วมกัน
ฉันทำงานกับข้อมูลร่วมกันมาระยะหนึ่งแล้ว แต่ฉันพบว่ามีการวัดล่าสุดใน "โลกแห่งความสัมพันธ์" ที่สามารถใช้เพื่อวัดความเป็นอิสระของการกระจายตัวที่เรียกว่า "ระยะทางสหสัมพันธ์" (หรือเรียกอีกอย่างว่าความสัมพันธ์ Brownian): http://en.wikipedia.org/wiki/Brownian_covariance . ฉันตรวจสอบเอกสารที่มีการใช้มาตรการนี้ แต่ไม่พบการพาดพิงถึงข้อมูลร่วมกัน ดังนั้นคำถามของฉันคือ: พวกเขาแก้ปัญหาเดียวกันได้หรือไม่? ถ้าไม่ปัญหาต่างกันอย่างไร? และหากคำถามก่อนหน้านี้สามารถตอบคำถามในเชิงบวกข้อดีของการใช้อย่างใดอย่างหนึ่งคืออะไร

1
มีการอธิบายลักษณะเฉพาะของความสัมพันธ์ทางไกลหรือไม่?
ฉันเฝ้าดูหน้าวิกิพีเดียเพื่อหาความสัมพันธ์ทางไกลที่ซึ่งมันดูเหมือนว่าจะถูกกำหนดโดยวิธีการคำนวณ ในขณะที่ฉันจะทำการคำนวณที่ผมต่อสู้เพื่อให้ได้รับมาตรการความสัมพันธ์สิ่งที่ระยะทางและทำไมการคำนวณดูที่พวกเขาทำ มีลักษณะของการสัมพันธ์ทางไกลที่เข้าใจได้ง่ายขึ้น (หรือมากขึ้น) ที่จะช่วยให้ฉันเข้าใจว่ามันวัดได้อย่างไร? ฉันรู้ว่าการขอสัญชาติญาณนั้นค่อนข้างคลุมเครือ แต่ถ้าฉันรู้ว่าฉันต้องการสัญชาติญาณแบบใดฉันคงไม่ได้ถามในตอนแรก ฉันก็จะมีความสุขกับสัญชาตญาณเกี่ยวกับกรณีของความสัมพันธ์ระยะทางระหว่างตัวแปรสุ่มสองตัว (แม้ว่าความสัมพันธ์ของระยะทางจะถูกกำหนดระหว่างเวกเตอร์สุ่มสองตัว)
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.