คำถามติดแท็ก independence

เหตุการณ์ (หรือตัวแปรสุ่ม) มีความเป็นอิสระเมื่อข้อมูลบางอย่างไม่บอกคุณเกี่ยวกับความน่าจะเป็นของการเกิด (/ การกระจาย) ของผู้อื่น โปรดอย่าใช้แท็กนี้สำหรับการใช้ตัวแปรอิสระ [ทำนาย] แทน

2
ความขัดแย้งของข้อมูล iid (อย่างน้อยสำหรับฉัน)
เท่าที่รวมของฉัน (และหายาก) ความรู้เกี่ยวกับใบอนุญาตสถิติผมเข้าใจว่าถ้าX1,X2,...,XnX1,X2,...,XnX_1, X_2,..., X_nเป็นตัวแปรสุ่มของ iid จากนั้นเมื่อคำเหล่านี้แสดงถึงความเป็นอิสระและการกระจายตัวที่เหมือนกัน ความกังวลของฉันที่นี่เป็นทรัพย์สินเดิมของตัวอย่าง iid ซึ่งอ่าน: p(Xn|Xi1,Xi2,...,Xik)=p(Xn),พี(Xn|Xผม1,Xผม2,...,Xผมk)=พี(Xn),p(X_{n}|X_{i_1},X_{i_2},...,X_{i_k}) = p(X_{n}), สำหรับคอลเลกชันใด ๆ ที่แตกต่างกัน 's เซนต์&lt;nijiji_j1≤ij&lt;n1≤ij&lt;n1 \leq i_j < n อย่างไรก็ตามมีใครรู้ว่าการรวมกลุ่มตัวอย่างอิสระของการแจกแจงแบบเดียวกันให้ข้อมูลเกี่ยวกับโครงสร้างการกระจายและเป็นผลเกี่ยวกับในกรณีข้างต้นดังนั้นจึงไม่ควรเป็นกรณีที่: XnXnX_np(Xn|Xi1,Xi2,...,Xik)=p(Xn).p(Xn|Xi1,Xi2,...,Xik)=p(Xn).p(X_{n}|X_{i_1},X_{i_2},...,X_{i_k}) = p(X_{n}). ฉันรู้ว่าฉันตกเป็นเหยื่อของการเข้าใจผิด แต่ฉันไม่รู้ว่าทำไม โปรดช่วยฉันออกจากนี้

2
เทคนิคการเพิ่มข้อมูลสำหรับชุดข้อมูลทั่วไป?
ในหลาย ๆ แอปพลิเคชันการเรียนรู้ของเครื่องวิธีการเสริมข้อมูลที่เรียกว่าได้อนุญาตให้สร้างแบบจำลองที่ดีกว่า ตัวอย่างเช่นสมมติชุดฝึกสุนัขและแมวจำนวนภาพ โดยการหมุน, การทำมิเรอร์, การปรับคอนทราสต์ ฯลฯ เป็นไปได้ที่จะสร้างภาพเพิ่มเติมจากภาพต้นฉบับ100100100 ในกรณีของภาพการเพิ่มข้อมูลค่อนข้างตรงไปตรงมา อย่างไรก็ตามสมมติว่ามีตัวอย่างชุดฝึกอบรมจำนวนตัวอย่างและตัวแปรต่อเนื่องสองสามร้อยตัวที่เป็นตัวแทนของสิ่งต่าง ๆ การเพิ่มข้อมูลดูเหมือนจะไม่ง่ายอีกต่อไป จะทำอะไรได้บ้างในกรณีเช่นนี้?100100100

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
มีใครแก้ไข PTLOS แบบฝึกหัด 4.1 ได้บ้างไหม?
นี้การออกกำลังกายที่ได้รับในทฤษฎีความน่าจะเป็น: ตรรกะของวิทยาศาสตร์โดยเอ็ดวินเจย์นส์, ปี 2003 มีวิธีการแก้ปัญหาบางส่วนเป็นที่นี่ ฉันได้หาทางแก้ปัญหาบางส่วนที่กว้างขึ้นและสงสัยว่ามีคนอื่นแก้ไขมันได้ไหม ฉันจะรอสักครู่ก่อนโพสต์คำตอบของฉันเพื่อให้ผู้อื่นได้ไป เอาล่ะสมมติว่าเรามีnnnพิเศษร่วมกันและสมมติฐานหมดจดแสดงโดยHi(i=1,…,n)Hi(i=1,…,n)H_i \;\;(i=1,\dots,n) ) ต่อไปสมมติว่าเรามีชุดข้อมูลmmmแสดงโดยDj(j=1,…,m)Dj(j=1,…,m)D_j \;\;(j=1,\dots,m) ) อัตราส่วนความน่าจะเป็นสำหรับข้อสมมติฐานที่ i ถูกกำหนดโดย: LR(Hi)=P(D1D2…,Dm|Hi)P(D1D2…,Dm|H¯¯¯¯¯i)LR(Hi)=P(D1D2…,Dm|Hi)P(D1D2…,Dm|H¯i)LR(H_{i})=\frac{P(D_{1}D_{2}\dots,D_{m}|H_{i})}{P(D_{1}D_{2}\dots,D_{m}|\overline{H}_{i})} โปรดทราบว่าสิ่งเหล่านี้เป็นความน่าจะเป็นตามเงื่อนไข ตอนนี้สมมติว่าได้รับ ith สมมติฐานเมตรชุดข้อมูลมีความเป็นอิสระเพื่อให้เรามี:HiHiH_{i}mmm P(D1D2…,Dm|Hi)=∏j=1mP(Dj|Hi)(i=1,…,n)Condition 1P(D1D2…,Dm|Hi)=∏j=1mP(Dj|Hi)(i=1,…,n)Condition 1P(D_{1}D_{2}\dots,D_{m}|H_{i})=\prod_{j=1}^{m}P(D_{j}|H_{i}) \;\;\;\; (i=1,\dots,n)\;\;\;\text{Condition 1} ตอนนี้มันจะค่อนข้างสะดวกถ้าตัวหารยังรวมอยู่ในสถานการณ์นี้ด้วยดังนั้นเราจึงมี: P(D1D2…,Dm|H¯¯¯¯¯i)=∏j=1mP(Dj|H¯¯¯¯¯i)(i=1,…,n)Condition 2P(D1D2…,Dm|H¯i)=∏j=1mP(Dj|H¯i)(i=1,…,n)Condition 2P(D_{1}D_{2}\dots,D_{m}|\overline{H}_{i})=\prod_{j=1}^{m}P(D_{j}|\overline{H}_{i}) \;\;\;\; (i=1,\dots,n)\;\;\;\text{Condition 2} สำหรับในกรณีนี้อัตราส่วนความน่าจะเป็นแยกเป็นผลิตภัณฑ์ที่มีขนาดเล็กลงสำหรับแต่ละชุดข้อมูลดังนั้นเราจึงมี: LR(Hi)=∏j=1mP(Dj|Hi)P(Dj|H¯¯¯¯¯i)LR(Hi)=∏j=1mP(Dj|Hi)P(Dj|H¯i)LR(H_i)=\prod_{j=1}^{m}\frac{P(D_{j}|H_{i})}{P(D_{j}|\overline{H}_{i})} ดังนั้นในกรณีนี้แต่ละชุดข้อมูล "จะออกเสียงลงคะแนนสำหรับHiHiH_i " หรือ "โหวตกับHiHiH_i " เป็นอิสระจากชุดข้อมูลอื่น ๆ แบบฝึกหัดคือการพิสูจน์ว่าถ้าn&gt;2n&gt;2n>2 (มากกว่าสองข้อสมมุติ) ไม่มีวิธีที่ไม่น่าสนใจเช่นนี้ที่แฟคตอริ่งสามารถเกิดขึ้นได้ นั่นคือถ้าคุณสมมติว่าเงื่อนไข 1 และเงื่อนไข …

4
ด้วยข้อมูลหมวดหมู่จะมีกลุ่มที่ไม่มีตัวแปรที่เกี่ยวข้องหรือไม่
เมื่อพยายามอธิบายการวิเคราะห์กลุ่มมันเป็นเรื่องปกติที่คนจะเข้าใจผิดเกี่ยวกับกระบวนการที่เกี่ยวข้องกับว่าตัวแปรมีความสัมพันธ์กันหรือไม่ วิธีหนึ่งที่จะทำให้ผู้คนสับสนได้ก็คือเรื่องแบบนี้: สิ่งนี้แสดงความแตกต่างอย่างชัดเจนระหว่างคำถามที่ว่ามีกลุ่มและคำถามที่เกี่ยวข้องกับตัวแปรหรือไม่ อย่างไรก็ตามนี่แสดงให้เห็นถึงความแตกต่างสำหรับข้อมูลต่อเนื่องเท่านั้น ฉันมีปัญหาในการคิดแบบอะนาล็อกกับข้อมูลที่เป็นหมวดหมู่: ID property.A property.B 1 yes yes 2 yes yes 3 yes yes 4 yes yes 5 no no 6 no no 7 no no 8 no no เราจะเห็นได้ว่ามีกลุ่มชัดเจนสองกลุ่มคือคนที่มีทั้งคุณสมบัติ A และ B และกลุ่มที่ไม่มี อย่างไรก็ตามถ้าเราดูตัวแปร (เช่นด้วยการทดสอบไคสแควร์) พวกมันจะเกี่ยวข้องกันอย่างชัดเจน: tab # B # A yes no # yes 4 …

1
ความหมายภาษาธรรมดาของการทดสอบแบบ "พึ่งพา" และ "อิสระ" ในวรรณคดีเปรียบเทียบหลายรายการ?
ในทั้งวรรณกรรมอัตราข้อผิดพลาดครอบครัว (FWER) และอัตราการค้นพบที่ผิดพลาด (FDR), วิธีการเฉพาะในการควบคุม FWER หรือ FDR กล่าวว่ามีความเหมาะสมกับการทดสอบขึ้นอยู่กับหรืออิสระ ตัวอย่างเช่นในปี 1979 บทความ "ขั้นตอนการทดสอบการปฏิเสธหลายครั้งอย่างง่าย ๆ " โฮล์มเขียนเพื่อเปรียบเทียบวิธีการแบบupidákแบบ step-up contrastidákกับวิธีการควบคุม Bonferroni แบบขั้นตอนของเขา: ความเรียบง่ายในการคำนวณเดียวกันจะได้รับเมื่อสถิติการทดสอบมีความเป็นอิสระ ใน "การควบคุมอัตราการค้นพบที่ผิด" โดย Benjamini และ Hochberg (1995) ผู้เขียนเขียน: ทฤษฎีบท 1.สำหรับอิสระสถิติการทดสอบและการกำหนดค่าของสมมติฐานที่ผิดพลาดใด ๆ ดังกล่าวข้างต้นการควบคุมขั้นตอนที่ FDR *q∗q∗q^{*} ต่อมาในปี 2544 เบญจมินิและเยคุเตเอลลีเขียน: 1.3 ปัญหาที่เกิดขึ้น เมื่อพยายามที่จะใช้วิธีการ FDR ในทางปฏิบัติสถิติการทดสอบขึ้นอยู่กับการพบบ่อยกว่าคนที่เป็นอิสระตัวอย่างของจุดปลายหลายจุดที่กล่าวถึงข้างต้นเป็นแบบตรงประเด็น ผู้เขียนเหล่านี้ใช้ความหมายใดเป็นพิเศษในการพึ่งพาความเป็นอิสระ ฉันจะมีความสุขกับคำจำกัดความที่เป็นทางการของสิ่งที่ทำให้การทดสอบขึ้นอยู่กับหรือเป็นอิสระจากกันถ้าพวกเขามาพร้อมกับคำอธิบายภาษาธรรมดา ฉันสามารถคิดถึงความหมายต่าง ๆ ที่เป็นไปได้สองสามอย่าง แต่ฉันไม่คิดเลยว่าจะเป็นเช่นนั้น: "Dependent" …

5
ปริมาณนี้เกี่ยวข้องกับความเป็นอิสระมีชื่อหรือไม่?
เห็นได้ชัดว่าเหตุการณ์ A และ B มีความเป็นอิสระ IFF Pr = Pr Pr (B)มานิยามปริมาณที่เกี่ยวข้องกัน( A ) ( B )(A∩B)(A∩B)(A\cap B)(A)(A)(A)(B)(B)(B) Q≡Pr(A∩B)Pr(A)Pr(B)Q≡Pr(A∩B)Pr(A)Pr(B)Q\equiv\frac{\mathrm{Pr}(A\cap B)}{\mathrm{Pr}(A)\mathrm{Pr}(B)} ดังนั้น A และ B จึงเป็นอิสระ iff Q = 1 (สมมติว่าตัวส่วนนั้นไม่ใช่ศูนย์) Q มีชื่อจริงหรือไม่? ฉันรู้สึกเหมือนมันหมายถึงแนวคิดพื้นฐานบางอย่างที่กำลังหลบหนีฉันในตอนนี้และฉันจะรู้สึกค่อนข้างโง่ที่ได้ถามคำถามนี้

3
ความสัมพันธ์ที่ไม่ใช่ศูนย์หมายถึงการพึ่งพาอาศัยกันหรือไม่?
เรารู้ถึงความจริงที่ว่าสหสัมพันธ์แบบศูนย์ไม่มีนัยยะถึงความเป็นอิสระ ฉันสนใจว่าความสัมพันธ์ที่ไม่เป็นศูนย์หมายถึงการพึ่งพาหรือไม่ - เช่นถ้าCorr(X,Y)≠0Corr(X,Y)≠0\text{Corr}(X,Y)\ne0สำหรับตัวแปรสุ่มบางตัวและเราสามารถพูดโดยทั่วไปว่า ?XXXYYYfX,Y(x,y)≠fX(x)fY(y)fX,Y(x,y)≠fX(x)fY(y)f_{X,Y}(x,y) \ne f_X(x) f_Y(y)

2
ความเป็นอิสระของสารตกค้างในการทดสอบ / จำลองทางคอมพิวเตอร์?
ฉันทำการประเมินทางคอมพิวเตอร์โดยใช้วิธีการที่แตกต่างกันของการปรับแบบจำลองที่ใช้ในวิทยาศาสตร์ Palaeo ฉันมีชุดฝึกอบรมแบบ ish ขนาดใหญ่ดังนั้นฉันจึงสุ่ม (ชุดชั้นในแบบสุ่มแบ่งชั้น) แล้ววางชุดทดสอบ ผมติดตั้งวิธีการแตกต่างกันไปตัวอย่างการฝึกอบรมชุดและการใช้ม.ส่งผลให้รูปแบบที่ผมคาดการตอบสนองสำหรับตัวอย่างการทดสอบชุดและคำนวณ RMSEP มากกว่ากลุ่มตัวอย่างที่อยู่ในชุดทดสอบ นี้เป็นหนึ่งในการทำงานม.ม.mม.ม.m ฉันทำกระบวนการนี้ซ้ำหลายครั้งทุกครั้งที่ฉันเลือกชุดฝึกอบรมที่แตกต่างกันโดยการสุ่มตัวอย่างชุดทดสอบใหม่ หลังจากทำสิ่งนี้แล้วฉันต้องการตรวจสอบว่าวิธีใดวิธีมีประสิทธิภาพ RMSEP ที่ดีขึ้นหรือแย่ลง ฉันต้องการเปรียบเทียบวิธีการจับคู่แบบฉลาด ๆม.ม.m วิธีการของฉันได้รับเพื่อให้พอดีกับผลกระทบที่ผสม (LME) รูปแบบเชิงเส้นที่มีผลกระทบสุ่มเดียวสำหรับการเรียกใช้ ฉันใช้lmer()จากแพ็คเกจlme4เพื่อให้พอดีกับรุ่นและฟังก์ชั่นของฉันจากแพ็คเกจmultcompเพื่อทำการเปรียบเทียบหลายอย่าง แบบจำลองของฉันเป็นหลัก lmer(RMSEP ~ method + (1 | Run), data = FOO) ที่methodบ่งชี้วิธีการที่ถูกนำมาใช้ในการสร้างแบบจำลองพยากรณ์สำหรับชุดทดสอบและRunเป็นตัวบ่งชี้สำหรับแต่ละโดยเฉพาะอย่างยิ่งการเรียกของ "ทดลอง" ของฉัน คำถามของฉันเกี่ยวกับส่วนที่เหลือของ LME ให้ผลแบบสุ่มเดียวสำหรับRunฉันสมมติว่าค่า RMSEP สำหรับการทำงานนั้นมีความสัมพันธ์กับระดับหนึ่ง แต่ไม่เกี่ยวข้องระหว่างการวิ่งบนพื้นฐานของความสัมพันธ์ที่ชักนำให้เกิดผลแบบสุ่ม ข้อสันนิษฐานเกี่ยวกับความเป็นอิสระระหว่างการรันนี้มีผลหรือไม่? หากไม่มีวิธีที่จะอธิบายสิ่งนี้ในโมเดล LME หรือฉันควรมองหาการวิเคราะห์ทางสถิติประเภทอื่นเพื่อตอบคำถามของฉัน?

2
ฉันจะตีความพล็อตส่วนที่เหลือเทียบกับส่วนที่เหลือนี้ได้อย่างไร
ฉันไม่เข้าใจความแตกต่างอย่างแท้จริง ฉันต้องการทราบว่าโมเดลของฉันเหมาะสมหรือไม่ตามพล็อตนี้

4
ทำไมความเป็นอิสระหมายถึงความสัมพันธ์เป็นศูนย์?
ก่อนอื่นฉันไม่ได้ถามสิ่งนี้: ทำไมความสัมพันธ์แบบศูนย์ไม่มีนัยถึงความเป็นอิสระ? นี่คือที่อยู่(ค่อนข้างดี)ที่นี่: /math/444408/why-does-zero-correlation-not-imply-independence สิ่งที่ฉันถามอยู่ตรงข้าม ... บอกว่าตัวแปรสองตัวเป็นอิสระจากกัน พวกเขาไม่สามารถมีความสัมพันธ์กันเล็กน้อยโดยไม่ได้ตั้งใจหรือไม่? มันไม่ควรจะเป็น ... ความเป็นอิสระหมายถึงสหสัมพันธ์น้อยมาก?

4
ตัวแปรสุ่มปกติแบบมาตรฐานสองตัวมีความเป็นอิสระเสมอหรือไม่?
ฉันเรียนรู้ว่าการแจกแจงแบบปกติมาตรฐานไม่เหมือนใครเพราะค่าเฉลี่ยและความแปรปรวนได้รับการแก้ไขที่ 0 และ 1 ตามลำดับ จากข้อเท็จจริงนี้ฉันสงสัยว่าตัวแปรสุ่มสองมาตรฐานใดต้องเป็นอิสระ

1
ส่วนประกอบ PCA ของข้อมูลแบบหลายตัวแปร Gaussian เป็นอิสระทางสถิติหรือไม่?
ส่วนประกอบ PCA (ในการวิเคราะห์องค์ประกอบหลัก) มีความเป็นอิสระทางสถิติหรือไม่หากข้อมูลของเรามีการกระจายหลายตัวแปรตามปกติ ถ้าเป็นเช่นนั้นสิ่งนี้สามารถแสดง / พิสูจน์ได้อย่างไร? ฉันถามเพราะฉันเห็นโพสต์นี้ซึ่งคำตอบยอดนิยมระบุไว้: PCA ไม่ได้ทำการตั้งสมมติฐาน Gaussianity ที่ชัดเจน พบว่าค่าไอเกนที่ผู้ใช้อธิบายความแปรปรวนสูงสุดในข้อมูล orthogonality ขององค์ประกอบหลักหมายความว่าจะพบส่วนประกอบที่ไม่เกี่ยวข้องมากที่สุดเพื่ออธิบายความแปรปรวนของข้อมูลให้มากที่สุด สำหรับการแจกแจงแบบเกาส์หลายตัวแปรความสัมพันธ์แบบไม่มีศูนย์ระหว่างส่วนประกอบหมายถึงความเป็นอิสระซึ่งไม่เป็นความจริงสำหรับการแจกแจงส่วนใหญ่ คำตอบจะถูกระบุโดยไม่มีการพิสูจน์และดูเหมือนจะบอกเป็นนัยว่า PCA ผลิตชิ้นส่วนที่เป็นอิสระหากข้อมูลเป็นตัวแปรปกติ โดยเฉพาะกล่าวว่าข้อมูลของเราเป็นตัวอย่างจาก: x∼N(μ,Σ)x∼N(μ,Σ)\mathbf{x} \sim \mathcal N(\mathbf{\mu}, \mathbf{\Sigma}) เราใส่nnnตัวอย่างxx\mathbf{x}เป็นแถวของเมทริกซ์ของตัวอย่างของเราXX\mathbf{X}เพื่อให้XX\mathbf{X}เป็นn×mn×mn \times mเมตร การคำนวณ SVD ของXX\mathbf{X} (หลังจากศูนย์กลาง) ให้ผลตอบแทน X=USVTX=USVT\mathbf{X} = \mathbf{USV}^{T} เราบอกได้ไหมว่าคอลัมน์ของUU\mathbf{U}นั้นมีความเป็นอิสระทางสถิติแล้วก็แถวของVTVT\mathbf{V}^Tโดยทั่วไปแล้วนี่เป็นเพียงแค่สำหรับx∼N(μ,Σ)x∼N(μ,Σ)\mathbf{x} \sim \mathcal N(\mathbf{\mu}, \mathbf{\Sigma})หรือไม่เป็นความจริงเลย?
16 pca  independence  svd 

2
ทดสอบการสุ่มตัวอย่าง IID
คุณจะทดสอบหรือตรวจสอบว่าการสุ่มตัวอย่างเป็น IID (เป็นอิสระและกระจายตัวเหมือนกัน) โปรดทราบว่าฉันไม่ได้หมายถึง Gaussian และการกระจายแบบเหมือนจริงเพียง IID และความคิดที่อยู่ในใจของฉันคือการแบ่งตัวอย่างซ้ำ ๆ เป็นสองตัวอย่างย่อยที่มีขนาดเท่ากันทำการทดสอบ Kolmogorov-Smirnov และตรวจสอบว่าการกระจายตัวของค่า p มีค่าเท่ากันหรือไม่ ความคิดเห็นใด ๆ เกี่ยวกับวิธีการนั้นและข้อเสนอแนะใด ๆ ยินดีต้อนรับ ความชัดเจนหลังจากเริ่มรับรางวัล: ฉันกำลังมองหาการทดสอบทั่วไปที่สามารถนำไปใช้กับข้อมูลอนุกรมที่ไม่ใช่เวลา

2
ทำความเข้าใจเกี่ยวกับการคำนวณความสัมพันธ์ระยะทาง
เท่าที่ฉันเข้าใจความสัมพันธ์ของระยะทางเป็นวิธีที่มีประสิทธิภาพและเป็นสากลในการตรวจสอบว่ามีความสัมพันธ์ระหว่างตัวแปรตัวเลขสองตัวหรือไม่ ตัวอย่างเช่นหากเรามีชุดจำนวนคู่: (x1, y1) (x2, y2) ... (xn, yn) เราสามารถใช้ความสัมพันธ์ของระยะทางเพื่อตรวจสอบว่ามีความสัมพันธ์ใด ๆ (ไม่จำเป็นต้องเป็นเชิงเส้น) ระหว่างตัวแปรสองตัว ( xและy) ยิ่งกว่านั้นxและyสามารถเป็นเวกเตอร์ที่มีขนาดต่างกัน มันค่อนข้างง่ายในการคำนวณความสัมพันธ์ของระยะทาง ก่อนอื่นเราใช้xixผมx_iในการคำนวณระยะทางเมทริกซ์ จากนั้นเราจะคำนวณเมทริกซ์ระยะทางโดยใช้yผมyผมy_iฉัน เมทริกซ์ระยะทางทั้งสองจะมีขนาดเท่ากันเนื่องจากจำนวนxผมxผมx_iและYผมyผมy_iเท่ากัน (เพราะมาเป็นคู่) ตอนนี้เรามีระยะทางมากมายที่สามารถจับคู่ได้ ตัวอย่างเช่นองค์ประกอบ(2,3)จากเมทริกซ์ระยะทางแรกถูกจับคู่กับองค์ประกอบ(2,3)จากเมทริกซ์ระยะทางที่สอง ดังนั้นเรามีชุดของระยะทางคู่หนึ่งและเราสามารถใช้มันเพื่อคำนวณความสัมพันธ์ (ความสัมพันธ์ระหว่างระยะทาง) หากระยะทางสองประเภทนั้นมีความสัมพันธ์กันมากกว่าที่หมายความว่า close Xs มักจะหมายถึง close Ys ตัวอย่างเช่นถ้าใกล้เคียงกับx 13มากกว่านั่นหมายความว่าy 7น่าจะใกล้เคียงกับy 13x7x7x_7x13x13x_{13}Y7Y7y_7Y13Y13y_{13} 13ดังนั้นเราสามารถสรุปได้ว่า Xs และ Ys ขึ้นอยู่กับ ฟังดูสมเหตุสมผล แต่มีสองด้านที่ผมไม่เข้าใจ อันดับแรกเพื่อคำนวณความสัมพันธ์ของระยะทางเราไม่ได้ใช้เมทริกซ์ระยะทางสองตัวโดยตรง เราใช้กับพวกเขาสองขั้นตอนกลาง (เพื่อให้ผลรวมขององค์ประกอบทั้งหมดในแถวใด ๆ (หรือคอลัมน์) เท่ากับศูนย์) ฉันไม่เข้าใจว่าทำไมเราต้องทำ ตรรกะ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.