ฉันมีdata.table :
groups <- data.table(group = c("A", "B", "C", "D", "E", "F", "G"),
code_1 = c(2,2,2,7,8,NA,5),
code_2 = c(NA,3,NA,3,NA,NA,2),
code_3 = c(4,1,1,4,4,1,8))
group code_1 code_2 code_3
A 2 NA 4
B 2 3 1
C 2 NA 1
D 7 3 4
E 8 NA 4
F NA NA 1
G 5 2 8
สิ่งที่ฉันต้องการจะทำคือให้แต่ละกลุ่มค้นหาเพื่อนบ้านที่ใกล้เคียงโดยใช้รหัสที่มีอยู่ ตัวอย่างเช่น: กลุ่ม A มีกลุ่มเพื่อนบ้านทันที B, C เนื่องจาก code_1 (code_1 เท่ากับ 2 ในทุกกลุ่ม) และมีกลุ่มเพื่อนบ้านทันที D, E เนื่องจาก code_3 (code_3 เท่ากับ 4 ในกลุ่มเหล่านั้นทั้งหมด)
สิ่งที่ฉันพยายามทำคือสำหรับแต่ละรหัสโดยการตั้งค่าคอลัมน์แรก (กลุ่ม) ตามการแข่งขันดังนี้
groups$code_1_match = list()
for (row in 1:nrow(groups)){
set(groups, i=row, j="code_1_match", list(groups$group[groups$code_1[row] == groups$code_1]))
}
group code_1 code_2 code_3 code_1_match
A 2 NA 4 A,B,C,NA
B 2 3 1 A,B,C,NA
C 2 NA 1 A,B,C,NA
D 7 3 4 D,NA
E 8 NA 4 E,NA
F NA NA 1 NA,NA,NA,NA,NA,NA,...
G 5 2 8 NA,G
"kinda" นี้ใช้งานได้ แต่ฉันคิดว่าจะมีตารางข้อมูลมากขึ้นในการทำเช่นนี้ ฉันเหนื่อย
groups[, code_1_match_2 := list(group[code_1 == groups$code_1])]
แต่มันไม่ได้ผล
ฉันไม่มีเคล็ดลับตารางข้อมูลที่ชัดเจนที่จะจัดการกับมันได้หรือไม่
ผลกรณีที่ดีที่สุดของฉันจะมีลักษณะเช่นนี้ (ซึ่งในปัจจุบันจะต้องใช้วิธีการของฉันสำหรับทั้ง 3 คอลัมน์แล้วต่อผลลัพธ์ที่ได้)
group code_1 code_2 code_3 Immediate neighbors
A 2 NA 4 B,C,D,E
B 2 3 1 A,C,D,F
C 2 NA 1 A,B,F
D 7 3 4 B,A
E 8 NA 4 A,D
F NA NA 1 B,C
G 5 2 8
igraph
ซึ่งอาจเป็นเรื่องที่น่าสนใจจริงๆ