ฉันจะเรียงเวกเตอร์หนึ่งตามค่าของอีกเวกเตอร์ได้อย่างไร


112

ฉันมีเวกเตอร์ x ที่ฉันต้องการจัดเรียงตามลำดับของค่าในเวกเตอร์ y เวกเตอร์ทั้งสองมีความยาวไม่เท่ากัน

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

ผลลัพธ์ที่คาดหวังคือ:

[1] 4 4 4 2 2 1 3 3 3

คำตอบ:


70

นี่คือหนึ่งซับ ...

y[sort(order(y)[x])]

[แก้ไข:] แบ่งออกเป็นดังนี้:

order(y)             #We want to sort by y, so order() gives us the sorting order
order(y)[x]          #looks up the sorting order for each x
sort(order(y)[x])    #sorts by that order
y[sort(order(y)[x])] #converts orders back to numbers from orders

1
มันรวบรัดมาก แต่ฉันมีช่วงเวลาที่ยากลำบากในการหาว่าเกิดอะไรขึ้นที่นั่น ช่วยอธิบายให้ละเอียดหน่อยได้ไหม
Matt Parker

3
นี่ค่อนข้างสวยและแสดงให้เห็นถึงความเข้าใจที่ดีเกี่ยวกับบิวท์อินของ R +1
Godeke

6
โดยทั่วไปอาจต้องการทำเช่นนี้แม้ว่า y จะไม่ใช่การเรียงสับเปลี่ยนของ 1: length (y) ในกรณีนี้วิธีนี้ใช้ไม่ได้ แต่วิธีแก้ปัญหาของ gd047 ด้านล่าง x [order (match (x, y))] จะทำ
Rahul Savani

5
ฉันรู้สึกงุนงงว่าทำไมถึงมีการโหวตถึง 40 ครั้ง มันล้มเหลวสำหรับรูปแบบที่เรียบง่ายจำนวนมากในและx เช่น yx <- c(1,4,2); y <- c(1,2,4)
thelatemail

1
@thelatemail ฉันเห็นด้วย หยุดความบ้าคลั่งและโหวตคำตอบนี้!
Ian Fellows

185

แล้วอันนี้หล่ะ

x[order(match(x,y))]

29
นี่เป็นสิ่งที่ดีมากดีกว่าคำตอบที่ยอมรับ IMHO เนื่องจากเป็นเรื่องทั่วไปมากกว่า
fmark

2
ฉันจะบอกว่านี่ควรอยู่ในฐาน GNU-R
หายนะ - ความล้มเหลว

คำตอบนี้ใช้ได้ดีสำหรับฉันเมื่อใช้เวกเตอร์อักขระทั้งสำหรับ x และ y การเพิ่มการย่อยสลาย / รายละเอียดเล็กน้อยในคำตอบที่ยอมรับจะดี
mavericks

4

คุณสามารถแปลงxเป็นปัจจัยสั่งซื้อ:

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

xเห็นได้ชัดว่าการเปลี่ยนหมายเลขของคุณมาเป็นปัจจัยอย่างรุนแรงสามารถเปลี่ยนรหัสวิธีการตอบสนองไปยังปลายน้ำ แต่เนื่องจากคุณไม่ได้ให้บริบทเกี่ยวกับสิ่งที่จะเกิดขึ้นต่อไปฉันคิดว่าฉันจะแนะนำสิ่งนี้เป็นตัวเลือก


1
นี่ควรเป็นคำตอบที่ดีที่สุดเนื่องจากใช้ได้กับกรณีที่ไม่ใช่จำนวนเต็ม หรือทำงานเมื่อไม่มีค่าในxเวกเตอร์การเรียงลำดับที่yมีการเปลี่ยนแปลงเล็กน้อย:x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3, 6); y <- c(4, 2, 1, 3); as.numeric(as.character(sort(factor(x, unique(c(y, x))))))
rawr


2

ในกรณีที่คุณต้องการสั่งซื้อ "y" ไม่ว่าจะเป็นตัวเลขหรืออักขระ:

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

ตามขั้นตอน:

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3

1

[ แก้ไข:เห็นได้ชัดว่าเอียนมีแนวทางที่ถูกต้อง แต่ฉันจะปล่อยไว้เพื่อลูกหลาน

คุณสามารถทำได้โดยไม่ต้องวนซ้ำโดยสร้างดัชนีบนเวกเตอร์ y ของคุณ เพิ่มค่าตัวเลขที่เพิ่มขึ้นให้กับ y และรวมเข้าด้วยกัน:

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3

0
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

ผลลัพธ์ใน z: 4 4 4 2 2 1 3 3 3

ขั้นตอนสำคัญ:

  1. สำหรับ (i in y) - วนซ้ำองค์ประกอบที่สนใจ

  2. z <- c (z, ... ) - เชื่อมนิพจน์ย่อยแต่ละส่วนเข้าด้วยกัน

  3. rep (i, sum (x == i)) - ทำซ้ำ i (องค์ประกอบปัจจุบันที่สนใจ) sum (x == i) ครั้ง (จำนวนครั้งที่เราพบ i ใน x)


0

นอกจากนี้คุณสามารถใช้sqldfและทำได้โดยไฟล์joinฟังก์ชั่นในsqlไลค์ดังต่อไปนี้:

library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))

result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.