ค้นหาตำแหน่งของอักขระในสตริง


88

ฉันต้องการค้นหาตำแหน่งของอักขระในสตริง

พูด: string = "the2quickbrownfoxeswere2tired"

ผมอยากฟังก์ชั่นที่จะกลับมา4และ24- สถานที่ตัวละครของใน2string


ทำไมต้องใช้ regex ไม่มี r .indexOf()หรืออะไร?
fge

2
ฉันสงสัยมัน. นักพัฒนาเป็น Nixers และถือว่าทุกคนรู้จัก regex การจัดการสตริงของ R เป็นสิ่งที่น่ารังเกียจ
IRTFM

คำตอบ:


116

คุณสามารถใช้ได้ gregexpr

 gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")


[[1]]
[1]  4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE

หรืออาจstr_locate_allมาจากแพ็คเกจstringrซึ่งเป็นกระดาษห่อหุ้มสำหรับ(ณเวอร์ชัน 1.0)gregexpr stringi::stri_locate_allstringr

library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")

[[1]]
     start end
[1,]     4   4
[2,]    24  24

โปรดทราบว่าคุณสามารถใช้ไฟล์ stringi

library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)

ตัวเลือกอื่นในฐานRจะเป็นอย่างไร

lapply(strsplit(x, ''), function(x) which(x == '2'))

ควรใช้งานได้ (กำหนดเวกเตอร์อักขระx)


เราจะแยกจำนวนเต็มออกจากรายการ / วัตถุที่ส่งคืนโดยโซลูชัน 3 รายการแรกของคุณได้อย่างไร
3pitt

ใช้regexprแทนgregexprเพื่อให้ได้จำนวนเต็มอย่างง่ายดาย หรือใช้unlistกับเอาต์พุตตามที่ระบุไว้ในคำตอบอื่นด้านล่าง
Arani

43

นี่เป็นอีกทางเลือกที่ตรงไปตรงมา

> which(strsplit(string, "")[[1]]=="2")
[1]  4 24

คุณอธิบายได้[[1]]ไหมว่าอะไร?
francoiskroll

@francoiskroll [[1]] แสดงถึงองค์ประกอบแรกของรายการ
Prafulla

20

คุณสามารถสร้างเอาต์พุตเป็น 4 และ 24 โดยใช้ไม่อยู่ในรายการ:

unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1]  4 24

3

ค้นหาตำแหน่งของการเกิดครั้งที่ n ของ str2 ใน str1 (ลำดับของพารามิเตอร์เดียวกันกับ Oracle SQL INSTR) ส่งกลับ 0 หากไม่พบ

instr <- function(str1,str2,startpos=1,n=1){
    aa=unlist(strsplit(substring(str1,startpos),str2))
    if(length(aa) < n+1 ) return(0);
    return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}


instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0

2

หากต้องการค้นหาสถานที่แรกเท่านั้นให้ใช้lapply()กับmin():

my_string <- c("test1", "test1test1", "test1test1test1")

unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(min) %>%
  unlist()
#> [1] 5 5 5

หากต้องการค้นหาเฉพาะตำแหน่งสุดท้ายให้ใช้lapply()กับmax():

unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1]  5 10 15

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(max) %>%
  unlist()
#> [1]  5 10 15

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.