ใน Java ฉันพยายามคืนค่าการจับคู่ regex ทั้งหมดไปยังอาร์เรย์ แต่ดูเหมือนว่าคุณสามารถตรวจสอบได้ว่ารูปแบบนั้นตรงกับบางสิ่งหรือไม่ (บูลีน)
ฉันจะใช้การจับคู่ regex ในรูปแบบอาร์เรย์ของสตริงทั้งหมดที่ตรงกับการแสดงออกของ regex ในสตริงที่กำหนดได้อย่างไร
ใน Java ฉันพยายามคืนค่าการจับคู่ regex ทั้งหมดไปยังอาร์เรย์ แต่ดูเหมือนว่าคุณสามารถตรวจสอบได้ว่ารูปแบบนั้นตรงกับบางสิ่งหรือไม่ (บูลีน)
ฉันจะใช้การจับคู่ regex ในรูปแบบอาร์เรย์ของสตริงทั้งหมดที่ตรงกับการแสดงออกของ regex ในสตริงที่กำหนดได้อย่างไร
คำตอบ:
( คำตอบของ 4castleดีกว่าด้านล่างหากคุณสามารถสมมติว่า Java> = 9)
คุณต้องสร้าง matcher และใช้สิ่งนั้นเพื่อค้นหาการแข่งขันซ้ำ ๆ
import java.util.regex.Matcher;
import java.util.regex.Pattern;
...
List<String> allMatches = new ArrayList<String>();
Matcher m = Pattern.compile("your regular expression here")
.matcher(yourStringHere);
while (m.find()) {
allMatches.add(m.group());
}
หลังจากนี้allMatches
มีการแข่งขันและคุณสามารถใช้allMatches.toArray(new String[0])
เพื่อรับอาร์เรย์ถ้าคุณต้องการจริงๆ
คุณยังสามารถใช้MatchResult
เพื่อเขียนฟังก์ชันตัวช่วยเพื่อวนซ้ำการจับคู่ตั้งแต่Matcher.toMatchResult()
คืนสแน็ปช็อตของสถานะกลุ่มปัจจุบัน
ตัวอย่างเช่นคุณสามารถเขียนตัววนซ้ำขี้เกียจเพื่อให้คุณทำ
for (MatchResult match : allMatches(pattern, input)) {
// Use match, and maybe break without doing the work to find all possible matches.
}
โดยทำสิ่งนี้:
public static Iterable<MatchResult> allMatches(
final Pattern p, final CharSequence input) {
return new Iterable<MatchResult>() {
public Iterator<MatchResult> iterator() {
return new Iterator<MatchResult>() {
// Use a matcher internally.
final Matcher matcher = p.matcher(input);
// Keep a match around that supports any interleaving of hasNext/next calls.
MatchResult pending;
public boolean hasNext() {
// Lazily fill pending, and avoid calling find() multiple times if the
// clients call hasNext() repeatedly before sampling via next().
if (pending == null && matcher.find()) {
pending = matcher.toMatchResult();
}
return pending != null;
}
public MatchResult next() {
// Fill pending if necessary (as when clients call next() without
// checking hasNext()), throw if not possible.
if (!hasNext()) { throw new NoSuchElementException(); }
// Consume pending so next call to hasNext() does a find().
MatchResult next = pending;
pending = null;
return next;
}
/** Required to satisfy the interface, but unsupported. */
public void remove() { throw new UnsupportedOperationException(); }
};
}
};
}
ด้วยสิ่งนี้,
for (MatchResult match : allMatches(Pattern.compile("[abc]"), "abracadabra")) {
System.out.println(match.group() + " at " + match.start());
}
อัตราผลตอบแทน
a at 0 b at 1 a at 3 c at 4 a at 5 a at 7 b at 8 a at 10
ArrayList
และLinkedList
ผลลัพธ์อาจน่าประหลาดใจ
allMatches
vs yourStringHere.length()
) คุณสามารถคำนวณขนาดที่เหมาะสมallMatches
ได้ ในประสบการณ์ของฉันค่าใช้จ่ายของLinkedList
หน่วยความจำและประสิทธิภาพการทำซ้ำที่ชาญฉลาดมักจะไม่คุ้มค่าดังนั้นจึงLinkedList
ไม่ใช่ท่าทางเริ่มต้นของฉัน แต่เมื่อทำการปรับฮอตสปอตให้เหมาะสมการเปลี่ยนการใช้งานลิสต์รายชื่อนั้นคุ้มค่าแน่นอนเพื่อดูว่าคุณได้รับการปรับปรุงหรือไม่
Matcher#results
เพื่อรับสิ่งStream
ที่คุณสามารถใช้เพื่อสร้างอาร์เรย์ (ดูคำตอบของฉัน )
ใน Java 9 ตอนนี้คุณสามารถใช้Matcher#results()
เพื่อรับสิ่งStream<MatchResult>
ที่คุณสามารถใช้เพื่อรับรายการ / อาร์เรย์ของการแข่งขัน
import java.util.regex.Pattern;
import java.util.regex.MatchResult;
String[] matches = Pattern.compile("your regex here")
.matcher("string to search from here")
.results()
.map(MatchResult::group)
.toArray(String[]::new);
// or .collect(Collectors.toList())
Java ทำให้ regex ซับซ้อนเกินไปและไม่เป็นไปตามรูปแบบของ perl ลองดูที่MentaRegexเพื่อดูว่าคุณจะทำได้อย่างไรในโค้ด Java บรรทัดเดียว:
String[] matches = match("aa11bb22", "/(\\d+)/g" ); // => ["11", "22"]
นี่คือตัวอย่างง่ายๆ:
Pattern pattern = Pattern.compile(regexPattern);
List<String> list = new ArrayList<String>();
Matcher m = pattern.matcher(input);
while (m.find()) {
list.add(m.group());
}
(หากคุณมีกลุ่มที่จับภาพได้มากขึ้นคุณสามารถอ้างถึงพวกเขาโดยใช้ดัชนีของพวกเขาเป็นอาร์กิวเมนต์ของวิธีการกลุ่มหากคุณต้องการอาร์เรย์ให้ใช้list.toArray()
)
Pattern.matches()
เป็นวิธีการคงที่คุณไม่ควรเรียกมันในPattern
อินสแตนซ์ เป็นเพียงชื่อย่อสำหรับPattern.matches(regex, input)
Pattern.compile(regex).matcher(input).matches()
จากเส้นทาง Java Regex อย่างเป็นทางการ :
Pattern pattern =
Pattern.compile(console.readLine("%nEnter your regex: "));
Matcher matcher =
pattern.matcher(console.readLine("Enter input string to search: "));
boolean found = false;
while (matcher.find()) {
console.format("I found the text \"%s\" starting at " +
"index %d and ending at index %d.%n",
matcher.group(), matcher.start(), matcher.end());
found = true;
}
ใช้find
และแทรกผลลัพธ์group
ในอาร์เรย์ / รายการ / อะไรก็ตาม
Set<String> keyList = new HashSet();
Pattern regex = Pattern.compile("#\\{(.*?)\\}");
Matcher matcher = regex.matcher("Content goes here");
while(matcher.find()) {
keyList.add(matcher.group(1));
}
return keyList;