ฉันพยายามใช้สิ่งนี้ แต่ไม่ได้ผล
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
ฉันพยายามใช้สิ่งนี้ แต่ไม่ได้ผล
return value.replaceAll("/[^A-Za-z0-9 ]/", "");
คำตอบ:
[^A-Za-z0-9]
ใช้
หมายเหตุ: นำช่องว่างออกเนื่องจากไม่นับเป็นตัวอักษรและตัวเลข
ลอง
return value.replaceAll("[^A-Za-z0-9]", "");
หรือ
return value.replaceAll("[\\W]|_", "");
return value.replaceAll("\\W", "");
คุณควรทราบว่า[^a-zA-Z]
จะแทนที่ตัวละครที่ไม่ได้อยู่ในช่วงตัวอักษร AZ / az นั่นหมายความว่าตัวอักษรพิเศษชอบé
, ß
ฯลฯ หรือตัวอักษรซีริลลิและดังกล่าวจะถูกลบออก
หากไม่ต้องการแทนที่อักขระเหล่านี้ให้ใช้คลาสอักขระที่กำหนดไว้ล่วงหน้าแทน:
str.replaceAll("[^\\p{IsAlphabetic}\\p{IsDigit}]", "");
PS: ไม่บรรลุผลนี้จะทำหน้าที่เช่นเดียวกับ\p{Alnum}
[A-Za-z0-9]
[^\\p{IsAlphabetic}\\p{IsDigit}]
ทำได้ดี.
{IsDigit}
ไม่ทำงานสำหรับฉันและ{Digit}
ไม่เป็นเพราะฉันลองบน Android และ Android ได้UNICODE_CHARACTER_CLASS
เปิดใช้งานตามค่าเริ่มต้น ขอบคุณสำหรับการกวาดล้าง
return value.replaceAll("[^A-Za-z0-9 ]", "");
สิ่งนี้จะทำให้ช่องว่างไม่เสียหาย ฉันคิดว่านั่นคือสิ่งที่คุณต้องการ มิฉะนั้นให้ลบช่องว่างออกจาก regex
คุณสามารถลองใช้ regex ที่เรียบง่ายกว่านี้ได้:
str = str.replaceAll("\\P{Alnum}", "");
str.replaceAll("[^\\p{Alnum}\\s]", "")
\\p{Alnum}\\p{Space}
หรือ
นิพจน์ทั่วไปของ Java ไม่ต้องการให้คุณใส่เครื่องหมายทับหน้า ( /
) หรือตัวคั่นอื่น ๆ รอบ ๆ regex ซึ่งตรงข้ามกับภาษาอื่น ๆ เช่น Perl เช่น
ฉันทำวิธีนี้ในการสร้างชื่อไฟล์:
public static String safeChar(String input)
{
char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
char[] charArray = input.toString().toCharArray();
StringBuilder result = new StringBuilder();
for (char c : charArray)
{
for (char a : allowed)
{
if(c==a) result.append(a);
}
}
return result.toString();
}
value.replaceAll("[^A-Za-z0-9]", "")
[^abc]
เมื่อเครื่องหมายรูปหมวก^
ปรากฏเป็นอักขระตัวแรกในวงเล็บเหลี่ยม รูปแบบนี้ตรงกับอักขระใด ๆ ยกเว้น a หรือ b หรือ c
ดูคำหลักเป็นสองฟังก์ชัน:
[(Pattern)] = match(Pattern)
[^(Pattern)] = notMatch(Pattern)
นอกจากนี้เกี่ยวกับรูปแบบ:
A-Z = all characters included from A to Z
a-z = all characters included from a to z
0=9 = all characters included from 0 to 9
ดังนั้นมันจะแทนที่ถ่านทั้งหมดที่ไม่รวมอยู่ในรูปแบบ
หากคุณต้องการอนุญาตให้ใช้ตัวอักษรและตัวเลขที่ไม่ได้อยู่ในชุดอักขระ ASCII เช่นในภาษาเยอรมัน umlaut คุณสามารถลองใช้วิธีแก้ปัญหาต่อไปนี้:
String value = "your value";
// this could be placed as a static final constant, so the compiling is only done once
Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);
value = pattern.matcher(value).replaceAll("");
โปรดทราบว่าการใช้งานธง UNICODE_CHARACTER_CLASS อาจมีการกำหนดโทษปรับประสิทธิภาพ (ดู javadoc ของธงนี้)
วิธีง่าย ๆ :
public boolean isBlank(String value) {
return (value == null || value.equals("") || value.equals("null") || value.trim().equals(""));
}
public String normalizeOnlyLettersNumbers(String str) {
if (!isBlank(str)) {
return str.replaceAll("[^\\p{L}\\p{Nd}]+", "");
} else {
return "";
}
}
public static void main(String[] args) {
String value = " Chlamydia_spp. IgG, IgM & IgA Abs (8006) ";
System.out.println(value.replaceAll("[^A-Za-z0-9]", ""));
}
เอาต์พุต: ChlamydiasppIgGIgMIgAAbs8006
Github: https://github.com/AlbinViju/Learning/blob/master/StripNonAlphaNumericFromString.java
เมื่อใช้ Guava คุณสามารถรวมเกณฑ์ประเภทต่างๆได้อย่างง่ายดาย สำหรับโซลูชันเฉพาะของคุณคุณสามารถใช้:
value = CharMatcher.inRange('0', '9')
.or(CharMatcher.inRange('a', 'z')
.or(CharMatcher.inRange('A', 'Z'))).retainFrom(value)
CharMatcherของ Guava ให้บริการโซลูชั่นที่กระชับ:
output = CharMatcher.javaLetterOrDigit().retainFrom(input);