การแสดงออกปกติเพื่อให้ตรงกับชื่อโฮสต์ DNS หรือที่อยู่ IP?

369

ใครบ้างมีการแสดงออกปกติที่มีประโยชน์ที่จะตรงกับชื่อโฮสต์ DNS หรือที่อยู่ IP ตามกฎหมายใด ๆ ?

ง่ายต่อการเขียนหนึ่งครั้งที่ทำงานได้ 95% แต่ฉันหวังว่าจะได้รับสิ่งที่ผ่านการทดสอบอย่างดีเพื่อให้ตรงกับข้อกำหนด RFC ล่าสุดสำหรับชื่อโฮสต์ DNS

regex dns

— DonGar
แหล่งที่มา

535

คุณสามารถใช้นิพจน์ทั่วไปต่อไปนี้แยกกันหรือรวมเข้าด้วยกันในนิพจน์ OR

ValidIpAddressRegex = "^(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])$";

ValidHostnameRegex = "^(([a-zA-Z0-9]|[a-zA-Z0-9][a-zA-Z0-9\-]*[a-zA-Z0-9])\.)*([A-Za-z0-9]|[A-Za-z0-9][A-Za-z0-9\-]*[A-Za-z0-9])$";

ValidIpAddressRegexตรงกับที่อยู่ IP ที่ถูกต้องและชื่อโฮสต์ที่ถูกต้องValidHostnameRegex ขึ้นอยู่กับภาษาที่คุณใช้ \ อาจต้องหลบหนีด้วย \

ValidHostnameRegexถูกต้องตามRFC 1123 เดิมทีRFC 952ระบุว่าส่วนชื่อโฮสต์ไม่สามารถเริ่มต้นด้วยตัวเลข

http://en.wikipedia.org/wiki/Hostname

ข้อมูลจำเพาะดั้งเดิมของชื่อโฮสต์ในRFC 952ซึ่งได้รับคำสั่งว่าฉลากไม่สามารถเริ่มต้นด้วยตัวเลขหรือด้วยเครื่องหมายยัติภังค์และต้องไม่ลงท้ายด้วยเครื่องหมายขีดกลาง อย่างไรก็ตามข้อกำหนดที่ตามมา ( RFC 1123 ) อนุญาตให้ใช้ชื่อโฮสต์เพื่อเริ่มต้นด้วยตัวเลข

Valid952HostnameRegex = "^(([a-zA-Z]|[a-zA-Z][a-zA-Z0-9\-]*[a-zA-Z0-9])\.)*([A-Za-z]|[A-Za-z][A-Za-z0-9\-]*[A-Za-z0-9])$";

— Jorge Ferreira
แหล่งที่มา

3

ที่นี่: stackoverflow.com/questions/4645126/… - ฉันอธิบายว่าชื่อที่ขึ้นต้นด้วยตัวเลขนั้นถือว่ามีความถูกต้องเช่นกัน นอกจากนี้จุดเดียวที่เป็นปัญหาที่น่าสงสัย คงจะดีถ้าได้รับคำติชมเพิ่มเติมเกี่ยวกับเรื่องนั้น

— BreakPhreak

16

คุณอาจต้องการเพิ่ม IPv6 OP ไม่ได้ระบุที่อยู่ประเภทใด (โดยวิธีนี้สามารถพบได้ที่นี่ )

— new123456

32

ก่อนที่ผู้ใช้จะใช้สิ่งนี้ในรหัสของพวกเขาโปรดทราบว่ามันไม่ถูกต้องสมบูรณ์ โดยไม่สนใจ RFC2181: "DNS กำหนดข้อ จำกัด เพียงหนึ่งป้ายเท่านั้นที่สามารถใช้เพื่อระบุระเบียนทรัพยากรข้อ จำกัด หนึ่งข้อนั้นเกี่ยวข้องกับความยาวของฉลากและชื่อเต็มความยาวของป้ายกำกับใด ๆ จะ จำกัด อยู่ระหว่าง 1 และ 63 octets ชื่อโดเมนแบบเต็มถูก จำกัด ไว้ที่ 255 octets (รวมถึงตัวคั่น) "

— รูเบิล

7

@UserControl: ชื่อโฮสต์ที่ไม่ใช่ลาติน (Punycoded) ต้องแปลงเป็นรูปแบบ ASCII ก่อน ( éxämplè.com= xn--xmpl-loa1ab.com) จากนั้นตรวจสอบความถูกต้อง

— Alix Axel

6

นิพจน์ชื่อโฮสต์ของคุณตรงกับค่าที่ไม่ถูกต้อง: ฉันลอง123.456.789.0และมันบอกว่าเป็นชื่อโฮสต์ที่ถูกต้อง

— lbarreira

62

Regex ชื่อโฮสต์ของsminkไม่ปฏิบัติตามข้อ จำกัด เกี่ยวกับความยาวของแต่ละป้ายชื่อภายในชื่อโฮสต์ แต่ละฉลากภายในชื่อโฮสต์ที่ถูกต้องอาจมีความยาวไม่เกิน 63 octets

ValidHostnameRegex = "^ ([a-zA-Z0-9] | [a-zA-Z0-9] [a-zA-Z0-9 \ -] {0,61} [a-zA-Z0-9]) \
(\ ([a-zA-Z0-9]. | [a-zA-Z0-9] [a-zA-Z0-9 \ -] {0,61} [a-zA-Z0-9])) * $"

โปรดทราบว่าแบ็กสแลชที่ส่วนท้ายของบรรทัดแรก (ด้านบน) เป็นไวยากรณ์เชลล์ Unix สำหรับการแบ่งบรรทัดที่ยาว มันไม่ได้เป็นส่วนหนึ่งของการแสดงออกปกติ

นี่เป็นเพียงการแสดงออกปกติเพียงอย่างเดียวในบรรทัดเดียว:

^ ([a-zA-Z0-9] | [a-zA-Z0-9] [a-zA-Z0-9 \ -] {0,61} [a-zA-Z0-9]) (\ ([a-zA-Z0-9] | [a-zA-Z0-9] [a-zA-Z0-9 \ -] {0,61} [เป็น zA-Z0-9])) * $

นอกจากนี้คุณยังควรตรวจสอบแยกกันที่ความยาวรวมของชื่อโฮสต์ต้องไม่เกิน 255 ตัวอักษร สำหรับข้อมูลเพิ่มเติมโปรดปรึกษา RFC-952 และ RFC-1123

— Sakari A. Maaranen
แหล่งที่มา

6

รูปแบบโฮสต์ที่ยอดเยี่ยม อาจขึ้นอยู่กับการใช้งาน regex ของภาษา แต่สำหรับ JS นั้นสามารถปรับเล็กน้อยเพื่อให้มีชีวิตอยู่ได้ดีขึ้นโดยไม่เสียอะไรเลย:/^[a-z\d]([a-z\d\-]{0,61}[a-z\d])?(\.[a-z\d]([a-z\d\-]{0,61}[a-z\d])?)*$/i

— Semicolon

31

เพื่อให้ตรงกับที่อยู่ IP ที่ถูกต้องใช้ regex ต่อไปนี้:

(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)(\.(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)){3}

แทน:

([01]?[0-9][0-9]?|2[0-4][0-9]|25[0-5])(\.([01]?[0-9][0-9]?|2[0-4][0-9]|25[0-5])){3}

คำอธิบาย

เอนจิน regex จำนวนมากตรงกับความเป็นไปได้แรกในORลำดับ ตัวอย่างเช่นลอง regex ต่อไปนี้:

10.48.0.200

ทดสอบ

ทดสอบความแตกต่างระหว่างดีกับไม่ดี

— เบลล่า
แหล่งที่มา

5

อย่าลืมเริ่มต้น ^ และสิ้นสุด $ หรือบางอย่างเช่น 0.0.0.999 หรือ 999.0.0.0 จะตรงกันเช่นกัน ;)

— andreas

1

ใช่เพื่อตรวจสอบความถูกต้องของสตริงเริ่มต้น ^ และสิ้นสุด $ เป็นสิ่งจำเป็น แต่ถ้าคุณกำลังค้นหา IP ในข้อความอย่าใช้มัน

— Alban

'ไม่ใช่ความโลภ' โดยไม่ได้ตั้งใจซึ่งคุณระบุใช้กับโซลูชันชื่อโฮสต์อื่นเช่นกัน มันจะเป็นการเพิ่มมูลค่าให้กับคำตอบของคุณเนื่องจากคนอื่น ๆ จะไม่ตรงกับชื่อโฮสต์แบบเต็ม เช่น([a-zA-Z0-9]|[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])(\.([a-zA-Z0-9]|[a-zA-Z0-9][a-zA-Z0-9\-]{0,61}[a-zA-Z0-9]))*กับ([a-zA-Z0-9][a-zA-Z0-9\-]{0,61}[a-zA-Z0-9]|[a-zA-Z0-9])(\.([a-zA-Z0-9][a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])|[a-zA-Z0-9]))*

— ergohack

แก้ไข: ในข้างต้นใช้+ที่ส่วนท้ายแทนที่จะ*ดูความล้มเหลว

— ergohack

5

ฉันดูเหมือนจะไม่สามารถแก้ไขโพสต์บนสุดดังนั้นฉันจะเพิ่มคำตอบของฉันที่นี่

สำหรับชื่อโฮสต์ - คำตอบง่ายๆตัวอย่างเช่นที่นี่ - http: //www.linuxinsight.com/how_to_grep_for_ip_addresses_using_the_gnu_egrep_utility.html

egrep '([[:digit:]]{1,3}\.){3}[[:digit:]]{1,3}'

แม้ว่าเคสจะไม่ได้คำนึงถึงค่าเช่น 0 ใน fist octet และค่าที่มากกว่า 254 (ip addres) หรือ 255 (netmask) อาจจะเพิ่มเติมถ้าคำสั่งจะช่วย

สำหรับชื่อโฮสต์ dns ทางกฎหมายหากคุณกำลังตรวจสอบชื่อโฮสต์อินเทอร์เน็ตเท่านั้น (และไม่ใช่อินทราเน็ต) ฉันเขียน snipped ต่อไปนี้ซึ่งมี shell / php ผสมกัน แต่ควรใช้เป็นนิพจน์ทั่วไปใด ๆ

ก่อนอื่นให้ไปที่เว็บไซต์ ietf ดาวน์โหลดและแยกรายชื่อโดเมนระดับ 1 ตามกฎหมาย:

tld=$(curl -s http://data.iana.org/TLD/tlds-alpha-by-domain.txt |  sed 1d  | cut -f1 -d'-' | tr '\n' '|' | sed 's/\(.*\)./\1/')
echo "($tld)"

นั่นควรจะให้โค้ดที่ดีสำหรับคุณตรวจสอบความถูกต้องตามกฎหมายของชื่อโดเมนยอดนิยมเช่น. com หรือ. com

จากนั้นเพิ่มส่วนแรกของนิพจน์ตามแนวทางที่พบที่นี่ - http: //www.domainit.com/support/faq.mhtml?category=Domain_FAQ&question=9 (ชุดอักขระผสมตัวเลขและสัญลักษณ์ใด ๆ เครื่องหมายขีดกลางไม่ควรอยู่ใน จุดเริ่มต้นหรือจุดสิ้นสุดของ octet

(([a-z0-9]+|([a-z0-9]+[-]+[a-z0-9]+))[.])+

จากนั้นนำมารวมกัน (ตัวอย่าง PHP preg_match):

$pattern = '/^(([a-z0-9]+|([a-z0-9]+[-]+[a-z0-9]+))[.])+(AC|AD|AE|AERO|AF|AG|AI|AL|AM|AN|AO|AQ|AR|ARPA|AS|ASIA|AT|AU|AW|AX|AZ|BA|BB|BD|BE|BF|BG|BH|BI|BIZ|BJ|BM|BN|BO|BR|BS|BT|BV|BW|BY|BZ|CA|CAT|CC|CD|CF|CG|CH|CI|CK|CL|CM|CN|CO|COM|COOP|CR|CU|CV|CX|CY|CZ|DE|DJ|DK|DM|DO|DZ|EC|EDU|EE|EG|ER|ES|ET|EU|FI|FJ|FK|FM|FO|FR|GA|GB|GD|GE|GF|GG|GH|GI|GL|GM|GN|GOV|GP|GQ|GR|GS|GT|GU|GW|GY|HK|HM|HN|HR|HT|HU|ID|IE|IL|IM|IN|INFO|INT|IO|IQ|IR|IS|IT|JE|JM|JO|JOBS|JP|KE|KG|KH|KI|KM|KN|KP|KR|KW|KY|KZ|LA|LB|LC|LI|LK|LR|LS|LT|LU|LV|LY|MA|MC|MD|ME|MG|MH|MIL|MK|ML|MM|MN|MO|MOBI|MP|MQ|MR|MS|MT|MU|MUSEUM|MV|MW|MX|MY|MZ|NA|NAME|NC|NE|NET|NF|NG|NI|NL|NO|NP|NR|NU|NZ|OM|ORG|PA|PE|PF|PG|PH|PK|PL|PM|PN|PR|PRO|PS|PT|PW|PY|QA|RE|RO|RS|RU|RW|SA|SB|SC|SD|SE|SG|SH|SI|SJ|SK|SL|SM|SN|SO|SR|ST|SU|SV|SY|SZ|TC|TD|TEL|TF|TG|TH|TJ|TK|TL|TM|TN|TO|TP|TR|TRAVEL|TT|TV|TW|TZ|UA|UG|UK|US|UY|UZ|VA|VC|VE|VG|VI|VN|VU|WF|WS|XN|XN|XN|XN|XN|XN|XN|XN|XN|XN|XN|YE|YT|YU|ZA|ZM|ZW)[.]?$/i';

    if (preg_match, $pattern, $matching_string){
    ... do stuff
    }

คุณอาจต้องการเพิ่มคำสั่ง if เพื่อตรวจสอบว่าสตริงที่คุณตรวจสอบนั้นสั้นกว่า 256 อักขระ - http://www.ops.ietf.org/lists/namedroppers/namedroppers.2003/msg00964.html

— อเล็กซ์วอลคอฟ
แหล่งที่มา

1

-1 เพราะนี่ตรงกับที่อยู่ IP ปลอมเช่น“ 999.999.999.999”

— bdesham

1

"แม้ว่าเคสจะไม่ได้คำนึงถึงค่าเช่น 0 ในเลขแปดตัวกำปั้นและค่าที่มากกว่า 254 (ip addres) หรือ 255 (netmask)"

— Alex Volkov

ฉันเห็นว่าคุณผ่านการรับรองคำตอบของคุณใช่ ฉันลงคะแนนเพราะคำตอบของคุณส่วนนั้นยังไม่เป็นประโยชน์

— bdesham

3

เป็นที่น่าสังเกตว่ามีห้องสมุดสำหรับภาษาส่วนใหญ่ที่ทำสิ่งนี้เพื่อคุณซึ่งมักจะสร้างไว้ในห้องสมุดมาตรฐาน และไลบรารีเหล่านั้นมีแนวโน้มที่จะได้รับการอัปเดตบ่อยกว่าโค้ดที่คุณคัดลอกออกจาก Stack Overflow คำตอบเมื่อสี่ปีที่แล้วและลืมไป และแน่นอนว่าพวกเขาจะแยกวิเคราะห์ที่อยู่ในรูปแบบที่สามารถใช้งานได้มากกว่าที่จะให้คุณจับคู่กับกลุ่มต่างๆ

ตัวอย่างเช่นการตรวจจับและแยกวิเคราะห์ IPv4 ใน (POSIX) C:

#include <arpa/inet.h>
#include <stdio.h>

int main(int argc, char *argv[]) {
  for (int i=1; i!=argc; ++i) {
    struct in_addr addr = {0};
    printf("%s: ", argv[i]);
    if (inet_pton(AF_INET, argv[i], &addr) != 1)
      printf("invalid\n");
    else
      printf("%u\n", addr.s_addr);
  }
  return 0;
}

เห็นได้ชัดว่าฟังก์ชั่นดังกล่าวไม่สามารถใช้งานได้หากคุณพยายามที่จะค้นหาที่อยู่ที่ถูกต้องทั้งหมดในข้อความแชท - แต่ถึงแม้จะอยู่ที่นั่นแล้วอาจจะง่ายกว่าถ้าใช้ regex ที่เรียบง่าย ห้องสมุดเพื่อแยกพวกเขา

ตัวอย่างเช่นใน Python:

>>> import ipaddress
>>> import re
>>> msg = "My address is 192.168.0.42; 192.168.0.420 is not an address"
>>> for maybeip in re.findall(r'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}', msg):
...     try:
...         print(ipaddress.ip_address(maybeip))
...     except ValueError:
...         pass

— abarnert
แหล่งที่มา

2

def isValidHostname(hostname):

    if len(hostname) > 255:
        return False
    if hostname[-1:] == ".":
        hostname = hostname[:-1]   # strip exactly one dot from the right,
                                   #  if present
    allowed = re.compile("(?!-)[A-Z\d-]{1,63}(?<!-)$", re.IGNORECASE)
    return all(allowed.match(x) for x in hostname.split("."))

— PythonDev
แหล่งที่มา

คุณสามารถอธิบาย regex นี้ได้ไหม ว่าอะไร (?! -), (? <! -) หมายถึงอะไร

— Scit

1

@ แยกชิ้นส่วนเหล่านั้นตรวจสอบให้แน่ใจว่าไม่ได้เริ่มต้นหรือลงท้ายด้วยอักขระ "-" หากเอนจิน regex ของคุณอนุญาตให้ใช้ ยกตัวอย่างเช่นจากงูหลามหรือจาก Perl

— YLearn

1

ฉันคิดว่านี่เป็น regex การตรวจสอบความถูกต้องที่ดีที่สุด กรุณาตรวจสอบอีกครั้ง !!!

^(([01]?[0-9]?[0-9]|2([0-4][0-9]|5[0-5]))\.){3}([01]?[0-9]?[0-9]|2([0-4][0-9]|5[0-5]))$

— Prakash Thapa
แหล่งที่มา

1

"^((\\d{1,2}|1\\d{2}|2[0-4]\\d|25[0-5])\.){3}(\\d{1,2}|1\\d{2}|2[0-4]\\d|25[0-5])$"

— zangw
แหล่งที่มา

1

ใช้ได้กับที่อยู่ IP ที่ถูกต้อง:

regex = '^([0-9]|[1-9][0-9]|[1][0-9][0-9]|[2][0-5][0-5])[.]([0-9]|[1-9][0-9]|[1][0-9][0-9]|[2][0-5][0-5])[.]([0-9]|[1-9][0-9]|[1][0-9][0-9]|[2][0-5][0-5])[.]([0-9]|[1-9][0-9]|[1][0-9][0-9]|[2][0-5][0-5])$'

— aliasav
แหล่งที่มา

1

/^(?:[a-zA-Z0-9]+|[a-zA-Z0-9][-a-zA-Z0-9]+[a-zA-Z0-9])(?:\.[a-zA-Z0-9]+|[a-zA-Z0-9][-a-zA-Z0-9]+[a-zA-Z0-9])?$/

— user2240578
แหล่งที่มา

0

นี่คือ regex ที่ฉันใช้ใน Ant เพื่อรับ IP โฮสต์พร็อกซีหรือชื่อโฮสต์จาก ANT_OPTS สิ่งนี้ถูกใช้เพื่อรับ IP พร็อกซีเพื่อให้ฉันสามารถเรียกใช้การทดสอบ Ant "isreachable" ก่อนที่จะกำหนดค่าพร็อกซีสำหรับ JVM ที่มีการแยก

^.*-Dhttp\.proxyHost=(\w{1,}\.\w{1,}\.\w{1,}\.*\w{0,})\s.*$

— บิลสตีเฟนส์
แหล่งที่มา

นั่นคือที่นั่น\wมันจะไม่จับ IP เพียงชื่อโฮสต์ในสถานการณ์

— Yaron

0

ฉันพบว่ามันใช้งานได้ดีสำหรับที่อยู่ IP มันตรวจสอบเช่นคำตอบด้านบน แต่ก็ทำให้แน่ใจว่า ip ที่แยกได้ดังนั้นจึงไม่มีข้อความหรือตัวเลข / ทศนิยมมากขึ้นหลังจากหรือก่อนที่ ip

(?! <\ S) ((:? \ D | [1-9] \ D | 1 \ d \ d | 2 [0-4] \ D | 25 [0-5]) \ ข | \ ข) {7} (?! \ S)

— แอนดรู
แหล่งที่มา

ฉันพยายามมาก แต่ฉันไม่สามารถเข้าใจ 2 สิ่งที่นี่ 1. \ b ระบุขอบเขตของคำทำไมเราถึงใช้ \ b? เขตแดนคืออะไร และ 2. ทำไมจึงทำงานได้เฉพาะกับ {7} จากสิ่งที่ฉันเข้าใจฉันคิดว่ามันควรเป็น {4} แต่มันไม่ทำงาน คุณสามารถบอกได้ว่าทำไมคุณถึงใช้บล็อกที่ไม่ได้จับภาพ

— Srichakradhar

0

AddressRegex = "^(ftp|http|https):\/\/([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}:[0-9]{1,5})$";

HostnameRegex =  /^(ftp|http|https):\/\/([a-z0-9]+\.)?[a-z0-9][a-z0-9-]*((\.[a-z]{2,6})|(\.[a-z]{2,6})(\.[a-z]{2,6}))$/i

ส่วนนี้ใช้สำหรับการตรวจสอบความถูกต้องประเภทนี้เท่านั้น

ทำงานได้ก็ต่อเมื่อ http://www.kk.com http://www.kk.co.in

ไม่ได้ผล

http://www.kk.com/ http: //www.kk.co.in.kk

http://www.kk.com/dfas http://www.kk.co.in/

— ayu สำหรับคุณ
แหล่งที่มา

0

ลองนี้:

((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

มันทำงานได้ในกรณีของฉัน

— เทวดา
แหล่งที่มา

0

เกี่ยวกับที่อยู่ IP ปรากฏว่ามีการถกเถียงกันอยู่ว่าจะรวมศูนย์นำหน้าด้วยหรือไม่ มันเคยเป็นวิธีปฏิบัติทั่วไปและเป็นที่ยอมรับกันโดยทั่วไปดังนั้นฉันขอยืนยันว่าพวกเขาควรถูกตั้งค่าสถานะว่าถูกต้องโดยไม่คำนึงถึงความชอบในปัจจุบัน นอกจากนี้ยังมีความเคลือบแคลงเกี่ยวกับว่าข้อความก่อนและหลังสตริงควรตรวจสอบและอีกครั้งฉันคิดว่ามันควร 1.2.3.4 เป็น IP ที่ถูกต้อง แต่ 1.2.3.4.5 ไม่ใช่และไม่ใช่ส่วน 1.2.3.4 หรือ 2.3.4.5 ส่วนที่ควรส่งผลในการแข่งขัน ข้อกังวลบางอย่างสามารถจัดการได้ด้วยการแสดงออกนี้:

grep -E '(^|[^[:alnum:]+)(([0-1]?[0-9]{1,2}|2[0-4][0-9]|25[0-5])\.){3}([0-1]?[0-9]{1,2}|2[0-4][0-9]|25[0-5])([^[:alnum:]]|$)'

ส่วนที่โชคร้ายที่นี่คือความจริงที่ว่าส่วน regex ที่ตรวจสอบ octet ซ้ำแล้วซ้ำอีกเป็นจริงในโซลูชั่นที่นำเสนอจำนวนมาก แม้ว่าสิ่งนี้จะดีกว่าสำหรับอินสแตนซ์ของรูปแบบการทำซ้ำสามารถถูกกำจัดได้ทั้งหมดหากสนับสนุนรูทีนย่อยใน regex ที่ใช้ ตัวอย่างถัดไปเปิดใช้งานฟังก์ชั่นเหล่านั้นด้วย-Pสวิตช์grepและยังใช้ประโยชน์จากฟังก์ชัน lookahead และ lookbehind (ชื่อฟังก์ชั่นที่ฉันเลือกคือ 'o' สำหรับ octet ฉันสามารถใช้ 'octet' เป็นชื่อ แต่ต้องการที่จะเป็นตัวย่อ)

grep -P '(?<![\d\w\.])(?<o>([0-1]?[0-9]{1,2}|2[0-4][0-9]|25[0-5]))(\.\g<o>){3}(?![\d\w\.])'

การจัดการจุดนั้นอาจสร้างผลลบปลอมหากที่อยู่ IP อยู่ในไฟล์ที่มีข้อความในรูปแบบของประโยคเนื่องจากช่วงเวลาสามารถติดตามได้โดยไม่ต้องเป็นส่วนหนึ่งของสัญกรณ์ประ ตัวแปรด้านบนจะแก้ไขได้ว่า:

grep -P '(?<![\d\w\.])(?<x>([0-1]?[0-9]{1,2}|2[0-4][0-9]|25[0-5]))(\.\g<x>){3}(?!([\d\w]|\.\d))'

— Thom Anderson
แหล่งที่มา

0

>>> my_hostname = "testhostn.ame"
>>> print bool(re.match("^(([a-zA-Z]|[a-zA-Z][a-zA-Z0-9\-]*[a-zA-Z0-9])\.)*([A-Za-z]|[A-Za-z][A-Za-z0-9\-]*[A-Za-z0-9])$", my_hostname))
True
>>> my_hostname = "testhostn....ame"
>>> print bool(re.match("^(([a-zA-Z]|[a-zA-Z][a-zA-Z0-9\-]*[a-zA-Z0-9])\.)*([A-Za-z]|[A-Za-z][A-Za-z0-9\-]*[A-Za-z0-9])$", my_hostname))
False
>>> my_hostname = "testhostn.A.ame"
>>> print bool(re.match("^(([a-zA-Z]|[a-zA-Z][a-zA-Z0-9\-]*[a-zA-Z0-9])\.)*([A-Za-z]|[A-Za-z][A-Za-z0-9\-]*[A-Za-z0-9])$", my_hostname))
True

— Mohammad Shahid Siddiqui
แหล่งที่มา

0

เฟรมเวิร์กเครือข่ายใหม่มี initializers พร้อมใช้งานสำหรับ struct IPv4Address และ struct IPv6Address ซึ่งจัดการส่วนที่อยู่ IP ได้อย่างง่ายดายมาก การทำสิ่งนี้ใน IPv6 ด้วย regex นั้นยากกับกฎการย่อทั้งหมด

น่าเสียดายที่ฉันไม่มีคำตอบที่สวยงามสำหรับชื่อโฮสต์

โปรดทราบว่า Network Framework เป็นรุ่นล่าสุดดังนั้นจึงอาจบังคับให้คุณคอมไพล์สำหรับเวอร์ชันระบบปฏิบัติการล่าสุด

import Network
let tests = ["192.168.4.4","fkjhwojfw","192.168.4.4.4","2620:3","2620::33"]

for test in tests {
    if let _ = IPv4Address(test) {
        debugPrint("\(test) is valid ipv4 address")
    } else if let _ = IPv6Address(test) {
        debugPrint("\(test) is valid ipv6 address")
    } else {
        debugPrint("\(test) is not a valid IP address")
    }
}

output:
"192.168.4.4 is valid ipv4 address"
"fkjhwojfw is not a valid IP address"
"192.168.4.4.4 is not a valid IP address"
"2620:3 is not a valid IP address"
"2620::33 is valid ipv6 address"

— ดาร์เรลรูต
แหล่งที่มา

-1

แล้วเรื่องนี้ล่ะ

([0-9]{1,3}\.){3}[0-9]{1,3}

— สายกฤษณะราว
แหล่งที่มา

9999999999.0.0.9999999999 :) แต่สำหรับโปรแกรมเมอร์ส่วนใหญ่แนวทางสั้น ๆ นี้จะพอเพียง

— อังเดร

3

-1 เนื่องจากนี่ตรงกับที่อยู่ IP ไร้สาระ (เป็น @Shebuka โน้ต)

— bdesham

-1

บน php: filter_var(gethostbyname($dns), FILTER_VALIDATE_IP) == true ? 'ip' : 'not ip'

— sirjay
แหล่งที่มา

2

ในขณะที่รหัสนี้อาจตอบคำถามโดยทั่วไปคำอธิบายข้างๆรหัสทำให้คำตอบมีประโยชน์มากกว่า โปรดแก้ไขคำตอบของคุณและระบุบริบทและคำอธิบาย

— user4642212

และถ้าฉันเข้าใจผิด FILTER_VALIDATE_IP เป็นค่า PHP เท่านั้น

— DonGar

-2

กำลังตรวจสอบชื่อโฮสต์เช่น ... mywebsite.co.in, thangaraj.name, 18thangaraj.in, thangaraj106.in เป็นต้น

[a-z\d+].*?\\.\w{2,4}$

— Thangaraj
แหล่งที่มา

3

-1 OP ขอสิ่งที่“ ผ่านการทดสอบอย่างดีเพื่อให้ตรงกับข้อกำหนด RFC ล่าสุด” แต่สิ่งนี้ไม่ตรงกันเช่น * .museum ขณะที่มันจะจับคู่ * .foo นี่คือรายการ TLD ที่ถูกต้อง

— bdesham

ฉันไม่แน่ใจว่าเป็นความคิดที่ดีที่จะใส่เครื่องหมายบวกไว้ในคลาสอักขระ (วงเล็บเหลี่ยม) นอกจากนี้ยังมี TLD ที่มี 5 ตัวอักษร ( ตัวอย่างเช่น . expert )

— Yaron

วิธีที่ดีที่สุดในการบรรลุด้วย RFC คือการใช้ฟังก์ชั่นระบบ / ภาษา inet_atonดีพอ

— m3nda

-2

ฉันคิดถึงรูปแบบการจับคู่ regex อย่างง่ายสำหรับการจับคู่ที่อยู่ IP \ d + [.] \ d + [.] \ d + [.] \ d +

— Dody
แหล่งที่มา

1111.1.1.1 ไม่ใช่ ip ที่ถูกต้อง ไม่มีวิธีในการทดสอบรูปแบบ ip จริง ๆ ถ้าคุณไม่สนใจซับเน็ต อย่างน้อยคุณควรดูแลเกี่ยวกับจำนวนของการปรากฏตัวด้วยสิ่งที่ชอบ^\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}และแน่นอนว่าจะไม่ถูกวิธี หากคุณมี languaje ที่จะเขียนสคริปต์แน่นอนคุณจะสามารถเข้าถึงฟังก์ชั่นเครือข่ายได้ วิธีที่ดีที่สุดในการตรวจสอบ REAL ip นั้นเป็นการบอกให้ระบบทำการแปลงและ ip ให้เป็นรูปแบบที่ถูกต้องจากนั้นตรวจสอบว่าเป็น true / false socket.inet_aton(ip)ในกรณีของงูใหญ่ใช้ฉัน กรณีของ PHP inet_aton($ip)ต้อง

— m3nda

ผู้ใช้ Python สามารถดูได้ที่นี่: gist.github.com/erm3nda/f25439bba66931d3ca9699b2816e796c

— m3nda