พิมพ์สตริงเป็นฐานสิบหกหรือไม่


155

ฉันมีสตริงนี้Hello world !!และฉันต้องการที่จะพิมพ์โดยใช้ Python 48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21เป็น

hex() ใช้งานได้เฉพาะสำหรับจำนวนเต็ม

จะทำอย่างไร?


หากแนวคิดคือการส่งคืนค่าเลขฐานสิบหกเพียง 2 หลักคำถามนี้แสดงถึงการใช้สตริงไบต์ (เช่น Python 2 strหรือ Python 3 bytestring) เนื่องจากไม่มีการแปลงอักขระที่ไม่ชัดเจนเป็นจำนวนเต็มใน 0 … 255 ดังนั้นสตริงอักขระ (Python 2 unicodeและ Python 3 str) ต้องมีการเข้ารหัสก่อนที่จะทำการแปลงสภาพในรูปแบบเลขฐานสิบหกนี้ คำตอบของ Aaron Hall เป็นแบบอย่างนี้
Eric O Lebigot

คำตอบ:


227

คุณสามารถแปลงสตริงของคุณให้เป็นตัวสร้าง int ใช้การจัดรูปแบบเลขฐานสิบหกสำหรับแต่ละองค์ประกอบและ intercalate ด้วยตัวคั่น:

>>> s = "Hello world !!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21

3
โปรดทราบว่าใน python3 แนวคิดของการพิมพ์แบบ a strhex ไม่สมเหตุสมผล คุณจะต้องการพิมพ์bytesวัตถุเป็นฐานสิบหก (แปลงstrเป็นbytesโดยการโทร.encode())
mic_e

8
ในความเป็นจริงนี้ผลิตออกไม่ถูกต้องใน python3: ":".join("{:02x}".format(ord(c)) for c in 'løl')ผลตอบแทน'6c:f8:6c'ในขณะที่":".join("{:02x}".format(c) for c in 'løl'.encode())การผลิตที่ถูกต้อง UTF-8 '6c:c3:b8:6c'เป็นตัวแทน
mic_e

2
คำถามและคำตอบเรียงลำดับนี้ถือว่าคุณไม่เคยมีอักขระที่ไม่ใช่ ASCII หากอินพุตของคุณอาจมีสิ่งต่าง ๆ เช่นอิโมจิหรือระบบ writting ที่ไม่ใช่ละตินคุณอาจต้องการใช้":".join("{:04x}".format(ord(c)) for c in s)(แทนที่02xด้วย04xzero-pad แต่ละตัวเลขเป็น 4 หลัก) แทน
Boris

@mic_e ทำไมจึงเป็นเช่นนี้ Scapy ทำการอ้างอิงถึงสิ่งนี้เมื่อคุณลองในล่ามที่ฝังอยู่ WARNING: Calling str(pkt) on Python 3 makes no sense!
sherrellbc

157
':'.join(x.encode('hex') for x in 'Hello World!')

3
วิธีการทำเช่นนี้ใน python3
h__

6
@hyh: h = binascii.hexlify(b"Hello world !!") to get hex string. b":".join(h[i:i+2] for i in range(0, len(h), 2))แทรก':'หลังจากทุกเลขฐานสิบหกสองหลักในนั้น
jfs

2
ใช้งานไม่ได้กับ Python 3LookupError: 'hex' is not a text encoding; use codecs.encode() to handle arbitrary codecs
Boris

55

สำหรับ Python 2.x:

':'.join(x.encode('hex') for x in 'Hello World!')

รหัสด้านบนจะไม่ทำงานกับ Python 3.xสำหรับ 3.x รหัสด้านล่างจะใช้งานได้:

':'.join(hex(ord(x))[2:] for x in 'Hello World!')

1
ควรสังเกตด้วยว่าภายหลังจะทำงานกับ python2.x ได้อีกด้วยและจะทำงานกับอักขระที่ไม่ใช่ ASCII ด้วย
raudi

1
แต่โปรดทราบด้วยว่าหลังไม่ได้เป็นศูนย์นำหน้า: hex (ord ("\ x00")) [2:] คือ "0" และ "\ x00" .encode ("hex") == "00"
Will Daniels

3
ทำไมคุณถึงตัดสินใจโพสต์สิ่งนี้เป็นคำตอบใหม่หลังจากผู้ใช้รายอื่นเสนอโซลูชั่นทั้งสองนี้มาหลายเดือนแล้ว ถ้าประเด็นคือการอธิบายความเข้ากันได้ของเวอร์ชั่นมันจะทำให้มีความเหมาะสมมากกว่าที่จะแนะนำการแก้ไขคำตอบที่มีอยู่
อากาศ

2
ตามที่ระบุไว้ที่อื่นคำตอบนี้ไม่ถูกต้องแม้แต่ครั้งเดียวเคลื่อนไหวเกิน ascii และพิจารณายูนิโค้ด ':'. เข้าร่วม (hex (ord (x)) [2:] สำหรับ x ใน 'løl') พิมพ์ '6c: f8: 6c' ไม่ถูกต้องขณะที่เอาต์พุตที่ถูกต้องคือ '6c: c3: b8: 6c'
mcduffee

23

อีกคำตอบในสองบรรทัดที่บางคนอาจอ่านง่ายขึ้นและช่วยในการดีบั๊กการแบ่งบรรทัดหรืออักขระแปลก ๆ ในสตริง:

สำหรับ Python 2.7

for character in string:
    print character, character.encode('hex')

สำหรับ Python 3.7 (ไม่ได้ทดสอบในทุกรุ่นของ 3)

for character in string:
    print(character, character.encode('utf-8').hex())

สิ่งนี้ใช้ไม่ได้กับ Python 3.6.8 (อย่างน้อย): "hex" ไม่ใช่การเข้ารหัสสตริง codecs.encode(<bytestring>, "hex")ทำงานอย่างไร
Eric O Lebigot

2
อ่าขอบคุณมากสำหรับข้อมูล ... ใช่แล้วมันเขียนไว้สำหรับ Python 2.7 ฉันจะอัปเดตคำตอบเพื่อรวมวิธีดำเนินการสำหรับ Python 3.7
copeland3300

ได้รับการยืนยัน, Python 3.7.6: import sys; s="Déjà vu Besançon,Lupiñén,Šiauliai,Großräschen,Łódź,Аша,广东省,LA"; for c in s:; w=sys.stdout.write(c+":"+c.encode('utf-8').hex()+"||"); (out)D:44||é:c3a9||j:6a||à:c3a0|| :20||v:76||u:75|| :20||B:42||e:65||s:73||a:61||n:6e||ç:c3a7||o:6f||n:6e||,:2c||L:4c||u:75||p:70||i:69||ñ:c3b1||é:c3a9||n:6e||,:2c||Š:c5a0||i:69||a:61||u:75||l:6c||i:69||a:61||i:69||,:2c||G:47||r:72||o:6f||ß:c39f||r:72||ä:c3a4||s:73||c:63||h:68||e:65||n:6e||,:2c||Ł:c581||ó:c3b3||d:64||ź:c5ba||,:2c||А:d090||ш:d188||а:d0b0||,:2c||广:e5b9bf||东:e4b89c||省:e79c81||,:2c||L:4c||A:41||
bballdave025

20

การเติมเต็มเพื่อ Fedor Gogolev ตอบ:

ขั้นแรกหากสตริงมีอักขระที่มี 'รหัส ASCII' ต่ำกว่า 10 สตริงจะไม่ปรากฏตามที่ต้องการ ในกรณีนั้นรูปแบบที่ถูกต้องควรเป็น{:02x}:

>>> s = "Hello unicode \u0005 !!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:20:21:21'
                                           ^

>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:20:21:21'
                                           ^^

ประการที่สองหาก "สตริง" ของคุณเป็นจริง "สตริงไบต์" - และเนื่องจากความแตกต่างสำคัญใน Python 3 - คุณอาจต้องการสิ่งต่อไปนี้:

>>> s = b"Hello bytes \x05 !!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:20:21:21'

โปรดทราบมีความจำเป็นสำหรับการแปลงรหัสข้างต้นไม่เป็นไบต์วัตถุที่ถูกกำหนดให้เป็น"ลำดับไม่เปลี่ยนรูปของจำนวนเต็มในช่วง 0 <= x <256"


11

พิมพ์สตริงเป็นฐานสิบหกหรือไม่

คำตอบที่ได้รับการยอมรับให้:

s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)

ผลตอบแทน:

'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'

คำตอบที่ได้รับการยอมรับจะใช้งานได้ตราบใดที่คุณใช้ไบต์ (ส่วนใหญ่เป็นอักขระ ASCII) แต่ถ้าคุณใช้ Unicode เช่น:

a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.

คุณต้องแปลงเป็นไบต์อย่างใด

หากเทอร์มินัลของคุณไม่ยอมรับอักขระเหล่านี้คุณสามารถถอดรหัสจาก UTF-8 หรือใช้ชื่อ (เพื่อให้คุณสามารถวางและเรียกใช้รหัสพร้อมกับฉัน):

a_string = (
    "\N{CYRILLIC CAPITAL LETTER PE}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER VE}"
    "\N{CYRILLIC SMALL LETTER IE}"
    "\N{CYRILLIC SMALL LETTER TE}"
    "\N{SPACE}"
    "\N{CYRILLIC SMALL LETTER EM}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{EXCLAMATION MARK}"
    "\N{EXCLAMATION MARK}"
)

ดังนั้นเราจะเห็นว่า:

":".join("{:02x}".format(ord(c)) for c in a_string)

ผลตอบแทน

'41f:440:438:432:435:442:20:43c:438:440:21:21'

ผลลัพธ์ไม่ดี / ไม่คาดคิด - เป็นจุดรหัสที่รวมกันเพื่อสร้างภาพกราฟิกที่เราเห็นใน Unicode จาก Unicode Consortium ซึ่งเป็นตัวแทนของภาษาทั่วโลก นี่ไม่ใช่วิธีที่เราจัดเก็บข้อมูลนี้เพื่อให้สามารถตีความโดยแหล่งข้อมูลอื่นได้

ในการอนุญาตให้แหล่งข้อมูลอื่นใช้ข้อมูลนี้เรามักจะต้องแปลงเป็นการเข้ารหัสแบบ UTF-8 เพื่อบันทึกสตริงนี้เป็นไบต์เป็นดิสก์หรือเผยแพร่เป็น html ดังนั้นเราต้องการการเข้ารหัสเพื่อแปลงรหัสจุดเป็นหน่วยรหัสของ UTF-8 - ใน Python 3 ordไม่จำเป็นเพราะbytesมันเป็นจำนวนเต็ม:

>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

หรืออาจจะหรูหรากว่านี้ด้วยการใช้ f-strings ใหม่ (มีเฉพาะใน Python 3):

>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

ใน Python 2 ให้ส่งผ่านcไปordก่อนord(c)- ตัวอย่างเพิ่มเติม:

>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

1
@ not2qubit โปรดลองตัวอย่างเหล่านี้อีกครั้ง - ฉันใช้เวลาสักครู่เพื่อพูดถึงความแตกต่างระหว่าง Python 2 และ 3 และเห็นได้ชัดว่าฉันเพิ่งเขียนสิ่งเหล่านี้สำหรับ Python 2 และขอบคุณสำหรับการตอบคำถามของฉัน!
Aaron Hall

ใช่มันทำ ขอบคุณ!
not2qubit

8

คุณสามารถใช้hexdump's

import hexdump
hexdump.dump("Hello World", sep=":")

(ต่อท้าย.lower()หากคุณต้องการตัวพิมพ์เล็ก) ใช้ได้ทั้ง Python 2 และ 3


นอกจากนี้ปัญหาที่ฉันพบถ้าคุณมีปัญหาในการติดตั้ง hexdump หรือแพคเกจอื่น ๆ มันเป็นเรื่องปกติเนื่องจากการตั้งค่าพร็อกซีให้ลองเรียกใช้ pip ด้วยตัวเลือกพรอกซี pip install -U hexdump --proxy http://proxy.address:port
Eduard Florinescu

ที่จริงผมทำผิดพลาดของการใช้sudoด้วยpipซึ่ง messed up pacman...
โทเบียส KIENZLER

6

การใช้ฟังก์ชั่นแผนที่และแลมบ์ดาสามารถสร้างรายการค่าฐานสิบหกซึ่งสามารถพิมพ์ได้ (หรือใช้เพื่อวัตถุประสงค์อื่น)

>>> s = 'Hello 1 2 3 \x01\x02\x03 :)'

>>> map(lambda c: hex(ord(c)), s)
['0x48', '0x65', '0x6c', '0x6c', '0x6f', '0x20', '0x31', '0x20', '0x32', '0x20', '0x33', '0x20', '0x1', '0x2', '0x3', '0x20', '0x3a', '0x29']

[hex(ord(c)) for c in s]
บอริส

2

ซึ่งสามารถทำได้ด้วยวิธีการดังต่อไปนี้:

from __future__ import print_function
str = "Hello World !!"
for char in str:
    mm = int(char.encode('hex'), 16)
    print(hex(mm), sep=':', end=' ' )

ผลลัพธ์ของสิ่งนี้จะเป็น hex ดังนี้

0x48 0x65 0x6c 0x6c 0x6f 0x20 0x57 0x6F 0x72 0x6C 0x64 0x64 0x20 0x21 0x21


ฉันจะหาอนาคตได้จาก
ไหน

สำหรับการอ้างอิงในอนาคต__future__เป็นไลบรารีมาตรฐานที่มีอยู่ใน Python 2 รุ่นล่าสุดที่สามารถใช้เพื่อสร้างคุณสมบัติตามปกติเฉพาะใน Python 3 ที่สามารถใช้ร่วมกันได้ ในคำตอบนี้ก็นำมาใช้เพื่อให้ได้print(text)คุณสมบัติ "ฟังก์ชั่นพิมพ์" ซึ่งแทนที่print textไวยากรณ์จากงูหลาม 2. โปรดดูเอกสารหลาม
Eric Reed

2

ค่อนข้างกว้างขึ้นสำหรับผู้ที่ไม่สนใจ Python3 หรือโคลอน:

from codecs import encode

data = open('/dev/urandom', 'rb').read(20)
print(encode(data, 'hex'))      # data

print(encode(b"hello", 'hex'))  # string

0

ใช้base64.b16encodeในpython2 (ในตัว)

>>> s = 'Hello world !!'
>>> h = base64.b16encode(s)
>>> ':'.join([h[i:i+2] for i in xrange(0, len(h), 2)]
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'

มันใช้งานไม่ได้ สิ่งที่คุณใช้สำหรับการนำเข้าและทำไมไม่ใช้.decode()?
not2qubit

0

เพียงเพื่อความสะดวกง่ายมาก

def hexlify_byteString(byteString, delim="%"):
    ''' very simple way to hexlify a bytestring using delimiters '''
    retval = ""
    for intval in byteString:
        retval += ( '0123456789ABCDEF'[int(intval / 16)])
        retval += ( '0123456789ABCDEF'[int(intval % 16)])
        retval += delim
    return( retval[:-1])

hexlify_byteString(b'Hello World!', ":")
# Out[439]: '48:65:6C:6C:6F:20:57:6F:72:6C:64:21'

0

สำหรับสิ่งที่ให้ประสิทธิภาพมากกว่า''.format()คุณสามารถใช้สิ่งนี้:

>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in 'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>> 
>>> ':'.join( '%02x'%(v if type(v) is int else ord(v)) for v in b'Hello World !!' )
'48:65:6C:6C:6F:20:77:6F:72:6C:64:20:21:21'
>>> 

ขอโทษที่ไม่สามารถมองดีกว่า
จะดีถ้าหนึ่งก็สามารถทำได้'%02x'%vแต่ที่ใช้เวลาเพียง int ...
แต่คุณจะติดอยู่กับไบต์สตริงโดยไม่ต้องตรรกะในการเลือกb''ord(v)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.