วิธีสร้าง python bytes object จาก long hex string


93

ฉันมีลำดับเลขฐานสิบหกแบบยาวในสตริงเช่น

000000000000484240FA063DE5D0B744ADBED63A81FAEA390000C8428640A43D5005BD44

อีกต่อไปเพียงหลายกิโลไบต์ มีวิธีในตัวในการแปลงสิ่งนี้เป็นวัตถุไบต์ใน python 2.6 / 3 หรือไม่?


4
โปรดทราบว่าคำตอบด้านล่างอาจมีลักษณะเหมือนกัน แต่ส่งคืนค่าประเภทต่างๆ s.decode ('hex') ส่งคืน str เช่นเดียวกับ unhexlify (s) bytearray.fromhex (s) ส่งคืน bytearray จากถ้อยคำของคำถามนี้ฉันคิดว่าเครื่องหมายถูกสีเขียวขนาดใหญ่ควรอยู่บน bytearray.fromhex (s) ไม่ใช่ใน s.decode ('hex')
Paul Hoffman


2
คำถามจะซ้ำซ้อนกับคำถามที่สร้างขึ้นใน 2 ปีต่อมาได้อย่างไร
ออกอากาศซ้ำ

1
@CiroSantilli 郝海东冠状病六四事件法轮功สตริงไบต์ไม่ใช่อาร์เรย์ไบต์ stackoverflow.com/questions/1740696/…
LarsH

@LarsH ยุติธรรมพอ. @ recursive: วันที่ไม่ใช่ปัจจัยหลัก: meta.stackexchange.com/questions/147643/…
Ciro Santilli 郝海东冠状病六四事件法轮功

คำตอบ:


101

ทำงานใน Python 2.7 ขึ้นไปรวมถึง python3:

result = bytearray.fromhex('deadbeef')

หมายเหตุ:ดูเหมือนว่าจะมีบั๊กกับbytearray.fromhex()ฟังก์ชันใน Python 2.6 เอกสาร python.org ระบุว่าฟังก์ชันยอมรับสตริงเป็นอาร์กิวเมนต์ แต่เมื่อนำไปใช้ข้อผิดพลาดต่อไปนี้จะเกิดขึ้น:

>>> bytearray.fromhex('B9 01EF')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: fromhex() argument 1 must be unicode, not str`

9
และอีกขั้นตอนหนึ่งฉันต้องการสตริงไบต์ (เช่น Python 3's b '\ x04 \ xea [... ]') ซึ่งคุณจะได้รับจาก bytearray ด้วยbytes(bytearray.fromhex('deadbeef'))
berto

5
@berto: ในกรณีนี้มีเส้นทางที่ตรงกว่าในรูปแบบของbinascii.unhexlify().
Martijn Pieters

1
ขอบคุณ @MartijnPieters ฉันจะให้ภาพนั้น
berto

1
คำตอบนี้ไม่ได้ทำตามที่คำถามนั้นถาม ส่งคืนอาร์เรย์ของไบต์ที่ไม่แน่นอนไม่ใช่ python bytestring นั่นเหมือนกับการส่งคืนอาร์เรย์ของสตริงแทนที่จะเป็นสตริง
Mike Martin

2
@LarsH: วิธีนี้ไม่มีใน Python 2 รุ่นเก่า นั่นไม่สำคัญอีกต่อไปในวันนี้ แต่เป็นปัญหาในปี 2559
Martijn Pieters

78
result = bytes.fromhex(some_hex_string)

2
นี่เป็นวิธีที่ตรงที่สุดในการทำสิ่งที่โพสต์ต้นฉบับถาม มีเหตุผลอะไรที่ไม่ใช่คำตอบที่ยอมรับ?
Sebastian Gaweda

fromhex () method (ทั้งไบต์และ bytearray) จะใช้ได้เช่นกันเมื่อเลขฐานสิบหกถูกคั่นด้วยช่องว่าง สะดวกมาก!
Klaws

1
นี่ควรเป็นคำตอบที่ยอมรับได้จริงๆ คำตอบที่ยอมรับในปัจจุบันไม่ได้ทำตามที่คำถามนั้นถาม ส่งคืนอาร์เรย์ของไบต์ที่ไม่แน่นอนไม่ใช่ bytestring
Mike Martin

40

คุณสามารถทำได้ด้วยตัวแปลงรหัสฐานสิบหก กล่าวคือ:

>>> s='000000000000484240FA063DE5D0B744ADBED63A81FAEA390000C8428640A43D5005BD44'
>>> s.decode('hex')
'\x00\x00\x00\x00\x00\x00HB@\xfa\x06=\xe5\xd0\xb7D\xad\xbe\xd6:\x81\xfa\xea9\x00\x00\xc8B\x86@\xa4=P\x05\xbdD'

16
codecs.decode('0a0a0a', 'hex_codec')ควรใช้งานได้กับ 2.x และ 3.x :-)
Abbafei

37

ลองใช้โมดูล binascii

from binascii import unhexlify
b = unhexlify(myhexstr)

9
สองวิธีในการทำ 2.x สามวิธีใน 3.x มากสำหรับ "มีทางเดียวเท่านั้นที่จะทำได้" ...
technomalogical

อีกสองวิธีคือ 'ในตัว' มากกว่าดังนั้นฉันจะใช้วิธีใดวิธีหนึ่ง
Crescent Fresh

@technomalogical: ความคิดเห็นของคุณไม่เกี่ยวข้องกับคำตอบ บางทีคุณควรลบและเปลี่ยนเป็นโพสต์ใน comp.lang.python
tzot

1
@technomalogical: ฉันเห็นด้วยกับΤΖΩΤΖΙΟΥ นอกจากนี้คุณเข้าใจผิด วลีที่ถูกต้องคือควรจะมีและควร one-- เพียงหนึ่ง - ที่เห็นได้ชัดวิธีที่จะทำมัน
nosklo

2
โปรดทราบว่าใน Python 3.2 (ไม่ว่าจะด้วยการออกแบบหรือข้อผิดพลาดฉันไม่แน่ใจ) unhexlifyตอนนี้จะไม่ยอมรับสตริง แต่มีเฉพาะไบต์ ค่อนข้างโง่จริงๆ แต่หมายความว่าคุณต้องใช้b = unhexlify(bytes(myhexstr, 'utf-8'))
Scott Griffiths


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.