คุณจะแปลงอาร์เรย์ไบต์เป็นสตริงเลขฐานสิบหกและในทางกลับกันได้อย่างไร


1371

คุณจะแปลงอาร์เรย์ไบต์เป็นสตริงเลขฐานสิบหกได้อย่างไรและในทางกลับกัน


8
คำตอบที่ยอมรับด้านล่างปรากฏขึ้นเพื่อจัดสรรจำนวนสตริงที่น่ากลัวในการแปลงสตริงเป็นไบต์ ฉันสงสัยว่าวิธีนี้ส่งผลกระทบต่อประสิทธิภาพการทำงาน
Wim Coenen

9
ชั้น SoapHexBinary ทำสิ่งที่คุณต้องการอย่างแน่นอน
Mykroft

สำหรับฉันแล้วการถามคำถาม 2 ข้อใน 1 โพสต์นั้นไม่ได้มาตรฐาน
SandRock

คำตอบ:


1353

ทั้ง:

public static string ByteArrayToString(byte[] ba)
{
  StringBuilder hex = new StringBuilder(ba.Length * 2);
  foreach (byte b in ba)
    hex.AppendFormat("{0:x2}", b);
  return hex.ToString();
}

หรือ:

public static string ByteArrayToString(byte[] ba)
{
  return BitConverter.ToString(ba).Replace("-","");
}

ตัวอย่างเช่นที่นี่มีความหลากหลายมากขึ้น

การแปลงกลับจะเป็นเช่นนี้:

public static byte[] StringToByteArray(String hex)
{
  int NumberChars = hex.Length;
  byte[] bytes = new byte[NumberChars / 2];
  for (int i = 0; i < NumberChars; i += 2)
    bytes[i / 2] = Convert.ToByte(hex.Substring(i, 2), 16);
  return bytes;
}

ใช้เป็นตัวเลือกที่ดีที่สุดในการทำงานร่วมกับSubstring Convert.ToByteดูคำตอบนี้สำหรับข้อมูลเพิ่มเติม หากคุณต้องการประสิทธิภาพที่ดีขึ้นคุณต้องหลีกเลี่ยงก่อนที่คุณจะสามารถวางConvert.ToByteSubString


24
คุณกำลังใช้ SubString การวนซ้ำนี้ไม่จัดสรรจำนวนวัตถุสตริงที่น่ากลัวใช่หรือไม่
Wim Coenen

30
สุจริต - จนกว่าจะทำให้ประสิทธิภาพการทำงานลดลงอย่างมากฉันมักจะเพิกเฉยต่อสิ่งนี้และเชื่อใจรันไทม์และ GC เพื่อดูแลมัน
Tomalak

87
เนื่องจากไบต์เป็นสอง nibbles สตริงเลขฐานสิบหกใด ๆ ที่ถูกต้องหมายถึงอาร์เรย์ไบต์จะต้องมีการนับจำนวนอักขระ ไม่ควรเพิ่ม 0 ไม่ว่าจะเพิ่มที่ใดก็ตาม - หากต้องการเพิ่มจะถือว่าสมมติฐานเกี่ยวกับข้อมูลที่ไม่ถูกต้องซึ่งอาจเป็นอันตราย หากมีสิ่งใดวิธีการ StringToByteArray ควรโยน FormatException หากสตริงเลขฐานสิบมีจำนวนอักขระคี่
David Boike

7
@ 00jt คุณต้องทำการตั้งสมมติฐานว่า F == 0F อาจเป็นเช่นเดียวกับ 0F หรืออินพุตถูกตัดและ F คือจุดเริ่มต้นของบางสิ่งที่คุณไม่ได้รับจริงๆ มันขึ้นอยู่กับบริบทของคุณที่จะตั้งสมมติฐานเหล่านั้น แต่ฉันเชื่อว่าฟังก์ชั่นวัตถุประสงค์ทั่วไปควรปฏิเสธตัวละครแปลก ๆ ว่าไม่ถูกต้องแทนที่จะทำตามสมมติฐานสำหรับรหัสการโทร
David Boike

11
@DavidBoike คำถามที่ไม่มีอะไรจะทำอย่างไรกับ "วิธีการจัดการค่าสตรีมอาจถูกตัด" มันพูดคุยเกี่ยวกับสตริง String myValue = 10.ToString ("X"); myValue คือ "A" ไม่ใช่ "0A" ตอนนี้ไปอ่านสตริงนั้นกลับไปเป็นไบต์, อุ๊ปคุณแตกมัน
00jt

488

การวิเคราะห์ประสิทธิภาพ

หมายเหตุ: ผู้นำคนใหม่ ณ วันที่ 2015-08-25

ฉันใช้วิธีการแปลงหลายวิธีผ่านStopwatchการทดสอบประสิทธิภาพหยาบการทดสอบประโยคแบบสุ่ม (n = 61, 1,000 ซ้ำ) และการรันด้วยข้อความ Project Gutenburg (n = 1,238,957, 150 iterations) นี่คือผลลัพธ์โดยประมาณจากเร็วที่สุดไปช้าที่สุด วัดทั้งหมดที่อยู่ในเห็บ ( 10,000 เห็บ = 1 มิลลิวินาที ) และบันทึกญาติทั้งหมดจะถูกเมื่อเทียบกับ [ช้า] StringBuilderการดำเนินการ สำหรับรหัสที่ใช้ดูด้านล่างหรือrepo กรอบการทดสอบที่ฉันตอนนี้รักษารหัสสำหรับการทำงานนี้

คำปฏิเสธ

คำเตือน: อย่าพึ่งพาสถิติเหล่านี้สำหรับสิ่งที่เป็นรูปธรรม พวกมันเป็นเพียงตัวอย่างของข้อมูลตัวอย่าง หากคุณต้องการประสิทธิภาพสูงสุดโปรดทดสอบวิธีเหล่านี้ในตัวแทนด้านสิ่งแวดล้อมของความต้องการการผลิตของคุณด้วยตัวแทนข้อมูลของสิ่งที่คุณจะใช้

ผล

ตารางการค้นหาเป็นผู้นำในการจัดการไบต์ โดยทั่วไปมีรูปแบบหนึ่งของการคำนวณล่วงหน้าว่า nibble หรือ byte ใด ๆ ที่กำหนดจะเป็น hex จากนั้นเมื่อคุณเจาะข้อมูลคุณเพียงแค่ค้นหาส่วนถัดไปเพื่อดูว่าจะเป็นสตริงเลขฐานสิบหก ค่านั้นจะถูกเพิ่มไปยังเอาต์พุตสตริงที่เกิดขึ้นในบางแบบ สำหรับการจัดการไบต์เป็นเวลานานอาจทำให้นักพัฒนาบางคนอ่านยากขึ้นเป็นวิธีที่มีประสิทธิภาพสูงสุด

ทางออกที่ดีที่สุดของคุณยังคงอยู่ในการค้นหาข้อมูลตัวแทนและทดลองใช้ในสภาพแวดล้อมที่เหมือนการผลิต หากคุณมีข้อ จำกัด ด้านหน่วยความจำที่แตกต่างกันคุณอาจต้องการวิธีที่มีการจัดสรรน้อยลงสำหรับวิธีที่จะเร็วกว่า แต่ใช้หน่วยความจำมากขึ้น

รหัสการทดสอบ

รู้สึกอิสระที่จะเล่นกับรหัสทดสอบที่ฉันใช้ มีเวอร์ชันรวมอยู่ที่นี่ แต่อย่าลังเลที่จะลอกแบบrepoและเพิ่มวิธีการของคุณเอง โปรดส่งคำขอการดึงหากคุณพบสิ่งที่น่าสนใจหรือต้องการช่วยปรับปรุงกรอบการทดสอบที่ใช้

  1. เพิ่มเมธอดสแตติกใหม่ ( Func<byte[], string>) ไปยัง /Tests/ConvertByteArrayToHexString/Test.cs
  2. เพิ่มชื่อของเมธอดนั้นให้กับTestCandidatesค่าส่งคืนในคลาสเดียวกันนั้น
  3. ตรวจสอบให้แน่ใจว่าคุณกำลังรันเวอร์ชันอินพุตที่คุณต้องการประโยคหรือข้อความโดยสลับความคิดเห็นในGenerateTestInputคลาสเดียวกันนั้น
  4. Hit F5และรอเอาต์พุต (สร้างดัมพ์ HTML ในโฟลเดอร์ / bin ด้วย)
static string ByteArrayToHexStringViaStringJoinArrayConvertAll(byte[] bytes) {
    return string.Join(string.Empty, Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaStringConcatArrayConvertAll(byte[] bytes) {
    return string.Concat(Array.ConvertAll(bytes, b => b.ToString("X2")));
}
static string ByteArrayToHexStringViaBitConverter(byte[] bytes) {
    string hex = BitConverter.ToString(bytes);
    return hex.Replace("-", "");
}
static string ByteArrayToHexStringViaStringBuilderAggregateByteToString(byte[] bytes) {
    return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.Append(b.ToString("X2"))).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachByteToString(byte[] bytes) {
    StringBuilder hex = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes)
        hex.Append(b.ToString("X2"));
    return hex.ToString();
}
static string ByteArrayToHexStringViaStringBuilderAggregateAppendFormat(byte[] bytes) {
    return bytes.Aggregate(new StringBuilder(bytes.Length * 2), (sb, b) => sb.AppendFormat("{0:X2}", b)).ToString();
}
static string ByteArrayToHexStringViaStringBuilderForEachAppendFormat(byte[] bytes) {
    StringBuilder hex = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes)
        hex.AppendFormat("{0:X2}", b);
    return hex.ToString();
}
static string ByteArrayToHexViaByteManipulation(byte[] bytes) {
    char[] c = new char[bytes.Length * 2];
    byte b;
    for (int i = 0; i < bytes.Length; i++) {
        b = ((byte)(bytes[i] >> 4));
        c[i * 2] = (char)(b > 9 ? b + 0x37 : b + 0x30);
        b = ((byte)(bytes[i] & 0xF));
        c[i * 2 + 1] = (char)(b > 9 ? b + 0x37 : b + 0x30);
    }
    return new string(c);
}
static string ByteArrayToHexViaByteManipulation2(byte[] bytes) {
    char[] c = new char[bytes.Length * 2];
    int b;
    for (int i = 0; i < bytes.Length; i++) {
        b = bytes[i] >> 4;
        c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
        b = bytes[i] & 0xF;
        c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
    }
    return new string(c);
}
static string ByteArrayToHexViaSoapHexBinary(byte[] bytes) {
    SoapHexBinary soapHexBinary = new SoapHexBinary(bytes);
    return soapHexBinary.ToString();
}
static string ByteArrayToHexViaLookupAndShift(byte[] bytes) {
    StringBuilder result = new StringBuilder(bytes.Length * 2);
    string hexAlphabet = "0123456789ABCDEF";
    foreach (byte b in bytes) {
        result.Append(hexAlphabet[(int)(b >> 4)]);
        result.Append(hexAlphabet[(int)(b & 0xF)]);
    }
    return result.ToString();
}
static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_Lookup32, GCHandleType.Pinned).AddrOfPinnedObject();
static string ByteArrayToHexViaLookup32UnsafeDirect(byte[] bytes) {
    var lookupP = _lookup32UnsafeP;
    var result = new string((char)0, bytes.Length * 2);
    fixed (byte* bytesP = bytes)
    fixed (char* resultP = result) {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++) {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return result;
}
static uint[] _Lookup32 = Enumerable.Range(0, 255).Select(i => {
    string s = i.ToString("X2");
    return ((uint)s[0]) + ((uint)s[1] << 16);
}).ToArray();
static string ByteArrayToHexViaLookupPerByte(byte[] bytes) {
    var result = new char[bytes.Length * 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        var val = _Lookup32[bytes[i]];
        result[2*i] = (char)val;
        result[2*i + 1] = (char) (val >> 16);
    }
    return new string(result);
}
static string ByteArrayToHexViaLookup(byte[] bytes) {
    string[] hexStringTable = new string[] {
        "00", "01", "02", "03", "04", "05", "06", "07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F",
        "10", "11", "12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C", "1D", "1E", "1F",
        "20", "21", "22", "23", "24", "25", "26", "27", "28", "29", "2A", "2B", "2C", "2D", "2E", "2F",
        "30", "31", "32", "33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D", "3E", "3F",
        "40", "41", "42", "43", "44", "45", "46", "47", "48", "49", "4A", "4B", "4C", "4D", "4E", "4F",
        "50", "51", "52", "53", "54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E", "5F",
        "60", "61", "62", "63", "64", "65", "66", "67", "68", "69", "6A", "6B", "6C", "6D", "6E", "6F",
        "70", "71", "72", "73", "74", "75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F",
        "80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A", "8B", "8C", "8D", "8E", "8F",
        "90", "91", "92", "93", "94", "95", "96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F",
        "A0", "A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB", "AC", "AD", "AE", "AF",
        "B0", "B1", "B2", "B3", "B4", "B5", "B6", "B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF",
        "C0", "C1", "C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC", "CD", "CE", "CF",
        "D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7", "D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF",
        "E0", "E1", "E2", "E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED", "EE", "EF",
        "F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8", "F9", "FA", "FB", "FC", "FD", "FE", "FF",
    };
    StringBuilder result = new StringBuilder(bytes.Length * 2);
    foreach (byte b in bytes) {
        result.Append(hexStringTable[b]);
    }
    return result.ToString();
}

อัปเดต (2010-01-13)

เพิ่มคำตอบของ Waleed ในการวิเคราะห์ ค่อนข้างเร็ว

อัปเดต (2011-10-05)

เพิ่มstring.Concat Array.ConvertAllชุดตัวเลือกเพื่อความสมบูรณ์ (ต้องการ. NET 4.0) เมื่อเทียบกับstring.Joinรุ่น

อัปเดต (2012-02-05)

ทดสอบ repo StringBuilder.Append(b.ToString("X2"))รวมสายพันธุ์เช่น ไม่มีใครเสียใจกับผลลัพธ์ใด ๆ foreachเร็วกว่า{IEnumerable}.Aggregateเช่น แต่BitConverterก็ยังชนะอยู่

อัปเดต (2012-04-03)

เพิ่มSoapHexBinaryคำตอบของ Mykroft ในการวิเคราะห์ซึ่งเข้าแทนที่อันดับสาม

อัปเดต (2013-01-15)

เพิ่มคำตอบในการจัดการไบต์ของ CodesInChaos ซึ่งเข้ามาแทนที่อันดับแรก

อัปเดต (2013-05-23)

เพิ่มคำตอบการค้นหาของ Nathan Moinvaziri และตัวแปรจากบล็อกของ Brian Lambert ทั้งค่อนข้างเร็ว แต่ไม่ได้เป็นผู้นำในเครื่องทดสอบที่ฉันใช้ (AMD Phenom 9750)

อัปเดต (2014-07-31)

เพิ่ม @ CodesInChaos ของคำตอบการค้นหาแบบใช้ไบต์ใหม่ ดูเหมือนจะเป็นผู้นำในการทดสอบประโยคและการทดสอบข้อความแบบเต็ม

อัปเดต (2015-08-20)

เพิ่มการเพิ่มประสิทธิภาพและความunsafeหลากหลายของ airbreatherให้กับrepo ของคำตอบนี้ หากคุณต้องการเล่นในเกมที่ไม่ปลอดภัยคุณจะได้รับประสิทธิภาพที่เหนือกว่าผู้ชนะอันดับต้น ๆ ของทั้งสตริงสั้นและข้อความขนาดใหญ่


คุณสนใจที่จะทดสอบรหัสจากคำตอบของ Waleed หรือไม่? ดูเหมือนว่าจะเร็วมาก stackoverflow.com/questions/311165/…
Cristian Diaconescu

5
แม้จะทำให้รหัสพร้อมใช้งานสำหรับคุณในการทำสิ่งที่คุณร้องขอด้วยตัวคุณเองฉันก็อัปเดตรหัสทดสอบเพื่อรวมคำตอบของ Waleed ความไม่พอใจกันทั้งหมดมันเร็วกว่ามาก
patridge

2
@CodesInChaos เรียบร้อยแล้ว และมันก็ชนะการทดสอบของฉันด้วยเช่นกัน ฉันยังไม่ได้หลอกให้เข้าใจวิธีการชั้นนำอย่างใดอย่างหนึ่งอย่างสมบูรณ์ แต่พวกเขาก็ถูกซ่อนไว้จากการโต้ตอบโดยตรงได้อย่างง่ายดาย
patridge

6
คำตอบนี้ไม่มีความตั้งใจที่จะตอบคำถามว่า "ธรรมดา" หรือธรรมดาเป็นอย่างไร เป้าหมายคือเพื่อให้การวัดประสิทธิภาพขั้นพื้นฐานแก่ผู้คนตั้งแต่เมื่อคุณต้องการทำ Conversion เหล่านี้คุณมักจะทำมาก ๆ หากมีคนต้องการความเร็วที่ไม่มากนักพวกเขาเพียงแค่รันการวัดประสิทธิภาพด้วยข้อมูลการทดสอบที่เหมาะสมในสภาพแวดล้อมการคำนวณที่ต้องการ จากนั้นให้นำวิธีการนั้นไปใช้กับวิธีการขยายที่คุณไม่เคยดูการใช้งานนั้นอีก (เช่นbytes.ToHexStringAtLudicrousSpeed())
patridge

2
เพิ่งสร้างตารางการค้นหาที่มีประสิทธิภาพสูง ตัวแปรที่ปลอดภัยนั้นเร็วกว่าผู้นำปัจจุบันของ CPU ประมาณ 30% ตัวแปรที่ไม่ปลอดภัยจะเร็วยิ่งขึ้น stackoverflow.com/a/24343727/445517
CodesInChaos

244

มีคลาสเรียกว่าSoapHexBinaryที่ทำสิ่งที่คุณต้องการ

using System.Runtime.Remoting.Metadata.W3cXsd2001;

public static byte[] GetStringToBytes(string value)
{
    SoapHexBinary shb = SoapHexBinary.Parse(value);
    return shb.Value;
}

public static string GetBytesToString(byte[] value)
{
    SoapHexBinary shb = new SoapHexBinary(value);
    return shb.ToString();
}

35
SoapHexBinary พร้อมใช้งานจาก. NET 1.0 และอยู่ใน mscorlib แม้จะเป็นเนมสเปซที่ตลก แต่ก็ทำในสิ่งที่คำถามถาม
Sly Gryphon

4
เยี่ยมมาก! โปรดทราบว่าคุณจะต้องวางสตริงคี่ด้วย 0 นำหน้าสำหรับ GetStringToBytes เช่นโซลูชันอื่น ๆ
Carter Medlin

คุณเคยเห็นความคิดในการปรับใช้หรือไม่ คำตอบที่ยอมรับมี IMHO ที่ดีกว่า
mfloryan

6
สนใจดูการใช้งานโมโนได้ที่นี่: github.com/mono/mono/blob/master/mcs/class/corlib/…
Jeremy

1
SoapHexBinary ไม่รองรับใน. NET Core /. NET Standard ...
juFo

141

เมื่อเขียนโค้ด crypto เป็นเรื่องปกติที่จะหลีกเลี่ยงการขึ้นอยู่กับข้อมูลและการค้นหาตารางเพื่อให้แน่ใจว่ารันไทม์ไม่ได้ขึ้นอยู่กับข้อมูล

มันค่อนข้างเร็วด้วย

static string ByteToHexBitFiddle(byte[] bytes)
{
    char[] c = new char[bytes.Length * 2];
    int b;
    for (int i = 0; i < bytes.Length; i++) {
        b = bytes[i] >> 4;
        c[i * 2] = (char)(55 + b + (((b-10)>>31)&-7));
        b = bytes[i] & 0xF;
        c[i * 2 + 1] = (char)(55 + b + (((b-10)>>31)&-7));
    }
    return new string(c);
}

Ph'nglui mglw'nafh Cthulhu R'lyeh wgah'nagl fhtagn


ละทิ้งความหวังทุกท่านที่เข้ามาที่นี่

คำอธิบายของซอที่เล่นแปลก:

  1. bytes[i] >> 4แยกแทะสูงของไบต์
    bytes[i] & 0xFแยกแทะต่ำของไบต์
  2. b - 10
    เป็น< 0ค่าb < 10ซึ่งจะกลายเป็นหลักทศนิยม
    คือ>= 0ค่าb > 10ซึ่งจะกลายเป็นจดหมายจากไปAF
  3. การใช้i >> 31จำนวนเต็ม 32 บิตที่มีการเซ็นชื่อจะแยกสัญญาณออกมาขอบคุณส่วนขยายสัญญาณ มันจะเป็น-1สำหรับi < 0และสำหรับ0i >= 0
  4. รวม 2) และ 3) แสดงว่า(b-10)>>31จะเป็น0ตัวอักษรและ-1ตัวเลข
  5. เมื่อมองถึงกรณีตัวอักษรคำสรุปสุดท้ายจะกลายเป็น0และbอยู่ในช่วง 10 ถึง 15 เราต้องการแมปกับA(65) ถึงF(70) ซึ่งหมายถึงการเพิ่ม 55 ( 'A'-10)
  6. หากต้องการดูตัวอักษรสำหรับตัวเลขเราต้องการที่จะปรับการสรุปล่าสุดเพื่อให้แผนที่bจากช่วง 0 ถึง 9 เป็นช่วง0(48) ถึง9(57) นี่หมายความว่ามันจะต้องเป็น -7 ( '0' - 55)
    ตอนนี้เราทำได้เพียงแค่คูณด้วย 7 แต่ตั้งแต่ -1 เป็นตัวแทนจากทุกบิตเป็น 1 เราสามารถใช้แทน& -7ตั้งแต่และ(0 & -7) == 0(-1 & -7) == -7

ข้อควรพิจารณาเพิ่มเติมบางประการ:

  • ฉันไม่ได้ใช้ตัวแปรลูปที่สองเพื่อจัดทำดัชนีcเนื่องจากการวัดแสดงให้เห็นว่าการคำนวณจากiราคาถูกกว่า
  • การใช้i < bytes.Lengthขอบเขตเดียวกับบนของลูปทำให้ JITter กำจัดการตรวจสอบขอบเขตbytes[i]ดังนั้นฉันจึงเลือกตัวแปรนั้น
  • การสร้างbint ทำให้เกิดการแปลงที่ไม่จำเป็นจากและไปยังไบต์

10
และhex stringเพื่อbyte[] array?
AaA

15
+1 สำหรับการอ้างอิงแหล่งที่มาของคุณอย่างถูกต้องหลังจากเรียกใช้เวทมนตร์สีดำบิตนั้น ทุกคนทักทายคธูลู
Edward

4
สิ่งที่เกี่ยวกับ string to byte []?
Syaiful Nizam Yahya

9
ดี! สำหรับผู้ที่ต้องการตัวพิมพ์เล็กการแสดงออกเปลี่ยนไปอย่างชัดเจน87 + b + (((b-10)>>31)&-39)
eXavier

2
@AaA คุณบอกว่า " byte[] array" byte[][]ที่แท้จริงหมายถึงอาร์เรย์ของอาร์เรย์ไบต์หรือ ฉันแค่ล้อเล่นสนุก
CoolOppo

97

หากคุณต้องการความยืดหยุ่นมากกว่าBitConverterแต่ไม่ต้องการลูปแบบชัด ๆ แบบ clunky ในช่วงปี 1990 คุณสามารถทำได้ดังนี้:

String.Join(String.Empty, Array.ConvertAll(bytes, x => x.ToString("X2")));

หรือถ้าคุณใช้. NET 4.0:

String.Concat(Array.ConvertAll(bytes, x => x.ToString("X2")));

(อันหลังมาจากความคิดเห็นในโพสต์ต้นฉบับ)


21
ยิ่งสั้นลง: String.Concat (Array.ConvertAll (bytes, x => x.ToString ("X2"))
Nestor

14
ยิ่งสั้นลง: String.Concat (bytes.Select (b => b.ToString ("X2")))) [.NET4]
Allon Guralnek

14
ตอบเพียงครึ่งคำถาม
Sly Gryphon

1
ทำไมคนที่สองต้องการ. Net 4 String.Concat อยู่ใน. Net 2.0
Polyfun

2
โดยทั่วไปแล้วลูป "90's style" จะเร็วขึ้น แต่มีจำนวนเล็กน้อยพอที่จะไม่สำคัญในบริบทส่วนใหญ่ ยังคงมีมูลค่าการกล่าวถึงแม้ว่า
Austin_Anderson

69

อีกวิธีการตามตารางการค้นหา อันนี้ใช้ตารางการค้นหาเพียงหนึ่งตารางสำหรับแต่ละไบต์แทนที่จะเป็นตารางการค้นหาต่อแทะ

private static readonly uint[] _lookup32 = CreateLookup32();

private static uint[] CreateLookup32()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
    }
    return result;
}

private static string ByteArrayToHexViaLookup32(byte[] bytes)
{
    var lookup32 = _lookup32;
    var result = new char[bytes.Length * 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        var val = lookup32[bytes[i]];
        result[2*i] = (char)val;
        result[2*i + 1] = (char) (val >> 16);
    }
    return new string(result);
}

ฉันยังผ่านการทดสอบสายพันธุ์นี้โดยใช้ushort, struct{char X1, X2}, struct{byte X1, X2}ในตารางการค้นหา

ขึ้นอยู่กับเป้าหมายการรวบรวม (x86, X64) ที่มีประสิทธิภาพเดียวกันโดยประมาณหรือช้ากว่าตัวแปรนี้เล็กน้อย


และเพื่อประสิทธิภาพที่สูงขึ้นunsafeพี่น้องของมัน:

private static readonly uint[] _lookup32Unsafe = CreateLookup32Unsafe();
private static readonly uint* _lookup32UnsafeP = (uint*)GCHandle.Alloc(_lookup32Unsafe,GCHandleType.Pinned).AddrOfPinnedObject();

private static uint[] CreateLookup32Unsafe()
{
    var result = new uint[256];
    for (int i = 0; i < 256; i++)
    {
        string s=i.ToString("X2");
        if(BitConverter.IsLittleEndian)
            result[i] = ((uint)s[0]) + ((uint)s[1] << 16);
        else
            result[i] = ((uint)s[1]) + ((uint)s[0] << 16);
    }
    return result;
}

public static string ByteArrayToHexViaLookup32Unsafe(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new char[bytes.Length * 2];
    fixed(byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return new string(result);
}

หรือถ้าคุณพิจารณาว่าสามารถเขียนลงในสตริงได้โดยตรง:

public static string ByteArrayToHexViaLookup32UnsafeDirect(byte[] bytes)
{
    var lookupP = _lookup32UnsafeP;
    var result = new string((char)0, bytes.Length * 2);
    fixed (byte* bytesP = bytes)
    fixed (char* resultP = result)
    {
        uint* resultP2 = (uint*)resultP;
        for (int i = 0; i < bytes.Length; i++)
        {
            resultP2[i] = lookupP[bytesP[i]];
        }
    }
    return result;
}

ทำไมการสร้างตารางการค้นหาในรุ่นที่ไม่ปลอดภัยจึงสลับ nibbles ของไบต์ที่คำนวณล่วงหน้าได้ ฉันคิดว่า endianness เพียงเปลี่ยนลำดับของเอนทิตีที่ประกอบด้วยหลายไบต์
Raif Atef

@RaifAtef สิ่งที่สำคัญที่นี่ไม่ใช่คำสั่งของไส้ปากกา แต่คำสั่งของ 16 บิตในจำนวนเต็ม 32 บิต แต่ฉันกำลังพิจารณาเขียนมันใหม่เพื่อให้รหัสเดียวกันสามารถทำงานได้โดยไม่คำนึงถึงความ endianness
CodesInChaos

ฉันอ่านรหัสอีกครั้งฉันคิดว่าคุณทำสิ่งนี้เพราะเมื่อคุณส่งถ่าน * ในภายหลังไปยัง uint * และกำหนด (เมื่อสร้าง hex char) รันไทม์ / CPU จะพลิกไบต์ (เนื่องจาก uint ไม่ได้รับการปฏิบัติ เช่นเดียวกับ 2 ตัวอักษร 16 บิตแยกต่างหาก) ดังนั้นคุณจะต้องทำการพลิกก่อนเพื่อชดเชย ฉันถูกไหม ? Endianness ทำให้เกิดความสับสน :-)
Raif Atef

4
นี่แค่ตอบครึ่งหนึ่งของคำถาม ... ถ้างั้นสตริง hex ถึงไบต์?
Narvalex

3
@CodesInChaos ฉันสงสัยว่าSpanสามารถใช้ตอนนี้แทนได้หรือunsafeไม่?
Konrad

64

คุณสามารถใช้วิธี BitConverter.ToString:

byte[] bytes = {0, 1, 2, 4, 8, 16, 32, 64, 128, 256}
Console.WriteLine( BitConverter.ToString(bytes));

เอาท์พุท:

00-01-02-04-08-10-20-40-80-FF

ข้อมูลเพิ่มเติม: วิธี BitConverter.ToString (ไบต์ [])


14
ตอบเพียงครึ่งคำถาม
Sly Gryphon

3
ส่วนที่สองของคำตอบอยู่ที่ไหน
สวรรค์

56

ฉันเพิ่งพบปัญหาเดียวกันมากในวันนี้และฉันเจอรหัสนี้:

private static string ByteArrayToHex(byte[] barray)
{
    char[] c = new char[barray.Length * 2];
    byte b;
    for (int i = 0; i < barray.Length; ++i)
    {
        b = ((byte)(barray[i] >> 4));
        c[i * 2] = (char)(b > 9 ? b + 0x37 : b + 0x30);
        b = ((byte)(barray[i] & 0xF));
        c[i * 2 + 1] = (char)(b > 9 ? b + 0x37 : b + 0x30);
    }
    return new string(c);
}

ที่มา: ฟอรั่มโพสต์byte [] Array to Hex String (ดูโพสต์โดย PZahra) ฉันแก้ไขโค้ดเล็กน้อยเพื่อลบคำนำหน้า 0x

ฉันทำการทดสอบประสิทธิภาพของรหัสและเร็วกว่าการใช้ BitConverter.ToString () เกือบแปดเท่า (เร็วที่สุดตามการส่งของ Patridge)


ไม่ต้องพูดถึงว่านี่ใช้หน่วยความจำน้อยที่สุด ไม่มีการสร้างสตริงกลางขึ้นมา
Chochos

8
ตอบเพียงครึ่งคำถาม
Sly Gryphon

มันยอดเยี่ยมเพราะมันใช้งานได้กับ NET ทุกรุ่นรวมถึง NETMF ผู้ชนะ!
Jonesome Reinstate Monica

1
คำตอบที่ได้รับการยอมรับมีวิธีการ HexToByteArray ที่ยอดเยี่ยม 2 วิธีซึ่งเป็นอีกครึ่งหนึ่งของคำถาม โซลูชันของ Waleed ตอบคำถามที่กำลังรันอยู่ว่าจะทำอย่างไรโดยไม่ต้องสร้างสตริงจำนวนมากในกระบวนการ
Brendten Eickstaedt

สตริงใหม่ (c) คัดลอกและจัดสรรใหม่หรือไม่หรือมันฉลาดพอที่จะรู้ว่าเมื่อใดที่มันสามารถห่ออักขระ [] ได้?
jjxtra

19

นี่คือคำตอบสำหรับการแก้ไขครั้งที่ 4ของคำตอบยอดนิยมของTomalak (และการแก้ไขที่ตามมา)

ฉันจะทำให้กรณีที่การแก้ไขนี้ไม่ถูกต้องและอธิบายว่าทำไมมันสามารถเปลี่ยนกลับ ระหว่างทางคุณอาจเรียนรู้สิ่งหนึ่งหรือสองอย่างเกี่ยวกับภายในและดูตัวอย่างอีกอย่างของการเพิ่มประสิทธิภาพก่อนวัยอันควรจริง ๆ และวิธีที่มันสามารถกัดคุณได้

tl; dr:ใช้Convert.ToByteและString.Substringถ้าคุณรีบ ("รหัสดั้งเดิม" ด้านล่าง) มันเป็นชุดค่าผสมที่ดีที่สุดหากคุณไม่ต้องการนำกลับมาใช้Convert.ToByteใหม่ ใช้สิ่งที่ก้าวหน้ากว่านี้ (ดูคำตอบอื่น ๆ ) ที่ไม่ได้ใช้Convert.ToByteหากคุณต้องการประสิทธิภาพ ไม่ได้ใช้อะไรอื่นนอกเหนือString.Substringร่วมกับConvert.ToByteเว้นแต่มีคนที่มีสิ่งที่น่าสนใจที่จะพูดเกี่ยวกับเรื่องนี้ในความคิดเห็นของคำตอบนี้

คำเตือน:คำตอบนี้อาจล้าสมัยหากมีConvert.ToByte(char[], Int32)การใช้งานเกินพิกัดในกรอบงาน สิ่งนี้ไม่น่าจะเกิดขึ้นเร็ว ๆ นี้

ตามกฎทั่วไปฉันไม่ชอบพูดว่า "อย่าปรับให้เหมาะสมก่อนกำหนด" เพราะไม่มีใครรู้ว่าเมื่อ "คลอดก่อนกำหนด" คืออะไร สิ่งเดียวที่คุณต้องพิจารณาเมื่อตัดสินใจว่าจะปรับให้เหมาะสมหรือไม่คือ: "ฉันมีเวลาและทรัพยากรในการตรวจสอบวิธีการปรับให้เหมาะสมหรือไม่" หากคุณไม่ทำมันก็เร็วเกินไปรอจนกว่าโครงการของคุณจะเป็นผู้ใหญ่มากขึ้นหรือจนกว่าคุณจะต้องการประสิทธิภาพ (หากมีความต้องการจริงคุณจะต้องใช้เวลา) ในระหว่างนี้ให้ทำสิ่งที่ง่ายที่สุดที่อาจใช้ได้แทน

รหัสเดิม:

    public static byte[] HexadecimalStringToByteArray_Original(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        for (var i = 0; i < outputLength; i++)
            output[i] = Convert.ToByte(input.Substring(i * 2, 2), 16);
        return output;
    }

รุ่นที่ 4:

    public static byte[] HexadecimalStringToByteArray_Rev4(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
                output[i] = Convert.ToByte(new string(new char[2] { (char)sr.Read(), (char)sr.Read() }), 16);
        }
        return output;
    }

การแก้ไขหลีกเลี่ยงString.Substringและใช้StringReaderแทน เหตุผลที่กำหนดคือ:

แก้ไข: คุณสามารถปรับปรุงประสิทธิภาพสำหรับสตริงยาวโดยใช้ตัวแยกวิเคราะห์รหัสผ่านตัวเดียวเช่น:

ดูรหัสอ้างอิงสำหรับString.Substringมันชัดเจน "Single-Pass" แล้ว; และทำไมมันไม่ควรเป็นเช่นนั้น? มันทำงานในระดับไบต์ไม่ได้อยู่ในคู่ตัวแทน

มันจะจัดสรรสตริงใหม่อย่างไรก็ตาม แต่คุณต้องจัดสรรสตริงใหม่เพื่อส่งConvert.ToByteต่อไป นอกจากนี้วิธีการแก้ปัญหาที่ให้ไว้ในการแก้ไขยังจัดสรรวัตถุอื่นในทุกการทำซ้ำ (อาร์เรย์สองถ่าน); คุณสามารถวางการจัดสรรนั้นไว้ภายนอกลูปและนำอาเรย์นั้นมาใช้ซ้ำเพื่อหลีกเลี่ยงปัญหานั้น

    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
            {
                numeral[0] = (char)sr.Read();
                numeral[1] = (char)sr.Read();
                output[i] = Convert.ToByte(new string(numeral), 16);
            }
        }
        return output;
    }

เลขฐานสิบหกแต่ละค่าnumeralแทน octet เดียวโดยใช้สองหลัก (สัญลักษณ์)

แต่ทำไมต้องโทรStringReader.Readสองครั้ง เพียงแค่เรียกโอเวอร์โหลดที่สองและขอให้อ่านตัวละครสองตัวในอาเรย์สองตัวพร้อมกัน และลดจำนวนการโทรสองครั้ง

    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        using (var sr = new StringReader(input))
        {
            for (var i = 0; i < outputLength; i++)
            {
                var read = sr.Read(numeral, 0, 2);
                Debug.Assert(read == 2);
                output[i] = Convert.ToByte(new string(numeral), 16);
            }
        }
        return output;
    }

สิ่งที่คุณเหลืออยู่คือตัวอ่านสตริงที่เพิ่มเฉพาะ "value" เป็นดัชนีขนาน (ภายใน_pos) ซึ่งคุณสามารถประกาศตัวเอง ( jเช่น) ตัวแปรความยาวซ้ำซ้อน (ภายใน_length) และการอ้างอิงซ้ำซ้อนกับอินพุต สตริง (ภายใน_s) มันไม่มีประโยชน์อะไร

หากคุณสงสัยว่าRead"อ่าน" เพียงแค่ดูที่รหัสสิ่งที่มันทำคือการเรียกString.CopyToใช้สตริงอินพุต ส่วนที่เหลือเป็นเพียงการจัดทำหนังสือเพื่อรักษาค่านิยมที่เราไม่ต้องการ

ดังนั้นลบตัวอ่านสตริงแล้วและเรียกCopyToตัวเอง; มันง่ายขึ้นชัดเจนขึ้นและมีประสิทธิภาพมากขึ้น

    public static byte[] HexadecimalStringToByteArray(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        for (int i = 0, j = 0; i < outputLength; i++, j += 2)
        {
            input.CopyTo(j, numeral, 0, 2);
            output[i] = Convert.ToByte(new string(numeral), 16);
        }
        return output;
    }

คุณต้องการjดัชนีที่เพิ่มขึ้นทีละสองขนานiหรือไม่? แน่นอนไม่เพียงแค่คูณiสอง (ซึ่งคอมไพเลอร์ควรจะสามารถเพิ่มประสิทธิภาพเพื่อเพิ่ม)

    public static byte[] HexadecimalStringToByteArray_BestEffort(string input)
    {
        var outputLength = input.Length / 2;
        var output = new byte[outputLength];
        var numeral = new char[2];
        for (int i = 0; i < outputLength; i++)
        {
            input.CopyTo(i * 2, numeral, 0, 2);
            output[i] = Convert.ToByte(new string(numeral), 16);
        }
        return output;
    }

โซลูชันมีลักษณะอย่างไรตอนนี้ เหมือนกับว่ามันเป็นจุดเริ่มต้นแทนที่จะใช้String.Substringเพื่อจัดสรรสตริงและคัดลอกข้อมูลไปยังมันคุณใช้อาร์เรย์ตัวกลางที่คุณคัดลอกตัวเลขฐานสิบหกไปแล้วจัดสรรสตริงด้วยตัวคุณเองและคัดลอกข้อมูลอีกครั้งจาก อาร์เรย์และเป็นสตริง (เมื่อคุณส่งมันในตัวสร้างสตริง) สำเนาที่สองอาจได้รับการปรับให้เหมาะสมหากสตริงอยู่ในพูลฝึกงานอยู่แล้ว แต่String.Substringจะสามารถหลีกเลี่ยงได้ในกรณีเหล่านี้

ในความเป็นจริงถ้าคุณดูString.Substringอีกครั้งคุณจะเห็นว่ามันใช้ความรู้ภายในระดับต่ำในการสร้างสตริงเพื่อจัดสรรสตริงได้เร็วกว่าที่คุณสามารถทำได้และมันอินไลน์รหัสเดียวกันที่ใช้CopyToโดยตรงเพื่อหลีกเลี่ยง ค่าโทร

String.Substring

  • กรณีที่เลวร้ายที่สุด: การจัดสรรอย่างรวดเร็วหนึ่งสำเนาเร็ว
  • กรณีที่ดีที่สุด: ไม่มีการจัดสรรไม่มีการคัดลอก

วิธีการด้วยตนเอง

  • กรณีที่เลวร้ายที่สุด: การจัดสรรปกติสองชุด, สำเนาปกติหนึ่งชุด, สำเนาด่วนหนึ่งชุด
  • กรณีที่ดีที่สุด: หนึ่งการจัดสรรปกติหนึ่งสำเนาปกติ

สรุป? หากคุณต้องการใช้Convert.ToByte(String, Int32) (เพราะคุณไม่ต้องการที่จะกลับมาใช้การทำงานที่ตัวเอง) มีไม่ได้ดูเหมือนจะเป็นวิธีที่จะชนะString.Substring; สิ่งที่คุณทำคือวิ่งเป็นวงกลมสร้างล้อใหม่ (เฉพาะวัสดุที่ดีที่สุดเท่านั้น)

โปรดทราบว่าการใช้Convert.ToByteและString.Substringเป็นตัวเลือกที่สมบูรณ์แบบหากคุณไม่ต้องการประสิทธิภาพที่ยอดเยี่ยม ข้อควรจำ: เลือกใช้ตัวเลือกอื่นหากคุณมีเวลาและทรัพยากรในการตรวจสอบวิธีการทำงานอย่างถูกต้อง

หากมีConvert.ToByte(char[], Int32)สิ่งต่าง ๆ จะแตกต่างกันแน่นอน (เป็นไปได้ที่จะทำสิ่งที่ฉันอธิบายไว้ข้างต้นและหลีกเลี่ยงอย่างสมบูรณ์String)

ฉันสงสัยว่าคนที่รายงานประสิทธิภาพที่ดีขึ้นด้วยการ "หลีกเลี่ยงString.Substring" ก็ควรหลีกเลี่ยงConvert.ToByte(String, Int32)ซึ่งคุณควรทำเช่นนั้นหากคุณต้องการประสิทธิภาพ ดูคำตอบอื่น ๆ นับไม่ถ้วนเพื่อค้นหาวิธีการที่แตกต่างกันทั้งหมด

ข้อจำกัดความรับผิดชอบ: ฉันไม่ได้แยกเฟรมเวิร์กเวอร์ชันล่าสุดออกมาเพื่อตรวจสอบว่าแหล่งอ้างอิงนั้นเป็นข้อมูลล่าสุดฉันคิดว่ามันเป็น

ตอนนี้ทุกอย่างฟังดูดีและมีเหตุผลหวังว่าจะชัดเจนหากคุณได้รับการจัดการเพื่อให้ห่างไกล แต่มันเป็นเรื่องจริงเหรอ?

Intel(R) Core(TM) i7-3720QM CPU @ 2.60GHz
    Cores: 8
    Current Clock Speed: 2600
    Max Clock Speed: 2600
--------------------
Parsing hexadecimal string into an array of bytes
--------------------
HexadecimalStringToByteArray_Original: 7,777.09 average ticks (over 10000 runs), 1.2X
HexadecimalStringToByteArray_BestEffort: 8,550.82 average ticks (over 10000 runs), 1.1X
HexadecimalStringToByteArray_Rev4: 9,218.03 average ticks (over 10000 runs), 1.0X

ใช่

อุปกรณ์ประกอบฉากสู่นกกระทาสำหรับกรอบการทำงานของมันง่ายต่อการแฮ็ก อินพุตที่ใช้คือแฮช SHA-1 ต่อไปนี้ทำซ้ำ 5,000 ครั้งเพื่อสร้างสตริงที่ยาว 100,000 ไบต์

209113288F93A9AB8E474EA78D899AFDBB874355

มีความสุข! (แต่เพิ่มประสิทธิภาพด้วยการกลั่นกรอง)


ข้อผิดพลาด: {"ไม่พบตัวเลขที่รู้จักใด ๆ "}
Priya Jagtap

17

เติมเต็มเพื่อตอบโดย @CodesInChaos (วิธีกลับรายการ)

public static byte[] HexToByteUsingByteManipulation(string s)
{
    byte[] bytes = new byte[s.Length / 2];
    for (int i = 0; i < bytes.Length; i++)
    {
        int hi = s[i*2] - 65;
        hi = hi + 10 + ((hi >> 31) & 7);

        int lo = s[i*2 + 1] - 65;
        lo = lo + 10 + ((lo >> 31) & 7) & 0x0f;

        bytes[i] = (byte) (lo | hi << 4);
    }
    return bytes;
}

คำอธิบาย:

& 0x0f คือการสนับสนุนตัวอักษรตัวพิมพ์เล็ก

hi = hi + 10 + ((hi >> 31) & 7); เหมือนกับ:

hi = ch-65 + 10 + (((ch-65) >> 31) & 7);

สำหรับ '0' .. '9' มันเป็นเช่นเดียวกับhi = ch - 65 + 10 + 7;ซึ่งเป็นhi = ch - 48(นี้เป็นเพราะ0xffffffff & 7)

สำหรับ 'A' .. 'F' มันเป็นhi = ch - 65 + 10;(เป็นเพราะ0x00000000 & 7)

สำหรับ '' .. 'F' เราต้องตัวเลขใหญ่ดังนั้นเราจึงต้องลบ 32 จากรุ่นเริ่มต้นโดยการทำบางบิตโดยใช้0& 0x0f

65 คือรหัสสำหรับ 'A'

48 คือรหัสสำหรับ '0'

7 คือจำนวนตัวอักษรระหว่าง'9'และ'A'ในตาราง ASCII ( ...456789:;<=>?@ABCD...)


16

ปัญหานี้สามารถแก้ไขได้โดยใช้ตารางการค้นหา สิ่งนี้จะต้องมีหน่วยความจำคงที่จำนวนเล็กน้อยสำหรับทั้งตัวเข้ารหัสและตัวถอดรหัส อย่างไรก็ตามวิธีนี้จะรวดเร็ว:

  • ตารางตัวเข้ารหัส 512 ไบต์หรือ 1024 ไบต์ (ขนาดเป็นสองเท่าหากต้องการตัวพิมพ์ใหญ่และตัวพิมพ์เล็ก)
  • ตัวถอดรหัสตาราง 256 ไบต์หรือ 64 KiB (ทั้งการค้นหาแบบถ่านเดี่ยวหรือการค้นหาแบบถ่านคู่)

โซลูชันของฉันใช้ 1024 ไบต์สำหรับตารางการเข้ารหัสและ 256 ไบต์สำหรับการถอดรหัส

ถอดรหัส

private static readonly byte[] LookupTable = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static byte Lookup(char c)
{
  var b = LookupTable[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

public static byte ToByte(char[] chars, int offset)
{
  return (byte)(Lookup(chars[offset]) << 4 | Lookup(chars[offset + 1]));
}

การเข้ารหัส

private static readonly char[][] LookupTableUpper;
private static readonly char[][] LookupTableLower;

static Hex()
{
  LookupTableLower = new char[256][];
  LookupTableUpper = new char[256][];
  for (var i = 0; i < 256; i++)
  {
    LookupTableLower[i] = i.ToString("x2").ToCharArray();
    LookupTableUpper[i] = i.ToString("X2").ToCharArray();
  }
}

public static char[] ToCharLower(byte[] b, int bOffset)
{
  return LookupTableLower[b[bOffset]];
}

public static char[] ToCharUpper(byte[] b, int bOffset)
{
  return LookupTableUpper[b[bOffset]];
}

การเปรียบเทียบ

StringBuilderToStringFromBytes:   106148
BitConverterToStringFromBytes:     15783
ArrayConvertAllToStringFromBytes:  54290
ByteManipulationToCharArray:        8444
TableBasedToCharArray:              5651 *

* วิธีนี้

บันทึก

ระหว่างการถอดรหัส IOException และ IndexOutOfRangeException อาจเกิดขึ้นได้ (หากตัวอักษรมีค่าสูงเกินไป> 256) ควรใช้วิธีการสำหรับการยกเลิกการเข้ารหัสสตรีมหรืออาร์เรย์นี่เป็นเพียงการพิสูจน์แนวคิด


2
การใช้หน่วยความจำ 256 ไบต์ไม่สำคัญเมื่อคุณเรียกใช้รหัสบน CLR
dolmen

9

นี่คือโพสต์ที่ยอดเยี่ยม ฉันชอบทางออกของ Waleed ฉันไม่ได้วิ่งผ่านการทดสอบของ patridge แต่มันก็ค่อนข้างเร็ว ฉันต้องการกระบวนการย้อนกลับโดยแปลงสตริง hex เป็นอาร์เรย์แบบไบต์ดังนั้นฉันจึงเขียนมันเป็นวิธีกลับด้านโซลูชันของ Waleed ไม่แน่ใจว่ามันเร็วกว่าโซลูชันเดิมของ Tomalak หรือไม่ อีกครั้งฉันไม่ได้ทำกระบวนการย้อนกลับผ่านการทดสอบของ Patridge

private byte[] HexStringToByteArray(string hexString)
{
    int hexStringLength = hexString.Length;
    byte[] b = new byte[hexStringLength / 2];
    for (int i = 0; i < hexStringLength; i += 2)
    {
        int topChar = (hexString[i] > 0x40 ? hexString[i] - 0x37 : hexString[i] - 0x30) << 4;
        int bottomChar = hexString[i + 1] > 0x40 ? hexString[i + 1] - 0x37 : hexString[i + 1] - 0x30;
        b[i / 2] = Convert.ToByte(topChar + bottomChar);
    }
    return b;
}

รหัสนี้จะถือว่าสตริงฐานสิบหกใช้ตัวอักษรอัลฟาตัวพิมพ์ใหญ่และจะระเบิดถ้าสตริงฐานสิบหกใช้ตัวอักษรตัวพิมพ์เล็ก อาจต้องการทำการแปลง "ตัวพิมพ์ใหญ่" บนสตริงอินพุตเพื่อให้ปลอดภัย
Marc Novakowski

นั่นคือการสังเกตการณ์ที่ชาญฉลาด รหัสถูกเขียนขึ้นเพื่อย้อนกลับโซลูชันของ Waleed การเรียกใช้ ToUpper จะทำให้อัลกอริทึมช้าลง แต่จะอนุญาตให้จัดการกับตัวอักษรตัวพิมพ์เล็ก
Chris F

3
Convert.ToByte (topChar + bottomChar) สามารถเขียนเป็น (ไบต์) (topChar + bottomChar)
Amir Rezaei

เพื่อจัดการกับทั้งสองกรณีโดยไม่มีการลงโทษที่มีประสิทธิภาพมากhexString[i] &= ~0x20;
เบ็น Voigt

9

ทำไมต้องทำให้ซับซ้อน นี่ง่ายใน Visual Studio 2008:

ค#:

string hex = BitConverter.ToString(YourByteArray).Replace("-", "");

VB:

Dim hex As String = BitConverter.ToString(YourByteArray).Replace("-", "")

2
เหตุผลคือประสิทธิภาพเมื่อคุณต้องการโซลูชันประสิทธิภาพสูง :)
Ricky

7

เพื่อไม่ให้กองซ้อนกับคำตอบมากมายที่นี่ แต่ฉันพบว่าค่อนข้างเหมาะสม (~ 4.5x ดีกว่าที่ยอมรับ) การใช้ตัวแยกสตริง hex แบบตรงไปตรงมา ก่อนออกจากการทดสอบของฉัน (ชุดแรกคือการใช้งานของฉัน):

Give me that string:
04c63f7842740c77e545bb0b2ade90b384f119f6ab57b680b7aa575a2f40939f

Time to parse 100,000 times: 50.4192 ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

Accepted answer: (StringToByteArray)
Time to parse 100000 times: 233.1264ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

With Mono's implementation:
Time to parse 100000 times: 777.2544ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

With SoapHexBinary:
Time to parse 100000 times: 845.1456ms
Result as base64: BMY/eEJ0DHflRbsLKt6Qs4TxGfarV7aAt6pXWi9Ak58=
BitConverter'd: 04-C6-3F-78-42-74-0C-77-E5-45-BB-0B-2A-DE-90-B3-84-F1-19-F6-AB-5
7-B6-80-B7-AA-57-5A-2F-40-93-9F

บรรทัด base64 และ 'BitConverter' อยู่ที่นั่นเพื่อทดสอบความถูกต้อง โปรดทราบว่าพวกเขาเท่ากัน

การดำเนินการ:

public static byte[] ToByteArrayFromHex(string hexString)
{
  if (hexString.Length % 2 != 0) throw new ArgumentException("String must have an even length");
  var array = new byte[hexString.Length / 2];
  for (int i = 0; i < hexString.Length; i += 2)
  {
    array[i/2] = ByteFromTwoChars(hexString[i], hexString[i + 1]);
  }
  return array;
}

private static byte ByteFromTwoChars(char p, char p_2)
{
  byte ret;
  if (p <= '9' && p >= '0')
  {
    ret = (byte) ((p - '0') << 4);
  }
  else if (p <= 'f' && p >= 'a')
  {
    ret = (byte) ((p - 'a' + 10) << 4);
  }
  else if (p <= 'F' && p >= 'A')
  {
    ret = (byte) ((p - 'A' + 10) << 4);
  } else throw new ArgumentException("Char is not a hex digit: " + p,"p");

  if (p_2 <= '9' && p_2 >= '0')
  {
    ret |= (byte) ((p_2 - '0'));
  }
  else if (p_2 <= 'f' && p_2 >= 'a')
  {
    ret |= (byte) ((p_2 - 'a' + 10));
  }
  else if (p_2 <= 'F' && p_2 >= 'A')
  {
    ret |= (byte) ((p_2 - 'A' + 10));
  } else throw new ArgumentException("Char is not a hex digit: " + p_2, "p_2");

  return ret;
}

ฉันลองบางสิ่งด้วยunsafeและย้ายลำดับ (ซ้ำซ้อน) ตัวละครไปยังตอดifไปที่วิธีอื่น แต่นี่เป็นวิธีที่เร็วที่สุดที่ได้รับ

(ฉันยอมรับว่าคำตอบนี้ครึ่งคำถามฉันรู้สึกว่าการแปลงสตริง -> ไบต์ [] มีการแสดงต่ำกว่าในขณะที่ไบต์ [] -> สตริงมุมดูเหมือนจะครอบคลุมดีดังนั้นคำตอบนี้)


1
สำหรับสาวกของ Knuth: ฉันทำเช่นนี้เพราะฉันต้องแยกสตริง hex สองสามพันทุกสองสามนาทีหรือมากกว่านั้นดังนั้นมันสำคัญที่จะเร็วที่สุดเท่าที่จะเป็นไปได้ วิธีการแก้ปัญหาของ Tomalak นั้นไม่ได้ช้าลงอย่างเห็นได้ชัดหากมีการแยกวิเคราะห์ดังกล่าวไม่เกิดขึ้น
Ben Mosher

5

รุ่นที่ปลอดภัย:

public static class HexHelper
{
    [System.Diagnostics.Contracts.Pure]
    public static string ToHex(this byte[] value)
    {
        if (value == null)
            throw new ArgumentNullException("value");

        const string hexAlphabet = @"0123456789ABCDEF";

        var chars = new char[checked(value.Length * 2)];
        unchecked
        {
            for (int i = 0; i < value.Length; i++)
            {
                chars[i * 2] = hexAlphabet[value[i] >> 4];
                chars[i * 2 + 1] = hexAlphabet[value[i] & 0xF];
            }
        }
        return new string(chars);
    }

    [System.Diagnostics.Contracts.Pure]
    public static byte[] FromHex(this string value)
    {
        if (value == null)
            throw new ArgumentNullException("value");
        if (value.Length % 2 != 0)
            throw new ArgumentException("Hexadecimal value length must be even.", "value");

        unchecked
        {
            byte[] result = new byte[value.Length / 2];
            for (int i = 0; i < result.Length; i++)
            {
                // 0(48) - 9(57) -> 0 - 9
                // A(65) - F(70) -> 10 - 15
                int b = value[i * 2]; // High 4 bits.
                int val = ((b - '0') + ((('9' - b) >> 31) & -7)) << 4;
                b = value[i * 2 + 1]; // Low 4 bits.
                val += (b - '0') + ((('9' - b) >> 31) & -7);
                result[i] = checked((byte)val);
            }
            return result;
        }
    }
}

รุ่นที่ไม่ปลอดภัยสำหรับผู้ที่ต้องการประสิทธิภาพและไม่กลัวความไม่ปลอดภัย ToHex เร็วขึ้นประมาณ 35% และ FromHex เร็วขึ้น 10%

public static class HexUnsafeHelper
{
    [System.Diagnostics.Contracts.Pure]
    public static unsafe string ToHex(this byte[] value)
    {
        if (value == null)
            throw new ArgumentNullException("value");

        const string alphabet = @"0123456789ABCDEF";

        string result = new string(' ', checked(value.Length * 2));
        fixed (char* alphabetPtr = alphabet)
        fixed (char* resultPtr = result)
        {
            char* ptr = resultPtr;
            unchecked
            {
                for (int i = 0; i < value.Length; i++)
                {
                    *ptr++ = *(alphabetPtr + (value[i] >> 4));
                    *ptr++ = *(alphabetPtr + (value[i] & 0xF));
                }
            }
        }
        return result;
    }

    [System.Diagnostics.Contracts.Pure]
    public static unsafe byte[] FromHex(this string value)
    {
        if (value == null)
            throw new ArgumentNullException("value");
        if (value.Length % 2 != 0)
            throw new ArgumentException("Hexadecimal value length must be even.", "value");

        unchecked
        {
            byte[] result = new byte[value.Length / 2];
            fixed (char* valuePtr = value)
            {
                char* valPtr = valuePtr;
                for (int i = 0; i < result.Length; i++)
                {
                    // 0(48) - 9(57) -> 0 - 9
                    // A(65) - F(70) -> 10 - 15
                    int b = *valPtr++; // High 4 bits.
                    int val = ((b - '0') + ((('9' - b) >> 31) & -7)) << 4;
                    b = *valPtr++; // Low 4 bits.
                    val += (b - '0') + ((('9' - b) >> 31) & -7);
                    result[i] = checked((byte)val);
                }
            }
            return result;
        }
    }
}

BTW สำหรับการทดสอบเกณฑ์มาตรฐานเริ่มต้นตัวอักษรทุกครั้งที่ฟังก์ชั่นการแปลงที่เรียกว่าผิดตัวอักษรจะต้องเป็น const (สำหรับสตริง) หรือแบบคงที่อ่านได้อย่างเดียว (สำหรับถ่าน []) จากนั้นการแปลงแบบตัวอักษรของไบต์ [] เป็นสตริงจะเร็วเท่ากับเวอร์ชันการจัดการไบต์

และแน่นอนการทดสอบจะต้องรวบรวมใน Release (ด้วยการปรับให้เหมาะสม) และด้วยตัวเลือกการดีบัก "ปิดใช้งานการเพิ่มประสิทธิภาพ JIT" (เช่นเดียวกับ "เปิดใช้งาน Just My Code" หากรหัสนั้นต้องสามารถ debuggable ได้)


5

ฟังก์ชั่นผกผันสำหรับรหัส Waleed Eissa (Hex String To Byte Array):

    public static byte[] HexToBytes(this string hexString)        
    {
        byte[] b = new byte[hexString.Length / 2];            
        char c;
        for (int i = 0; i < hexString.Length / 2; i++)
        {
            c = hexString[i * 2];
            b[i] = (byte)((c < 0x40 ? c - 0x30 : (c < 0x47 ? c - 0x37 : c - 0x57)) << 4);
            c = hexString[i * 2 + 1];
            b[i] += (byte)(c < 0x40 ? c - 0x30 : (c < 0x47 ? c - 0x37 : c - 0x57));
        }

        return b;
    }

ฟังก์ชัน Waleed Eissa พร้อมรองรับตัวพิมพ์เล็ก:

    public static string BytesToHex(this byte[] barray, bool toLowerCase = true)
    {
        byte addByte = 0x37;
        if (toLowerCase) addByte = 0x57;
        char[] c = new char[barray.Length * 2];
        byte b;
        for (int i = 0; i < barray.Length; ++i)
        {
            b = ((byte)(barray[i] >> 4));
            c[i * 2] = (char)(b > 9 ? b + addByte : b + 0x30);
            b = ((byte)(barray[i] & 0xF));
            c[i * 2 + 1] = (char)(b > 9 ? b + addByte : b + 0x30);
        }

        return new string(c);
    }

4

วิธีการขยาย (ปฏิเสธความรับผิดชอบ: รหัสยังไม่ได้ทดสอบอย่างสมบูรณ์ BTW ... ):

public static class ByteExtensions
{
    public static string ToHexString(this byte[] ba)
    {
        StringBuilder hex = new StringBuilder(ba.Length * 2);

        foreach (byte b in ba)
        {
            hex.AppendFormat("{0:x2}", b);
        }
        return hex.ToString();
    }
}

ฯลฯ ใช้หนึ่งในสามโซลูชั่นของTomalak (ด้วยวิธีสุดท้ายเป็นวิธีการขยายบนสตริง)


คุณควรทดสอบโค้ดก่อนที่จะเสนอคำถามนี้
jww

3

จากนักพัฒนาของ Microsoft การแปลงที่ง่ายและดี:

public static string ByteArrayToString(byte[] ba) 
{
    // Concatenate the bytes into one long string
    return ba.Aggregate(new StringBuilder(32),
                            (sb, b) => sb.Append(b.ToString("X2"))
                            ).ToString();
}

ในขณะที่ข้างต้นมีความสะอาดและกระทัดรัดขยะที่มีประสิทธิภาพจะกรีดร้องโดยใช้ตัวแจงนับ คุณสามารถรับประสิทธิภาพสูงสุดด้วยคำตอบดั้งเดิมของ Tomalakรุ่นปรับปรุง:

public static string ByteArrayToString(byte[] ba)   
{   
   StringBuilder hex = new StringBuilder(ba.Length * 2);   

   for(int i=0; i < ba.Length; i++)       // <-- Use for loop is faster than foreach   
       hex.Append(ba[i].ToString("X2"));   // <-- ToString is faster than AppendFormat   

   return hex.ToString();   
} 

นี่คือขั้นตอนที่เร็วที่สุดของทุกขั้นตอนที่ฉันเคยเห็นโพสต์ที่นี่ ไม่เพียงแค่ใช้คำของฉันสำหรับมัน ... การทดสอบประสิทธิภาพในแต่ละงานและตรวจสอบรหัส CIL ด้วยตัวคุณเอง


2
ตัววนซ้ำไม่ใช่ปัญหาหลักของรหัสนี้ b.ToSting("X2")คุณควรมาตรฐาน
dolmen

2

และสำหรับการแทรกลงในสตริง SQL (หากคุณไม่ได้ใช้พารามิเตอร์คำสั่ง):

public static String ByteArrayToSQLHexString(byte[] Source)
{
    return = "0x" + BitConverter.ToString(Source).Replace("-", "");
}

ถ้าSource == nullหรือSource.Length == 0เรามีปัญหาครับ!
Andrei Krasutski

2

ในแง่ของความเร็วดูเหมือนว่าจะดีกว่าทุกอย่างที่นี่:

  public static string ToHexString(byte[] data) {
    byte b;
    int i, j, k;
    int l = data.Length;
    char[] r = new char[l * 2];
    for (i = 0, j = 0; i < l; ++i) {
      b = data[i];
      k = b >> 4;
      r[j++] = (char)(k > 9 ? k + 0x37 : k + 0x30);
      k = b & 15;
      r[j++] = (char)(k > 9 ? k + 0x37 : k + 0x30);
    }
    return new string(r);
  }

2

ฉันไม่ได้รับรหัสที่คุณแนะนำให้ใช้งาน Olipro เห็นได้ชัดว่ากลับhex[i] + hex[i+1]int

ฉันทำได้ แต่ประสบความสำเร็จโดยการเอาคำแนะนำบางอย่างจากรหัส Waleeds และใช้วิธีนี้ร่วมกัน มันน่าเกลียดเหมือนนรก แต่ดูเหมือนว่าจะทำงานและทำงานที่ 1/3 ของเวลาเมื่อเทียบกับคนอื่น ๆ ตามการทดสอบของฉัน (โดยใช้กลไกการทดสอบแบบตลับหมึก) ขึ้นอยู่กับขนาดอินพุต การสลับไปมาระหว่าง?: s เพื่อแยก 0-9 ก่อนอาจทำให้ได้ผลลัพธ์ที่เร็วขึ้นเล็กน้อยเนื่องจากมีตัวเลขมากกว่าตัวอักษร

public static byte[] StringToByteArray2(string hex)
{
    byte[] bytes = new byte[hex.Length/2];
    int bl = bytes.Length;
    for (int i = 0; i < bl; ++i)
    {
        bytes[i] = (byte)((hex[2 * i] > 'F' ? hex[2 * i] - 0x57 : hex[2 * i] > '9' ? hex[2 * i] - 0x37 : hex[2 * i] - 0x30) << 4);
        bytes[i] |= (byte)(hex[2 * i + 1] > 'F' ? hex[2 * i + 1] - 0x57 : hex[2 * i + 1] > '9' ? hex[2 * i + 1] - 0x37 : hex[2 * i + 1] - 0x30);
    }
    return bytes;
}

2

ByteArrayToHexViaByteManipulation รุ่นนี้อาจเร็วขึ้น

จากรายงานของฉัน:

  • ByteArrayToHexViaByteManipulation3: 1,68 เฉลี่ยเห็บ (มากกว่า 1,000 วิ่ง), 17,5X
  • ByteArrayToHexViaByteManipulation2: เห็บเฉลี่ย 1,73 (มากกว่า 1,000 วิ่ง), 16,9X
  • ByteArrayToHexViaByte การจัดการ: เห็บเฉลี่ย 2,90 (มากกว่า 1,000 วิ่ง), 10,1X
  • ByteArrayToHexViaLookupAndShift: เฉลี่ยเห็บ 3,22 (มากกว่า 1,000 วิ่ง) 9,1X
  • ...

    static private readonly char[] hexAlphabet = new char[]
        {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    static string ByteArrayToHexViaByteManipulation3(byte[] bytes)
    {
        char[] c = new char[bytes.Length * 2];
        byte b;
        for (int i = 0; i < bytes.Length; i++)
        {
            b = ((byte)(bytes[i] >> 4));
            c[i * 2] = hexAlphabet[b];
            b = ((byte)(bytes[i] & 0xF));
            c[i * 2 + 1] = hexAlphabet[b];
        }
        return new string(c);
    }

และฉันคิดว่าอันนี้เป็นการเพิ่มประสิทธิภาพ:

    static private readonly char[] hexAlphabet = new char[]
        {'0','1','2','3','4','5','6','7','8','9','A','B','C','D','E','F'};
    static string ByteArrayToHexViaByteManipulation4(byte[] bytes)
    {
        char[] c = new char[bytes.Length * 2];
        for (int i = 0, ptr = 0; i < bytes.Length; i++, ptr += 2)
        {
            byte b = bytes[i];
            c[ptr] = hexAlphabet[b >> 4];
            c[ptr + 1] = hexAlphabet[b & 0xF];
        }
        return new string(c);
    }

2

ฉันจะเข้าสู่การแข่งขันที่เล่นซอนิด ๆ นี้เพราะฉันมีคำตอบที่ใช้การเล่นซอดบิตเพื่อถอดรหัสเลขฐานสิบหก โปรดทราบว่าการใช้อาร์เรย์อักขระอาจเร็วขึ้นเนื่องจากStringBuilderวิธีการโทรจะใช้เวลาเช่นกัน

public static String ToHex (byte[] data)
{
    int dataLength = data.Length;
    // pre-create the stringbuilder using the length of the data * 2, precisely enough
    StringBuilder sb = new StringBuilder (dataLength * 2);
    for (int i = 0; i < dataLength; i++) {
        int b = data [i];

        // check using calculation over bits to see if first tuple is a letter
        // isLetter is zero if it is a digit, 1 if it is a letter
        int isLetter = (b >> 7) & ((b >> 6) | (b >> 5)) & 1;

        // calculate the code using a multiplication to make up the difference between
        // a digit character and an alphanumerical character
        int code = '0' + ((b >> 4) & 0xF) + isLetter * ('A' - '9' - 1);
        // now append the result, after casting the code point to a character
        sb.Append ((Char)code);

        // do the same with the lower (less significant) tuple
        isLetter = (b >> 3) & ((b >> 2) | (b >> 1)) & 1;
        code = '0' + (b & 0xF) + isLetter * ('A' - '9' - 1);
        sb.Append ((Char)code);
    }
    return sb.ToString ();
}

public static byte[] FromHex (String hex)
{

    // pre-create the array
    int resultLength = hex.Length / 2;
    byte[] result = new byte[resultLength];
    // set validity = 0 (0 = valid, anything else is not valid)
    int validity = 0;
    int c, isLetter, value, validDigitStruct, validDigit, validLetterStruct, validLetter;
    for (int i = 0, hexOffset = 0; i < resultLength; i++, hexOffset += 2) {
        c = hex [hexOffset];

        // check using calculation over bits to see if first char is a letter
        // isLetter is zero if it is a digit, 1 if it is a letter (upper & lowercase)
        isLetter = (c >> 6) & 1;

        // calculate the tuple value using a multiplication to make up the difference between
        // a digit character and an alphanumerical character
        // minus 1 for the fact that the letters are not zero based
        value = ((c & 0xF) + isLetter * (-1 + 10)) << 4;

        // check validity of all the other bits
        validity |= c >> 7; // changed to >>, maybe not OK, use UInt?

        validDigitStruct = (c & 0x30) ^ 0x30;
        validDigit = ((c & 0x8) >> 3) * (c & 0x6);
        validity |= (isLetter ^ 1) * (validDigitStruct | validDigit);

        validLetterStruct = c & 0x18;
        validLetter = (((c - 1) & 0x4) >> 2) * ((c - 1) & 0x2);
        validity |= isLetter * (validLetterStruct | validLetter);

        // do the same with the lower (less significant) tuple
        c = hex [hexOffset + 1];
        isLetter = (c >> 6) & 1;
        value ^= (c & 0xF) + isLetter * (-1 + 10);
        result [i] = (byte)value;

        // check validity of all the other bits
        validity |= c >> 7; // changed to >>, maybe not OK, use UInt?

        validDigitStruct = (c & 0x30) ^ 0x30;
        validDigit = ((c & 0x8) >> 3) * (c & 0x6);
        validity |= (isLetter ^ 1) * (validDigitStruct | validDigit);

        validLetterStruct = c & 0x18;
        validLetter = (((c - 1) & 0x4) >> 2) * ((c - 1) & 0x2);
        validity |= isLetter * (validLetterStruct | validLetter);
    }

    if (validity != 0) {
        throw new ArgumentException ("Hexadecimal encoding incorrect for input " + hex);
    }

    return result;
}

แปลงจากรหัส Java


อืมฉันควรทำสิ่งนี้ให้ดีที่สุดChar[]และใช้Charภายในแทน ints ...
Maarten Bodewes

สำหรับ C # การกำหนดค่าเริ่มต้นให้กับตัวแปรที่ใช้แทนการวนรอบนอกอาจเป็นที่ต้องการเพื่อให้คอมไพเลอร์ปรับให้เหมาะสม ฉันได้รับประสิทธิภาพที่เท่าเทียมกันทั้งสองทาง
Peteter

2

เพื่อประสิทธิภาพฉันจะไปกับโซลูชัน drphrozens การปรับให้เหมาะสมเล็กน้อยสำหรับตัวถอดรหัสอาจใช้ตารางสำหรับตัวอักขระทั้งสองเพื่อกำจัด "<< 4"

เห็นได้ชัดว่าการโทรทั้งสองวิธีมีค่าใช้จ่ายสูง หากการตรวจสอบบางอย่างเกิดขึ้นกับข้อมูลอินพุตหรือเอาต์พุต (อาจเป็น CRC, เช็คซัมหรืออะไรก็ตาม) if (b == 255)...ก็สามารถข้ามไปได้

การใช้offset++และoffsetแทนที่จะใช้offsetและoffset + 1อาจให้ประโยชน์ทางทฤษฎีบางอย่าง แต่ฉันสงสัยว่าคอมไพเลอร์จะจัดการกับสิ่งนี้ได้ดีกว่าฉัน

private static readonly byte[] LookupTableLow = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x0F, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static readonly byte[] LookupTableHigh = new byte[] {
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0x00, 0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80, 0x90, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xA0, 0xB0, 0xC0, 0xD0, 0xE0, 0xF0, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xA0, 0xB0, 0xC0, 0xD0, 0xE0, 0xF0, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF,
  0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF, 0xFF
};

private static byte LookupLow(char c)
{
  var b = LookupTableLow[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

private static byte LookupHigh(char c)
{
  var b = LookupTableHigh[c];
  if (b == 255)
    throw new IOException("Expected a hex character, got " + c);
  return b;
}

public static byte ToByte(char[] chars, int offset)
{
  return (byte)(LookupHigh(chars[offset++]) | LookupLow(chars[offset]));
}

นี่เป็นเพียงส่วนหัวของฉันและไม่ได้รับการทดสอบหรือเปรียบเทียบ


1

อีกรูปแบบหนึ่งสำหรับความหลากหลาย:

public static byte[] FromHexString(string src)
{
    if (String.IsNullOrEmpty(src))
        return null;

    int index = src.Length;
    int sz = index / 2;
    if (sz <= 0)
        return null;

    byte[] rc = new byte[sz];

    while (--sz >= 0)
    {
        char lo = src[--index];
        char hi = src[--index];

        rc[sz] = (byte)(
            (
                (hi >= '0' && hi <= '9') ? hi - '0' :
                (hi >= 'a' && hi <= 'f') ? hi - 'a' + 10 :
                (hi >= 'A' && hi <= 'F') ? hi - 'A' + 10 :
                0
            )
            << 4 | 
            (
                (lo >= '0' && lo <= '9') ? lo - '0' :
                (lo >= 'a' && lo <= 'f') ? lo - 'a' + 10 :
                (lo >= 'A' && lo <= 'F') ? lo - 'A' + 10 :
                0
            )
        );
    }

    return rc;          
}

1

ไม่เหมาะสำหรับความเร็ว แต่ LINQy มากกว่าคำตอบส่วนใหญ่ (.NET 4.0):

<Extension()>
Public Function FromHexToByteArray(hex As String) As Byte()
    hex = If(hex, String.Empty)
    If hex.Length Mod 2 = 1 Then hex = "0" & hex
    Return Enumerable.Range(0, hex.Length \ 2).Select(Function(i) Convert.ToByte(hex.Substring(i * 2, 2), 16)).ToArray
End Function

<Extension()>
Public Function ToHexString(bytes As IEnumerable(Of Byte)) As String
    Return String.Concat(bytes.Select(Function(b) b.ToString("X2")))
End Function

1

สองผสมที่พับสองแทะการดำเนินการเป็นหนึ่ง

รุ่นที่มีประสิทธิภาพค่อนข้างน่าจะเป็น:

public static string ByteArrayToString2(byte[] ba)
{
    char[] c = new char[ba.Length * 2];
    for( int i = 0; i < ba.Length * 2; ++i)
    {
        byte b = (byte)((ba[i>>1] >> 4*((i&1)^1)) & 0xF);
        c[i] = (char)(55 + b + (((b-10)>>31)&-7));
    }
    return new string( c );
}

รุ่น linq-with-bit-hack ที่ลดลง:

public static string ByteArrayToString(byte[] ba)
{
    return string.Concat( ba.SelectMany( b => new int[] { b >> 4, b & 0xF }).Select( b => (char)(55 + b + (((b-10)>>31)&-7))) );
}

และย้อนกลับ:

public static byte[] HexStringToByteArray( string s )
{
    byte[] ab = new byte[s.Length>>1];
    for( int i = 0; i < s.Length; i++ )
    {
        int b = s[i];
        b = (b - '0') + ((('9' - b)>>31)&-7);
        ab[i>>1] |= (byte)(b << 4*((i&1)^1));
    }
    return ab;
}

1
HexStringToByteArray ("09") ส่งคืน 0x02 ซึ่งไม่ดี
CoperNick

1

อีกวิธีคือใช้stackallocเพื่อลดความดันหน่วยความจำ GC:

static string ByteToHexBitFiddle(byte[] bytes)
{
        var c = stackalloc char[bytes.Length * 2 + 1];
        int b; 
        for (int i = 0; i < bytes.Length; ++i)
        {
            b = bytes[i] >> 4;
            c[i * 2] = (char)(55 + b + (((b - 10) >> 31) & -7));
            b = bytes[i] & 0xF;
            c[i * 2 + 1] = (char)(55 + b + (((b - 10) >> 31) & -7));
        }
        c[bytes.Length * 2 ] = '\0';
        return new string(c);
}

1

นี่คือช็อตของฉัน ฉันสร้างคลาสส่วนขยายคู่หนึ่งเพื่อขยายสตริงและไบต์ ในการทดสอบไฟล์ขนาดใหญ่ประสิทธิภาพนั้นเทียบได้กับ Byte Manipulation 2

รหัสด้านล่างสำหรับ ToHexString เป็นการใช้งานที่ดีที่สุดของอัลกอริทึมการค้นหาและกะ มันเกือบจะเหมือนกันกับ Behrooz แต่มันกลับกลายเป็นว่าใช้foreachเพื่อทำซ้ำและตัวนับนั้นเร็วกว่าการทำดัชนีอย่างชัดเจนforเพื่อย้ำและเคาน์เตอร์จะเร็วกว่าการจัดทำดัชนีอย่างชัดเจน

มันมาในที่ 2 หลัง Byte Manipulation 2 บนเครื่องของฉันและเป็นรหัสที่อ่านง่ายมาก ผลการทดสอบต่อไปนี้เป็นที่สนใจด้วย:

ToHexStringCharArrayWithCharArrayLookup: 41,589.69 ติ๊กเฉลี่ย (มากกว่า 1,000 วิ่ง), 1.5X ToHexStringCharArrayWithStringLookup: 50,764.06 เห็บโดยเฉลี่ย (มากกว่า 1,000 ครั้ง), 1.2X ToHexStringCharArrayWithCharArrayLookup

จากผลลัพธ์ข้างต้นดูเหมือนว่าปลอดภัยที่จะสรุปว่า:

  1. บทลงโทษสำหรับการจัดทำดัชนีลงในสายอักขระเพื่อดำเนินการค้นหากับอาร์เรย์ char มีความสำคัญในการทดสอบไฟล์ขนาดใหญ่
  2. บทลงโทษสำหรับการใช้ StringBuilder ของความจุที่รู้จักกับอาร์เรย์ขนาดที่รู้จักกันในการสร้างสตริงนั้นมีความสำคัญยิ่งกว่า

นี่คือรหัส:

using System;

namespace ConversionExtensions
{
    public static class ByteArrayExtensions
    {
        private readonly static char[] digits = new char[] { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'A', 'B', 'C', 'D', 'E', 'F' };

        public static string ToHexString(this byte[] bytes)
        {
            char[] hex = new char[bytes.Length * 2];
            int index = 0;

            foreach (byte b in bytes)
            {
                hex[index++] = digits[b >> 4];
                hex[index++] = digits[b & 0x0F];
            }

            return new string(hex);
        }
    }
}


using System;
using System.IO;

namespace ConversionExtensions
{
    public static class StringExtensions
    {
        public static byte[] ToBytes(this string hexString)
        {
            if (!string.IsNullOrEmpty(hexString) && hexString.Length % 2 != 0)
            {
                throw new FormatException("Hexadecimal string must not be empty and must contain an even number of digits to be valid.");
            }

            hexString = hexString.ToUpperInvariant();
            byte[] data = new byte[hexString.Length / 2];

            for (int index = 0; index < hexString.Length; index += 2)
            {
                int highDigitValue = hexString[index] <= '9' ? hexString[index] - '0' : hexString[index] - 'A' + 10;
                int lowDigitValue = hexString[index + 1] <= '9' ? hexString[index + 1] - '0' : hexString[index + 1] - 'A' + 10;

                if (highDigitValue < 0 || lowDigitValue < 0 || highDigitValue > 15 || lowDigitValue > 15)
                {
                    throw new FormatException("An invalid digit was encountered. Valid hexadecimal digits are 0-9 and A-F.");
                }
                else
                {
                    byte value = (byte)((highDigitValue << 4) | (lowDigitValue & 0x0F));
                    data[index / 2] = value;
                }
            }

            return data;
        }
    }
}

ด้านล่างนี้เป็นผลการทดสอบที่ฉันได้รับเมื่อฉันใส่รหัสในโครงการทดสอบของ @ patridge บนเครื่องของฉัน ฉันยังเพิ่มการทดสอบสำหรับการแปลงเป็นอาร์เรย์ไบต์จากเลขฐานสิบหก การทดสอบรันที่ใช้รหัสของฉันคือ ByteArrayToHexViaOptimizedLookupAndShift และ HexToByteArrayViaByteManipulation HexToByteArrayViaConvertToByte ถูกนำมาจาก XXXX HexToByteArrayViaSoapHexBinary เป็นคำตอบจาก @ Mykroft

โปรเซสเซอร์ Intel Pentium III Xeon

    Cores: 4 <br/>
    Current Clock Speed: 1576 <br/>
    Max Clock Speed: 3092 <br/>

การแปลงอาร์เรย์ของไบต์เป็นการแสดงสตริงเลขฐานสิบหก


ByteArrayToHexViaByteManipulation2: 39,366.64 เห็บเฉลี่ย (มากกว่า 1,000 วิ่ง), 22.4X

ByteArrayToHexViaOptimizedLookupAndShift: ticks เฉลี่ย 41,588.64 (มากกว่า 1,000 ตัววิ่ง), 21.2X

ByteArrayToHexViaLookup: เห็บเฉลี่ย 55,509.56 (มากกว่า 1,000 ตัววิ่ง), 15.9X

ByteArrayToHexViaByteManipulation: เห็บ 65,349.12 เฉลี่ย (มากกว่า 1,000 วิ่ง), 13.5X

ByteArrayToHexViaLookupAndShift: ticks เฉลี่ย 86,926.87 (มากกว่า 1,000 ตัววิ่ง), 10.2X

ByteArrayToHexStringViaBitConverter: ticks เฉลี่ย 139,353.73 (มากกว่า 1,000 ตัววิ่ง), 6.3X

ByteArrayToHexViaSoapHexBinary: เห็บเฉลี่ย 314,598.77 (เกิน 1,000 ตัว), 2.8X

ByteArrayToHexStringViaStringBuilderForEachByteToString: 344,264.63 เฉลี่ยเห็บ (มากกว่า 1,000 วิ่ง) 2.6X

ByteArrayToHexStringViaStringBuilderAggregateByteToString: 382,623.44 เห็บเฉลี่ย (มากกว่า 1,000 ตัว), 2.3X

ByteArrayToHexStringViaStringBuilderForEachAppendFormat: 818,111.95 เห็บเฉลี่ย (มากกว่า 1,000 ตัว), 1.1X

ByteArrayToHexStringViaStringConcatArrayConvertAll: 839,244.84 เห็บเฉลี่ย (มากกว่า 1,000 ตัว), 1.1X

ByteArrayToHexStringViaStringBuilderAggregateAppendFormat: 867,303.98 ติ๊กเฉลี่ย (มากกว่า 1,000 ตัว), 1.0X

ByteArrayToHexStringViaStringJoinArrayConvertAll: 882,710.28 เห็บเฉลี่ย (มากกว่า 1,000 ตัว), 1.0X



1

อีกฟังก์ชั่นที่รวดเร็ว ...

private static readonly byte[] HexNibble = new byte[] {
    0x0, 0x1, 0x2, 0x3, 0x4, 0x5, 0x6, 0x7,
    0x8, 0x9, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0xA, 0xB, 0xC, 0xD, 0xE, 0xF, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0,
    0x0, 0xA, 0xB, 0xC, 0xD, 0xE, 0xF
};

public static byte[] HexStringToByteArray( string str )
{
    int byteCount = str.Length >> 1;
    byte[] result = new byte[byteCount + (str.Length & 1)];
    for( int i = 0; i < byteCount; i++ )
        result[i] = (byte) (HexNibble[str[i << 1] - 48] << 4 | HexNibble[str[(i << 1) + 1] - 48]);
    if( (str.Length & 1) != 0 )
        result[byteCount] = (byte) HexNibble[str[str.Length - 1] - 48];
    return result;
}
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.