.NET - คุณจะแยกสตริงที่คั่นด้วย "ตัวพิมพ์ใหญ่" ออกเป็นอาร์เรย์ได้อย่างไร

114

ฉันจะไปจากสตริงนี้ได้อย่างไร: "ThisIsMyCapsDelimitedString"

... ถึงสตริงนี้: "This Is My Caps Delimited String"

แนะนำให้ใช้โค้ดน้อยที่สุดใน VB.net แต่ยินดีต้อนรับ C #

ไชโย!

— Matias Nino
แหล่งที่มา

1

จะเกิดอะไรขึ้นเมื่อคุณต้องจัดการกับ "OldMacDonaldAndMrO'TooleWentToMcDonalds"

— Grant Wagner

2

จะเห็นเฉพาะการใช้งานที่ จำกัด ส่วนใหญ่จะใช้เพื่อแยกวิเคราะห์ชื่อตัวแปรเช่น ThisIsMySpecialVariable

— Matias Nino

สิ่งนี้ได้ผลสำหรับฉัน: Regex.Replace(s, "([A-Z0-9]+)", " $1").Trim(). และถ้าคุณต้องการแยกตัวพิมพ์ใหญ่แต่ละตัวให้เอาเครื่องหมายบวกออก

— Mladen B.

173

ฉันทำไว้เมื่อสักครู่ที่ผ่านมา ตรงกับส่วนประกอบแต่ละส่วนของชื่อ CamelCase

/([A-Z]+(?=$|[A-Z][a-z])|[A-Z]?[a-z]+)/g

ตัวอย่างเช่น:

"SimpleHTTPServer" => ["Simple", "HTTP", "Server"]
"camelCase" => ["camel", "Case"]

ในการแปลงเพียงแค่แทรกช่องว่างระหว่างคำ:

Regex.Replace(s, "([a-z](?=[A-Z])|[A-Z](?=[A-Z][a-z]))", "$1 ")

หากคุณต้องการจัดการตัวเลข:

/([A-Z]+(?=$|[A-Z][a-z]|[0-9])|[A-Z]?[a-z]+|[0-9]+)/g

Regex.Replace(s,"([a-z](?=[A-Z]|[0-9])|[A-Z](?=[A-Z][a-z]|[0-9])|[0-9](?=[^0-9]))","$1 ")

— Markus Jarderot
แหล่งที่มา

1

CamelCase! นั่นคือสิ่งที่เรียกว่า! ฉันรักมัน! ขอบคุณมาก!

— Matias Nino

19

จริงๆแล้ว camelCase มีอักษรตัวพิมพ์เล็กนำหน้า สิ่งที่คุณอ้างถึงที่นี่คือ PascalCase

— Drew Noakes

12

... และเมื่อคุณอ้างถึงบางสิ่งที่อาจเป็น "กรณีอูฐ" หรือ "กรณีปาสคาล" จะเรียกว่า "สับเปลี่ยน"

— คริส

ไม่แยก "Take5" ซึ่งจะทำให้กรณีการใช้งานของฉันล้มเหลว

— PandaWood

1

@PandaWood Digits ไม่ได้อยู่ในคำถามดังนั้นคำตอบของฉันจึงไม่ได้อธิบายถึงพวกเขา ฉันได้เพิ่มรูปแบบที่แตกต่างกันซึ่งแสดงถึงตัวเลข

— Markus Jarderot

36

Regex.Replace("ThisIsMyCapsDelimitedString", "(\\B[A-Z])", " $1")

— เวย์น
แหล่งที่มา

นี่เป็นทางออกที่ดีที่สุด แต่คุณต้องใช้ \\ B เพื่อรวบรวม มิฉะนั้นคอมไพลเลอร์จะพยายามถือว่า \ B เป็นลำดับการหลีกเลี่ยง

— Ferruccio

ทางออกที่ดี ใครสามารถคิดเหตุผลที่ไม่ควรเป็นคำตอบที่ยอมรับได้? มีความสามารถน้อยกว่าหรือมีประสิทธิภาพน้อยกว่า?

— Drew Noakes

8

คำนี้ถือว่าตัวพิมพ์ใหญ่ต่อเนื่องกันเป็นคำแยกกัน (เช่น ANZAC คือ 5 คำ) โดยที่คำตอบของ MizardX ถือว่า (IMHO ที่ถูกต้อง) เป็นคำเดียว

— Ray

2

@Ray ฉันขอยืนยันว่า "ANZAC" ควรเขียนเป็น "Anzac" เพื่อให้ถือว่าเป็นคำที่ใช้ตัวพิมพ์ใหญ่ในภาษาปาสคาลเนื่องจากไม่ใช่ภาษาอังกฤษ

— Sam

1

@Neaox ในภาษาอังกฤษควรจะเป็น แต่นี่ไม่ใช่ตัวย่อหรือตัวพิมพ์ปกติภาษาอังกฤษ มันคั่นด้วยตัวพิมพ์ใหญ่ หากข้อความต้นฉบับควรเป็นตัวพิมพ์ใหญ่ในลักษณะเดียวกับที่เป็นภาษาอังกฤษปกติตัวอักษรอื่น ๆ ก็ไม่ควรเป็นตัวพิมพ์ใหญ่ ตัวอย่างเช่นเหตุใด "i" ใน "จึงควรเป็นตัวพิมพ์ใหญ่เพื่อให้พอดีกับรูปแบบที่คั่นด้วยตัวพิมพ์ใหญ่ แต่ไม่ใช่" NZAC "ใน" ANZAC " พูดอย่างเคร่งครัดถ้าคุณตีความว่า "ANZAC" เป็นตัวพิมพ์ใหญ่ที่คั่นด้วยตัวพิมพ์ใหญ่จะเป็น 5 คำสำหรับแต่ละตัวอักษร

— แซม

19

คำตอบที่ดี MizardX! ฉันปรับแต่งเล็กน้อยเพื่อให้ถือว่าตัวเลขเป็นคำแยกกันดังนั้น "AddressLine1" จะกลายเป็น "Address Line 1" แทน "Address Line1":

Regex.Replace(s, "([a-z](?=[A-Z0-9])|[A-Z](?=[A-Z][a-z]))", "$1 ")

— JoshL
แหล่งที่มา

2

นอกจากนี้ที่ดี! ฉันสงสัยว่าจะมีไม่กี่คนที่จะประหลาดใจกับคำตอบที่ได้รับการยอมรับในการจัดการตัวเลขในสตริง :)

— Jordan Grey

ฉันรู้ว่าเป็นเวลาเกือบ 8 ปีแล้วที่คุณโพสต์สิ่งนี้ แต่มันก็ใช้ได้ผลกับฉันเช่นกัน :) ตัวเลขทำให้ฉันสะดุดในตอนแรก

— Michael Armes

คำตอบเดียวที่ผ่านการทดสอบค่าผิดปกติ 2 รายการของฉัน: "Take5" -> "Take 5", "PublisherID" -> "รหัสผู้เผยแพร่โฆษณา" ฉันต้องการโหวตเพิ่มสองครั้ง

— PandaWood

18

เพื่อความหลากหลายเพียงเล็กน้อย ... นี่คือวิธีการขยายที่ไม่ใช้นิพจน์ทั่วไป

public static class CamelSpaceExtensions
{
    public static string SpaceCamelCase(this String input)
    {
        return new string(Enumerable.Concat(
            input.Take(1), // No space before initial cap
            InsertSpacesBeforeCaps(input.Skip(1))
        ).ToArray());
    }

    private static IEnumerable<char> InsertSpacesBeforeCaps(IEnumerable<char> input)
    {
        foreach (char c in input)
        {
            if (char.IsUpper(c)) 
            { 
                yield return ' '; 
            }

            yield return c;
        }
    }
}

— ทรอยฮาวเวิร์ด
แหล่งที่มา

เพื่อหลีกเลี่ยงการใช้ Trim () ก่อนที่จะใส่ foreach: int counter = -1 ข้างในเพิ่มตัวนับ ++ เปลี่ยนการตรวจสอบเป็น: if (char.IsUpper (c) && counter> 0)

— Outside the Box Developer

สิ่งนี้แทรกช่องว่างก่อนอักขระตัวที่ 1

— Zar Shardan

ฉันมีเสรีภาพในการแก้ไขปัญหาที่ @ZarShardan ชี้ให้เห็น โปรดอย่าลังเลที่จะย้อนกลับหรือแก้ไขการแก้ไขของคุณเองหากคุณไม่ชอบการเปลี่ยนแปลง

— jpmc26

สิ่งนี้สามารถปรับปรุงเพื่อจัดการตัวย่อได้หรือไม่เช่นการเพิ่มช่องว่างก่อนตัวพิมพ์ใหญ่ตัวสุดท้ายในชุดของตัวอักษรตัวพิมพ์ใหญ่เช่นBOEForecast => BOE Forecast

— Nepaluz

11

ให้ข้อคิดเห็นที่ยอดเยี่ยมของ Grant Wagner:

Dim s As String = RegularExpressions.Regex.Replace("ThisIsMyCapsDelimitedString", "([A-Z])", " $1")

— หลอก Masochist
แหล่งที่มา

จุดดี ... โปรดอย่าลังเลที่จะแทรก. substring (), .trimstart (), .trim (), .remove () ฯลฯ ที่คุณเลือก :)

— Pseudo Masochist

9

ฉันต้องการโซลูชันที่รองรับคำย่อและตัวเลข โซลูชันที่ใช้ Regex นี้ถือว่ารูปแบบต่อไปนี้เป็น "คำ" แต่ละคำ:

อักษรตัวใหญ่ตามด้วยตัวพิมพ์เล็ก
ลำดับของตัวเลขที่ต่อเนื่องกัน
ตัวพิมพ์ใหญ่ที่ต่อเนื่องกัน (แปลว่าเป็นคำย่อ) - คำใหม่สามารถเริ่มต้นโดยใช้ตัวพิมพ์ใหญ่สุดท้ายเช่น HTMLGuide => "HTML Guide", "TheATeam" => "The A Team"

คุณสามารถทำเป็นซับเดียวได้:

Regex.Replace(value, @"(?<!^)((?<!\d)\d|(?(?<=[A-Z])[A-Z](?=[a-z])|[A-Z]))", " $1")

แนวทางที่อ่านได้มากขึ้นอาจดีกว่า:

using System.Text.RegularExpressions;

namespace Demo
{
    public class IntercappedStringHelper
    {
        private static readonly Regex SeparatorRegex;

        static IntercappedStringHelper()
        {
            const string pattern = @"
                (?<!^) # Not start
                (
                    # Digit, not preceded by another digit
                    (?<!\d)\d 
                    |
                    # Upper-case letter, followed by lower-case letter if
                    # preceded by another upper-case letter, e.g. 'G' in HTMLGuide
                    (?(?<=[A-Z])[A-Z](?=[a-z])|[A-Z])
                )";

            var options = RegexOptions.IgnorePatternWhitespace | RegexOptions.Compiled;

            SeparatorRegex = new Regex(pattern, options);
        }

        public static string SeparateWords(string value, string separator = " ")
        {
            return SeparatorRegex.Replace(value, separator + "$1");
        }
    }
}

นี่คือสารสกัดจากการทดสอบ (XUnit):

[Theory]
[InlineData("PurchaseOrders", "Purchase-Orders")]
[InlineData("purchaseOrders", "purchase-Orders")]
[InlineData("2Unlimited", "2-Unlimited")]
[InlineData("The2Unlimited", "The-2-Unlimited")]
[InlineData("Unlimited2", "Unlimited-2")]
[InlineData("222Unlimited", "222-Unlimited")]
[InlineData("The222Unlimited", "The-222-Unlimited")]
[InlineData("Unlimited222", "Unlimited-222")]
[InlineData("ATeam", "A-Team")]
[InlineData("TheATeam", "The-A-Team")]
[InlineData("TeamA", "Team-A")]
[InlineData("HTMLGuide", "HTML-Guide")]
[InlineData("TheHTMLGuide", "The-HTML-Guide")]
[InlineData("TheGuideToHTML", "The-Guide-To-HTML")]
[InlineData("HTMLGuide5", "HTML-Guide-5")]
[InlineData("TheHTML5Guide", "The-HTML-5-Guide")]
[InlineData("TheGuideToHTML5", "The-Guide-To-HTML-5")]
[InlineData("TheUKAllStars", "The-UK-All-Stars")]
[InlineData("AllStarsUK", "All-Stars-UK")]
[InlineData("UKAllStars", "UK-All-Stars")]

— แดนมัลคอล์ม
แหล่งที่มา

1

+ 1 เพื่ออธิบาย regex และทำให้อ่านได้ และฉันได้เรียนรู้สิ่งใหม่ ๆ มีโหมดเว้นวรรคและแสดงความคิดเห็นใน. NET Regex ขอบคุณ!

— Felix Keil

4

สำหรับความหลากหลายมากขึ้นโดยใช้อ็อบเจ็กต์ C # แบบเก่าสิ่งต่อไปนี้จะสร้างเอาต์พุตเช่นเดียวกับนิพจน์ทั่วไปที่ยอดเยี่ยมของ @ MizardX

public string FromCamelCase(string camel)
{   // omitted checking camel for null
    StringBuilder sb = new StringBuilder();
    int upperCaseRun = 0;
    foreach (char c in camel)
    {   // append a space only if we're not at the start
        // and we're not already in an all caps string.
        if (char.IsUpper(c))
        {
            if (upperCaseRun == 0 && sb.Length != 0)
            {
                sb.Append(' ');
            }
            upperCaseRun++;
        }
        else if( char.IsLower(c) )
        {
            if (upperCaseRun > 1) //The first new word will also be capitalized.
            {
                sb.Insert(sb.Length - 1, ' ');
            }
            upperCaseRun = 0;
        }
        else
        {
            upperCaseRun = 0;
        }
        sb.Append(c);
    }

    return sb.ToString();
}

— โรเบิร์ตพอลสัน
แหล่งที่มา

2

ว้าวน่าเกลียดจัง ตอนนี้ฉันจำได้แล้วว่าทำไมฉันถึงรัก regex มาก! +1 สำหรับความพยายามแม้ว่า ;)

— Mark Brackett

3

ด้านล่างนี้คือต้นแบบที่แปลงสิ่งต่อไปนี้เป็น Title Case:

snake_case
CamelCase
PascalCase
กรณีประโยค
Title Case (ใช้การจัดรูปแบบปัจจุบัน)

เห็นได้ชัดว่าคุณต้องใช้เมธอด "ToTitleCase" ด้วยตัวเองเท่านั้น

using System;
using System.Collections.Generic;
using System.Globalization;
using System.Text.RegularExpressions;

public class Program
{
    public static void Main()
    {
        var examples = new List<string> { 
            "THEQuickBrownFox",
            "theQUICKBrownFox",
            "TheQuickBrownFOX",
            "TheQuickBrownFox",
            "the_quick_brown_fox",
            "theFOX",
            "FOX",
            "QUICK"
        };

        foreach (var example in examples)
        {
            Console.WriteLine(ToTitleCase(example));
        }
    }

    private static string ToTitleCase(string example)
    {
        var fromSnakeCase = example.Replace("_", " ");
        var lowerToUpper = Regex.Replace(fromSnakeCase, @"(\p{Ll})(\p{Lu})", "$1 $2");
        var sentenceCase = Regex.Replace(lowerToUpper, @"(\p{Lu}+)(\p{Lu}\p{Ll})", "$1 $2");
        return new CultureInfo("en-US", false).TextInfo.ToTitleCase(sentenceCase);
    }
}

คอนโซลออกจะเป็นดังนี้:

THE Quick Brown Fox
The QUICK Brown Fox
The Quick Brown FOX
The Quick Brown Fox
The Quick Brown Fox
The FOX
FOX
QUICK

บล็อกโพสต์อ้างอิง

— Brantley Blanchard
แหล่งที่มา

2

string s = "ThisIsMyCapsDelimitedString";
string t = Regex.Replace(s, "([A-Z])", " $1").Substring(1);

— Ferruccio
แหล่งที่มา

ฉันรู้ว่าจะมีวิธี RegEx ที่ง่าย ... ฉันต้องเริ่มใช้มันมากขึ้น

— Max Schmeling

1

ไม่ใช่กูรู regex แต่จะเกิดอะไรขึ้นกับ "HeresAWTFString"?

— นิค

1

คุณได้รับ "Heres AWTF String" แต่นั่นคือสิ่งที่ Matias Nino ถามในคำถาม

— Max Schmeling

ใช่เขาต้องการเพิ่มว่า "เมืองหลวงที่อยู่ติดกันหลายแห่งเหลืออยู่คนเดียว" ซึ่งเห็นได้ชัดว่าจำเป็นในหลาย ๆ กรณีเช่น "PublisherID" ที่นี่ไปที่ "Publisher I D" ซึ่งแย่มาก

— PandaWood

2

Regex ช้ากว่าลูปธรรมดาประมาณ 10-12 เท่า:

    public static string CamelCaseToSpaceSeparated(this string str)
    {
        if (string.IsNullOrEmpty(str))
        {
            return str;
        }

        var res = new StringBuilder();

        res.Append(str[0]);
        for (var i = 1; i < str.Length; i++)
        {
            if (char.IsUpper(str[i]))
            {
                res.Append(' ');
            }
            res.Append(str[i]);

        }
        return res.ToString();
    }

— ซาร์ชาร์ดัน
แหล่งที่มา

1

โซลูชัน regex ที่ไร้เดียงสา จะไม่จัดการ O'Conner และเพิ่มช่องว่างที่จุดเริ่มต้นของสตริงด้วย

s = "ThisIsMyCapsDelimitedString"
split = Regex.Replace(s, "[A-Z0-9]", " $&");

— เจฟฟ์
แหล่งที่มา

ฉันปรับแต่งคุณให้ดีขึ้น แต่คนทั่วไปมักจะใช้วิธี smackdown ได้ดีกว่าถ้ามันไม่ได้เริ่มต้นด้วย "ไร้เดียงสา"

— MusiGenesis

ฉันไม่คิดว่านั่นเป็นการทุบลง ในบริบทนี้ความไร้เดียงสามักหมายถึงชัดเจนหรือเรียบง่าย (กล่าวคือไม่จำเป็นต้องเป็นทางออกที่ดีที่สุด) ไม่มีเจตนาดูถูก

— Ferruccio

0

อาจมีวิธีแก้ปัญหาที่หรูหรากว่านี้ แต่นี่คือสิ่งที่ฉันคิดขึ้นจากด้านบนของหัว:

string myString = "ThisIsMyCapsDelimitedString";

for (int i = 1; i < myString.Length; i++)
{
     if (myString[i].ToString().ToUpper() == myString[i].ToString())
     {
          myString = myString.Insert(i, " ");
          i++;
     }
}

— Max Schmeling
แหล่งที่มา

0

ลองนำไปใช้

"([A-Z]*[^A-Z]*)"

ผลลัพธ์จะเหมาะสำหรับการผสมตัวอักษรกับตัวเลข

Regex.Replace("AbcDefGH123Weh", "([A-Z]*[^A-Z]*)", "$1 ");
Abc Def GH123 Weh  

Regex.Replace("camelCase", "([A-Z]*[^A-Z]*)", "$1 ");
camel Case

— Erxin
แหล่งที่มา

0

การติดตั้งรหัส psudo จาก: https://stackoverflow.com/a/5796394/4279201

    private static StringBuilder camelCaseToRegular(string i_String)
    {
        StringBuilder output = new StringBuilder();
        int i = 0;
        foreach (char character in i_String)
        {
            if (character <= 'Z' && character >= 'A' && i > 0)
            {
                output.Append(" ");
            }
            output.Append(character);
            i++;
        }
        return output;
    }

— shinzou
แหล่งที่มา

0

ในการจับคู่ระหว่างหมวดหมู่ Unicode ตัวอักษรที่ไม่ใช่ตัวพิมพ์ใหญ่และตัวพิมพ์ใหญ่ :(?<=\P{Lu})(?=\p{Lu})

Dim s = Regex.Replace("CorrectHorseBatteryStaple", "(?<=\P{Lu})(?=\p{Lu})", " ")

— Slai
แหล่งที่มา

0

ขั้นตอนและรวดเร็วโดยนัย:

  /// <summary>
  /// Get the words in a code <paramref name="identifier"/>.
  /// </summary>
  /// <param name="identifier">The code <paramref name="identifier"/></param> to extract words from.
  public static string[] GetWords(this string identifier) {
     Contract.Ensures(Contract.Result<string[]>() != null, "returned array of string is not null but can be empty");
     if (identifier == null) { return new string[0]; }
     if (identifier.Length == 0) { return new string[0]; }

     const int MIN_WORD_LENGTH = 2;  //  Ignore one letter or one digit words

     var length = identifier.Length;
     var list = new List<string>(1 + length/2); // Set capacity, not possible more words since we discard one char words
     var sb = new StringBuilder();
     CharKind cKindCurrent = GetCharKind(identifier[0]); // length is not zero here
     CharKind cKindNext = length == 1 ? CharKind.End : GetCharKind(identifier[1]);

     for (var i = 0; i < length; i++) {
        var c = identifier[i];
        CharKind cKindNextNext = (i >= length - 2) ? CharKind.End : GetCharKind(identifier[i + 2]);

        // Process cKindCurrent
        switch (cKindCurrent) {
           case CharKind.Digit:
           case CharKind.LowerCaseLetter:
              sb.Append(c); // Append digit or lowerCaseLetter to sb
              if (cKindNext == CharKind.UpperCaseLetter) {
                 goto TURN_SB_INTO_WORD; // Finish word if next char is upper
              }
              goto CHAR_PROCESSED;
           case CharKind.Other:
              goto TURN_SB_INTO_WORD;
           default:  // charCurrent is never Start or End
              Debug.Assert(cKindCurrent == CharKind.UpperCaseLetter);
              break;
        }

        // Here cKindCurrent is UpperCaseLetter
        // Append UpperCaseLetter to sb anyway
        sb.Append(c); 

        switch (cKindNext) {
           default:
              goto CHAR_PROCESSED;

           case CharKind.UpperCaseLetter: 
              //  "SimpleHTTPServer"  when we are at 'P' we need to see that NextNext is 'e' to get the word!
              if (cKindNextNext == CharKind.LowerCaseLetter) {
                 goto TURN_SB_INTO_WORD;
              }
              goto CHAR_PROCESSED;

           case CharKind.End:
           case CharKind.Other:
              break; // goto TURN_SB_INTO_WORD;
        }

        //------------------------------------------------

     TURN_SB_INTO_WORD:
        string word = sb.ToString();
        sb.Length = 0;
        if (word.Length >= MIN_WORD_LENGTH) {  
           list.Add(word);
        }

     CHAR_PROCESSED:
        // Shift left for next iteration!
        cKindCurrent = cKindNext;
        cKindNext = cKindNextNext;
     }

     string lastWord = sb.ToString();
     if (lastWord.Length >= MIN_WORD_LENGTH) {
        list.Add(lastWord);
     }
     return list.ToArray();
  }
  private static CharKind GetCharKind(char c) {
     if (char.IsDigit(c)) { return CharKind.Digit; }
     if (char.IsLetter(c)) {
        if (char.IsUpper(c)) { return CharKind.UpperCaseLetter; }
        Debug.Assert(char.IsLower(c));
        return CharKind.LowerCaseLetter;
     }
     return CharKind.Other;
  }
  enum CharKind {
     End, // For end of string
     Digit,
     UpperCaseLetter,
     LowerCaseLetter,
     Other
  }

แบบทดสอบ:

  [TestCase((string)null, "")]
  [TestCase("", "")]

  // Ignore one letter or one digit words
  [TestCase("A", "")]
  [TestCase("4", "")]
  [TestCase("_", "")]
  [TestCase("Word_m_Field", "Word Field")]
  [TestCase("Word_4_Field", "Word Field")]

  [TestCase("a4", "a4")]
  [TestCase("ABC", "ABC")]
  [TestCase("abc", "abc")]
  [TestCase("AbCd", "Ab Cd")]
  [TestCase("AbcCde", "Abc Cde")]
  [TestCase("ABCCde", "ABC Cde")]

  [TestCase("Abc42Cde", "Abc42 Cde")]
  [TestCase("Abc42cde", "Abc42cde")]
  [TestCase("ABC42Cde", "ABC42 Cde")]
  [TestCase("42ABC", "42 ABC")]
  [TestCase("42abc", "42abc")]

  [TestCase("abc_cde", "abc cde")]
  [TestCase("Abc_Cde", "Abc Cde")]
  [TestCase("_Abc__Cde_", "Abc Cde")]
  [TestCase("ABC_CDE_FGH", "ABC CDE FGH")]
  [TestCase("ABC CDE FGH", "ABC CDE FGH")] // Should not happend (white char) anything that is not a letter/digit/'_' is considered as a separator
  [TestCase("ABC,CDE;FGH", "ABC CDE FGH")] // Should not happend (,;) anything that is not a letter/digit/'_' is considered as a separator
  [TestCase("abc<cde", "abc cde")]
  [TestCase("abc<>cde", "abc cde")]
  [TestCase("abc<D>cde", "abc cde")]  // Ignore one letter or one digit words
  [TestCase("abc<Da>cde", "abc Da cde")]
  [TestCase("abc<cde>", "abc cde")]

  [TestCase("SimpleHTTPServer", "Simple HTTP Server")]
  [TestCase("SimpleHTTPS2erver", "Simple HTTPS2erver")]
  [TestCase("camelCase", "camel Case")]
  [TestCase("m_Field", "Field")]
  [TestCase("mm_Field", "mm Field")]
  public void Test_GetWords(string identifier, string expectedWordsStr) {
     var expectedWords = expectedWordsStr.Split(' ');
     if (identifier == null || identifier.Length <= 1) {
        expectedWords = new string[0];
     }

     var words = identifier.GetWords();
     Assert.IsTrue(words.SequenceEqual(expectedWords));
  }

— Patrick จากทีม NDepend
แหล่งที่มา

0

วิธีแก้ปัญหาง่ายๆซึ่งควรเป็นลำดับความสำคัญเร็วกว่าโซลูชัน regex (จากการทดสอบที่ฉันใช้กับโซลูชันอันดับต้น ๆ ในเธรดนี้) โดยเฉพาะอย่างยิ่งเมื่อขนาดของสตริงอินพุตเพิ่มขึ้น:

string s1 = "ThisIsATestStringAbcDefGhiJklMnoPqrStuVwxYz";
string s2;
StringBuilder sb = new StringBuilder();

foreach (char c in s1)
    sb.Append(char.IsUpper(c)
        ? " " + c.ToString()
        : c.ToString());

s2 = sb.ToString();

— iliketocode
แหล่งที่มา