วิธีการแปลงชื่อเรื่องเป็นทาก URL ใน jQuery?


163

ฉันกำลังทำงานกับแอปใน CodeIgniter และฉันกำลังพยายามสร้างฟิลด์บนฟอร์มที่สร้าง URL แบบไดนามิก สิ่งที่ฉันต้องการจะทำคือลบเครื่องหมายวรรคตอนแปลงเป็นตัวพิมพ์เล็กและแทนที่ช่องว่างด้วยเครื่องหมายขีดคั่น ตัวอย่างเช่น Rib Shack ของ Shane จะกลายเป็น shane-rib-shack

นี่คือสิ่งที่ฉันมี ส่วนตัวพิมพ์เล็กนั้นเป็นเรื่องง่าย แต่การเปลี่ยนไม่ได้ผลเลยและฉันก็ไม่ทราบว่าจะเอาเครื่องหมายวรรคตอนออก:

$("#Restaurant_Name").keyup(function(){
    var Text = $(this).val();
    Text = Text.toLowerCase();
    Text = Text.replace('/\s/g','-');
    $("#Restaurant_Slug").val(Text);    
});

2
ไม่ใช่ jQuery แต่มองเข้าไปที่ 'speakurl' ของไลบรารีหรือ 'node-slug'
Kevin Wheeler

... หรือslugify
x-yuri

คำตอบ:


379

ฉันไม่รู้ว่าคำว่า 'กระสุน' มาจากไหน แต่เราไปที่นี่:

function convertToSlug(Text)
{
    return Text
        .toLowerCase()
        .replace(/ /g,'-')
        .replace(/[^\w-]+/g,'')
        ;
}

การแทนที่อันดับแรกจะเปลี่ยนช่องว่างเป็นเครื่องหมายขีดคั่นการแทนที่อันดับสองจะลบสิ่งที่ไม่ใช่ตัวอักษรและตัวเลขเครื่องหมายขีดล่างหรือเครื่องหมายขีดกลาง

หากคุณไม่ต้องการสิ่งที่ "ถูกใจ -" เปลี่ยนเป็น "ถูกใจ --- นี้" คุณสามารถใช้สิ่งนี้แทน:

function convertToSlug(Text)
{
    return Text
        .toLowerCase()
        .replace(/[^\w ]+/g,'')
        .replace(/ +/g,'-')
        ;
}

ที่จะลบยัติภังค์ (แต่ไม่ใช่ที่ว่าง) ในการแทนที่ครั้งแรกและในการแทนที่ครั้งที่สองจะเป็นการรวมช่องว่างที่ต่อเนื่องกันเป็นยัติภังค์เดียว

ดังนั้น "like - this" ออกมาเป็น "like-this"


1
อย่าลืมเพิ่ม "/" เช่นกันหากคุณต้องการแยกหลายไดเรกทอรี
Val

6
คำว่า "กระสุน" มาจาก wordpress
Brynner Ferreira

18
เพื่อหลีกเลี่ยงยัติภังค์ต่อเนื่องหลายอันฉันใช้text.toLowerCase().replace(/ /g,'-').replace(/[-]+/g, '-').replace(/[^\w-]+/g,'');แทนตัวเลือก 2 ตัวเลือกที่ 2 จะเปลี่ยน "th - คือ" เป็น "นี้"
Ryan Allen

ฉันจะอนุญาตให้ใช้จุดใน URL ได้อย่างไร
Idan Shechter

สำหรับการหลีกเลี่ยง "_" ในกระสุนให้แทนที่. แทนที่ (/ + / g, '-') ถึง. แทนที่ (/ + | _ / g, '-')
Odin Thunder

112
var slug = function(str) {
  str = str.replace(/^\s+|\s+$/g, ''); // trim
  str = str.toLowerCase();

  // remove accents, swap ñ for n, etc
  var from = "ãàáäâẽèéëêìíïîõòóöôùúüûñç·/_,:;";
  var to   = "aaaaaeeeeeiiiiooooouuuunc------";
  for (var i=0, l=from.length ; i<l ; i++) {
    str = str.replace(new RegExp(from.charAt(i), 'g'), to.charAt(i));
  }

  str = str.replace(/[^a-z0-9 -]/g, '') // remove invalid chars
    .replace(/\s+/g, '-') // collapse whitespace and replace by -
    .replace(/-+/g, '-'); // collapse dashes

  return str;
};

และลอง

slug($('#field').val())

ต้นฉบับโดย: http://dense13.com/blog/2009/05/03/converting-string-to-slug-javascript/


แก้ไข: ขยายสำหรับตัวอักษรภาษาเฉพาะเพิ่มเติม:

var from = "ÁÄÂÀÃÅČÇĆĎÉĚËÈÊẼĔȆĞÍÌÎÏİŇÑÓÖÒÔÕØŘŔŠŞŤÚŮÜÙÛÝŸŽáäâàãåčçćďéěëèêẽĕȇğíìîïıňñóöòôõøðřŕšşťúůüùûýÿžþÞĐđßÆa·/_,:;";
var to   = "AAAAAACCCDEEEEEEEEGIIIIINNOOOOOORRSSTUUUUUYYZaaaaaacccdeeeeeeeegiiiiinnooooooorrsstuuuuuyyzbBDdBAa------";

6
แต่ไม่ถูกต้อง ในตำราภาษาเยอรมันüควรถูกแทนที่ด้วยueฯลฯ
feklee

5
@feklee: "ไม่ถูกต้อง" เป็นจริงสำหรับภาษาเยอรมัน (และอาจเป็นภาษาอื่น ๆ ) แต่ในภาษาอื่นมันก็ใช้ได้ สำหรับเว็บไซต์ภาษาอังกฤษฉันต้องการให้ "Márföldi" (นามสกุลของต้นกำเนิดของฮังการี) ถูกแปลงเป็น "marfoldi" และไม่ใช่ "marfoeldi" เหมือนที่ชาวเยอรมันทำ
michalstanko

1
เพื่อให้แน่ใจถึงความเข้ากันได้ข้ามแพลตฟอร์มคุณอาจต้องการย่อยจาก = "\ u00E3 \ u00E0 \ u00E1 \ u00E4 \ u00E2 \ u1EBD \ u00E8 \ u00E9 \ u00EB \ u00EB \ u00EE u00F6 \ u00F4 \ u00F9 \ u00FA \ u00FC \ u00FB \ u00F1 \ u00E7 \ u00B7 / _:; ";
Mike Godin

1
ทางออกที่ดี! åแม้ว่าสแกนดิเนเวียจะหายไปก็ตาม
Fredric

1
คุณสามารถเพิ่มİĞŞığşให้กับfromตัวแปรและแปลงเป็นIGSigsเพื่อรองรับอักขระตุรกี
CemilF

19

ก่อนอื่นนิพจน์ทั่วไปไม่ควรมีเครื่องหมายคำพูดล้อมรอบดังนั้น'/ \ s / g'ควรเป็น/ \ s / g

ในการแทนที่อักขระที่ไม่ใช่ตัวอักษรและตัวเลขทั้งหมดด้วยเครื่องหมายขีดกลางควรทำงาน (ใช้รหัสตัวอย่างของคุณ):

$("#Restaurant_Name").keyup(function(){
        var Text = $(this).val();
        Text = Text.toLowerCase();
        Text = Text.replace(/[^a-zA-Z0-9]+/g,'-');
        $("#Restaurant_Slug").val(Text);        
});

นั่นควรทำเคล็ดลับ ...


8

ฉันพบทางออกที่ดีและสมบูรณ์แบบสำหรับภาษาอังกฤษ

function slugify(string) {
  return string
    .toString()
    .trim()
    .toLowerCase()
    .replace(/\s+/g, "-")
    .replace(/[^\w\-]+/g, "")
    .replace(/\-\-+/g, "-")
    .replace(/^-+/, "")
    .replace(/-+$/, "");
}

ตัวอย่างบางส่วนของการใช้งาน:

slugify(12345);
// "12345"

slugify("  string with leading   and   trailing whitespace    ");
// "string-with-leading-and-trailing-whitespace"

slugify("mIxEd CaSe TiTlE");
// "mixed-case-title"

slugify("string with - existing hyphens -- ");
// "string-with-existing-hyphens"

slugify("string with Special™ characters");
// "string-with-special-characters"

ขอบคุณAndrew Stewart


8

หวังว่านี่จะช่วยให้วันของใครบางคน ...

/* Encode string to slug */
function convertToSlug( str ) {
	
  //replace all special characters | symbols with a space
  str = str.replace(/[`~!@#$%^&*()_\-+=\[\]{};:'"\\|\/,.<>?\s]/g, ' ').toLowerCase();
	
  // trim spaces at start and end of string
  str = str.replace(/^\s+|\s+$/gm,'');
	
  // replace space with dash/hyphen
  str = str.replace(/\s+/g, '-');	
  document.getElementById("slug-text").innerHTML= str;
  //return str;
}
<input type="text" onload="convertToSlug(this.value)" onkeyup="convertToSlug(this.value)" value="Try it Yourself"/>
<p id="slug-text"></p>


7

สิ่งที่คุณต้องการก็คือข้อดี :)

$("#Restaurant_Name").keyup(function(){
        var Text = $(this).val();
        Text = Text.toLowerCase();
        var regExp = /\s+/g;
        Text = Text.replace(regExp,'-');
        $("#Restaurant_Slug").val(Text);        
});

6

ดูฟังก์ชั่นกระสุนนี้เพื่อฆ่าเชื้อ URL ที่พัฒนาโดย Sean Murphy ที่https://gist.github.com/sgmurphy/3095196

/**
 * Create a web friendly URL slug from a string.
 *
 * Requires XRegExp (http://xregexp.com) with unicode add-ons for UTF-8 support.
 *
 * Although supported, transliteration is discouraged because
 *     1) most web browsers support UTF-8 characters in URLs
 *     2) transliteration causes a loss of information
 *
 * @author Sean Murphy <sean@iamseanmurphy.com>
 * @copyright Copyright 2012 Sean Murphy. All rights reserved.
 * @license http://creativecommons.org/publicdomain/zero/1.0/
 *
 * @param string s
 * @param object opt
 * @return string
 */
function url_slug(s, opt) {
    s = String(s);
    opt = Object(opt);

    var defaults = {
        'delimiter': '-',
        'limit': undefined,
        'lowercase': true,
        'replacements': {},
        'transliterate': (typeof(XRegExp) === 'undefined') ? true : false
    };

    // Merge options
    for (var k in defaults) {
        if (!opt.hasOwnProperty(k)) {
            opt[k] = defaults[k];
        }
    }

    var char_map = {
        // Latin
        'À': 'A', 'Á': 'A', 'Â': 'A', 'Ã': 'A', 'Ä': 'A', 'Å': 'A', 'Æ': 'AE', 'Ç': 'C', 
        'È': 'E', 'É': 'E', 'Ê': 'E', 'Ë': 'E', 'Ì': 'I', 'Í': 'I', 'Î': 'I', 'Ï': 'I', 
        'Ð': 'D', 'Ñ': 'N', 'Ò': 'O', 'Ó': 'O', 'Ô': 'O', 'Õ': 'O', 'Ö': 'O', 'Ő': 'O', 
        'Ø': 'O', 'Ù': 'U', 'Ú': 'U', 'Û': 'U', 'Ü': 'U', 'Ű': 'U', 'Ý': 'Y', 'Þ': 'TH', 
        'ß': 'ss', 
        'à': 'a', 'á': 'a', 'â': 'a', 'ã': 'a', 'ä': 'a', 'å': 'a', 'æ': 'ae', 'ç': 'c', 
        'è': 'e', 'é': 'e', 'ê': 'e', 'ë': 'e', 'ì': 'i', 'í': 'i', 'î': 'i', 'ï': 'i', 
        'ð': 'd', 'ñ': 'n', 'ò': 'o', 'ó': 'o', 'ô': 'o', 'õ': 'o', 'ö': 'o', 'ő': 'o', 
        'ø': 'o', 'ù': 'u', 'ú': 'u', 'û': 'u', 'ü': 'u', 'ű': 'u', 'ý': 'y', 'þ': 'th', 
        'ÿ': 'y',

        // Latin symbols
        '©': '(c)',

        // Greek
        'Α': 'A', 'Β': 'B', 'Γ': 'G', 'Δ': 'D', 'Ε': 'E', 'Ζ': 'Z', 'Η': 'H', 'Θ': '8',
        'Ι': 'I', 'Κ': 'K', 'Λ': 'L', 'Μ': 'M', 'Ν': 'N', 'Ξ': '3', 'Ο': 'O', 'Π': 'P',
        'Ρ': 'R', 'Σ': 'S', 'Τ': 'T', 'Υ': 'Y', 'Φ': 'F', 'Χ': 'X', 'Ψ': 'PS', 'Ω': 'W',
        'Ά': 'A', 'Έ': 'E', 'Ί': 'I', 'Ό': 'O', 'Ύ': 'Y', 'Ή': 'H', 'Ώ': 'W', 'Ϊ': 'I',
        'Ϋ': 'Y',
        'α': 'a', 'β': 'b', 'γ': 'g', 'δ': 'd', 'ε': 'e', 'ζ': 'z', 'η': 'h', 'θ': '8',
        'ι': 'i', 'κ': 'k', 'λ': 'l', 'μ': 'm', 'ν': 'n', 'ξ': '3', 'ο': 'o', 'π': 'p',
        'ρ': 'r', 'σ': 's', 'τ': 't', 'υ': 'y', 'φ': 'f', 'χ': 'x', 'ψ': 'ps', 'ω': 'w',
        'ά': 'a', 'έ': 'e', 'ί': 'i', 'ό': 'o', 'ύ': 'y', 'ή': 'h', 'ώ': 'w', 'ς': 's',
        'ϊ': 'i', 'ΰ': 'y', 'ϋ': 'y', 'ΐ': 'i',

        // Turkish
        'Ş': 'S', 'İ': 'I', 'Ç': 'C', 'Ü': 'U', 'Ö': 'O', 'Ğ': 'G',
        'ş': 's', 'ı': 'i', 'ç': 'c', 'ü': 'u', 'ö': 'o', 'ğ': 'g', 

        // Russian
        'А': 'A', 'Б': 'B', 'В': 'V', 'Г': 'G', 'Д': 'D', 'Е': 'E', 'Ё': 'Yo', 'Ж': 'Zh',
        'З': 'Z', 'И': 'I', 'Й': 'J', 'К': 'K', 'Л': 'L', 'М': 'M', 'Н': 'N', 'О': 'O',
        'П': 'P', 'Р': 'R', 'С': 'S', 'Т': 'T', 'У': 'U', 'Ф': 'F', 'Х': 'H', 'Ц': 'C',
        'Ч': 'Ch', 'Ш': 'Sh', 'Щ': 'Sh', 'Ъ': '', 'Ы': 'Y', 'Ь': '', 'Э': 'E', 'Ю': 'Yu',
        'Я': 'Ya',
        'а': 'a', 'б': 'b', 'в': 'v', 'г': 'g', 'д': 'd', 'е': 'e', 'ё': 'yo', 'ж': 'zh',
        'з': 'z', 'и': 'i', 'й': 'j', 'к': 'k', 'л': 'l', 'м': 'm', 'н': 'n', 'о': 'o',
        'п': 'p', 'р': 'r', 'с': 's', 'т': 't', 'у': 'u', 'ф': 'f', 'х': 'h', 'ц': 'c',
        'ч': 'ch', 'ш': 'sh', 'щ': 'sh', 'ъ': '', 'ы': 'y', 'ь': '', 'э': 'e', 'ю': 'yu',
        'я': 'ya',

        // Ukrainian
        'Є': 'Ye', 'І': 'I', 'Ї': 'Yi', 'Ґ': 'G',
        'є': 'ye', 'і': 'i', 'ї': 'yi', 'ґ': 'g',

        // Czech
        'Č': 'C', 'Ď': 'D', 'Ě': 'E', 'Ň': 'N', 'Ř': 'R', 'Š': 'S', 'Ť': 'T', 'Ů': 'U', 
        'Ž': 'Z', 
        'č': 'c', 'ď': 'd', 'ě': 'e', 'ň': 'n', 'ř': 'r', 'š': 's', 'ť': 't', 'ů': 'u',
        'ž': 'z', 

        // Polish
        'Ą': 'A', 'Ć': 'C', 'Ę': 'e', 'Ł': 'L', 'Ń': 'N', 'Ó': 'o', 'Ś': 'S', 'Ź': 'Z', 
        'Ż': 'Z', 
        'ą': 'a', 'ć': 'c', 'ę': 'e', 'ł': 'l', 'ń': 'n', 'ó': 'o', 'ś': 's', 'ź': 'z',
        'ż': 'z',

        // Latvian
        'Ā': 'A', 'Č': 'C', 'Ē': 'E', 'Ģ': 'G', 'Ī': 'i', 'Ķ': 'k', 'Ļ': 'L', 'Ņ': 'N', 
        'Š': 'S', 'Ū': 'u', 'Ž': 'Z', 
        'ā': 'a', 'č': 'c', 'ē': 'e', 'ģ': 'g', 'ī': 'i', 'ķ': 'k', 'ļ': 'l', 'ņ': 'n',
        'š': 's', 'ū': 'u', 'ž': 'z'
    };

    // Make custom replacements
    for (var k in opt.replacements) {
        s = s.replace(RegExp(k, 'g'), opt.replacements[k]);
    }

    // Transliterate characters to ASCII
    if (opt.transliterate) {
        for (var k in char_map) {
            s = s.replace(RegExp(k, 'g'), char_map[k]);
        }
    }

    // Replace non-alphanumeric characters with our delimiter
    var alnum = (typeof(XRegExp) === 'undefined') ? RegExp('[^a-z0-9]+', 'ig') : XRegExp('[^\\p{L}\\p{N}]+', 'ig');
    s = s.replace(alnum, opt.delimiter);

    // Remove duplicate delimiters
    s = s.replace(RegExp('[' + opt.delimiter + ']{2,}', 'g'), opt.delimiter);

    // Truncate slug to max. characters
    s = s.substring(0, opt.limit);

    // Remove delimiter from ends
    s = s.replace(RegExp('(^' + opt.delimiter + '|' + opt.delimiter + '$)', 'g'), '');

    return opt.lowercase ? s.toLowerCase() : s;
}

1
ในคอมมามีคนพูดว่า "สิ่งนี้จะไม่ทำงานกับการใช้งานที่เข้มงวดในเบราว์เซอร์ IE11- เนื่องจากการทำซ้ำในวัตถุ char_map"
BBaysinger


3
function slugify(text){
  return text.toString().toLowerCase()
    .replace(/\s+/g, '-')           // Replace spaces with -
    .replace(/[^\u0100-\uFFFF\w\-]/g,'-') // Remove all non-word chars ( fix for UTF-8 chars )
    .replace(/\-\-+/g, '-')         // Replace multiple - with single -
    .replace(/^-+/, '')             // Trim - from start of text
    .replace(/-+$/, '');            // Trim - from end of text
}

* อ้างอิงจากhttps://gist.github.com/mathewbyrne/1280286

ตอนนี้คุณสามารถแปลงสตริงนี้:

Barack_Obama       Барак_Обама ~!@#$%^&*()+/-+?><:";'{}[]\|`

เป็น:

barack_obama-барак_обама

ใช้กับรหัสของคุณ:

$("#Restaurant_Name").keyup(function(){
    var Text = $(this).val();
    Text = slugify(Text);
    $("#Restaurant_Slug").val(Text);
});

ไม่แน่ใจว่าทำไมถึงไม่เลือกคำตอบที่ถูกต้อง คำตอบจำนวนมากไม่นับรวมการลบ # หรือ? จากกระสุน - URL ได้รับความเสียหายด้วยวิธีนี้ แม้แต่ไลบรารีปฏิกิริยาที่ใช้บ่อยๆก็ยังไม่มีการใช้คุณสมบัตินี้ คำตอบนี้ง่ายมาก แต่เป็นสากล
Vladimir Marton

3

การรวมความหลากหลายขององค์ประกอบจากคำตอบที่นี่กับปกติให้ความคุ้มครองที่ดี รักษาลำดับของการดำเนินการเพื่อทำความสะอาด URL ที่เพิ่มขึ้น

function clean_url(s) {
    return s.toString().normalize('NFD').replace(/[\u0300-\u036f]/g, "") //remove diacritics
            .toLowerCase()
            .replace(/\s+/g, '-') //spaces to dashes
            .replace(/&/g, '-and-') //ampersand to and
            .replace(/[^\w\-]+/g, '') //remove non-words
            .replace(/\-\-+/g, '-') //collapse multiple dashes
            .replace(/^-+/, '') //trim starting dash
            .replace(/-+$/, ''); //trim ending dash
}

normlize('NFD')แบ่งอักขระเน้นเสียงออกเป็นองค์ประกอบของพวกเขาซึ่งเป็นตัวอักษรพื้นฐานรวมทั้งกำกับเสียง (ส่วนที่เน้น) replace(/[\u0300-\u036f]/g, "")กวาดล้างนักแสดงทั้งหมดออกจากตัวอักษรพื้นฐานด้วยตัวเอง ส่วนที่เหลือจะอธิบายด้วยความคิดเห็นแบบอินไลน์


1
ขอบคุณ. ง่ายและทำงานได้ดีกับกรณีทดสอบของฉัน แม้แต่ตัวอักษรเวียดนาม `` `const testCases = [{อินพุต: 'มันเป็นกระสุนที่ดี' คาดหวัง: 'is-it-a-good-slug'}, {อินพุต: '----- คือ --- - มัน ----- a ----- good ----- slug ----- ', คาดหวัง:' is-it-a-a-good-slug '}, {อินพุต:' CÔNG cha như núiTháiSơn ', คาดหวัง:' cong-cha-nhu-nui-thai-son '}, {อินพุต:' -Haha - Nhất-Nguyễn ', คาดหวัง:' haha-nhat-nguyen '}] `` `
Phat Tran Ky

1

คุณสามารถใช้ฟังก์ชั่นของคุณเองสำหรับสิ่งนี้

ลองใช้: http://jsfiddle.net/xstLr7aj/

function string_to_slug(str) {
  str = str.replace(/^\s+|\s+$/g, ''); // trim
  str = str.toLowerCase();

  // remove accents, swap ñ for n, etc
  var from = "àáäâèéëêìíïîòóöôùúüûñç·/_,:;";
  var to   = "aaaaeeeeiiiioooouuuunc------";
  for (var i=0, l=from.length ; i<l ; i++) {
    str = str.replace(new RegExp(from.charAt(i), 'g'), to.charAt(i));
  }

  str = str.replace(/[^a-z0-9 -]/g, '') // remove invalid chars
    .replace(/\s+/g, '-') // collapse whitespace and replace by -
    .replace(/-+/g, '-'); // collapse dashes

  return str;
}
$(document).ready(function() {
    $('#test').submit(function(){
        var val = string_to_slug($('#t').val());
        alert(val);
        return false;
    });
});

อะไรคือความแตกต่างในโซลูชันนี้จากคำตอบที่ได้รับการโหวตอย่างสูงข้างต้น
nilsi

รหัสปรับปรุงที่นี่เพื่อลบตัวอักษรตัวสุดท้ายถ้าเป็น "-" jsfiddle.net/xstLr7aj/36
MGE

1

คำตอบที่ได้รับการยอมรับไม่ตรงกับความต้องการของฉัน (มันช่วยให้ขีดเส้นใต้ไม่จัดการขีดกลางและส่วนท้าย ฯลฯ ) และคำตอบอื่น ๆ มีปัญหาอื่น ๆ ที่ไม่เหมาะกับกรณีการใช้งานของฉันดังนั้นนี่คือฟังก์ชัน slugify ฉันมากับ:

function slugify(string) {
    return string.trim() // Remove surrounding whitespace.
    .toLowerCase() // Lowercase.
    .replace(/[^a-z0-9]+/g,'-') // Find everything that is not a lowercase letter or number, one or more times, globally, and replace it with a dash.
    .replace(/^-+/, '') // Remove all dashes from the beginning of the string.
    .replace(/-+$/, ''); // Remove all dashes from the end of the string.
}

นี้จะเปิด 'foo !!! BAR _-_-_ baz-' (โปรดทราบพื้นที่ที่จุดเริ่มต้น) foo-bar-bazลง



1

อีกคนหนึ่ง สั้นและเก็บตัวอักษรพิเศษ:

imaginaçãoé mato => imaginacao-e-mato

function slugify (text) {
  const a = 'àáäâãèéëêìíïîòóöôùúüûñçßÿœæŕśńṕẃǵǹḿǘẍźḧ·/_,:;'
  const b = 'aaaaaeeeeiiiioooouuuuncsyoarsnpwgnmuxzh------'
  const p = new RegExp(a.split('').join('|'), 'g')

  return text.toString().toLowerCase()
    .replace(/\s+/g, '-')           // Replace spaces with -
    .replace(p, c =>
        b.charAt(a.indexOf(c)))     // Replace special chars
    .replace(/&/g, '-and-')         // Replace & with 'and'
    .replace(/[^\w\-]+/g, '')       // Remove all non-word chars
    .replace(/\-\-+/g, '-')         // Replace multiple - with single -
    .replace(/^-+/, '')             // Trim - from start of text
    .replace(/-+$/, '')             // Trim - from end of text
}

1

วิธีการสร้างกระสุนที่มีประสิทธิภาพยิ่งขึ้นบน JavaScript บริสุทธิ์ มันเป็นพื้นรองรับการทับศัพท์อักขระซีริลลิกและ Umlauts จำนวนมาก (เยอรมัน, เดนมาร์ก, ฝรั่งเศส, ตุรกี, ยูเครนและอื่น ๆ ) แต่สามารถขยายได้อย่างง่ายดาย

function makeSlug(str)
{
  var from="а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я ā ą ä á à â å č ć ē ę ě é è ê æ ģ ğ ö ó ø ǿ ô ő ḿ ʼn ń ṕ ŕ ş ü ß ř ł đ þ ĥ ḧ ī ï í î ĵ ķ ł ņ ń ň ř š ś ť ů ú û ứ ù ü ű ū ý ÿ ž ź ż ç є ґ".split(' ');
  var to=  "a b v g d e e zh z i y k l m n o p r s t u f h ts ch sh shch # y # e yu ya a a ae a a a a c c e e e e e e e g g oe o o o o o m n n p r s ue ss r l d th h h i i i i j k l n n n r s s t u u u u u u u u y y z z z c ye g".split(' ');
	
  str = str.toLowerCase();
  
  // remove simple HTML tags
  str = str.replace(/(<[a-z0-9\-]{1,15}[\s]*>)/gi, '');
  str = str.replace(/(<\/[a-z0-9\-]{1,15}[\s]*>)/gi, '');
  str = str.replace(/(<[a-z0-9\-]{1,15}[\s]*\/>)/gi, '');
  
  str = str.replace(/^\s+|\s+$/gm,''); // trim spaces
  
  for(i=0; i<from.length; ++i)
    str = str.split(from[i]).join(to[i]);
  
  // Replace different kind of spaces with dashes
  var spaces = [/(&nbsp;|&#160;|&#32;)/gi, /(&mdash;|&ndash;|&#8209;)/gi,
     /[(_|=|\\|\,|\.|!)]+/gi, /\s/gi];

  for(i=0; i<from.length; ++i)
  	str = str.replace(spaces[i], '-');
  str = str.replace(/-{2,}/g, "-");

  // remove special chars like &amp;
  str = str.replace(/&[a-z]{2,7};/gi, '');
  str = str.replace(/&#[0-9]{1,6};/gi, '');
  str = str.replace(/&#x[0-9a-f]{1,6};/gi, '');
  
  str = str.replace(/[^a-z0-9\-]+/gmi, ""); // remove all other stuff
  str = str.replace(/^\-+|\-+$/gm,''); // trim edges
  
  return str;
};


document.getElementsByTagName('pre')[0].innerHTML = makeSlug(" <br/> &#x202A;Про&amp;вер<strong>ка_тран</strong>с…литеърьации\rюга\nи&ndash;южного&nbsp;округа\t \nс\tёжикам&#180;и&nbsp;со\\всеми&ndash;друзьями\tтоже.Danke schön!ich heiße=КáÞÿá-Skånske,København çağatay rí gé tőr zöldülésetekről - . ");
<div>
  <pre>Hello world!</pre>
</div>


1

สำหรับคนที่ใช้อยู่แล้ว lodash

ตัวอย่างเหล่านี้ส่วนใหญ่ดีมากและครอบคลุมหลายกรณี แต่ถ้าคุณรู้ว่าคุณมีแค่ข้อความภาษาอังกฤษนี่เป็นเวอร์ชั่นของฉันที่อ่านง่ายสุด ๆ :)

_.words(_.toLower(text)).join('-')


1

หลังจากอ่านคำตอบแล้วฉันก็พบสิ่งนี้

    const generateSlug = (text) => text.toLowerCase().trim().replace(/[^\w- ]+/g, '').replace(/ /g, '-').replace(/[-]+/g, '-');

1

หมายเหตุ: หากคุณไม่สนใจเกี่ยวกับการโต้เถียงกับคำตอบที่ยอมรับแล้วและกำลังมองหาคำตอบจากนั้นข้ามหัวข้อถัดไปคุณจะพบคำตอบที่เสนอตอนท้าย

คำตอบที่ยอมรับมีปัญหาเล็กน้อย (ในความคิดของฉัน):

1) สำหรับตัวอย่างข้อมูลฟังก์ชันแรก:

ไม่คำนึงถึงช่องว่างที่ต่อเนื่องกันหลายรายการ

การป้อนข้อมูล: is it a good slug

ที่ได้รับ: ---is---it---a---good---slug---

คาดว่า: is-it-a-good-slug

ไม่คำนึงถึงขีดกลางติดต่อกันหลายครั้ง

การป้อนข้อมูล: -----is-----it-----a-----good-----slug-----

ที่ได้รับ: -----is-----it-----a-----good-----slug-----

คาดว่า: is-it-a-good-slug

โปรดทราบว่าการใช้งานนี้ไม่ได้จัดการกับขีดกลางด้านนอก (หรือช่องว่างสำหรับเรื่องนั้น) ไม่ว่าจะเป็นตัวต่อเนื่องหลายตัวหรือตัวละครเอกพจน์ซึ่ง (เท่าที่ฉันเข้าใจทากและการใช้งาน) ไม่ถูกต้อง

2) สำหรับตัวอย่างข้อมูลฟังก์ชันที่สอง:

ดูแลช่องว่างที่ต่อเนื่องหลายรายการด้วยการแปลงให้เป็นแบบซิงเกิล-แต่นั่นไม่เพียงพอที่จะเป็นด้านนอก (ที่จุดเริ่มต้นและจุดสิ้นสุดของสตริง) whitespaces นั้นจัดการเหมือนกันดังนั้นis it a good slugจะกลับมา-is-it-a-good-slug-

มันยังเอาขีดกลางทั้งหมดจากการป้อนข้อมูลที่แปลงสิ่งที่ต้องการ--is--it--a--good--slug--'ที่จะisitagoodslugข้อมูลโค้ดในความคิดเห็นโดย @ ryan อัลเลนดูแลที่ออกจากรอยขีดข่วนด้านนอกออก แต่ยังไม่แก้

ตอนนี้ฉันรู้แล้วว่าไม่มีข้อกำหนดมาตรฐานสำหรับตัวบุ้งและคำตอบที่ยอมรับอาจทำให้งานเสร็จ (ซึ่งผู้ใช้ที่โพสต์คำถามกำลังมองหาอยู่) เสร็จแล้ว แต่นี่เป็นคำถาม SO ที่นิยมมากที่สุดเกี่ยวกับตัวบุ้งใน JS ดังนั้นปัญหาเหล่านั้น ต้องชี้ให้เห็นด้วย (เกี่ยวกับการทำให้งานเสร็จ! ) ลองนึกภาพการพิมพ์สิ่งที่น่ารังเกียจของ URL นี้ ( www.blog.com/posts/-----how-----to-----slugify-----a-----string-----) หรือแม้กระทั่งแค่เปลี่ยนเส้นทางไปที่มันแทนที่จะเป็นสิ่งที่ชอบ ( www.blog.com/posts/how-to-slugify-a-string) ฉันรู้ว่านี่เป็นกรณีที่รุนแรงมาก สำหรับ

ทางออกที่ดีกว่าในความคิดของฉันจะเป็นดังนี้:

const slugify = str =>
  str
  .trim()                      // remove whitespaces at the start and end of string
  .toLowerCase()              
  .replace(/^-+/g, "")         // remove one or more dash at the start of the string
  .replace(/[^\w-]+/g, "-")    // convert any on-alphanumeric character to a dash
  .replace(/-+/g, "-")         // convert consecutive dashes to singuar one
  .replace(/-+$/g, "");        // remove one or more dash at the end of the string

ตอนนี้อาจมีนินจา RegExp อยู่ที่นั่นซึ่งสามารถแปลงเป็นนิพจน์ซับไลน์ได้ฉันไม่ใช่ผู้เชี่ยวชาญใน RegExp และฉันไม่ได้บอกว่านี่เป็นทางออกที่ดีที่สุดหรือกะทัดรัดที่สุดหรือตัวที่มีประสิทธิภาพดีที่สุด แต่หวังว่ามันจะทำงานได้สำเร็จ


นี่เป็นข้อบกพร่องที่การแปลงอักขระที่ไม่ใช่ตัวอักษรและตัวเลขเป็นเครื่องหมายขีดคั่นอาจเป็นไปได้ที่จะคืนค่าเส้นประที่จุดเริ่มต้นของบรรทัด แต่โปรดอย่าทำให้มันเป็นหนึ่งซับ อันนี้ง่ายต่อการเข้าใจ!
Timo

1
$("#Restaurant_Name").keyup(function(){
        var Text = $(this).val();
        Text = Text.toLowerCase();
        Text = Text.replace(/[^a-zA-Z0-9]+/g,'-');
        $("#Restaurant_Slug").val(Text);        
});

รหัสนี้ใช้งานได้


ขอบคุณ! ใช้งานง่ายกว่า
Jane Doe

0
//
//  jQuery Slug Plugin by Perry Trinier (perrytrinier@gmail.com)
//  MIT License: http://www.opensource.org/licenses/mit-license.php

jQuery.fn.slug = function(options) {
var settings = {
    slug: 'slug', // Class used for slug destination input and span. The span is created on $(document).ready() 
    hide: true   // Boolean - By default the slug input field is hidden, set to false to show the input field and hide the span. 
};

if(options) {
    jQuery.extend(settings, options);
}

$this = $(this);

$(document).ready( function() {
    if (settings.hide) {
        $('input.' + settings.slug).after("<span class="+settings.slug+"></span>");
        $('input.' + settings.slug).hide();
    }
});

makeSlug = function() {
        var slug = jQuery.trim($this.val()) // Trimming recommended by Brooke Dukes - http://www.thewebsitetailor.com/2008/04/jquery-slug-plugin/comment-page-1/#comment-23
                    .replace(/\s+/g,'-').replace(/[^a-zA-Z0-9\-]/g,'').toLowerCase() // See http://www.djangosnippets.org/snippets/1488/ 
                    .replace(/\-{2,}/g,'-'); // If we end up with any 'multiple hyphens', replace with just one. Temporary bugfix for input 'this & that'=>'this--that'
        $('input.' + settings.slug).val(slug);
        $('span.' + settings.slug).text(slug);

    }

$(this).keyup(makeSlug);

return $this;
    };

สิ่งนี้ช่วยฉันด้วยปัญหาเดียวกัน!


0
function slugify(content) {
   return content.toLowerCase().replace(/ /g,'-').replace(/[^\w-]+/g,'');
}
// slugify('Hello World');
// this will return 'hello-world';

มันใช้งานได้ดีสำหรับฉัน

พบได้ในCodeSnipper


-5
private string ToSeoFriendly(string title, int maxLength) {
    var match = Regex.Match(title.ToLower(), "[\\w]+");
    StringBuilder result = new StringBuilder("");
    bool maxLengthHit = false;
    while (match.Success && !maxLengthHit) {
        if (result.Length + match.Value.Length <= maxLength) {
            result.Append(match.Value + "-");
        } else {
            maxLengthHit = true;
            // Handle a situation where there is only one word and it is greater than the max length.
            if (result.Length == 0) result.Append(match.Value.Substring(0, maxLength));
        }
        match = match.NextMatch();
    }
    // Remove trailing '-'
    if (result[result.Length - 1] == '-') result.Remove(result.Length - 1, 1);
    return result.ToString();
}
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.