uTools-Manuals/docs/javascript/Guide/Regular_Expressions.html
2019-04-21 11:50:48 +08:00

566 lines
38 KiB
HTML
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<article id="wikiArticle">
<p></p> <div class="prevnext" style="text-align: right;">
<p><a href="Guide/Text_formatting" style="float: left;">« 上一页</a><a href="Guide/Indexed_collections">下一页 »</a></p>
</div><p></p>
<p>正则表达式是用于匹配字符串中字符组合的模式。在 JavaScript中正则表达式也是对象。这些模式被用于 <a href="Reference/RegExp" title="此页面仍未被本地化, 期待您的翻译!"><code>RegExp</code></a> 的 <a href="Reference/Global_Objects/RegExp/exec" title="exec() 方法在一个指定字符串中执行一个搜索匹配。返回一个结果数组或 null。"><code>exec</code></a> 和 <a href="Reference/Global_Objects/RegExp/test" title="test() 方法执行一个检索,用来查看正则表达式与指定的字符串是否匹配。返回 true 或 false。"><code>test</code></a> 方法, 以及 <a href="Reference/String" title="此页面仍未被本地化, 期待您的翻译!"><code>String</code></a> 的 <a href="Reference/Global_Objects/String/match" title="match() 方法检索返回一个字符串匹配正则表达式的的结果。"><code>match</code></a><a href="Reference/Global_Objects/String/replace" title="replace() 方法返回一个由替换值replacement替换一些或所有匹配的模式pattern后的新字符串。模式可以是一个字符串或者一个正则表达式替换值可以是一个字符串或者一个每次匹配都要调用的函数。"><code>replace</code></a><a href="Reference/Global_Objects/String/search" title="search() 方法执行正则表达式和 String对象之间的一个搜索匹配。"><code>search</code></a> 和 <a href="Reference/Global_Objects/String/split" title="split() 方法使用指定的分隔符字符串将一个String对象分割成字符串数组以将字符串分隔为子字符串以确定每个拆分的位置。"><code>split</code></a> 方法。本章介绍 JavaScript正则表达式。</p>
<h2 id="创建一个正则表达式">创建一个正则表达式</h2>
<p>你可以使用以下两种方法之一构建一个正则表达式:</p>
<p>使用一个正则表达式字面量,其由包含在斜杠之间的模式组成,如下所示:</p>
<pre><code class="language-javascript">/*
/pattern/flags
*/
const regex = /ab+c/;
const regex = /^[a-zA-Z]+[0-9]*\W?_$/gi;</code></pre>
<p>在加载脚本后,正则表达式字面值提供正则表达式的编译。当正则表达式保持不变时,使用此方法可获得更好的性能。</p>
<p>或者调用<code><a href="/zh-CN/docs/JavaScript/Reference/Global_Objects/RegExp" title="zh-CN/docs/JavaScript/Reference/Global Objects/RegExp">RegExp</a></code>对象的构造函数,如下所示:</p>
<pre><code class="language-javascript">/*
new RegExp(pattern [, flags])
*/
let regex = new RegExp("ab+c");
let regex = new RegExp(/^[a-zA-Z]+[0-9]*\W?_$/, "gi");
let regex = new RegExp("^[a-zA-Z]+[0-9]*\\W?_$", "gi");
</code></pre>
<p>使用构造函数提供正则表达式的运行时编译。使用构造函数,当你知道正则表达式模式将会改变,或者你不知道模式,并从另一个来源,如用户输入。</p>
<h2 id="编写一个正则表达式的模式">编写一个正则表达式的模式</h2>
<p>一个正则表达式模式是由简单的字符所构成的,比如<code>/abc/</code>, 或者是简单和特殊字符的组合,比如 <code>/ab*c/</code> 或 <code>/Chapter (\d+)\.\d*/。后者</code>用到了括号,它在正则表达式中可以被用作是一个记忆设备。这一部分正则所匹配的字符将会被记住,在后面可以被利用。正如 <a href="#使用括号的子字符串匹配">使用括号的子字符串匹配</a></p>
<h3 id="使用简单的模式">使用简单的模式</h3>
<p>简单的模式是由你找到的直接匹配所构成的。比如,<code>/abc/</code>这个模式就匹配了在一个字符串中,仅仅字符 'abc' 同时出现并按照这个顺序。在 "Hi, do you know your abc's?" 和 "The latest airplane designs evolved from slabcraft." 就会匹配成功。在上面的两个实例中,匹配的是子字符串 'abc'。在字符串 "Grab crab" 中将不会被匹配,因为它不包含任何的 'abc' 子字符串。</p>
<h3 id="使用特殊字符">使用特殊字符</h3>
<p>当你需要搜索一个比直接匹配需要更多条件的匹配时,比如寻找一个或多个 'b',或者寻找空格,那么这时模式将要包含特殊字符。比如, 模式<code>/ab*c/</code>匹配了一个单独的 'a' 后面跟了零个或者多个 'b'*的意思是前面一项出现了零个或者多个),且后面跟着 'c' 的任何字符组合。在字符串 "cbbabbbbcdebc" 中,这个模式匹配了子字符串 "abbbbc"。</p>
<p>下面的表格列出了一个我们在正则表达式中可以利用的特殊字符的完整列表和描述。</p>
<table class="fullwidth-table">
<caption>表 4.1 正则表达式中的特殊字符</caption>
<thead>
<tr>
<th scope="col">字符</th>
<th scope="col">含义</th>
</tr>
</thead>
<tbody>
<tr>
<td style="vertical-align: middle;"><a href="#special-backslash" id="special-backslash" name="special-backslash"><code>\</code></a></td>
<td>
<p>匹配将依照下列规则:</p>
<p>在非特殊字符之前的反斜杠表示下一个字符是特殊的,不能从字面上解释。例如,前面没有'\'的'b'通常匹配小写'b',无论它们出现在哪里。如果加了'\',这个字符变成了一个特殊意义的字符,意思是匹配一个<a href="#note" title="#special-word-boundary">字符边界</a></p>
<p>反斜杠也可以将其后的特殊字符,转义为字面量。例如,模式 /a*/ 代表会匹配 0 个或者多个 a。相反模式 /a\*/ 将 '*' 的特殊性移除,从而可以匹配像 "a*" 这样的字符串。</p>
<p>使用 new RegExp("pattern") 的时候不要忘记将 \ 进行转义,因为 \ 在字符串里面也是一个转义字符。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-caret" id="special-caret" name="special-caret"><code>^</code></a></td>
<td>
<p>匹配输入的开始。如果多行标志被设置为true那么也匹配换行符后紧跟的位置。</p>
<p>例如,/^A/ 并不会匹配 "an A" 中的 'A',但是会匹配 "An E" 中的 'A'。</p>
<p>当 '^' 作为第一个字符出现在一个字符集合模式时,它将会有不同的含义。<a href="#note">补充字符集合</a> 一节有详细介绍和示例。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-dollar" id="special-dollar" name="special-dollar"><code>$</code></a></td>
<td>
<p>匹配输入的结束。如果多行标示被设置为true那么也匹配换行符前的位置。</p>
<p>例如,/t$/ 并不会匹配 "eater" 中的 't',但是会匹配 "eat" 中的 't'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-asterisk" id="special-asterisk" name="special-asterisk"><code>*</code></a></td>
<td>
<p>匹配前一个表达式0次或多次。等价于 {0,}。</p>
<p>例如,/bo*/会匹配 "A ghost boooooed" 中的 'booooo' 和 "A bird warbled" 中的 'b',但是在 "A goat grunted" 中将不会匹配任何东西。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-plus" id="special-plus" name="special-plus"><code>+</code></a></td>
<td>
<p>匹配前面一个表达式1次或者多次。等价于 {1,}。</p>
<p>例如,/a+/匹配了在 "candy" 中的 'a',和在 "caaaaaaandy" 中所有的 'a'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-questionmark" id="special-questionmark" name="special-questionmark"><code>?</code></a></td>
<td>
<p>匹配前面一个表达式0次或者1次。等价于 {0,1}。</p>
<p>例如,/e?le?/ 匹配 "angel" 中的 'el',和 "angle" 中的 'le' 以及"oslo' 中的'l'。</p>
<p>如果<strong>紧跟在任何量词 *、 +、? 或 {} 的后面</strong>,将会使量词变为<strong>非贪婪</strong>的(匹配尽量少的字符),和缺省使用的<strong>贪婪模式</strong>(匹配尽可能多的字符)正好相反。</p>
<p>例如,对 "123abc" 应用 /\d+/ 将会返回 "123",如果使用 /\d+?/,那么就只会匹配到 "1"。</p>
<p>还可以运用于先行断言,如本表的 <code>x(?=y)</code> 和 <code>x(?!y)</code> 条目中所述。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-dot" id="special-dot" name="special-dot"><code>.</code></a></td>
<td>
<p>(小数点)匹配除换行符之外的任何单个字符。</p>
<p>例如,/.n/将会匹配 "nay, an apple is on the tree" 中的 'an' 和 'on',但是不会匹配 'nay'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-capturing-parentheses" id="special-capturing-parentheses" name="special-capturing-parentheses"><code>(x)</code></a></td>
<td>
<p>匹配 'x' 并且记住匹配项,就像下面的例子展示的那样。括号被称为 <em>捕获括号</em></p>
<p>模式<code>/(foo) (bar) \1 \2/</code>中的 '(foo)' 和 '(bar)' 匹配并记住字符串 "foo bar foo bar" 中前两个单词。模式中的 \1 和 \2 匹配字符串的后两个单词。注意 \1、\2、\n 是用在正则表达式的匹配环节。在正则表达式的替换环节,则要使用像 $1、$2、$n 这样的语法,例如,'bar foo'.replace( /(...) (...)/, '$2 $1' )。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-non-capturing-parentheses" id="special-non-capturing-parentheses" name="special-non-capturing-parentheses"><code>(?:x)</code></a></td>
<td>
<p>匹配 'x' 但是不记住匹配项。这种叫作非捕获括号,使得你能够定义为与正则表达式运算符一起使用的子表达式。来看示例表达式 /(?:foo){1,2}/。如果表达式是 /foo{1,2}/{1,2}将只对 foo 的最后一个字符 o 生效。如果使用非捕获括号,则{1,2}会匹配整个 foo 单词。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-lookahead" id="special-lookahead" name="special-lookahead"><code>x(?=y)</code></a></td>
<td>
<p>匹配'x'仅仅当'x'后面跟着'y'.这种叫做正向肯定查找。</p>
<p>例如,/Jack(?=Sprat)/会匹配到'Jack'仅仅当它后面跟着'Sprat'。/Jack(?=Sprat|Frost)/匹配Jack仅仅当它后面跟着'Sprat'或者是Frost。但是SpratFrost都不是匹配结果的一部分。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-negated-look-ahead" id="special-negated-look-ahead" name="special-negated-look-ahead"><code>x(?!y)</code></a></td>
<td>
<p>匹配'x'仅仅当'x'后面不跟着'y',这个叫做正向否定查找。</p>
<p>例如,/\d+(?!\.)/匹配一个数字仅仅当这个数字后面没有跟小数点的时候。正则表达式/\d+(?!\.)/.exec("3.141")匹配141而不是3.141</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-or" id="special-or" name="special-or"><code>x|y</code></a></td>
<td>
<p>匹配x或者y</p>
<p>例如,/green|red/匹配“green apple”中的green和“red apple”中的red</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-quantifier" id="special-quantifier" name="special-quantifier"><code>{n}</code></a></td>
<td>
<p>n是一个正整数匹配了前面一个字符刚好发生了n次。</p>
<p>比如,/a{2}/不会匹配“candy”中的'a',但是会匹配“caandy”中所有的a以及“caaandy”中的前两个'a'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-quantifier-range" id="special-quantifier-range" name="special-quantifier-range"><code>{n,m}</code></a></td>
<td>
<p>n 和 m 都是整数。匹配前面的字符至少n次最多m次。如果 n 或者 m 的值是0 这个值被忽略。</p>
<p>例如,/a{1, 3}/ 并不匹配“cndy”中的任意字符匹配“candy”中的a匹配“caandy”中的前两个a也匹配“caaaaaaandy”中的前三个a。注意当匹配”caaaaaaandy“时匹配的值是“aaa”即使原始的字符串中有更多的a。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-character-set" id="special-character-set" name="special-character-set"><code>[xyz]</code></a></td>
<td>
<p>一个字符集合。匹配方括号中的任意字符,包括<a href="Guide/Grammar_and_types">转义序列</a>。你可以使用破折号(-)来指定一个字符范围。对于点(.)和星号(*)这样的特殊符号在一个字符集中没有特殊的意义。他们不必进行转义,不过转义也是起作用的。</p>
<p>例如,[abcd] 和[a-d]是一样的。他们都匹配"brisket"中的b,也都匹配“city”中的c。/[a-z.]+/ 和/[\w.]+/与字符串“test.i.ng”匹配。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-negated-character-set" id="special-negated-character-set" name="special-negated-character-set"><code>[^xyz]</code></a></td>
<td>
<p>一个反向字符集。也就是说, 它匹配任何没有包含在方括号中的字符。你可以使用破折号(-)来指定一个字符范围。任何普通字符在这里都是起作用的。</p>
<p>例如,[^abc] 和 [^a-c] 是一样的。他们匹配"brisket"中的r也匹配“chop”中的h</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-backspace" id="special-backspace" name="special-backspace"><code>[\b]</code></a></td>
<td>
<p>匹配一个退格(U+0008)。(不要和\b混淆了。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-word-boundary" id="special-word-boundary" name="special-word-boundary"><code>\b</code></a></td>
<td>
<p>匹配一个词的边界。一个词的边界就是一个词不被另外一个“字”字符跟随的位置或者没有其他“字”字符在其前面的位置。注意一个匹配的词的边界并不包含在匹配的内容中。换句话说一个匹配的词的边界的内容的长度是0。不要和[\b]混淆了)</p>
<p>例子:</p>
<p>/\bm/匹配“moon”中的m</p>
<p>/oo\b/并不匹配"moon"中的'oo',因为'oo'被一个“字”字符'n'紧跟着。</p>
<p>/oon\b/匹配"moon"中的'oon',因为'oon'是这个字符串的结束部分。这样他没有被一个“字”字符紧跟着。</p>
<p>/\w\b\w/将不能匹配任何字符串,因为在一个单词中间的字符永远也不可能同时满足没有“字”字符跟随和有“字”字符跟随两种情况。</p>
<div class="note">
<p><strong><a id="note" name="note"></a>注意:</strong> JavaScript的正则表达式引擎将<a class="external" href="http://www.ecma-international.org/ecma-262/5.1/#sec-15.10.2.6" rel="noopener">特定的字符集</a>定义为“字”字符。不在该集合中的任何字符都被认为是一个断词。这组字符相当有限:它只包括大写和小写的罗马字母,十进制数字和下划线字符。不幸的是,重要的字符,例如“<a id="none" name="none"></a>é”或“ü”,被视为断词。</p>
</div>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-non-word-boundary" id="special-non-word-boundary" name="special-non-word-boundary"><code>\B</code></a></td>
<td>
<p>匹配一个非单词边界。他匹配一个前后字符都是相同类型的位置:都是“字”字符或者都不是“字”字符。一个字符串的开始和结尾都被认为不是“字”字符,或者空字符串。</p>
<p>例如,/\B../匹配"noonday"中的'oo', 而/y\B../匹配"possibly yesterday"中的yes</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-control" id="special-control" name="special-control"><code>\c<em>X</em></code></a></td>
<td>
<p>当X是处于A到Z之间的字符的时候匹配字符串中的一个控制符。</p>
<p>例如,<code>/\cM/</code> 匹配字符串中的 control-M (U+000D)。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-digit" id="special-digit" name="special-digit"><code>\d</code></a></td>
<td>
<p>匹配一个数字<code></code></p>
<p><code>等价于[0-9]</code></p>
<p>例如, <code>/\d/</code> 或者 <code>/[0-9]/</code> 匹配"B2 is the suite number."中的'2'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-non-digit" id="special-non-digit" name="special-non-digit"><code>\D</code></a></td>
<td>
<p>匹配一个非数字字符<code></code></p>
<p><code>等价于[^0-9]</code></p>
<p>例如, <code>/\D/</code> 或者 <code>/[^0-9]/</code> 匹配"B2 is the suite number."中的'B' 。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-form-feed" id="special-form-feed" name="special-form-feed"><code>\f</code></a></td>
<td>匹配一个换页符 (U+000C)。</td>
</tr>
<tr>
<td><a href="#special-line-feed" id="special-line-feed" name="special-line-feed"><code>\n</code></a></td>
<td>匹配一个换行符 (U+000A)。</td>
</tr>
<tr>
<td><a href="#special-carriage-return" id="special-carriage-return" name="special-carriage-return"><code>\r</code></a></td>
<td>匹配一个回车符 (U+000D)。</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-white-space" id="special-white-space" name="special-white-space"><code>\s</code></a></td>
<td>
<p>匹配一个空白字符,包括空格、制表符、换页符和换行符。</p>
<p>等价于[ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]。</p>
<p>例如, <code>/\s\w*/</code> 匹配"foo bar."中的' bar'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-non-white-space" id="special-non-white-space" name="special-non-white-space"><code>\S</code></a></td>
<td>
<p>匹配一个非空白字符。</p>
<p>等价于<code>[^ </code>\f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff<code>]</code></p>
<p>例如, <code>/\S\w*/</code> 匹配"foo bar."中的'foo'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-tab" id="special-tab" name="special-tab"><code>\t</code></a></td>
<td>匹配一个水平制表符 (U+0009)。</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-vertical-tab" id="special-vertical-tab" name="special-vertical-tab"><code>\v</code></a></td>
<td>匹配一个垂直制表符 (U+000B)。</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-word" id="special-word" name="special-word"><code>\w</code></a></td>
<td>
<p>匹配一个单字字符(字母、数字或者下划线)。</p>
<p>等价于<code>[A-Za-z0-9_]</code></p>
<p>例如, <code>/\w/</code> 匹配 "apple," 中的 'a'"$5.28,"中的 '5' 和 "3D." 中的 '3'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-non-word" id="special-non-word" name="special-non-word"><code>\W</code></a></td>
<td>
<p>匹配一个非单字字符。</p>
<p>等价于<code>[^A-Za-z0-9_]</code></p>
<p>例如, <code>/\W/</code> 或者 <code>/[^A-Za-z0-9_]/</code> 匹配 "50%." 中的 '%'。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-backreference" id="special-backreference" name="special-backreference"><code>\<em>n</em></code></a></td>
<td>
<p>在正则表达式中它返回最后的第n个子捕获匹配的子字符串(捕获的数目以左括号计数)。</p>
<p>比如 <code>/apple(,)\sorange\1/</code> 匹配"apple, orange, cherry, peach."中的'apple, orange,' 。</p>
</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-null" id="special-null" name="special-null"><code>\0</code></a></td>
<td>匹配 NULL (U+0000) 字符, 不要在这后面跟其它小数,因为 <code>\0&lt;digits&gt;</code> 是一个八进制转义序列。</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-hex-escape" id="special-hex-escape" name="special-hex-escape"><code>\xhh</code></a></td>
<td>与代码 hh 匹配字符(两个十六进制数字)</td>
</tr>
<tr>
<td style="vertical-align: middle;"><a href="#special-unicode-escape" id="special-unicode-escape" name="special-unicode-escape"><code>\uhhhh</code></a></td>
<td>与代码 hhhh 匹配字符(四个十六进制数字)。</td>
</tr>
</tbody>
</table>
<table>
<tbody>
<tr>
<td><a class="new" href="https://developer.mozilla.orgGuide/Regular_Expressions$edit#special-unicode-escape-es6" id="special-unicode-escape-es6" name="special-unicode-escape-es6" rel="nofollow"><code>\u{hhhh}</code></a></td>
<td>(仅当设置了u标志时) 使用Unicode值hhhh匹配字符 (十六进制数字).</td>
</tr>
</tbody>
</table>
<p>将用户输入转义为正则表达式中的一个字面字符串, 可以通过简单的替换来实现:</p>
<pre>function escapeRegExp(string){
return string.replace(/([.*+?^=!:${}()|[\]\/\\])/g, "\\$&amp;");
  //$&amp;表示整个被匹配的字符串
}</code></pre>
<h3 id="使用插入语">使用插入语</h3>
<p>任何正则表达式的插入语都会使这部分匹配的副字符串被记忆。一旦被记忆,这个副字符串就可以被调用于其它用途,如同 <a href="#使用括号的子字符串匹配">使用括号的子字符串匹配</a>之中所述。</p>
<p>比如, <code>/Chapter (\d+)\.\d*/</code> 解释了额外转义的和特殊的字符并说明了这部分pattern应该被记忆。它精确地匹配后面跟着一个以上数字字符的字符 'Chapter '  (<code>\d</code> 意为任何数字字符,<code>+ 意为1次以上</code>),跟着一个小数点(在这个字符中本身也是一个特殊字符;小数点前的 \ 意味着这个pattern必须寻找字面字符 '.')跟着任何数字字符0次以上。 (<code>\d</code> 意为数字字符, <code>*</code> 意为0次以上)。另外,插入语也用来记忆第一个匹配的数字字符。</p>
<p>此模式可以匹配字符串"Open Chapter 4.3, paragraph 6",并且'4'将会被记住。此模式并不能匹配"Chapter 3 and 4",因为在这个字符串中'3'的后面没有点号'.'。</p>
<p>括号中的"?:",这种模式匹配的子字符串将不会被记住。比如,(?:\d+)匹配一次或多次数字字符,但是不能记住匹配的字符。</p>
<h2 id="使用正则表达式">使用正则表达式</h2>
<p>正则表达式可以被用于<code><a href="https://developer.mozilla.org/zh-CN/docs/JavaScript/Reference/Global_Objects/RegExp" style="line-height: 1.5;" title="RegExp">RegExp</a></code><a href="https://developer.mozilla.org/zh-CN/docs/JavaScript/Reference/Global_Objects/RegExp/exec" style="line-height: 1.5;" title="exec"><code>exec</code></a><a class="new" href="https://developer.mozilla.org/zh-CN/docs/JavaScript/Reference/Global_Objects/RegExp/test" rel="nofollow" style="color: rgb(153, 0, 0); line-height: 1.5;" title="test"><code>test</code></a>方法以及 <a href="https://developer.mozilla.org/zh-CN/docs/JavaScript/Reference/Global_Objects/String" style="line-height: 1.5;" title="String"><code>String</code></a><a class="new" href="https://developer.mozilla.org/zh-CN/docs/JavaScript/Reference/Global_Objects/String/match" rel="nofollow" style="color: rgb(153, 0, 0); line-height: 1.5;" title="match"><code>match</code></a><a href="https://developer.mozilla.org/zh-CN/docs/JavaScript/Reference/Global_Objects/String/replace" style="line-height: 1.5;" title="zh-CN/docs/JavaScript/Reference/Global_Objects/String/replace"><code>replace</code></a><a class="new" href="https://developer.mozilla.org/zh-CN/docs/JavaScript/Reference/Global_Objects/String/search" rel="nofollow" style="color: rgb(153, 0, 0); line-height: 1.5;" title="search"><code>search</code></a><a class="new" href="https://developer.mozilla.org/zh-CN/docs/JavaScript/Reference/Global_Objects/String/split" rel="nofollow" style="color: rgb(153, 0, 0); line-height: 1.5;" title="split"><code>split</code></a>方法。这些方法在<a href="/zh-CN/docs/JavaScript/Reference" title="zh-CN/docs/JavaScript/Reference">JavaScript 手册</a>中有详细的解释。</p>
<table class="standard-table">
<caption>表 4.2 使用正则表达式的方法</caption>
<thead>
<tr>
<th scope="col">方法</th>
<th scope="col">描述</th>
</tr>
</thead>
<tbody>
<tr>
<td><code><a href="/zh-CN/docs/JavaScript/Reference/Global_Objects/RegExp/exec" title="zh-CN/docs/JavaScript/Reference/Global_Objects/RegExp/exec">exec</a></code></td>
<td>一个在字符串中执行查找匹配的RegExp方法它返回一个数组未匹配到则返回null</td>
</tr>
<tr>
<td><code><a class="new" href="/zh-CN/docs/JavaScript/Reference/Global_Objects/RegExp/test" rel="nofollow" title="zh-CN/docs/JavaScript/Reference/Global_Objects/RegExp/test">test</a></code></td>
<td>一个在字符串中测试是否匹配的RegExp方法它返回true或false。</td>
</tr>
<tr>
<td><code><a class="new" href="/zh-CN/docs/JavaScript/Reference/Global_Objects/String/match" rel="nofollow" title="zh-CN/docs/JavaScript/Reference/Global_Objects/String/match">match</a></code></td>
<td>一个在字符串中执行查找匹配的String方法它返回一个数组或者在未匹配到时返回null。</td>
</tr>
<tr>
<td><code><a class="new" href="/zh-CN/docs/JavaScript/Reference/Global_Objects/String/search" rel="nofollow" title="zh-CN/docs/JavaScript/Reference/Global_Objects/String/search">search</a></code></td>
<td>一个在字符串中测试匹配的String方法它返回匹配到的位置索引或者在失败时返回-1。</td>
</tr>
<tr>
<td><code><a href="/zh-CN/docs/JavaScript/Reference/Global_Objects/String/replace" title="zh-CN/docs/JavaScript/Reference/Global_Objects/String/replace">replace</a></code></td>
<td>一个在字符串中执行查找匹配的String方法并且使用替换字符串替换掉匹配到的子字符串。</td>
</tr>
<tr>
<td><code><a class="new" href="/zh-CN/docs/JavaScript/Reference/Global_Objects/String/split" rel="nofollow" title="zh-CN/docs/JavaScript/Reference/Global_Objects/String/split">split</a></code></td>
<td>一个使用正则表达式或者一个固定字符串分隔一个字符串并将分隔后的子字符串存储到数组中的String方法。</td>
</tr>
</tbody>
</table>
<p>当你想要知道在一个字符串中的一个匹配是否被找到你可以使用test或search方法想得到更多的信息但是比较慢则可以使用exec或match方法。如果你使用exec或match方法并且匹配成功了那么这些方法将返回一个数组并且更新相关的正则表达式对象的属性和预定义的正则表达式对象详见下。如果匹配失败那么exec方法返回null也就是false</p>
<p>在接下来的例子中脚本将使用exec方法在一个字符串中查找一个匹配。</p>
<pre>var myRe = /d(b+)d/g;
var myArray = myRe.exec("cdbbdbsbz");
</code></pre>
<p>如果你不需要访问正则表达式的属性这个脚本通过另一个方法来创建myArray</p>
<pre>var myArray = /d(b+)d/g.exec("cdbbdbsbz");
</code></pre>
<p>如果你想通过一个字符串构建正则表达式,那么这个脚本还有另一种方法:</p>
<pre>var myRe = new RegExp("d(b+)d", "g");
var myArray = myRe.exec("cdbbdbsbz");
</code></pre>
<p>通过这些脚本,匹配成功后将返回一个数组并且更新正则表达式的属性,如下表所示。</p>
<table class="fullwidth-table">
<caption>表 4.3 正则表达式执行返回信息</caption>
<thead>
<tr>
<th scope="col">对象</th>
<th scope="col">属性或索引</th>
<th scope="col">描述</th>
<th scope="col">在例子中对应的值</th>
</tr>
</thead>
<tbody>
<tr>
<td rowspan="4"><code>myArray</code></td>
<td> </td>
<td>匹配到的字符串和所有被记住的子字符串。</td>
<td><code>["dbbd", "bb"]</code></td>
</tr>
<tr>
<td><code>index</code></td>
<td>在输入的字符串中匹配到的以0开始的索引值。</td>
<td><code>1</code></td>
</tr>
<tr>
<td><code>input</code></td>
<td>初始字符串。</td>
<td><code>"cdbbdbsbz"</code></td>
</tr>
<tr>
<td><code>[0]</code></td>
<td>匹配到的所有字符串(并不是匹配后记住的字符串)。注:原文"The last matched characters.",应该是原版错误。匹配到的最终字符。</td>
<td><code>"dbbd"</code></td>
</tr>
<tr>
<td rowspan="2"><code>myRe</code></td>
<td><code>lastIndex</code></td>
<td>下一个匹配的索引值。这个属性只有在使用g参数时可用在 <a href="https://developer.mozilla.orgGuide/Regular_Expressions#.E9.80.9A.E8.BF.87.E5.8F.82.E6.95.B0.E8.BF.9B.E8.A1.8C.E9.AB.98.E7.BA.A7.E6.90.9C.E7.B4.A2">通过参数进行高级搜索</a> 一节有详细的描述.)</td>
<td><code>5</code></td>
</tr>
<tr>
<td><code>source</code></td>
<td>模式文本。在正则表达式创建时更新,不执行。</td>
<td><code>"d(b+)d"</code></td>
</tr>
</tbody>
</table>
<p>在这个例子中如第二种形式所示,你可以使用一个正则表达式创建一个没有分配给变量的对象初始化容器。如果你这样做,那么,每一次使用时都好比在使用一个新的正则表达式。因为这个原因,如果你使用这个未分配给一个变量的正则表达式,你将在随后不能访问这个正则表达式的属性。例如,假如你有如下脚本:</p>
<pre>var myRe = /d(b+)d/g;
var myArray = myRe.exec("cdbbdbsbz");
console.log("The value of lastIndex is " + myRe.lastIndex);
</code></pre>
<p>这个脚本输出如下:</p>
<pre>The value of lastIndex is 5
</code></pre>
<p>然而,如果你有如下脚本:</p>
<pre>var myArray = /d(b+)d/g.exec("cdbbdbsbz");
console.log("The value of lastIndex is " + /d(b+)d/g.lastIndex);
</code></pre>
<p>它显示为:</p>
<pre>The value of lastIndex is 0
</code></pre>
<p>当发生/d(b+)d/g使用两个不同状态的正则表达式对象lastIndex属性会得到不同的值。如果你需要访问一个正则表达式的属性则需要创建一个对象初始化生成器你应该首先把它赋值给一个变量。</p>
<h3 id="使用括号的子字符串匹配_2"><a id="使用括号的子字符串匹配" name="使用括号的子字符串匹配">使用括号的子字符串匹配</a></h3>
<p>一个正则表达式模式使用括号,将导致相应的子匹配被记住。例如,/a(b)c /可以匹配字符串“abc”并且记得“b”。回调这些括号中匹配的子串使用数组元素[1],……[n]。</p>
<p>使用括号匹配的子字符串的数量是无限的。返回的数组中保存所有被发现的子匹配。下面的例子说明了如何使用括号的子字符串匹配。</p>
<p>下面的脚本使用replace()方法来转换字符串中的单词。在匹配到的替换文本中,脚本使用替代的$ 1,$ 2表示第一个和第二个括号的子字符串匹配。</p>
<pre>var re = /(\w+)\s(\w+)/;
var str = "John Smith";
var newstr = str.replace(re, "$2, $1");
console.log(newstr);
</code></pre>
<p>这个表达式输出 "Smith, John"。</p>
<h3 id="通过标志进行高级搜索">通过标志进行高级搜索</h3>
<p>正则表达式有四个可选参数进行全局和不分大小写搜索。这些参数既可以单独使用也可以一起使用在任何顺序和包含正则表达式的部分中。</p>
<table class="standard-table" dir="ltr">
<caption>正则表达式标志</caption>
<thead>
<tr>
<th scope="col" style="white-space: nowrap;">标志</th>
<th scope="col" style="white-space: nowrap;">描述</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align: center;"><code>g</code></td>
<td>全局搜索。</td>
</tr>
<tr>
<td style="text-align: center;">i</td>
<td>不区分大小写搜索。</td>
</tr>
<tr>
<td style="text-align: center;">m</td>
<td>多行搜索。</td>
</tr>
<tr>
<td style="text-align: center;">y</td>
<td>执行“粘性”搜索,匹配从目标字符串的当前位置开始可以使用y标志。</td>
</tr>
</tbody>
</table>
<p>包含一个标志的正则表达式,使用这个表达式:</p>
<pre>var re = /pattern/flags;
</code></pre>
<p>或者</p>
<pre>var re = new RegExp("pattern", "flags");
</code></pre>
<p>值得注意的是,标志是一个正则表达式的一部分,它们在接下来的时间将不能添加或删除。</p>
<p>例如re = /\w+\s/g 将创建一个查找一个或多个字符后有一个空格的正则表达式,或者组合起来像此要求的字符串。</p>
<pre>var re = /\w+\s/g;
var str = "fee fi fo fum";
var myArray = str.match(re);
console.log(myArray);
</code></pre>
<p>这段代码将输出 ["fee ", "fi ", "fo "]。在这个例子中,你可以将:</p>
<pre>var re = /\w+\s/g;
</code></pre>
<p>替换成:</p>
<pre>var re = new RegExp("\\w+\\s", "g");
</code></pre>
<p>并且能获取到相同的结果。</p>
<p>m标志用于指定多行输入字符串应该被视为多个行。如果使用m标志^和$匹配的开始或结束输入字符串中的每一行,而不是整个字符串的开始或结束。</p>
<h2 id="例子">例子</h2>
<p>以下例子说明了一些正则表达式的用途。</p>
<h3 id="改变输入字符串的顺序">改变输入字符串的顺序</h3>
<p>以下例子解释了正则表达式的构成和<code>string.split()</code> 以及 <code>string.replace()</code>的用途。它会整理一个只有粗略格式的含有全名名字首先出现的输入字符串这个字符串被空格、换行符和一个分号分隔。最终它会颠倒名字顺序姓氏首先出现和list的类型。</p>
<pre><code class="language-javascript">// 下面这个姓名字符串包含了多个空格和制表符,
// 且在姓和名之间可能有多个空格和制表符。
var names = "Harry Trump ;Fred Barney; Helen Rigby ; Bill Abel ; Chris Hand ";
var output = ["---------- Original String\n", names + "\n"];
// 准备两个模式的正则表达式放进数组里。
// 分割该字符串放进数组里。
// 匹配模式:匹配一个分号及紧接其前后所有可能出现的连续的不可见符号。
var pattern = /\s*;\s*/;
// 把通过上述匹配模式分割的字符串放进一个叫做nameList的数组里面。
var nameList = names.split(pattern);
// 新建一个匹配模式:匹配一个或多个连续的不可见字符及其前后紧接着由
// 一个或多个连续的基本拉丁字母表中的字母、数字和下划线组成的字符串
// 用一对圆括号来捕获该模式中的一部分匹配结果。
// 捕获的结果稍后会用到。
pattern = /(\w+)\s+(\w+)/;
// 新建一个数组 bySurnameList 用来临时存放正在处理的名字。
var bySurnameList = [];
// 输出 nameList 的元素并且把 nameList 里的名字
// 用逗号接空格的模式把姓和名分割开来然后存放进数组 bySurnameList 中。
//
// 下面的这个替换方法把 nameList 里的元素用 <strong>$2, $1</strong> 的模式
// (第二个捕获的匹配结果紧接着一个逗号一个空格然后紧接着第一个捕获的匹配结果)替换了
// 变量 $1 和变量 $2 是上面所捕获的匹配结果。
output.push("---------- After Split by Regular Expression");
var i, len;
for (i = 0, len = nameList.length; i &lt; len; i++){
output.push(nameList[i]);
bySurnameList[i] = nameList[i].replace(pattern, "$2, $1");
}
// 输出新的数组
output.push("---------- Names Reversed");
for (i = 0, len = bySurnameList.length; i &lt; len; i++){
output.push(bySurnameList[i]);
}
// 根据姓来排序,然后输出排序后的数组。
bySurnameList.sort();
output.push("---------- Sorted");
for (i = 0, len = bySurnameList.length; i &lt; len; i++){
output.push(bySurnameList[i]);
}
output.push("---------- End");
console.log(output.join("\n"));
</code></pre>
<h3 id="用特殊字符检验输入">用特殊字符检验输入</h3>
<p>在以下例子中我们期望用户输入一个电话号码。当用户点击“Check”按钮我们的脚本开始检查这些数字是否合法。如果数字合法匹配正则表达式所规定的字符序列脚本显示一条感谢用户的信息并确认该数字。如果这串数字不合法脚本提示用户电话号码不合法。.</p>
<p>包含非捕获括号 <code>(?:</code> 这个正则表达式寻找三个数字字符<code>\d{3}</code> 或者 <code>|</code> 一个左半括号<code>\(</code>跟着三位数字<code>\d{3}</code>, 跟着一个封闭括号 <code>\)</code>, (结束非捕获括号 <code>)</code>) 后跟着一个短破折号或左斜杠或小数点,随后跟随三个数字字符,当记忆字符 <code>([-\/\.])捕获并记住,后面跟着三位小数</code> <code>\d{3},再后面跟随记住的左斜杠、右斜杠或小数点</code> <code>\1最后跟着四位小数</code> <code>\d{4}。</code></p>
<p>当用户按下Enter设置RegExp.input这些变化也能被激活。</p>
<pre>&lt;!DOCTYPE html&gt;
&lt;html&gt;
&lt;head&gt;
&lt;meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"&gt;
&lt;meta http-equiv="Content-Script-Type" content="text/javascript"&gt;
&lt;script type="text/javascript"&gt;
var re = /(?:\d{3}|\(\d{3}\))([-\/\.])\d{3}\1\d{4}/;
function testInfo(phoneInput) {
var OK = re.exec(phoneInput.value);
if (!OK)
window.alert(phoneInput.value + ' isn\'t a phone number with area code!');
else
window.alert('Thanks, your phone number is ' + OK[0]);
}
&lt;/script&gt;
&lt;/head&gt;
&lt;body&gt;
&lt;p&gt;Enter your phone number (with area code) and then click "Check".
&lt;br&gt;The expected format is like ###-###-####.&lt;/p&gt;
&lt;form action="#"&gt;
&lt;input id="phone"&gt;&lt;button onclick="testInfo(document.getElementById('phone'));"&gt;Check&lt;/button&gt;
&lt;/form&gt;
&lt;/body&gt;
&lt;/html&gt;</code></pre>
<p></p><div class="prevnext" style="text-align: right;">
<p><a href="Guide/Text_formatting" style="float: left;">« 上一页</a><a href="Guide/Indexed_collections">下一页 »</a></p>
</div><p></p>
<p> </p>
</article>