正则表达式 - 语法学习笔记

简介

正则表达式是一种用于描述字符串模式的表达式。在许多程序语言中,正则表达式都被广泛应用于文本处理和数据筛选。

基本语法

正则表达式由一系列字符和特殊符号组成。其中最常见的特殊符号为元字符,代表着不同种类的字符或字符集合。

以下是几个常用的元字符:

  • .:匹配除换行符外的任意字符。
  • ^:匹配字符串的开头。
  • $:匹配字符串的结尾。
  • *:匹配前面的字符零次或多次。
  • +:匹配前面的字符一次或多次。
  • ?:匹配前面的字符零次或一次。
  • []:匹配方括号内的任意字符。
  • ():捕获匹配到的字符。

实例

匹配电子邮件地址

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}

该正则表达式能够匹配大部分电子邮件地址,包括用户名、域名和顶级域名。

例如:

匹配多个单词

\b\w+\b

该正则表达式能够匹配一个或多个连续的单词。

例如:

  • The quick brown fox
  • jumps over
  • the lazy dog

匹配日期格式

\d{4}-\d{2}-\d{2}

该正则表达式能够匹配YYYY-MM-DD格式的日期。

例如:

  • 2023-06-05

总结

正则表达式是一种非常有用的字符串处理工具。通过掌握基本语法和特殊符号,可以轻松地编写出复杂的正则表达式,并对文本进行准确、高效的匹配和替换。