leetcode10. 正则表达式匹配
给你一个字符串 s
和一个字符规律 p
,请你来实现一个支持 '.'
和 '*'
的正则表达式匹配。
'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s
的,而不是部分字符串。
说明:
s
可能为空,且只包含从 a-z
的小写字母。p
可能为空,且只包含从 a-z
的小写字母,以及字符 .
和 *
。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
方法:动态规划
思路:
由于整个字符串是否可以匹配是与子串是否匹配相关的,因此使用动态规划来解决。
我们使用dp(i,j)表示s的[0,i-1]和p的[0,j-1]两个子串是否匹配,注意i或j等于0的时候,表示子串为空串,所以答案为dp(m,n)。m=len(s),n=len(p)。
由于存在'.'符号,可以匹配任意的字符,所以我们编写一个match(i,j)函数来判断两个字符s[i-1]和p[j-1]是否匹配。如果两个字符相等,或者p[j-1] = '.',那么返回True。如果i=0或者j=0,那么相当于此时为空字串,不存在s[i-1]或p[j-1],所以返回False。
下面我们考虑状态转移方程:
当遍历到i,j时,如果此时p[j-1]不为'',那么意味着不需要考虑 的情况,只需要考虑match(i,j),转移方程为:
如果此时的p[j-1]为'',那么需要考虑匹配情况,我们把符号 和它前面的符号当作一个整体。如果此时s[i-1]与p[j-2]不匹配,即match(i,j-1)=False,比如下图这种情况:
此时b和c不相等,说明此时的这个 符号是无效的,因为它只能当作一个或多个b,所以我们把这个 * 当作“0个”的意思,把这整个'b*符号去掉,结果就是蓝色部分匹配的结果,即dp(i,j-2)。
如果此时s[i-1]与p[j-2]匹配,那么实际上是有两种情况的,一种如下图所示,按照我们理解,这种情况下这个 实际可以匹配多个b,但是我们直接枚举的话,比较耗时,我们充分发挥动态规划的优点,直接结果为dp(i-1,j)即可,因为dp(i-1,j)中就已经包含了这个 匹配前面的b的情况了。
另一种情况如下所示,此时'b*'并没有什么用,因此可以与上面一样,当作0个的意思,所以为dp(i,j-2)。
因此如果p[j-1]为'*',状态转移方程为:
下面我们考虑边界条件,首先如果s和p都为空,那么为True,故dp(0,0)=True,如果p为空,那么都为False,所以我们初始化dp数组的时候,全部初始化为False,然后dp(0,0) = True,遍历的时候,i取值[0,m],j取值[1,n]。
最后返回dp[m] [n]即可。
class Solution:def isMatch(self, s: str, p: str) -> bool:m = len(s)n = len(p)#判断s[i-1]与p[j-1]是否匹配def match(i,j):if i == 0 or j == 0:return Falseif p[j-1] == '.':return Truereturn s[i-1] == p[j-1]#初始化dp数组dp = [[False for _ in range(n+1)] for _ in range(m+1)]dp[0][0] = True#遍历进行dp数组的填写for i in range(m+1):for j in range(1,n+1):if p[j-1] == '*':#对应无法使用*匹配或者自己放弃使用*匹配的情况dp[i][j] = dp[i][j-2]#如果可以使用*匹配if match(i,j-1):dp[i][j] |= dp[i-1][j]else:#不是*的话,如果s[i-1]和p[j-1]匹配,则答案为dp[i-1][j-1],否则为Falsedp[i][j] = dp[i-1][j-1] if match(i,j) else Falsereturn dp[m][n]
结果: