强大的正则表达式——Medium
由上一篇文章《Easy》中提到过的:
还是直接让AI写个python脚本生成难度2的正则表达式,但是生成的正则表达式无法成功获取到flag:
这里了解了一下相关知识,字符串形式的整数对常数求模是可以用有限状态机来实现的。对于二进制数字来讲,在末尾加上 0 相当于将数字乘以 2;在末尾加上 1 相当于将数字乘以 2 再加上 1。
假设状态编号 n 表示「现在的数字为 k % 13 = n」。在状态 n 时每次读到下一个字符时会有两种状态转移:
读到 0 时,在末尾加上 0 之后的数字 k' = 2k
新的状态为 k' % 13 = 2n % 13
读到 1 时,在末尾加上 1 之后的数字 k' = 2k + 1
新的状态为 k' % 13 = (2n + 1) % 13
这个自动机在开始匹配时的状态为 0。在自动机运行完之后,如果处在状态 n,则说明这个二进制数字除 13 余 n。
构建了这个状态机之后,就需要将它转化为正则表达式。我们需要匹配可以被 13 整除的二进制数字,因此起始状态和终止状态都为 0。
状态机转化到正则表达式的思想是一个个删除中间的状态(起始状态和终止状态之外的状态),最后将状态机转化为只有一个状态。删除中间的状态 q 时,我们需要将所有经过状态 q 的路径拼接起来。例如如果有 p -> q -> r 这样一条路径,则需要将 p -> q 和 q -> r 的状态转移拼接起来,得到一条 p -> r 的状态转移。
这里以「匹配 4 的倍数」的状态机举例:
(具体数字可以看下面表格,圈内数字是状态)
读上标部分:
读到 0 时,在末尾加上 0 之后的数字 k' = 2k
新的状态为 k' % 4 = 2n % 4
读到 1 时,在末尾加上 1 之后的数字 k' = 2k + 1
新的状态为 k' % 4 = (2n + 1) % 4
状态k(n) | 读上标数字(0,1) | 状态k' |
0 | 0 | 0【(2*0)%4=0】 |
0 | 1 | 1【(2*0+1)%4=1】 |
1 | 0 | 2【(2*1)%4=2】 |
1 | 1 | 3【(2*1+1)%4=3】 |
2 | 0 | 0【(2*2)%4=0】 |
2 | 1 | 1【(2*2+1)%4=1】 |
3 | 0 | 2【(2*3)%4=2】 |
3 | 1 | 3【(2*3+1)%4=3】 |
删掉状态3:
(0|11*0)
删掉状态2:
(0|11*0)1
(0|11*0)0
删掉状态1:
(1((0|11*0)1)*(0|11*0)0)|0
「匹配 13 的倍数」的状态机也是同理,编写python代码:
# 定义状态数量
n = 13
# 初始化状态转移矩阵,每个元素是一个列表,用于存储可能的转移路径
paths = [[[] for _ in range(n)] for _ in range(n)]
# 构建状态转移矩阵
for i in range(n):
# 从状态 i 读入 0 后转移到状态 (2*i) % n
paths[i][(2 * i) % n].append("0")
# 从状态 i 读入 1 后转移到状态 (2*i+1) % n
paths[i][(2 * i + 1) % n].append("1")
# 定义一个函数,用于将多个路径合并成一个正则表达式
def path_union(lst):
return "(" + "|".join(lst) + ")"
# 当前状态数量
state_count = n
# 逐步消除状态,直到只剩下一个状态
while state_count > 1:
target = state_count - 1 # 当前要消除的状态
loop = "" # 用于存储目标状态到自身的循环路径
# 如果目标状态有自环路径,构建自环正则表达式
if len(paths[target][target]) > 0:
loop = path_union(paths[target][target]) + "*"
# 消除目标状态后,更新其他状态之间的路径
for i in range(target):
for j in range(target):
if len(paths[i][target]) > 0 and len(paths[target][j]) > 0:
# 从状态 i 到状态 j 的新路径 = 从 i 到 target 的路径 + 自环路径 + 从 target 到 j 的路径
new_path = path_union(paths[i][target]) + loop + path_union(paths[target][j])
paths[i][j].append(new_path)
# 减少状态数量
state_count -= 1
# 最终生成的正则表达式是从状态 0 出发并回到状态 0 的所有路径的并集
regex = path_union(paths[0][0]) + "*"
# 打印生成的正则表达式
print(f"生成的正则表达式为: {regex}")
但这个正则表达式明显过长了,换一种思路,直接用网络连接来传输生成的正则表达式
加上网络连接部分对应的python代码:
import pwn
# 令牌
token = b"531:MEYCIQDHL9dv6rPhZXD7kTqsNQhOCMdkSDmQ9lwfWCGlJGX9WwIhAIRyevrdkoLnKaHDBDnUCADQ9Yt0R6nf5irm5hQwDTiI"
# 建立远程连接
conn = pwn.remote('202.38.93.141', 30303)
# 发送令牌
conn.send(token)
conn.send(b"\n")
# 接收提示信息
conn.recvuntil(b"(1~3): ")
# 选择选项2
conn.send(b"2\n")
# 接收提示信息
conn.recvuntil(b"regex: ")
# 定义状态数量
n = 13
# 初始化状态转移矩阵,每个元素是一个列表,用于存储可能的转移路径
paths = [[[] for _ in range(n)] for _ in range(n)]
# 构建状态转移矩阵
for i in range(n):
# 从状态 i 读入 0 后转移到状态 (2*i) % n
paths[i][(2 * i) % n].append("0")
# 从状态 i 读入 1 后转移到状态 (2*i+1) % n
paths[i][(2 * i + 1) % n].append("1")
# 定义一个函数,用于将多个路径合并成一个正则表达式
def path_union(lst):
return "(" + "|".join(lst) + ")"
# 当前状态数量
state_count = n
# 逐步消除状态,直到只剩下一个状态
while state_count > 1:
target = state_count - 1 # 当前要消除的状态
loop = "" # 用于存储目标状态到自身的循环路径
# 如果目标状态有自环路径,构建自环正则表达式
if len(paths[target][target]) > 0:
loop = path_union(paths[target][target]) + "*"
# 消除目标状态后,更新其他状态之间的路径
for i in range(target):
for j in range(target):
if len(paths[i][target]) > 0 and len(paths[target][j]) > 0:
# 从状态 i 到状态 j 的新路径 = 从 i 到 target 的路径 + 自环路径 + 从 target 到 j 的路径
new_path = path_union(paths[i][target]) + loop + path_union(paths[target][j])
paths[i][j].append(new_path)
# 减少状态数量
state_count -= 1
# 最终生成的正则表达式是从状态 0 出发并回到状态 0 的所有路径的并集
regex = path_union(paths[0][0]) + "*"
# 打印生成的正则表达式
#print(f"生成的正则表达式为: {regex}")
# 发送生成的正则表达式
conn.send(regex.encode())
conn.send(b"\n")
# 进入交互模式
conn.interactive()
成功获取到flag
原文地址:https://blog.csdn.net/weixin_73049307/article/details/143866282
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!