我试着匹配文件夹中文件的模式,文件扩展名是pdf。
我有许多pdf文件,有相同的模式,但与不同的名称在末尾。
模式包括文件的日期+名称.
问题是,当我运行脚本时,系统将这两个文件名视为第一个模式(python_pt),而不使用elif语句。
示例:
10-11-2021 python.pdf22-09-2021 java.pdf代码:
import re
import os
from os import path
from tqdm import tqdm
from time import sleep
python_pt= "^[0-3]?[0-9]-[0-3]?[0-9]-(?:[0-9]{2})?[0-9]{2}$ python.pdf"
java_pt1= "^[0-3]?[0-9]-[0-3]?[0-9]-(?:[0-9]{2})?[0-9]{2}$ java.pdf"
java_pt2= "^ java [0-3]?[0-9]-[0-3]?[0-9]-(?:[0-9]{2})?[0-9]{2}$.pdf"
str = 'c:'
a = 0
i = 0
for dirpath, dirnames, files in os.walk(src, topdown=True):
print(f'\nFound directory: {dirpath}\n')
for file in tqdm(files):
sleep(.1)
full_file_name = os.path.join(dirpath, file)
if os.path.join(dirpath) == src:
if file.endswith("pdf"):
if python_pt:
i+=1
elif java_pt1 or java_pt2:
a+=1
print("{} file 1 \n".format(i))
print("{} file 2 \n".format(a))发布于 2021-11-10 10:24:00
问题在于正则表达式和执行regex检查的方式:
$就会使模式无效(字符串结束后不可能有字符)。由于您需要检查文件名是否与您的模式结尾,所以只在结尾添加$,并且不要忘记转义文字$检查是否有匹配,需要使用re.search / re.match / re.fullmatch方法之一.。
下面是一个固定的片段:
import re, os
from os import path
from tqdm import tqdm
from time import sleep
python_pt= r"[0-3]?[0-9]-[0-3]?[0-9]-(?:[0-9]{2})?[0-9]{2} python\.pdf$" # FIXED
java_pt1= r"[0-3]?[0-9]-[0-3]?[0-9]-(?:[0-9]{2})?[0-9]{2} java\.pdf$" # FIXED
java_pt2= r"java [0-3]?[0-9]-[0-3]?[0-9]-(?:[0-9]{2})?[0-9]{2}\.pdf$" # FIXED
src = "C:"
i=0
a=0
for dirpath, dirnames, files in os.walk(src, topdown=True):
print(f'\nFound directory: {dirpath}\n')
for file in tqdm(files):
sleep(.1)
full_file_name = os.path.join(dirpath, file)
if os.path.join(dirpath) == src:
if file.endswith("pdf"):
if re.search(python_pt, file): # FIXED
i+=1
elif re.search(java_pt1, file) or re.search(java_pt2, file): # FIXED
a+=1
print("{} file 1 \n".format(i))
print("{} file 2 \n".format(a))请参阅# FIXED行。
https://stackoverflow.com/questions/69910982
复制相似问题