热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python检索文件内容工具

公司内部需求一个工具检索目录下的文件在另外的目录中使用次数,用来优化包体的大小。此代码效率并不高效,另添加对应的后缀检索。用python实现比较快速,另还有缺点是只支持

公司内部需求一个工具检索目录下的文件在另外的目录中使用次数, 用来优化包体的大小。

此代码效率并不高效, 另添加对应的 后缀检索。 用python 实现比较快速, 另还有缺点是只支持 utf-8 格式内容。

各位用到的可以自己摘一下。

(本人习惯使用c\c++,目前发现这种脚本类的确实实现方便,接口齐全, 我能想到的接口, 真的全都有, 用python 写工具, 应该是一个调试起来还可以的过程)

代码如下:

1 #coding=utf-8
2
3 import os
4 import sys
5 import time
6
7 #private:
8 def checkSuffix(strFileName, strCompareSuffix):
9 strPreFileName = ''
10 strFileSuffix = ''
11 bIsCheckOk = False
12 strArray = strFileName.split('.')
13 if len(strArray) > 1:
14 strPreFileName = strArray[0]
15 strFileSuffix = strArray[1]
16 #print(strFileSuffix)
17 #print(strCompareSuffix)
18 if strCompareSuffix == '*' or strFileSuffix == strCompareSuffix:
19 bIsCheckOk = True
20 return bIsCheckOk, strPreFileName
21
22 def readFileName(file_dir):
23 for root, dirs, files in os.walk(file_dir):
24 return files,dirs, root
25 return '', '', ''
26
27 def findString(pathFile, findKey):
28 #print("open pathFile:", pathFile)
29 fp = open(pathFile, "r", encoding='utf-8')
30 strr = fp.read()
31 if(strr.find(findKey) != -1):
32 return True
33 return False
34
35 def startFind(files, dirs, root, findKey, strSuffix):
36 for fileName in files:
37 try:
38 bIsCheckOk, strPreFileName = checkSuffix(fileName, strSuffix)
39 if bIsCheckOk == False:
40 #print("fileName", fileName, " is not suffx :", strSuffix)
41 continue
42 if(findString(root + "\\" + fileName, findKey)):
43 return True, fileName
44 except Exception as err:
45 continue
46
47 for jj in dirs:
48 fi, di, ro = readFileName(root + jj)
49 bIsFind, fileName = startFind(fi, di, ro, findKey, strSuffix)
50 if(bIsFind == True):
51 return bIsFind, fileName
52 return False, ''
53
54 #public:
55 def findUse(dirPath, findKey, strSuffix):
56 files, dirs, root = readFileName(dirPath)
57 return startFind(files, dirs, root, findKey, strSuffix)
58
59 def getDirsFiles(dirPath):
60 dirfiles = [];
61 for root, dirs, files in os.walk(dirPath):
62 dirfiles += files;
63 return dirfiles
64
65 def writeResult(strFileName, strWriteSign, list):
66 fp = open(strFileName, 'a+')
67 fp.write(strWriteSign)
68 #fp.writelines(list)
69 for str in list:
70 fp.write(str)
71 fp.write('\n')
72 fp.close()
73
74 if __name__ == '__main__':
75 """
76 findDir = u"E:\\mmo2018001\\artist\\open\\ui\\free\\"
77 findAimDir = u"E:\\mmo2018001\\artist\\open\\effect\\"
78 findsuffix = "prefab" # 哪些要搜索的文件的后缀
79 findAimsuffix = "*" # 搜索那些后缀的文件
80 """
81 bt = time.clock() # 记录时间
82
83 findDir = sys.argv[1]
84 findAimDir = sys.argv[2]
85 findsuffix = sys.argv[3]
86 findAimsuffix = sys.argv[4]
87
88 thisPath = os.getcwd()
89 print("this path is ", thisPath)
90 print(findDir)
91 print(findAimDir)
92 print(findsuffix)
93 print(findAimsuffix)
94
95 dirFiles = getDirsFiles(findAimDir)
96 useFiles = []
97 notUseFiles = []
98 nLen = len(dirFiles)
99 i = 0
100 for filesName in dirFiles :
101
102 bIsCheckOk, strPreFileName = checkSuffix(filesName, findsuffix)
103 if bIsCheckOk == True:
104 isFind, fileName = findUse(findDir, strPreFileName, findAimsuffix)
105 #print("filesName:\t", filesName, " \nIsFind:\t\t", isFind)
106 if(isFind):
107 useFiles.append(filesName)
108 else:
109 notUseFiles.append(filesName)
110 i += 1
111 p = round(i * 100 / nLen)
112 duration = round(time.clock() - bt, 2)
113 remaining = round(duration * 100 / (0.01 + p) - duration, 2)
114 print("进度:{0}%,已耗时:{1}s,预计剩余时间:{2}s".format(p, duration, remaining), end="\r")
115
116 writePath = thisPath + "\\Result.txt"
117 try:
118 os.remove(writePath)
119 except Exception as err:
120 print(err)
121 writeResult(writePath, "***************NotUseFiles:***************\n", notUseFiles)
122 writeResult(writePath, "***************UseFiles:***************\n", useFiles)
123 useTime = time.clock() - bt
124 print("已完成 总耗时:", useTime)

 


推荐阅读
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • 这篇文章主要介绍了Python拼接字符串的七种方式,包括使用%、format()、join()、f-string等方法。每种方法都有其特点和限制,通过本文的介绍可以帮助读者更好地理解和运用字符串拼接的技巧。 ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • C# 7.0 新特性:基于Tuple的“多”返回值方法
    本文介绍了C# 7.0中基于Tuple的“多”返回值方法的使用。通过对C# 6.0及更早版本的做法进行回顾,提出了问题:如何使一个方法可返回多个返回值。然后详细介绍了C# 7.0中使用Tuple的写法,并给出了示例代码。最后,总结了该新特性的优点。 ... [详细]
  • 本文详细介绍了Java中vector的使用方法和相关知识,包括vector类的功能、构造方法和使用注意事项。通过使用vector类,可以方便地实现动态数组的功能,并且可以随意插入不同类型的对象,进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下,使用vector类是一个很好的选择。 ... [详细]
  • 本文讨论了Kotlin中扩展函数的一些惯用用法以及其合理性。作者认为在某些情况下,定义扩展函数没有意义,但官方的编码约定支持这种方式。文章还介绍了在类之外定义扩展函数的具体用法,并讨论了避免使用扩展函数的边缘情况。作者提出了对于扩展函数的合理性的质疑,并给出了自己的反驳。最后,文章强调了在编写Kotlin代码时可以自由地使用扩展函数的重要性。 ... [详细]
  • Python爬虫中使用正则表达式的方法和注意事项
    本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤,并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法,包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块,并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习,读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ... [详细]
  • 本文介绍了在MFC下利用C++和MFC的特性动态创建窗口的方法,包括继承现有的MFC类并加以改造、插入工具栏和状态栏对象的声明等。同时还提到了窗口销毁的处理方法。本文详细介绍了实现方法并给出了相关注意事项。 ... [详细]
  • 超级简单加解密工具的方案和功能
    本文介绍了一个超级简单的加解密工具的方案和功能。该工具可以读取文件头,并根据特定长度进行加密,加密后将加密部分写入源文件。同时,该工具也支持解密操作。加密和解密过程是可逆的。本文还提到了一些相关的功能和使用方法,并给出了Python代码示例。 ... [详细]
  • 本文介绍了一个Python函数same_set,用于判断两个相等长度的数组是否包含相同的元素。函数会忽略元素的顺序和重复次数,如果两个数组包含相同的元素,则返回1,否则返回0。文章还提供了函数的具体实现代码和样例输入输出。 ... [详细]
  • 颜色迁移(reinhard VS welsh)
    不要谈什么天分,运气,你需要的是一个截稿日,以及一个不交稿就能打爆你狗头的人,然后你就会被自己的才华吓到。------ ... [详细]
  • R语言拼接字符串_paste的用法说明
    这篇文章主要介绍了R语言拼接字符串_paste的用法说明,具有很好的参考价值,希望对大家有所帮助。一 ... [详细]
  • 如何自行分析定位SAP BSP错误
    The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • eclipse学习(第三章:ssh中的Hibernate)——11.Hibernate的缓存(2级缓存,get和load)
    本文介绍了eclipse学习中的第三章内容,主要讲解了ssh中的Hibernate的缓存,包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ... [详细]
author-avatar
深深i
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有