使用powershell工具,根据文件的MD5值查找多个文件夹里的重复文件,并删除重复的文件只保留文件名最长的文件。
编写运行.ps1文件
新建文本文档,输入如下内容:
# 指定文件夹路径
$folderPath = "D:\111"
# 获取文件夹中的所有文件,不包括子文件夹
$files = Get-ChildItem -Path $folderPath -File -Recurse
# 创建一个哈希表来存储文件MD5值和文件路径
$md5Table = @{}
# 遍历文件,计算MD5值,并保存最长文件的路径
foreach ($file in $files) {
$md5 = Get-FileHash -Path $file.FullName -Algorithm MD5 | Select-Object -ExpandProperty Hash
$fileName = $file.Name
# 如果MD5值已经在哈希表中,比较文件名长度,保留最长文件的路径
if ($md5Table.ContainsKey($md5)) {
$existingFileName = Get-Item $md5Table[$md5] | Select-Object -ExpandProperty Name
if ($fileName.Length -gt $existingFileName.Length) {
$md5Table[$md5] = $file.FullName
}
} else {
# 如果MD5值不在哈希表中,添加该MD5值和文件路径
$md5Table[$md5] = $file.FullName
}
}
# 遍历文件夹,删除除最长文件名之外的文件
foreach ($file in $files) {
$md5 = Get-FileHash -Path $file.FullName -Algorithm MD5 | Select-Object -ExpandProperty Hash
$longestFile = $md5Table[$md5]
# 如果当前文件不是最长文件,就删除它
if ($file.FullName -ne $longestFile) {
Remove-Item -Path $file.FullName -Force
Write-Output "已删除文件: $($file.FullName)"
}
}
路径根据情况修改。代码保存为“.ps1”为后缀的文件,如“111.ps1”。
打开powershell,在“111.ps1”的路径下输入“ .\111.ps1”,执行该文件。
效果
查找文件夹中所有文件,包括子文件夹中的文件,按照MD5值判断是否重复,如果有重复,删除重复文件,只保留文件名最长的文件。
如果需要保留的是文件名最短的文件,比如微信,接收文件的文件夹中,有一些重复文件,需要删掉重复文件保留文件名最短的文件,只需要将
if ($fileName.Length -gt $existingFileName.Length) {
修改为
if ($fileName.Length -lt $existingFileName.Length) {
。这就可以删去重复文件,而且是根据MD5值删除,修改后的文件虽然文件名与原文件相似,但是不会出现误删。
报错
powershell运行指令,常出现的报错及处理参见:
Windows系统powershell运行指令常见报错及处理_weixin_56337147的博客-CSDN博客
扫描二维码关注公众号,回复:
17357859 查看本文章
总结
编写运行.ps1文件,查找并删除重复文件