Windows系统使用powershell查找并删除重复文件

使用powershell工具,根据文件的MD5值查找多个文件夹里的重复文件,并删除重复的文件只保留文件名最长的文件。

编写运行.ps1文件

新建文本文档,输入如下内容:

# 指定文件夹路径
$folderPath = "D:\111"

# 获取文件夹中的所有文件,不包括子文件夹
$files = Get-ChildItem -Path $folderPath -File  -Recurse

# 创建一个哈希表来存储文件MD5值和文件路径
$md5Table = @{}

# 遍历文件,计算MD5值,并保存最长文件的路径
foreach ($file in $files) {
    $md5 = Get-FileHash -Path $file.FullName -Algorithm MD5 | Select-Object -ExpandProperty Hash
    $fileName = $file.Name

    # 如果MD5值已经在哈希表中,比较文件名长度,保留最长文件的路径
    if ($md5Table.ContainsKey($md5)) {
        $existingFileName = Get-Item $md5Table[$md5] | Select-Object -ExpandProperty Name
        if ($fileName.Length -gt $existingFileName.Length) {
            $md5Table[$md5] = $file.FullName
        }
    } else {
        # 如果MD5值不在哈希表中,添加该MD5值和文件路径
        $md5Table[$md5] = $file.FullName
    }
}
# 遍历文件夹,删除除最长文件名之外的文件
foreach ($file in $files) {
    $md5 = Get-FileHash -Path $file.FullName -Algorithm MD5 | Select-Object -ExpandProperty Hash
    $longestFile = $md5Table[$md5]

    # 如果当前文件不是最长文件,就删除它
    if ($file.FullName -ne $longestFile) {
        Remove-Item -Path $file.FullName -Force
        Write-Output "已删除文件: $($file.FullName)"
    }
}

路径根据情况修改。代码保存为“.ps1”为后缀的文件,如“111.ps1”。

打开powershell,在“111.ps1”的路径下输入“ .\111.ps1”,执行该文件。

效果

查找文件夹中所有文件,包括子文件夹中的文件,按照MD5值判断是否重复,如果有重复,删除重复文件,只保留文件名最长的文件。

如果需要保留的是文件名最短的文件,比如微信,接收文件的文件夹中,有一些重复文件,需要删掉重复文件保留文件名最短的文件,只需要将

        if ($fileName.Length -gt $existingFileName.Length) {
   
   

修改为 

        if ($fileName.Length -lt $existingFileName.Length) {
   
   

。这就可以删去重复文件,而且是根据MD5值删除,修改后的文件虽然文件名与原文件相似,但是不会出现误删。

报错

powershell运行指令,常出现的报错及处理参见:

Windows系统powershell运行指令常见报错及处理_weixin_56337147的博客-CSDN博客

扫描二维码关注公众号,回复: 17357859 查看本文章

 总结 

编写运行.ps1文件,查找并删除重复文件

猜你喜欢

转载自blog.csdn.net/weixin_56337147/article/details/133898025