用于在指定目录及其子目录中查找并删除重复文件。脚本会根据文件内容（SHA-256 哈希值）比较文件，而不是根据文件名。脚本会告知用户找到的重复文件，并删除副本，只保留每个文件的一个实例。

Bash 脚本

 #!/bin/bash
 
 # 检查是否提供了目录作为参数
 if [ "$#" -ne 1 ]; then
     echo "用法：$0 目录"
     echo "示例：$0 /path/to/my_directory"
     exit 1
 fi
 
 directory=$1
 
 # 检查目录是否存在
 if [ ! -d "$directory" ]; then
     echo "指定的目录不存在。"
     exit 1
 fi
 
 # 创建临时文件以保存哈希值
 tempfile=$(mktemp)
 
 # 生成目录及其子目录中所有文件的 SHA-256 哈希值
 find "$directory" -type f -exec sha256sum {} + > "$tempfile"
 
 # 根据哈希值查找重复文件，忽略第一个唯一文件
 duplicates=$(awk '{print $1}' "$tempfile" | sort | uniq -d)
 
 if [ -z "$duplicates" ]; then
     echo "未找到重复文件。"
     rm "$tempfile"
     exit 0
 fi
 
 # 处理每个重复哈希值
 echo "$duplicates" | while read hash; do
     # 查找具有相同哈希值的文件
     files=$(grep "$hash" "$tempfile" | awk '{print $2}')
     first_file=$(echo "$files" | head -n 1)
     rest_files=$(echo "$files" | tail -n +2)
 
     if [ -n "$rest_files" ]; then
         echo "找到重复文件，保留：$first_file"
         echo "删除以下重复文件："
         for file in $rest_files; do
             echo "删除：$file"
             rm "$file"
         done
     fi
 done
 
 rm "$tempfile"
 echo "处理完成。重复文件已删除。"

使用说明

保存脚本到文件：将脚本内容保存到一个文件中，例如 remove_duplicates.sh。
给文件添加执行权限：
bash复制
chmod +x remove_duplicates.sh
运行脚本：提供目标目录作为参数运行脚本。例如：
bash复制
./remove_duplicates.sh /path/to/my_directory
该命令会查找 /path/to/my_directory 目录及其子目录中的重复文件，并删除副本，只保留每个文件的一个实例。

注意事项

备份数据：在运行此脚本之前，请务必备份重要数据，以防止意外丢失文件。
文件权限：确保脚本具有足够的权限来删除文件。如果脚本没有权限删除某些文件，可以使用 sudo 来运行脚本。
脚本逻辑：脚本会保留每个重复文件的第一个实例，并删除其余的副本。如果需要保留最后一个实例，可以修改脚本逻辑，将 head -n 1 和 tail -n +2 的顺序调换。
大文件处理：如果目录中包含大量文件，脚本可能会运行较慢。可以考虑在低负载时运行脚本，或者对脚本进行优化。

相关推荐

0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM): 文档编写目的在前面的文档中，介绍了在有CM和无CM两种情况下使用rpm方式安装CDH5.10.0，本文档将介绍如何在无CM的情况下使用rpm方式安装CDH6.2.0，与之前安装C5进行对比。环境介绍：...

ARM64 平台基于 openEuler + iSula 环境部署 Kubernetes: 为什么要在arm64平台上部署Kubernetes，而且还是鲲鹏920的架构。说来话长。。。此处省略5000字。介绍下系统信息；o架构：鲲鹏920(Kunpeng920)oOS：ope...

生产环境starrocks 3.1存算一体集群部署: 集群规划FE：节点主要负责元数据管理、客户端连接管理、查询计划和查询调度。>3节点。BE:节点负责数据存储和SQL执行。>3节点。CN:无存储功能能的BE。环境准备CPU检查JDK...

在CentOS上添加swap虚拟内存并设置优先级: 现如今很多云服务器都会自己配置好虚拟内存，当然也有很多没有配置虚拟内存的，虚拟内存可以让我们的低配服务器使用更多的内存，可以减少很多硬件成本，比如我们运行很多服务的时候，内存常常会满，当配置了虚拟内存...

国产深度(deepin)操作系统优化指南: 1.升级内核随着deepin版本的更新，会自动升级系统内核，但是我们依旧可以通过命令行手动升级内核，以获取更好的性能和更多的硬件支持。具体操作：-添加PPAs使用以下命令添加PPAs：```...

postgresql-15.4 多节点主从(读写分离): 1、下载软件[root@TX-CN-PostgreSQL01-252software]#wgethttps://ftp.postgresql.org/pub/source/v15.4/postg...

Docker 容器 Java 服务内存与 GC 优化实施方案: 一、设置Docker容器内存限制（生产环境建议）1.查看宿主机可用内存bashfree-h#示例输出（假设宿主机剩余16GB可用内存）#Mem:64G...

虚拟内存设置、解决linux内存不够问题: 虚拟内存设置（解决linux内存不够情况）背景介绍　　Memory指机器物理内存，读写速度低于CPU一个量级，但是高于磁盘不止一个量级。所以，程序和数据如果在内存的话，会有非常快的读写速度。但是，内存...

Elasticsearch性能调优(5):服务器配置选择: 在选择elasticsearch服务器时，要尽可能地选择与当前业务量相匹配的服务器。如果服务器配置太低，则意味着需要更多的节点来满足需求，一个集群的节点太多时会增加集群管理的成本。如果服务器配置太高，...

Es如何落地: 一、配置准备节点类型CPU内存硬盘网络机器数操作系统data节点16C64G2000G本地SSD所有es同一可用区3(ecs)Centos7master节点2C8G200G云SSD所有es同一可用区...

针对Linux内存管理知识学习总结: 现在的服务器大部分都是运行在Linux上面的，所以，作为一个程序员有必要简单地了解一下系统是如何运行的。对于内存部分需要知道：地址映射内存管理的方式缺页异常先来看一些基本的知识，在进程看来，内存分为内...

MySQL进阶之性能优化: 概述MySQL的性能优化，包括了服务器硬件优化、操作系统的优化、MySQL数据库配置优化、数据库表设计的优化、SQL语句优化等5个方面的优化。在进行优化之前，需要先掌握性能分析的思路和方法，找出问题，...

Linux Cgroups(Control Groups)原理: LinuxCgroups（ControlGroups）是内核提供的资源分配、限制和监控机制，通过层级化进程分组实现资源的精细化控制。以下从核心原理、操作示例和版本演进三方面详细分析：一、核心原理与...

linux 常用性能优化参数及理解: 1.优化内核相关参数配置文件/etc/sysctl.conf配置方法直接将参数添加进文件每条一行.sysctl-a可以查看默认配置sysctl-p执行并检测是否有错误例如设置错了参数:[roo...

如何在 Linux 中使用 Sysctl 命令?: sysctl是一个用于配置和查询Linux内核参数的命令行工具。它通过与/proc/sys虚拟文件系统交互，允许用户在运行时动态修改内核参数。这些参数控制着系统的各种行为，包括网络设置、文件...

通过实例学习Linux脚本11 查找并删除重复文件

Bash 脚本

使用说明

注意事项

相关推荐

取消回复欢迎你发表评论:

极空间如何无损移机，新Z4 Pro又有哪些升级?极空间Z4 Pro深度体验

手机如何设置与显示准确时间的详细指南

NAS:DS video/DS file/DS photo等群晖移动端APP远程访问的教程

如何修复用户配置文件服务在 WINDOWS 上登录失败的问题

一加手机与电脑互传文件的便捷方法FileDash

日本海上自卫队的军衔制度（日本海上自卫队的军衔制度是什么）

10个免费文件中转服务站，分享文件简单方便，你知道几个?

银河麒麟高级服务版本V10设置ntp服务器

【系统配置】信创终端挂载NAS共享全攻略:一步到位!

iPhone输错密码锁屏1小时怎么办?连接电脑2步立刻解决

通过实例学习Linux脚本11 查找并删除重复文件

Bash 脚本

使用说明

注意事项

相关推荐

取消回复欢迎 你 发表评论:

极空间如何无损移机，新Z4 Pro又有哪些升级?极空间Z4 Pro深度体验

手机如何设置与显示准确时间的详细指南

NAS:DS video/DS file/DS photo等群晖移动端APP远程访问的教程

如何修复用户配置文件服务在 WINDOWS 上登录失败的问题

一加手机与电脑互传文件的便捷方法FileDash

日本海上自卫队的军衔制度（日本海上自卫队的军衔制度是什么）

10个免费文件中转服务站，分享文件简单方便，你知道几个?

银河麒麟高级服务版本V10设置ntp服务器

【系统配置】信创终端挂载NAS共享全攻略:一步到位!

iPhone输错密码锁屏1小时怎么办?连接电脑2步立刻解决

取消回复欢迎你发表评论: