Поиск дубликатов файлов
Всё уже сделано до нас - есть замечательная утилита fdupes, которая пересматривает каталоги в поисках добликатов файлов (в т.ч. и по содержанию)
Запускал с параметрами fdupes -q -r -S /home/archive , а подсчитать общий размер дубликатов можно простым скриптом:
#!/bin/bash
let sum=0
let dups=0
read l
while [ -n "$l" ]
do
curr_size=`echo $l | sed -e "s/ bytes each://g"`
if [ "$l" != "$curr_size" ]
then
read l
read l
while [ -n "$l" ]
do
let sum=$sum+$curr_size
let dups=$dups+1
read l
done
fi
read l
done
echo $dups files with $sum bypes
fdupes, debian, linux |