2013年1月6日星期日

delete or move/copy lots of files in Linux

http://houwenhui.gotoip2.com/archives/1700


(1)快速删除大量小文件
    今天遇见一个百万级的cache目录,删了20+分钟只删掉一个目录。。。。
    在网上找到了一种巧妙的快速删除方法,原理很简单,使用rsync同步一个空目录即可。对于万级文件的目录基本是秒删,回车就OK。
    步骤如下:
    1、建立一个空目录
        mkdir -p /tmp/rsync_blank
    2、确立需要清空的目标目录
        /data/ooxx
    3、使用rsync同步删除(注意目录后面的“/”),整体效率会快一个数量级的样子。
        rsync –delete-before -a -H -v –progress –stats /tmp/rsync_blank/ /data/ooxx/
    选项说明:
    –delete-before 接收者在传输之前进行删除操作
    –progress 在传输时显示传输过程
    -a 归档模式,表示以递归方式传输文件,并保持所有文件属性
    -H 保持硬连接的文件
    -v 详细输出模式
    -stats 给出某些文件的传输状态
    一般我们不需要显示进度,使用以下命令即可
        rsync –delete-before -a -H /tmp/rsync_blank/ /data/ooxx/
  这样我们要删除的 cache目录就会被清空了。
tips:
当SRC和DEST文件性质不一致时将会报错
当SRC和DEST性质都为文件【f】时,意思是清空文件内容而不是删除文件
当SRC和DEST性质都为目录【d】时,意思是删除该目录下的所有文件,使其变为空目录
最重要的是,它的处理速度相当快,处理几个G的文件也就是秒级的事
最核心的内容是:rsync实际上用的就是替换原理

  (2)快速复制大量小文件方法
  1,在需要对大量小文件进行移动或复制时,用cp、mv都会显得很没有效率,可以用tar先压缩再解压缩的方式。
  2,在网络环境中传输时,可以再结合nc命令,通过管道和tcp端口进行传输。
  nc和tar可以用来快速的在两台机器之间传输文件和目录,比ftp和scp要来得简单的多。
  由于nc是一个超轻量的命令,所以一般busybox都会集成它。当一个linux终端,比如linux pda,
  通过usblan的方式连接到另一台linux主机的时候,这样的嵌入式终端上一般不会集成ftp server, ssh server
  这样比较笨重的服务,这个时候, nc可能成为唯一的上传手段。
  比如将机器A上的mytest目录上传到到机器 B(192.168.0.11)上,只需要:
  在机器B上,用nc来监听一个端口,随便就好,只要不被占用;并且将收到的数据用tar展开。-l代表监听模式。
  #nc -l 4444 |tar -C /tmp/dir -zxf -
  然后,在A上通过nc和 tar发送test目录。使用一致的4444的端口。
  #tar -zcvf  -  test|nc 192.168.0.11 4444

没有评论:

发表评论