计算机科学与探索 ›› 2011, Vol. 5 ›› Issue (1): 38-49.DOI: 10.3778/j.issn.1673-9418.2011.01.004
徐 旦 1+, 生拥宏2, 鞠大鹏2 , 吴建平1, 汪东升2,3
XU Dan1+, SHENG Yonghong2, JU Dapeng2, WU Jianping1, WANG Dongsheng2,3
摘要: 远程文件快速同步在文件备份与恢复、Web 与ftp 网站镜像、内容分发网络、Web 访问中具有广泛的应用。提出了一种高效的基于内容变长分块和定长滑动块相结合的两轮快速文件同步算法——tpsync。同步算法分两轮进行, 第一轮利用基于内容可变分块技术在粗粒度上定位待同步文件的局部变化数据段,第二轮对局部变化数据段采用定长滑动切块技术在细粒度上查找出差异数据, 最终通过两轮数据交互实现文件的同步。将tpsync 与传统的单轮同步算法rsync 进行了对比实验, 通过对文本、二进制和数据库三种文件类型相似版本之间的同步实验, 结果表明tpsync 在平均同步时间和网络传输数据量两个方面均优于rsync。
中图分类号: