今天一学信息安全的同学让我编写一个软件,功能大致如下:输入网站首页,自动下载该网站所有网页并保存?拿到后感觉属于搜索引擎相关的,说实话我就感觉会用到递归,不过我不会写,百度也没找到资料,后来聪哥给我了份资料,就是简要介绍wget的,笔者摘录如下:
wget是linux命令。
实际上该问题就是整站下载,哈哈,碰巧 “使用” 这个词的五笔编译就是wget...wget这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接,这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接,wget加上参数之后,即可成为相当强大的下载工具。如:wget -r -p -np -k ,-r, --recursive(递归) specify recursive download.(指定递归下载)-k, --convert-links(转换链接) make links in downloaded HTML point to local files.(将下载的HTML页面中的链接转换为相对链接即本地链接)-p, --page-requisites(页面必需元素) get all images, etc. needed to display HTML page.(下载所有的图片等页面显示所需的内容)-np, --no-parent(不追溯至父级) don't ascend to the parent directory.另外断点续传用-nc参数 日志 用-o参数,熟练掌握wget命令,可以帮助你方便的使用linux。 参考来源: