写这个采集器的初衷本是为自己站添加内容之用,后来经群里面几个好友一再要求,做成了个通用型了,功能虽不说很强大,现在应该还是能凑合着用吧,不怕笑话,今天将它发布。如果效果还好,我将继续开发下去。
安装环境:
本采集器采用Visual C#编写,可以在Windows2003下运行,若在Windows2000,Xp下运行请先到微软官方下载一个.net framework1.1或更高环境组件:
附:.net framework 1.1下载地址:http://www.microsoft.com/downloads/details.aspx?FamilyID=262D25E3-F589-4842-8157-034D1E7CF3A3&displaylang=zh-cn
.net framework 2.0下载地址:http://www.microsoft.com/downloads/details.aspx?familyid=7ABD8C8F-287E-4C7E-9A4A-A4ECFF40FC8E&displaylang=zh-cn
功能简介:
1、多系统支持,现已加入对PHPWIND,DISCUZ,DEDECMS2.X和PHPArticle2.01的采集支持,若您的系统现在软件里没加入,请与我们联系,将在下期版本中加入网友要求最多的几套系统。
2、模拟用户登录,和操作浏览器一样,但程序只处理核心数据,运行速度更快。
3、可以设定是否将远程图片及Flash下载到本地(Flash文件一般较大,建议不下载,程序会将其自动获取到其绝对地址)。
4、多线程,时间间隔设定 可以根据您的机器性能和网速或系统允许的文章发表时间设定
5、较强大的网址采集功能,配合页面内定义区域采集、手动生成网址及采集二级页面功能基本上可采集到您所要的任何网址集合。
6、内容规则定义有多条内容过滤规则,彻底过滤掉内容里的广告等无用内容。
7、网址集合、内容规则导入、导出功能,方便网友共享采集到的内容。
8、论坛支持Html和UBB发帖两种模式。
9、、大家想好再告诉我吧。
内容入库功能尚未加入,以后再完善吧。。。
Enjoy it!
|
|