在Eclipse中配置Heritrix 1.14.1(测试成功,方法简单)

配置之后的工作空间目录结构如下:

在Eclipse中配置Heritrix 1.14.1(测试成功,方法简单)

1、下载heritrix-1.14.4-src.zipheritrix-1.14.4.zip 这两个文件,并解压
2、以heritrix-1.14.4-src/heritrix-1.14.4/src/java为目录建工程

3、将G:/×××/Hertrix/heritrix-1.14.4/heritrix-1.14.4下的heritrix-1.14.4.jar文件解压缩,然后复制到java文件夹中,复制过程中选择覆盖

4、将G:/×××/Hertrix/heritrix-1.14.4/heritrix-1.14.4下的lib文件夹都复制到Java文件夹中,便于以后导入全部jar包

5、将G:/×××/Hertrix/heritrix-1.14.4/heritrix-1.14.4下的webapps文件夹复制到java文件夹中,便得到如图所示的。

6、新建一个java project ,从已有的文件中导入,如下:

在Eclipse中配置Heritrix 1.14.1(测试成功,方法简单)

7、然后保存。将java文件夹重命名为Heritrix,复制到已有的workspace中。

8、修改项目根目录下的heritrix.properties文件,主要是修改红色部分,如下:

在Eclipse中配置Heritrix 1.14.1(测试成功,方法简单)

9、项目/src/org.archive.crawler包下Heritrix.java上点击右键选运行方式->运行。

10、运行结果为:

在Eclipse中配置Heritrix 1.14.1(测试成功,方法简单)

11、设置成功!!!