热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Heritrix1.14.4Web后台使用简介

启动Heritrix后,访问http:localhost:6789就可以打开Heritrix的登录界面,登录后即进入了HeritrixWeb后台的主页:?console:Herit

? ? ? ??启动Heritrix后,访问http://localhost:6789就可以打开Heritrix的登录界面,登录后即进入了Heritrix Web后台的主页:
bubuko.com,布布扣
?console: Heritrix的控制台,会显示Heritrix的抓取任务和分配给HeritrixHeap使用情况

???JobsHeritrix的抓取任务界面,比如创建抓取任务,已挂起的任务,已完成的任务统计

? ?Profiles:Heritrix抓取任务相关的配置

? ?Logs:Heritrix的运行日志

? ?Reports:Heritrix的统计报表

? ?Setup:Heritrix实例管理界面以及Heritrix后台登录帐号密码修改

? ?Help:Heritrix的使用帮助文档

?

?首先我们需要切到Jobs界面,创建一个Job,如图:
bubuko.com,布布扣
?

??根据一个已经存在的job创建抓取任务

2.? ?根据一个抓取任务备份来创建抓取任务

3.? ?根据配置创建抓取任务

4.? ?按照默认方式创建抓取任务

asd ??

? ? 一般我们选择第3种创建方式:
bubuko.com,布布扣
?
bubuko.com,布布扣
?
bubuko.com,布布扣
?
bubuko.com,布布扣
?
关于Settings里相关配置项的含义解释说明请看下面这张图:
bubuko.com,布布扣
?
修改好后提交创建job,然后就能切到Console界面点击Start来启动抓取任务进行页面抓取
bubuko.com,布布扣
?
bubuko.com,布布扣
?
抓取到的网页默认保存在heritrix_hone\jobs目录下,我们创建的每个job都会在jobs目录下生成一个文件夹,命名方式为job名称+当前时间戳的方式,如图:
bubuko.com,布布扣
?
虽然Heritrixweb后台是全英文的,但我觉得没什么使用难度,你们多点点它的功能,从宏观上多感受下Heritrix的强大之处。最后是多阅读下Help界面里列出的一些帮助文档,这是你学习Heritrix最宝贵的资料:
bubuko.com,布布扣
?

? 益达的GitHub地址请猛戳我,用力,吃点劲儿!!!

益达的新浪微博:看这里,看这里

益达的技术交流社区:码农们,I want you!!!

?

? ?益达Q-Q: ? ? ? ? ? ? ? ?7-3-6-0-3-1-3-0-5

?

?

? ?益达的Q-Q群: ? ? ?1-0-5-0-9-8-8-0-6

?

?

?

?

?

?

?

?

?

?

?

?

?

?


推荐阅读
  • 猫猫分享,必须精品原文地址:http:blog.csdn.netu013357243articledetails44571163素材地址:http:download.csdn.n ... [详细]
  • Vue项目结构分析-项目结构重点在src文件夹:assets——静态资源,如css,jscomponents——公共组件router——路由文件(vuecli3.x没有自 ... [详细]
  • FroggerTimeLimit:1000MSMemoryLimit:65536KTotalSubmissions:32257Accepted:10396DescriptionFr ... [详细]
  • 22.Container With Most Water(能装最多水的容器)
    thecontainercontainsthemos ... [详细]
  • python基础(二、pycharm安装、卸载)
    3.在Ubuntu中安装PyCharmPyCharm的官方网站地址是:https:www.jetbrains.compycharm注意:安装时不要使用root用户安装,否则后期使用 ... [详细]
  • 这一篇主要总结一下jQuery这个js在引入的时候做的一些初始化工作第一句window.undefinedwindow.undefined;是为了兼容低版本的IE而写的因为在低版本 ... [详细]
  • spotify engineering culture part 1
    原文,因为原视频说的太快太长,又没有字幕,于是借助youtube,把原文听&打出来了。中文版日后有时间再翻译。oneofthebigsucceessfactorshereatSpo ... [详细]
  • MyBatis模糊查询和多条件查询一、ISmbmsUserDao层根据姓名模糊查询publicListgetUser();多条件查询publicList ... [详细]
  • vscode里的html标签导航的一系列问题
    哈喽,我今天带来的经验是,vscode在18年10月更新后的1.29以后,编辑html文档时,会发现最上面有个类似于HTML标签导航的玩意儿,可能部分同学和我一样不习惯用它们,现在 ... [详细]
  • Illustrator绘制逼真的愤怒的小鸟实例教程
    Illustrator教程: ... [详细]
  • 抓取百万知乎用户设计之实体设计
    一.实体的关系实体是根据返回的Json数据来设计的教育经历方面用户可以有很多教育经理,USER和education是一对多的关系,一个education对应一个education一 ... [详细]
  • 软件自动化测试的学习路线
    软件自动化测试的学习步骤软件测试交流群关注软件测试技术公众号获取阅读目录软件自动化测试的学习步骤自动化测试的本质自动化测试学习的误区自动化测试的职位自动化测试分类Web自动化 ... [详细]
  • iOS之富文本
    之前做项目时遇到一个问题:使用UITextView显示一段电影的简介,由于字数比较多,所以字体设置的很小,行间距和段间距也很小,一大段文字挤在一起看起来很别扭,想要把行间距调大,结 ... [详细]
  • Xib九宫格应用管理使用xib封装一个自定义view的步骤1新建一个继承UIView的自定义view,假设类名叫做(AppView)2新建一个AppView.xib文件来描述 ... [详细]
  • 【自制小工具】代码生成器
    【自制小工具】代码生成器陆陆续续接触过好几款代码生成工具,发现确实好用,但都会有那么点不完善的地方,所以索性就自己做一个吧。界面非常简单,反正是自己用的,简单点用起来也方便上图:左 ... [详细]
author-avatar
Ki丶ng-james-LBJ威_112
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有