解决nutch-1.0的Web前端搜索无结果
这个问题困扰我很久,无论怎么配置,搜索关键字,一直提示以下令人郁闷的信息:
第0-0项 (共有 0 项查询结果):
今天终于解决了。
nutch-1.1命令行中搜索有结果,但是到web前端搜索,始终无结果,很是郁闷,今天终于解决了。
(1)直接把nutch-1.1.war放到Tomcat目录下的webapps,启动tomacat;修改nutch-site.xml后必须重启tomcat。(每次修改Nutch-site.xml后请重启tomcat,再搜索)
nutch-site.xml必须配置以下参数:
<property>
<name>http.agent.name</name>
必须配置,否则搜索不到结果 <value>nutch-1.0< alue>
<description>HTTP 'User-Agent' </description>
</property>
<property>
<name>searcher.dir</name>
<value>D:\data< alue> data是爬虫生成的目录。参数值请使用绝对路径
<description>Path to root of crawl.</description>
</property>
data目录是爬虫生成的目录,下面有这些目录:
crawldb,
index,
indexes,
linkdb,
segments
(2)请保证tomcat的安装目录不要出现空格,否则搜索结果永远是0
我出现问题的地方就是这里,
我的tomcat安装路径是
D:\Program Files\Apache Software Foundation\Tomcat 6.0\webapps\nutch-1.0,
这里的空格有影响,导致无结果,很痛苦,请千万注意。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/zklth/archive/2010/05/18/5605961.aspx
分享到:
相关推荐
eclipse配置nutch,eclipse配置nutch
一步一步详细解释了如何搭建nutch web开发环境,对nutch1.2有效,nutch1.3以上已经没有web这部分内容了
Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。
Nutch的配置文件主要有三类: 1.Hadoop的配置文件,Hadoop-default.xml和Hadoop-site.xml。 2.Nutch的配置文件,Nutch-default.xml和Nutch-site.xml。 3.Nutch的插件的配置文件,这些插件的配置文件在加载插件的时候...
Nutch是一个优秀的开放源代码的Web搜索引擎。虽然Nutch的页面排序方法比较合理,但是很多情况下仍然不能 满足需要。分析开源搜索引擎Nutch代码,研究了Nutch的页面排序方法。在Nutch原有的结构基础上提出了3种修改...
nutch 1.4 在windows下安装配置
windows下nutch的安装配置以及与tomcat的集成.doc
Linux 下 Nutch 单机配置
北京邮电大学研究生课程实验指导书。 在windows上配置测试Nutch 用于学习nutch配置的各种问题 分为本地抓取,局域网抓取和互联网抓取三部分
Nutch1.6的编译配置过程,详细介绍了Nutch1.6的下载到安装运行过程。
nutch配置nutch-default.xml
Nutch各个配置项的详细说明,非常详细的说明了每一项
图解搜索引擎nutch配置,自己制作的教程。因为在网上搜索到的教程很多都是粗略,对于初学nutch搜索引擎很难配置好,所以自己亲自打造了一篇图解教程!希望你能够配置成功!
Linux下Nutch分布式配置 使用:分布式爬虫、索引、Nutch搜索本地数据、Nutch搜索HDFS数据。
nutch配置文件的备注 解决代理问题
nutch1.4 在windows下的安装配置环境搭建
这里是在网上搜到的Nutch配置的博客,比较详细,担心自己以后配置的时候忘了,所以传到csdn,顺便分享给大家。
这是本人在完全分布式环境下在Cent-OS中配置Nutch-1.1时的总结文档,但该文档适合所有Linux系统和目前各版本的nutch。 目 录 介绍 ............................................................... 2 0 集群...
我自己对nutch安装开发环境的一些理解,以及遇到问题的解决方法
基于Apache Nutch 1.8和Htmlunit组件,实现对于AJAX加载类型页面的完整页面内容抓取解析。 According to the implementation of Apache Nutch 1.8, we can't get dynamic ...