首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 开源 FAQ 第二书店 博文视点 程序员
频道: 研发 数据库 中间件 信息化 视频 .NET Java 游戏 移动 服务: 人才 外包 培训

       
热门搜索: ASP.NET Ajax Spring Hibernate Java
开发自己的搜索引擎——Lucene 2.0+Heritrix(含光盘)   
人民邮电出版社 / 2007-6-1 / 邱哲,符滔滔 编著 / 65 元
ISBN:9787115160003
何处购买:   去DearBook购买(¥48.75)
Book Rank:  75 

正在获取信息...........

该书常用的标签(推荐/用户提交):  提交tag
构建(193)  搜索引擎(15)  综合实例(12)  lucene(3)  s(1)  J(1)  配置成功了(1)  爬虫(1)  
用户书架推荐:
收藏到我的书架
《开发自己的搜索引擎——Lucene 2.0+Heritrix(含光盘)》图书论坛:
我要发表话题
配置成功了 - coreoak   财富等级:   
虽然配置成功了, 但是觉得, 书中这段文字写的确实不怎么样,太不清晰了!
2007年05月10日 2点48分   |  2回应 |   2 /4人觉得此评论有用
此评论对你有用  没用
 
开发自己的搜索引擎——Lucene 2.0+Heritrix(含光盘) - lenolong   财富等级:   
正在查阅挺好的
2008年12月05日 11点23分   |  1回应 |   1 /1人觉得此评论有用
此评论对你有用  没用
 
【首届读书月】缺乏对读者应有爱心 - Natureboy520   财富等级:   
开发自己的搜索引擎——Lucene 2.0+Heritrix,听起来很不错,但是看了真不知道大家是什么样的感觉。只想说,不要小看了大众读者。大家的眼睛是雪亮的。虽然,两位读者花了不少的心思,去编写此书,但是给我的映像还是平平啊。

本书主要的缺点:
1.错误不少。比如,书皮上的Heritrix就写错了;
2.提供的源码(CD)和书中的代码不一致。其实异地个实例中就用这种现象。不信,大家自己去找;
3.大量时间和篇幅来将Lucene的源码,有一点为了凑数量的嫌疑;
4.拘泥于写作,还有编程环境和开源架构;
5.代码质量差。比如,静态方法的调用方法都是错误的,好在IDE还容忍了这种低级错误;
6.代码排版不好,代码行很长;
7.语言描述不怎么流畅等;

与其说是构建搜索引擎,不如是对基础知识的介绍罢了。不过,对于初学者来说还是由一定的帮助。国内没有更好的书籍,Lucene in action中的许多API都已经失效。所以没办法了,也只好推介大家了。忍着点就好了。有总比没有好,比如自己的五官。大家自己评说去。
2007年09月11日 9点42分   |  1回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
有什么 好的搜索啊 - cut0408   财富等级:   
我想要个 分词的搜索引擎有没有啊,很急哦。。有的话请联系我啦。或者给我留言
2007年05月22日 11点45分   |  1回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
thx - sixgun   财富等级:   
so goooooood
谢谢分享,找了很久了,终于找到了
2009年06月18日 10点55分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
开发自己的搜索引擎——Lucene 2.0+Heriterx(含1CD) - scnujie   财富等级:   
test
2008年12月11日 3点57分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
说明:因为mirror.rar文件引用了第三方网站的大量信息,这需要得到网站的授权,授权的办理需要一段时间,而本书的出版不能再被延误,故本次印刷的图书,mirror.rar文件不能放在光盘中,请读者谅解。请读者在理解书中讲述的原理与方法后灵活处理。
2008年03月27日 11点28分   |  0回应 |   2 /2人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
开了样章,感觉还不错,讲的比较清楚了。

我也是比较关注爬虫技术,还有Lucene分布式相关的内容。
2008年03月27日 11点28分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
真是难得啊,开发自己的搜索引擎居然是一本国人写的书,

这些年来我看的电脑书籍,比较深入一点的都得看外国人所写,再由国人翻译的书!

因为本人英语水平不行!
2008年03月27日 11点28分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
lucene和 heritrix(题目都写错了)是网上的两个开源项目,在sourceforge上能够免费下载到,而且里面有完备的文档。我们正在搞这个方面的东西,如果说这两个东西很复杂,我并不否认,但对于这两个软件有没有必要写成一本书500多页,还要卖钱我深表怀疑。
2008年03月27日 11点27分   |  0回应 |   4 /4人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
一直以来,想找本搜索引擎方面的书籍看看,苦于书籍太少。看了这本书后,我发觉我找到我想要的了。
2008年03月27日 11点27分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
看看 - abcd168   财富等级:   
现在网上关于 搜索引擎的资料比较少,.net版本更是没有。我是从Lucene的Java版获取思路,完善Lucene.net的功能。偶尔可以看看,如果你想学习搜索引擎。
2008年03月27日 11点26分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
是一本入门的好书,不过要想学高升一点的.建议不要买这本!感觉有点像照着API在写书,只不过比API多了几句中文的说明.
2008年03月27日 11点26分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
不过内部大部分是关于Lucene2.0基础接口使用的介绍,是入门的好书,如果能多讲一些Lucene2.0的高级主题就好啦,比如如何创建高性能,分布式搜索引擎。
2008年03月27日 11点26分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
看完一遍,感觉还不错,Lucene2.0讲的比较细致,是学习Lucene2.0的一本好书!
2008年03月27日 11点25分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
“配有一个完整的搜索引擎案例。这个案例有很强的实用价值,只需稍加修改,就能应用于实际项目,市场价值在30000元以上!”。
2008年03月27日 11点25分   |  0回应 |   0 /2人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
这书相对于入门者就有点无所适从,因为涉及到其它方面的东西,所以建议初学者先看看关于Apache等环境软件的搭建!!
2008年03月27日 11点24分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
呵呵 - abcd168   财富等级:   
对于想自己开发垂直搜索引擎的朋友的话,那么这本书会是一本不错的入门书,而且找不到第二本替代的书。至少我没发现 呵呵 !
2008年03月27日 11点24分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
该书我觉得对搜索引擎入门来说还可以,我已经看了索引和检索那部分了,感觉真的不错! 或许是因为书的作者跟我们一样都很年轻吧,我也看了作者为书做的BLOG
2008年03月27日 11点24分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
从头看到尾,所获颇丰,已经可以把Lucene用到实际工作中了。
2008年03月27日 11点23分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
弄两个开源项目一凑,就能搞出搜索引擎来,呵呵,看看就好了,别太认真了。不过还是感谢作者分享精神。
2008年03月27日 11点23分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
第二章那个入门好像太难了点,不太像是真正的入门。不过最后的例子还不错,挺详细的。就是用Lucene开发的东西少了点,仅仅用了QueryParser来parse成一个Query。这个地方值得改进。
2008年03月27日 11点23分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
第一爬取耗费大量网络带宽
第二 重复资源 浪费空间
2008年03月27日 11点22分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
总之 以后再发现自己研究领域相关的事情 大概不会这么热心的告诉读者具体的细节了 也不原意细谈了。另外,看懂source forge不只需要数学和语文。还需要软件工程相关领域的很多知识。搜索引擎建立多了
2008年03月27日 11点22分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
最近一段时间没有上网 在作研究方向的一些东西
看见了一些评论 觉得挺没意思的
2008年03月27日 11点21分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
我想买 (因我对“搜索引擎“很感兴趣)
但我在雅安
邮寄费也贵 哎!!
还有一个问题就是:学C语言的能看懂这本书吗
求助!求助!求助!求助!求助!求助!求助!求助!
2008年03月27日 11点21分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
“市场价值在30000元以上!...”
值30000的东西你随书送了,你傻的啊?
30000的东西都送了,还在乎这点书钱?干嘛不把书都一起送了?
2008年03月27日 11点20分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
光盘找不到了咋整?出版者给的那个网站上的链接都下不来了。
2008年03月27日 11点20分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
我最喜爱的技术图书评选会员评论:〈br〉把搜索相关各种技术整合了起来,不错
2008年03月27日 11点20分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
大致看完了,作者还是比较尽心的去研究lucene2.0,只是内容比较偏向“如果用lucene2.0去搭建你自己的搜索应用”,所以对我这种想深入了解细节的人,尤其是想了解lucene分布式任务、文件系统描述的人....感觉有些不过瘾:)
2008年03月27日 11点19分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
这本书不错 不过建议 对java 有点了解 和 对搜索引擎都点点 了解 的人读比较好
2008年03月27日 11点19分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
感觉有点低不成高不就,书中一些代码都是抄网上资料,以及compass那部分完全是翻译了官方文档的前2-3节,我劝大家如果想理解lucene的话,就买哪本lucene ,比这本便宜,并且知识面很全。
2008年03月27日 11点19分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
支持 - abcd168   财富等级:   
今天在图书城翻了翻,还特意和lucene in action做了对比,发现这本书不如lucene in action。
2008年03月27日 11点18分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
不错 - abcd168   财富等级:   
《开发自己的搜索引擎:Lucene 2.0+Heritrix》
本书详细介绍了如何应用Lucene进行搜索引擎开发,通过学习本书,读者可以完成构建一个企业级的搜索引擎网站。.全书共分为14章,内容包括搜索引擎与信息检索基础,Lucene入门实例,Lucene索引的建立,使用Lucene构建搜索,Lucene的排序,Lucene的分析器,对Word、Excel和PDF格式文档的解析,Compass搜索引擎框架,Lucene分布式和Google Search API,爬虫Heritrix,综合实例之准备篇,综合实例之HTMLParser篇,综合实例之DWR篇,综合实例之Web编。..
2008年03月25日 4点8分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
无题 - abcd168   财富等级:   
开发自己的搜索引擎——Lucene 2.0+Heriterx这本书是真的还是盗版的啊!希望大家有知道的告诉我啊!
2008年03月25日 4点5分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
无题 - xxxcyy   财富等级:   
Lucene 2.0+Heritrix这种方式有应用成功的例子吗?
2007年09月12日 9点20分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
不是关键所在 - slex   财富等级:   
.net上做过一个爬虫。
其实这并不是技术难点,关键在于如何过滤和识别字词上。
2007年05月18日 12点40分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
文档格式的解析,新颖啊 - slex   财富等级:   
对Word、Excel和PDF格式文档的解析
这个可是相当新颖啊,一年前手动编写了构造Excel的程序,苦啊
2007年05月18日 12点37分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
评价 - 218.10.233.*      
这本书不应该这么厚,
书里面写了太多没用的东西。
许多内容都写得非常浅,而且不能用。
最后一个例子根本没有办法修改。
用不了。
但是,前面写的关于lucene的东西还有点价值。
不如看
2007年05月15日 12点33分   |  0回应 |   12 /12人觉得此评论有用
此评论对你有用  没用
 
OK - CONLONG   财富等级:   
我想用java写一个爬虫的搜索引擎,不过看看书中写的还可以啊 !!挺好的!!!!!
2007年05月14日 8点23分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
好象难了 - dz08039   财富等级:   
好象难了点,关注一下.不会很难的吧,找本来看看.
2007年05月13日 2点5分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
书还是不错的 - masterwang2002   财富等级:   
看了点点。觉得不错。不过不打算买。因为还学不到这么深。
2007年05月11日 7点1分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
爬虫那张写的是什么押? - coreoak   财富等级:   
爬虫这一章我觉得写的不算是很好, 我按照上面的步骤做了, 怎么也出不来, 关于eclipse中的配置我觉得根本就什么也没有讲。或者是讲的很差劲!
2007年05月10日 1点37分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
这句是什么意思? - coreoak   财富等级:   
这句是什么意思?只需在src目录下,把图10-7中的内容配全,就可以将工程的结构完整了。如图10-9所示。
2007年05月10日 11点38分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
好书 - weilianlei2008   财富等级:   
作JAVA这么久,很想作割个搜索引擎,这本书应该对我帮助很大,谢谢啊
2007年04月24日 8点31分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
爬虫Heritrix - weihuandeng   财富等级:   
我觉得里面的爬虫Heritrix还行我现在一直在研究这个爬虫不过我以前一直都是通过官方网站的英文文档来学习,这本书的出现无疑给了我一个很大的帮助
2007年04月11日 10点47分   |  0回应 |   0 /1人觉得此评论有用
此评论对你有用  没用
 
挺实用的书 - 58.100.83.*      
即使不做搜索引擎,那些解析PDF、word、excel的工具也很有用,希望快点出版好像买来看看
2007年04月08日 9点0分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
- 124.42.60.*      
不是吧,这都出书了。。真有高手啊。。
2007年04月07日 12点26分   |  0回应 |   0 /0人觉得此评论有用
此评论对你有用  没用
 
标题:
Tag: (多个tag请用","分隔,最多支持5个)
评论内容:  
请先登录后再发表评论,点这里登陆
请填入验证码:   
中国的首都在哪里? 输入问题答案(提示:北京):
(注:评论内容必须大于20个字方可赠送C币,否则只发送评论)