我们的文件有时候不在本地,可能是在网络上,这时候我们该如何对其进行索引呢?当然你可以先通过爬虫把它抓取下来保存到本地硬盘,然后通过上篇博客介绍的方式对其进行索引,其实Solr内置了URLDataSource,支持直接获取远程资源进行索引的,下面就详细介绍该如何配置实现。废话不多说,我直接贴相应的配置文件:
solrconfig.xml配置文件基本没什么变化,依赖的jar请从上篇博客里获取,
关键点是dataSource必须是urlDataSource类型才能加载远程资源文件,url表示一个远程资源文件的访问URL。
最后你需要在schema.xml配置文件中定义一个text域,如图。就这样,配置文件就搞定了,重启你的tomcat开始测试:
OK,打完收工!惯例,solr配置文件我会打包上传到底下附件里供你们参考,依赖的相关jar包请参见上一篇博客,那里面有提供下载地址。
如果你还有什么问题请加我Q-Q:7-3-6-0-3-1-3-0-5,
或者加裙
一起交流学习!
相关推荐
NULL 博文链接:https://iamyida.iteye.com/blog/2214905
NULL 博文链接:https://iamyida.iteye.com/blog/2215358
NULL 博文链接:https://iamyida.iteye.com/blog/2215711
NULL 博文链接:https://iamyida.iteye.com/blog/2210621
NULL 博文链接:https://iamyida.iteye.com/blog/2214600
NULL 博文链接:https://iamyida.iteye.com/blog/2220474
NULL 博文链接:https://iamyida.iteye.com/blog/2222508
NULL 博文链接:https://mengxiangfeng101.iteye.com/blog/2299961
NULL 博文链接:https://iamyida.iteye.com/blog/2220833
NULL 博文链接:https://iamyida.iteye.com/blog/2221224
兰小伟(网名:益达)资深Java工程师,在Java技术上有很深的积累和造诣。国内较早接触Solr的技术专家之一,长期致力于Solr的技术研究、实践和生产环境部署,是Solr社区的积极参与者和实践者,以让Solr技术能够在中国...
实益达:首次公开发行股票招股说明书.PDF
益达防封V2.7
益达口香糖广告策划书.doc