Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/v5tech/solrj-example
solrj示例
https://github.com/v5tech/solrj-example
selenium solr solrj webmagic
Last synced: 3 months ago
JSON representation
solrj示例
- Host: GitHub
- URL: https://github.com/v5tech/solrj-example
- Owner: v5tech
- Created: 2015-10-09T09:48:22.000Z (over 9 years ago)
- Default Branch: master
- Last Pushed: 2016-02-03T09:35:53.000Z (about 9 years ago)
- Last Synced: 2024-11-02T02:33:22.286Z (3 months ago)
- Topics: selenium, solr, solrj, webmagic
- Language: Java
- Size: 5.24 MB
- Stars: 55
- Watchers: 10
- Forks: 44
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# solrj-example
solrj+webmagic+selenium示例
使用webmagic和selenium-java爬取京东商品信息并入库MySQL。采用solr dataimport创建索引,采用solrj检索商品信息。
# solr单机模式
https://coding.net/u/aimeizi/p/solr/git
基于solr4.10.4集成IKAnalyzer、mmseg4j、ansj中文分词及Dataimport功能
# solr集群模式
https://coding.net/u/aimeizi/p/SolrCloud/git
solr集群模式。基于solr4.10.4集成IKAnalyzer、mmseg4j、ansj中文分词及Dataimport等功能
# 运行
JDProductProcessor 是JD商品采集的入口,main方法直接运行。
CcdiPageProcessor 是纪检委网站采集的入口,main方法直接运行。
启动solr服务,运行爬虫采集程序,启动搜索服务,完成搜索。
# Screenshots
webmagic jmx监控
![](Screenshots/jconsole-1.png)webmagic jmx监控查看总抓取页数
![](Screenshots/jconsole-2.png)webmagic爬取JD商品数据入库数据
![](Screenshots/jddata.png)solrdataimport数据导入
![](Screenshots/solrdataimport.png)solr搜索 查询`所有商品`按`评论降序`排列,以`表格`的方式展现
![](Screenshots/search-1.png)solr搜索 查询`名称`为`手机`的商品按`价格降序`排列,以`表格`的方式展现
![](Screenshots/search-2.png)solr搜索 查询`名称`为`手机`且过滤`产品类别为手机`的商品信息按`价格降序`,以`列表`的方式展现
![](Screenshots/search-3.png)solr搜索 查询名称为`洗衣机`且过滤`产品类别为洗衣机`的商品信息按`价格降序`,以`表格`的方式展现
![](Screenshots/search-4.png)solr搜索 查询名称为`iPhone`的商品信息按`价格降序`,以`表格`的方式展现
![](Screenshots/search-5.png)# 参考文档
http://webmagic.io/docs/zh/