Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/v5tech/solrj-example

solrj示例
https://github.com/v5tech/solrj-example

selenium solr solrj webmagic

Last synced: 3 months ago
JSON representation

solrj示例

Awesome Lists containing this project

README

        

# solrj-example

solrj+webmagic+selenium示例

使用webmagic和selenium-java爬取京东商品信息并入库MySQL。采用solr dataimport创建索引,采用solrj检索商品信息。

# solr单机模式

https://coding.net/u/aimeizi/p/solr/git

基于solr4.10.4集成IKAnalyzer、mmseg4j、ansj中文分词及Dataimport功能

# solr集群模式

https://coding.net/u/aimeizi/p/SolrCloud/git

solr集群模式。基于solr4.10.4集成IKAnalyzer、mmseg4j、ansj中文分词及Dataimport等功能

# 运行

JDProductProcessor 是JD商品采集的入口,main方法直接运行。

CcdiPageProcessor 是纪检委网站采集的入口,main方法直接运行。

启动solr服务,运行爬虫采集程序,启动搜索服务,完成搜索。

# Screenshots

webmagic jmx监控
![](Screenshots/jconsole-1.png)

webmagic jmx监控查看总抓取页数
![](Screenshots/jconsole-2.png)

webmagic爬取JD商品数据入库数据
![](Screenshots/jddata.png)

solrdataimport数据导入
![](Screenshots/solrdataimport.png)

solr搜索 查询`所有商品`按`评论降序`排列,以`表格`的方式展现
![](Screenshots/search-1.png)

solr搜索 查询`名称`为`手机`的商品按`价格降序`排列,以`表格`的方式展现
![](Screenshots/search-2.png)

solr搜索 查询`名称`为`手机`且过滤`产品类别为手机`的商品信息按`价格降序`,以`列表`的方式展现
![](Screenshots/search-3.png)

solr搜索 查询名称为`洗衣机`且过滤`产品类别为洗衣机`的商品信息按`价格降序`,以`表格`的方式展现
![](Screenshots/search-4.png)

solr搜索 查询名称为`iPhone`的商品信息按`价格降序`,以`表格`的方式展现
![](Screenshots/search-5.png)

# 参考文档

http://webmagic.io/docs/zh/