Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/toobigdata/papa
一个浏览器端数据爬虫,做每个人的数据助手
https://github.com/toobigdata/papa
chrome data-analysis kickstarter spider
Last synced: 3 months ago
JSON representation
一个浏览器端数据爬虫,做每个人的数据助手
- Host: GitHub
- URL: https://github.com/toobigdata/papa
- Owner: toobigdata
- License: mit
- Created: 2017-09-26T12:39:44.000Z (over 7 years ago)
- Default Branch: master
- Last Pushed: 2021-02-09T05:49:46.000Z (almost 4 years ago)
- Last Synced: 2024-08-02T19:33:01.512Z (6 months ago)
- Topics: chrome, data-analysis, kickstarter, spider
- Language: JavaScript
- Homepage: https://toobigdata.com/
- Size: 993 KB
- Stars: 154
- Watchers: 5
- Forks: 56
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# TooBigData
爬爬是你的个人数据助手,帮你在浏览器中爬到一些需要的数据。
它是一款采集数据的 Chrome 插件,可在 QQ 浏览器、360 浏览器、搜狗浏览器等 Chromium 内核的浏览器中使用。
## 支持数据源
- 微信文章
- 淘宝众筹
- 今日头条文章
- 豆瓣电影
- 大众点评
- 链家租房
- 我爱我家租房
- 京东商品
- 京东商品评论
- 淘宝商品
- 天猫商品
- 天猫商品评论
- 亚马逊商品
- 亚马逊商品评论
- Kickstarter 评论
- Kickstarter 用户
- 微博用户信息
- 微博用户关注
- 抖音小视频
- 火山小视频## 安装
- [通过 Chrome 商店安装](https://chrome.google.com/webstore/detail/toobigdata/iadbllfinbilapjhgjibpeifljdgeopn)
- 通过加载 app 目录安装## 演示
数据网站
http://app.toobigdata.com/
使用视频
https://www.youtube.com/watch?v=NCUJCnFZrAw
https://www.youtube.com/watch?v=7LY7CDP4k34
## 特色功能
- 可以在网页上显示微信文章的阅读点赞评论打赏数据
- 微信文章分钟监测及文章回采
- 查看收藏夹数据,分层级显示
- 内置通用的URL打开器,可辅助自动爬数
- 自动关闭已爬页面
- 插件开源,无限扩展## 动手改造
要添加更多的数据源,可通过以下方式完成
1. 修改 app/scripts/config.js,添加数据源定义
2. 在 app/scripts/track/ 目录下,添加对应的采集脚本如果想自定义接收数据的网关,可修改 `app/scripts/background.js` 中的 `data_upload_url` 变量