An open API service indexing awesome lists of open source software.

https://github.com/breezedeus/loveshare

breezedeus的各种分享
https://github.com/breezedeus/loveshare

cnocr cnstd cv deep-learning llm nlp ocr pix2text

Last synced: 3 months ago
JSON representation

breezedeus的各种分享

Awesome Lists containing this project

README

        

# Year 2022

* **[视觉-语言预训练(VLP)技术介绍](https://www.bilibili.com/video/BV1dr4y1E7ZR)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1dr4y1E7ZR)](https://www.bilibili.com/video/BV1dr4y1E7ZR)
* 分享对应的 [PPT](2022/Intro-to-VLP.pdf);

* 对当前的视觉-语言预训练(Vision-Language Pretraining, VLP) 技术做了概要介绍,也可以看成是对当前多模态学习(Multi-Modal Learning)技术的概要介绍。

* **[信息抽取统一框架介绍和实例—— UIE (Universal Information Extraction)](https://www.bilibili.com/video/BV1LW4y1U7ch)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1LW4y1U7ch)](https://www.bilibili.com/video/BV1LW4y1U7ch)
* 分享对应的 [文档](2022/UIE_Universal_Information_Extraction.pdf);
* 介绍了百度 ACL 2022 的论文《Unified Structure Generation for Universal Information Extraction》,并基于百度开源的代码跑了训练示例。

* **[BERT 还有哪些神奇的能力呢!? - 知乎](https://zhuanlan.zhihu.com/p/532010499)**

### 开源工具的使用介绍

* **[Pix2Text: 替代 Mathpix 的免费 Python 开源工具](https://www.bilibili.com/video/BV12e4y1871U)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV12e4y1871U)](https://www.bilibili.com/video/BV12e4y1871U)
* **[Pix2Text (P2T)](https://github.com/breezedeus/pix2text)** ,目标是 **Mathpix** 的Python开源替代品,现在可以识别截图中的数学公式并转换为Latex表示,也可以识别图片中的中英文文字;
* 知乎文章(文字版):[Pix2Text: 替代 Mathpix 的免费 Python 开源工具](https://zhuanlan.zhihu.com/p/566498651)
* 在线Demo: https://huggingface.co/spaces/breezedeus/pix2text ;
* **Gitee** Fork: https://gitee.com/breezedeus/pix2text 。

* **[更更好用的开源Python OCR工具包——CnOCR V2.2 - 知乎](https://zhuanlan.zhihu.com/p/546441117)**
* 在线Demo: https://huggingface.co/spaces/breezedeus/cnocr 。
* **[利用CnOCR实现自动对截屏图片OCR - 知乎](https://zhuanlan.zhihu.com/p/554108141)**
* **[如何安装CnOCR,以及免安装直接使用CnOCR](https://www.bilibili.com/video/BV1NY4y1T7jG)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1NY4y1T7jG)](https://www.bilibili.com/video/BV1NY4y1T7jG)
* 分享对应的 [PPT](2022/CnOCR-Installation-FAQ.pdf);
* 介绍了 **[CnOCR](https://github.com/breezedeus/cnocr)** 安装和使用过程中大家遇到的一些问题。能不能不安装试用CnOCR效果?没问题,本视频中提供了**4种免安装**使用的方法。
* 相关资源:[文本检测和识别——附CnStd与CnOcr工具介绍](https://www.bilibili.com/video/BV1uU4y1N7Ba) [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1uU4y1N7Ba)](https://www.bilibili.com/video/BV1uU4y1N7Ba)

* **[antiOCR 使用介绍](https://www.bilibili.com/video/BV1q8411G7HE)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1q8411G7HE)](https://www.bilibili.com/video/BV1q8411G7HE)
* **[antiOCR](https://github.com/breezedeus/antiOCR)** 把指定文本转换成机器无法识别但人可读的文字图片,即拒绝图片内容被OCR。常见的使用场景是图片验证码。antiOCR 是Python工具包,安装即可使用,或者直接使用作者提供的在线Demo生成图片;
* 在线Demo:https://huggingface.co/spaces/breezedeus/antiOCR 。

# Year 2021

* **[Tricks for Sparse & Dense Retrieval Models](https://www.bilibili.com/video/BV13y4y1R71Q)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV13y4y1R71Q)](https://www.bilibili.com/video/BV13y4y1R71Q)

* 分享对应的 [PPT](2021/sparse-dense-retrieval.pdf);
* 介绍了 **Sparse Retrieval (SR)** 和 **Dense Retrieval (DR)** 中的几大类改进方法。 *虽然是 2021年底的分享,不过到 2023年才发布出来,拖延症😅。*

* **[文本检测和识别——附CnStd与CnOcr工具介绍](https://www.bilibili.com/video/BV1uU4y1N7Ba)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1uU4y1N7Ba)](https://www.bilibili.com/video/BV1uU4y1N7Ba)

* 分享对应的 [PPT](2021/cnstd-cnocr.pdf);
* 介绍了文本检测和识别中的深度学习框架与代表性算法,之后介绍了 **[CnSTD](https://github.com/breezedeus/cnstd)** 与 **[CnOCR](https://github.com/breezedeus/cnocr)** 两个python3工具包的使用。

* **[RS论文阅读:你真的读懂了Youtube DNN推荐论文吗?](https://www.bilibili.com/video/BV1BK4y1d7gD)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1BK4y1d7gD)](https://www.bilibili.com/video/BV1BK4y1d7gD)

* 分享的 [文字版](https://zhuanlan.zhihu.com/p/372238343) ;
* Youtube 在2016年发表的DNN推荐论文是最早把深度学习成功应用于推荐的代表性工作。很多博客都对这篇文章进行过翻译和解读,但你真的读懂了吗?本视频将带你温习这篇经典论文,并让你真的读懂它。

* **[线上测试 I:如何快速进行线上测试](https://www.bilibili.com/video/BV18b4y1972v)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV18b4y1972v)](https://www.bilibili.com/video/BV18b4y1972v)

* 介绍了线上测试的两种方法:**A/B测试** 和 **交错测试**,适用于算法测试、产品增长测试等场景。

* **[线上测试 II:效果评估——假设检验](https://www.bilibili.com/video/BV1LK4y1S7uR)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1LK4y1S7uR)](https://www.bilibili.com/video/BV1LK4y1S7uR)

* 介绍了客观评估线上实验效果的数学方法:**假设检验**。

* **[声纹分割聚类(Speaker Diarization)](https://www.bilibili.com/video/BV1rp4y1q7HW)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1rp4y1q7HW)](https://www.bilibili.com/video/BV1rp4y1q7HW)

* 分享的 [文字版](https://zhuanlan.zhihu.com/p/338656027) ;
* 介绍了声纹分割聚类的整体流程以及涉及的技术知识。

* **[更好地理解图片:场景文字检测工具 cnstd - 知乎](https://zhuanlan.zhihu.com/p/145913973)**

* **[2021年云栖大会见闻分享](https://www.bilibili.com/video/BV1bq4y1k7yr)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1bq4y1k7yr)](https://www.bilibili.com/video/BV1bq4y1k7yr)

* 分享在2021年云栖大会的见闻,包括视频理解、NLP、多模态、虚拟人、元宇宙等内容,无技术细节。

# Year 2020

* **[如何做调研](https://www.bilibili.com/video/BV1tD4y127Xq/)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1tD4y127Xq)](https://www.bilibili.com/video/BV1tD4y127Xq)
* 分享对应的 [脑图](如何做调研.png);
* 介绍了不同层面的调研该怎么做,包括竞品调研,针对某个具体应用的方案调研,针对某个算法(任务)方向的调研。同时介绍了一些常用的调研工具。

* **[自监督学习&对比学习](https://www.bilibili.com/video/BV1v5411x7rD)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1v5411x7rD)](https://www.bilibili.com/video/BV1v5411x7rD)
* 分享对应的 [PPT](2020/自监督学习-对比学习.pdf);
* 介绍深度学习中最前沿的自监督学习和对比学习技术。

* **[NLP中的自监督学习&对比学习](https://www.bilibili.com/video/BV13T4y1c73g)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV13T4y1c73g)](https://www.bilibili.com/video/BV13T4y1c73g)
* 分享对应的 [PPT](2020/自监督学习-对比学习2-NLP.pdf);
* self-supervised & contrastive learning 第二弹:介绍NLP领域自监督学习和对比学习的最新工作(2020年)。
* self-supervised & contrastive learning 第一弹:[自监督学习&对比学习](https://www.bilibili.com/video/BV1v5411x7rD) [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1v5411x7rD)](https://www.bilibili.com/video/BV1v5411x7rD)

* **[最新语音识别技术简介(Introduction to ASR)](https://www.bilibili.com/video/BV1fZ4y1g7UP)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1fZ4y1g7UP)](https://www.bilibili.com/video/BV1fZ4y1g7UP)
* 分享对应的 [PPT](2020/Intro-to-ASR.pdf);
* 本次分享对最新的语音识别技术做了整体的介绍。
* **[开放域聊天机器人技术介绍](https://www.bilibili.com/video/BV1e5411Y7ci)** [![bilibili](https://img.shields.io/badge/dynamic/json?label=views&style=social&logo=bilibili&query=data.stat.view&url=https%3A%2F%2Fapi.bilibili.com%2Fx%2Fweb-interface%2Fview%3Fbvid%3DBV1e5411Y7ci)](https://www.bilibili.com/video/BV1e5411Y7ci)
* 分享对应的 [PPT](2020/open-domain-chatbot.pdf);
* 分享的 [文字版](https://zhuanlan.zhihu.com/p/150608851) ;
* 主要介绍 Google Meena 和 Facebook Blender 这两个工作,它们分别发表于今年1月和4月(他们远程办公的效率看来很高)。这两篇论文在模型方面都没有什么创新,但融合了很多有意思的技术,这些模型之外的技术值得做对话的同学了解一下。现在大概是聊天机器人的 GPT-1 时代,谁会开启聊天机器人的 BERT 时代呢?
* **[微软小冰对话机器人架构 - 知乎](https://zhuanlan.zhihu.com/p/57532328)**

# Old Notes

## Graphical Models

**图模型、VEM**等相关知识的[介绍pdf](./Graphical_Models.pdf) 。

## Bayes Factors

**贝叶斯因子**(**Bayes Factors**)一篇论文的 [学习笔记pdf](./Bayes_Factors.pdf) 。

---

**官方库**:[https://github.com/breezedeus/LoveShare](https://github.com/breezedeus/LoveShare)。