https://github.com/logcreative/qlib-cnn

Last synced: 3 months ago
JSON representation

Host: GitHub
URL: https://github.com/logcreative/qlib-cnn
Owner: LogCreative
License: mit
Created: 2021-11-15T23:30:18.000Z (over 3 years ago)
Default Branch: main
Last Pushed: 2022-01-23T06:38:48.000Z (over 3 years ago)
Last Synced: 2025-02-14T12:17:37.580Z (5 months ago)
Language: Jupyter Notebook
Homepage:
Size: 5.7 MB
Stars: 2
Watchers: 1
Forks: 0
Open Issues: 2
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

# qlib-CNN

Qlib 依赖版本：0.8.3

## 运行范例

直接运行范例代码，得到结果。

```
python task1/workflow_by_code.py
```

![](task1/pass.png)

## pytorch 实现 CNN

基础版本的CNN论文展现了下面的三层卷积网络。

![](img/oldcnn.png)

但是对于一维卷积网络来讲，删去了 Pooling 层，并采用 padding 的方式保证数据维度一致。更好的优化需要使用 TCN 模型做多层卷积，使用因果卷积 Chomp1d。

首先需要运行 [数据获取](task2/get_data.ipynb) 的代码。

[代码](task2/pytorch_cnn.py) 为 CNN 的实现情况，层由 `layers` 定义。运行时需要将其移入 qlib 包的 `qlib/contrib/model/` 中，训练框架参考 [pytorch_nn](https://github.com/microsoft/qlib/blob/main/qlib/contrib/model/pytorch_nn.py)。

使用
```cmd
qrun task2/workflow_config_cnn_Alpha158.yaml
qrun task2/workflow_config_cnn_Alpha360.yaml
```
运行模型。

使用含有 RTX 3080 Ti 的服务器上运行该模型，结果如下：

![](img/run_CNN.png)

### 分析

TCN 已经被[实现](https://github.com/microsoft/qlib/blob/main/qlib/contrib/model/pytorch_tcn_ts.py)，参照对应的 [YAML 文件](task3/workflow_config_tcn_Alpha158.yaml)，将尝试直接运行该模型。由于本地算力不足，使用 Google Colab 运行之见 [代码](task3/workflow_tcn.ipynb)。

> `TSDatasetSampler` 近期有 API 变动，需要手动进行数据转换（已经进行 Issue [评论](https://github.com/microsoft/qlib/issues/411#issuecomment-993484655)）。

![](img/report.png)

![](img/return.png)

![](img/scoreIC.png)

![](img/IC.png)

### 量化交易分析流程

- **构造数据** 按照 Qlib 官方库的方法获取内置数据。
股票池：沪深300成分股。
- **特征分析** 特征采用 Qlib 内置的因子库 Alpha158 中的 158 个因子特征。
- **特征预处理** 训练与验证集：DropnaLabel 用于去除缺失值，CSRrankNorm 用于截面标准化。测试集：RobustZScoreNorm 用来归一化数据，Fillna 用来去除缺失值。
- **训练模型** 使用自己的模型，或者是 TCN 等其他模型。
- **回测模型** 得到最优参数后，进行模型预测得到测试集中每一天股票的预测收益率。使用TopkDropout 策略。
- **回测结果分析** 尝试将 TCN 适配进 workflow_by_code.ipynb 中可视化结果。发现由于 TCN 实现使用了 TSDatasetSampler，最近有 API 变动，适配了一些代码以绘制出图像。对此在 Qlib 中进行了 Issue 评论。
- **模型上线** 现在关于自行实现的 CNN 模型上线还不现实，效果还不好。而现在的 TCN 模型在普通的 GPU （GTX 1050 Ti）上会因为显存不足的原因无法运行，轻量化的 CNN 模型还有待探索。

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/logcreative/qlib-cnn

Awesome Lists containing this project

README