Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/zhengqi98/Hefei_ECG_TOP1

“合肥高新杯”心电人机智能大赛 —— 心电异常事件预测 TOP1 Solution
https://github.com/zhengqi98/Hefei_ECG_TOP1

competition data-mining deep-learning ecg ecg-classification multi-lead

Last synced: 24 days ago
JSON representation

“合肥高新杯”心电人机智能大赛 —— 心电异常事件预测 TOP1 Solution

Awesome Lists containing this project

README

        

## “合肥高新杯”心电人机智能大赛——心电异常事件预测冠军解决方案
### 赛题地址
https://tianchi.aliyun.com/competition/entrance/231754/introduction
### 开源baseline
感谢比赛期间JavisPeng开源的优质[baseline](https://github.com/JavisPeng/ecg_pytorch)
### 比赛分数



### 赛题回顾
- 问题描述:依据心电图机8导联的数据和年龄、性别特征,预测心电异常事件
- 比赛数据:32142条初赛数据和20036条复赛数据(初赛数据有重复,初复赛标签分布差异大)
- 评价指标:MicroF1
### 数据分析
- 标签相关性:计算公式为两标签交集数量除以两标签并集数量,0表示完全互斥。该相关性也可视为一种“特征”。



- 不同导联节拍一致:尖峰位置一致。



- 不同导联十分相似:将不同导联画在同一坐标轴上,可看出**相似性**。如何构建模型以利用这种**相似性**是**最为关键**的思路。



### 模型构建
针对多导联心电图分类任务,我创新地提出一种网络结构,将其称之为**ECGNet: Multi-scale ResNet for Multi-lead ECG Data**。该模型是本次比赛的**致胜关键**。(细节可见PPT)



### 模型融合



模型融合阶段效果提升,我认为主要有两点原因:
1. 充分利用初赛和复赛的数据
2. “隐含”地利用了不同标签的相关性

不足之处:
1. 模型缺乏多样性
2. 没有用到传统特征和树模型

此外,植物提出的[嫁接学习](https://github.com/plantsgo/ijcai-2018)也是种很有意思的思路。

### 效果评估
线下对20类标签用单模型评估效果,反正比我自己判断的(仅限电轴偏转方向)好得多。



### 经验总结
- 充分利用提供的数据很重要,尤其分布差异很大时。
- 多去思考多去尝试。

在处理多导联心电图数据时:
- 对不同导联应用相同的卷积核,能在减小参数量的同时,很好地提升模型的效果。
- 采用多尺度网络能捕捉不同尺度的特征,较好地提升模型的效果。
- 网络初期可以采用较大的卷积核,后期可以采用较小的卷积核。
- BN-ReLU-Conv要优于Conv-BN-ReLU。
- Squeeze-and-excitation结构也能提升模型的效果。
- 传统特征也很重要。

### 失败尝试
以下是一些失败的尝试(不代表这些方法真的不行,也许是我的打开方式有问题):
- 傅里叶变换
- 小波变换
- 频谱图
- DenseNet
- EfficientNet
- Attention
- LSTM
- 滑动窗口
- 去噪
- 特征工程

总之还是要多思考多去尝试吧,没有什么事能一帆风顺的。

### 赛后感想
本次比赛收获颇丰,除了实质性奖励以外,还锻炼了我赛题思考、数据分析、模型构建、论文阅读、编程实现以及答辩的能力,且与其他选手交流了一些有趣的思路。
客观上来看,本次比赛有很大的运气成分的,自己还有很多不足。总之,继续努力,再接再厉吧。
~~单人参赛好累啊,还有复现阶段需要抓紧时间,我差点没在期限内整出来。~~

### PS
很多细节我没有详细介绍,有兴趣地可以看PPT或答辩视频。

### 答辩视频
https://tianchi.aliyun.com/course/video?liveId=41127