https://github.com/bing-su/train-with-tsdae
https://github.com/bing-su/train-with-tsdae
Last synced: 4 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/bing-su/train-with-tsdae
- Owner: Bing-su
- License: mit
- Created: 2022-08-23T05:52:06.000Z (almost 3 years ago)
- Default Branch: main
- Last Pushed: 2024-03-13T01:52:17.000Z (over 1 year ago)
- Last Synced: 2025-01-02T15:50:43.563Z (6 months ago)
- Language: Python
- Size: 18.6 KB
- Stars: 0
- Watchers: 2
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# train-with-tsdae
[TSDAE](https://www.sbert.net/examples/unsupervised_learning/TSDAE/README.html)
[raw model](https://huggingface.co/Bingsu/my_reformer_untrained)
### Note
TSDAE로 모델을 학습하려면 모델이 다음 조건을 만족해야 한다.
1. `AutoModelForCausalLM`로 모델을 불러올 수 있어야 합니다.
2. 모델의 `forward` 함수가 `encoder_hidden_states`를 입력으로 받아야 합니다.
둘 모두를 만족하지 않는 모델을 TSDAE로 학습하려면,
`losses.DenoisingAutoEncoderLoss`에서 `tie_encoder_decoder=False`로 설정하고,
디코더로 사용할 모델을 따로 설정해주어야 합니다.이는 학습 성능이 낮아질 수 있습니다...