https://github.com/isaaccorley/simsiam-pytorch

PyTorch Implementation of SimSiam from "Exploring Simple Siamese Representation Learning" by Chen et al.
https://github.com/isaaccorley/simsiam-pytorch

artificial-intelligence pytorch self-supervised-learning simsiam simsiam-pytorch

Last synced: 6 months ago
JSON representation

PyTorch Implementation of SimSiam from "Exploring Simple Siamese Representation Learning" by Chen et al.

Host: GitHub
URL: https://github.com/isaaccorley/simsiam-pytorch
Owner: isaaccorley
License: mit
Created: 2020-12-03T04:45:13.000Z (almost 5 years ago)
Default Branch: main
Last Pushed: 2021-01-11T03:01:44.000Z (over 4 years ago)
Last Synced: 2025-03-26T11:11:15.790Z (7 months ago)
Topics: artificial-intelligence, pytorch, self-supervised-learning, simsiam, simsiam-pytorch
Language: Python
Homepage:
Size: 104 KB
Stars: 17
Watchers: 2
Forks: 4
Open Issues: 2
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

          # simsiam-pytorch

Minimal PyTorch Implementation of SimSiam from ["Exploring Simple Siamese Representation Learning" by Chen et al.](https://arxiv.org/abs/2011.10566)



### Load and train on a custom dataset

```python

from simsiam.models import SimSiam

from simsiam.losses import negative_cosine_similarity

model = SimSiam(

    backbone="resnet50",    # encoder network

    latent_dim=2048,        # predictor network output size

    proj_hidden_dim=2048    # projection mlp hidden layer size

    pred_hidden_dim=512     # predictor mlp hidden layer size

)

model = model.to("cuda")    # use all the parallels

model.train()

transforms = ...

dataset = ...

dataloader = ...

opt = ...

for epoch in range(epochs):

    for batch, (x, y) in enumerate(dataloader):

        opt.zero_grad()

        x1, x2 = transforms(x), transforms(x)           # Augment

        e1, e2 = model.encode(x1), model.encode(x2)     # Encode

        z1, z2 = model.project(e1), model.project(e2)   # Project

        p1, p2 = model.predict(z1), model.predict(z2)   # Predict

        # Compute loss

        loss1 = negative_cosine_similarity(p1, z1)

        loss2 = negative_cosine_similarity(p2, z2)

        loss = loss1/2 + loss2/2

        loss.backward()

        opt.step()

# Save encoder weights for later

torch.save(model.encoder.state_dict(), "pretrained.pt")

```

### Use pretrained weights in a classifier

```python

from simsiam.models import ResNet

# just a wrapper around encoder + linear classifier networks

model = ResNet(

    backbone="resnet50",    # Same as during pretraining

    num_classes=10,         # number of output neurons 

    pretrained=False,       # Whether to load pretrained imagenet weights

    freeze=True             # Freeze the encoder weights (or not)

)

# Load the pretrained weights from SimSiam

model.encoder.load_state_dict(torch.load("pretrained.pt"))

model = model.to("cuda")

model.train()

transforms = ...

dataset = ...

dataloader = ...

opt = optim.SGD(model.parameters())

loss_func = nn.CrossEntropyLoss()

# Train on your small labeled train set

for epoch in range(epochs):

    for batch, (x, y) in enumerate(dataloader):

        opt.zero_grad()

        y_pred = model(x)

        loss = loss_func(y_pred, y)

        loss.backward()

        opt.step()

```

### Install dependencies

```bash

pip install -r requirements.txt

```

### Train on STL-10 dataset

Modify pretrain.yaml to your liking and run

```python

python pretrain.py --cfg configs/pretrain.json

```

### View logs in tensorboard

```python

tensorboard --logdir=logs

```

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/isaaccorley/simsiam-pytorch

Awesome Lists containing this project

README