Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/p1atdev/sd-danbooru-tags-upsampler

Makes the prompts for generating anime images more detailed by upsampling Danbooru tags.
https://github.com/p1atdev/sd-danbooru-tags-upsampler

Last synced: 6 days ago
JSON representation

Makes the prompts for generating anime images more detailed by upsampling Danbooru tags.

Awesome Lists containing this project

README

        

# sd-danbooru-tags-upsampler

English version is [here](./README.md).

これは軽量な LLM を利用して danbooru タグを生成/補完することで、プロンプトをアップサンプルすることができる Stable Diffusion WebUI 向けの拡張機能です。

長いプロンプトを考えたくない場合や、何も考えないで**多様**かつ**自然**で**高品質**な画像を見ていたいという場合に便利です。

## 更新履歴

- 2024/2/29: v0.2.0。新機能: 生成オプション、多様性レベル、範囲禁止タグの実装。
- 2024/2/25: v0.1.1。シード値の処理、括弧のエスケープ処理、軽微な不具合が修正されました。
- 2024/2/23: 最初のバージョンである v0.1.0 をリリースしました

## 使い方

拡張機能のスクリーンショット

`Danbooru Tags Upsampler` と書かれたアコーディオンを開き、`Enabled` チェックボックスにチェックをいれることで拡張機能を有効化できます。

パラメーターの説明:

| パラメーター名 | 説明 | 例 |
| -------------- | ----------- | ------------- |
| **Total tag length** | これは **タグの補完後のプロンプト内のタグの総量を指定します**。 補完するタグの量ではありません。 `very short` は「タグ10個以下」, `short` は「タグ20個以下」, `long` は「タグ40個以下」、 `very long` は「それよりも多い」を意味します。 | 推奨は `long` です |
| **Ban tags** | ここで指定された全てのタグは補完時に出現しなくなります。出てきて欲しくないタグがあるときに便利です。`*` は全ての文字列にマッチします。(例: `* background` は `simple background`、`white background` 等にマッチします) | `official alternate costume, english text, * background, ...` |
| **Seed for upsampling tags** | この値とポジティブプロンプトが固定された場合、補完されるタグも固定されます。`-1` は毎回ことなるシードで補完することを意味します。 | 毎回異なる補完をしてほしい場合は `-1` に設定します。 |
| **Upsampling timing** | sd-dynamic-prompts や webui の styles 機能などの、他のプロンプト加工処理が実行される前にアップサンプルするか、後にアップサンプルするかどうかです。 | `After applying other prompt processing` |
| **Variety level** | このパラメーターは `Generation config` のプリセットです。アップサンプルされるタグの多様度を指定できます。 | `varied` |
| **Generation config** | タグの生成に利用される LLM のパラメーターです。言語モデルの生成パラメーターに詳しくない場合は触らず、 `Variety level` を使うことをおすすめします。 ||

## ショーケース


入力のプロンプト
アップサンプルなし
アップサンプルあり


1girl, solo, cowboy shot (seed: 2396487241)

Sample image 1 generated without upsampling

Sample image 1 generated with upsampling


(最終的なプロンプト)
1girl, solo, cowboy shot
1girl, solo, cowboy shot, ahoge, animal ears, bare shoulders, blue hair, blush, closed mouth, collarbone, collared shirt, dress, eyelashes, fox ears, fox girl, fox tail, hair between eyes, heart, long hair, long sleeves, looking at viewer, neck ribbon, ribbon, shirt, simple background, sleeves past wrists, smile, tail, white background, white dress, white shirt, yellow eyes


3girls (seed: 684589178)

Sample image 2 generated without upsampling

Sample image 2 generated with upsampling


(最終的なプロンプト)
3girls
3girls, black footwear, black hair, black thighhighs, boots, bow, bowtie, chibi, closed mouth, collared shirt, flower, grey hair, hair between eyes, hair flower, hair ornament, long hair, long sleeves, looking at viewer, multiple girls, purple eyes, red eyes, shirt, short hair, sitting, smile, thighhighs, vest, white shirt, white skirt


no humans, scenery (seed: 3702717413)

Sample image 3 generated without upsampling

Sample image 3 generated with upsampling


(最終的なプロンプト)
no humans, scenery
no humans, scenery, animal, animal focus, bird, blue eyes, cat, dog, flower, grass, leaf, nature, petals, shadow, sitting, star (sky), sunflower, tree


1girl, frieren, sousou no frieren
(seed: 787304393)

Sample image 4 generated without upsampling

Sample image 4 generated with upsampling


(最終的なプロンプト)
1girl, frieren, sousou no frieren
1girl, frieren, sousou no frieren, black pantyhose, cape, closed mouth, elf, fingernails, green eyes, grey hair, hair between eyes, long hair, long sleeves, looking at viewer, pantyhose, pointy ears, simple background, skirt, solo, twintails, white background, white skirt

生成設定:

- モデル: [AnimagineXL 3.0](https://huggingface.co/cagliostrolab/animagine-xl-3.0)
- ネガティブプロンプト (animaginexl 3.0 公式の推奨設定と同じ):

```
nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name
```

アップサンプル設定:

- Total tag length: `long`
- Ban tags: 指定なし
- Seed: `-1`
- When to perform the process: `Before applying styles`

### 多様性レベル

(シードは同じではないです。)


入力プロンプト
Very unvaried
Unvaried
Normal
Varied
Very varied


1girl, solo, from side
Variation sample image 1; very unvaried
Variation sample image 1; unvaried
Variation sample image 1; normal
Variation sample image 1; varied
Variation sample image 1; very varied


1girl, frieren, sousou no frieren,
Variation sample image 2; very unvaried
Variation sample image 2; unvaried
Variation sample image 2; normal
Variation sample image 2; varied
Variation sample image 2; very varied


no humans, scenery
Variation sample image 3; very unvaried
Variation sample image 3; unvaried
Variation sample image 3; normal
Variation sample image 3; varied
Variation sample image 3; very varied

`Very unvaried`, `Unvaried` は多様性が低いことを意味しますが、同時に入力プロンプトに忠実であり、比較的無難なタグを生成します。また、`Very varied`, `Varied` はより多様なタグが生成されますが、入力プロンプトに従わなかったり不自然な生成になったりしやすくなります。

## モデルへのアクセス

この拡張機能では次のモデルを使用しています:

- `p1atdev/dart-v1-sft`: [🤗 HuggingFace](https://huggingface.co/p1atdev/dart-v1-sft)

## Stable Diffusion WebUI なしで使いたいですか?

🤗 Space 上にデモがあるのでインストール不要で試すことができます:

デモ: https://huggingface.co/spaces/p1atdev/danbooru-tags-transformer

## デフォルト値を変更するには?

`[webui のルート]/ui-config.json` を開き、`customscript/dart_upsampler.py/` で始まるパラメーターを探して編集してください。

もしデフォルト値が壊れていると感じたら、それらのパラメータを削除することでデフォルト値をリセットできます。

## 謝辞

このプロジェクトは以下のプロジェクトや研究の影響を受けています。 これらのプロジェクトの開発者および貢献者に敬意と感謝の意を表します:

- succinctly/text2image-prompt-generator: https://huggingface.co/succinctly/text2image-prompt-generator
- Gustavosta/MagicPrompt-Stable-Diffusion: https://huggingface.co/Gustavosta/MagicPrompt-Stable-Diffusion
- FredZhang7/anime-anything-promptgen-v2: https://huggingface.co/FredZhang7/anime-anything-promptgen-v2
- sd-dynamic-prompts: https://github.com/adieyal/sd-dynamic-prompts
- DALL-E 3: https://cdn.openai.com/papers/dall-e-3.pdf
- caption-upsampling: https://github.com/sayakpaul/caption-upsampling
- StableDiffusionWebUI: https://github.com/AUTOMATIC1111/stable-diffusion-webui とその派生物