https://github.com/ableinc/prompt-token-count

Tokenize a prompt and/or get the number of tokens a prompt will take
https://github.com/ableinc/prompt-token-count

ai chat-gpt gpt llm openai token-count tokenizer

Last synced: 2 months ago
JSON representation

Tokenize a prompt and/or get the number of tokens a prompt will take

Host: GitHub
URL: https://github.com/ableinc/prompt-token-count
Owner: ableinc
Created: 2025-02-24T17:40:33.000Z (over 1 year ago)
Default Branch: main
Last Pushed: 2025-02-25T16:22:39.000Z (over 1 year ago)
Last Synced: 2025-10-05T00:25:05.379Z (9 months ago)
Topics: ai, chat-gpt, gpt, llm, openai, token-count, tokenizer
Language: Go
Homepage: https://github.com/ableinc/prompt-token-count
Size: 9.77 KB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

          # Prompt Token Count

Tokenize a prompt and/or get the number of tokens a prompt will take

## Install

```bash

go get github.com/ableinc/prompt-token-count

```

## Usage

```go

package main

import (

	"fmt"

	"log"

	"github.com/ableinc/prompt-token-count/cmd/tokenizer"

)

func encodingForModel(model string) (*tokenizer.Encoding, error) {

	switch model {

	case "gpt-4", "gpt-4-turbo", "gpt-3.5-turbo", "text-embedding-ada-002":

		return tokenizer.GetEncoding("cl100k_base")

	case "gpt-4o", "gpt-4o-mini":

		return tokenizer.GetEncoding("o200k_base")

	case "text-davinci-002", "text-davinci-003", "code-davinci-002", "text-davinci-edit-001":

		return tokenizer.GetEncoding("p50k_base")

	case "code-cushman-001", "davinci", "curie", "babbage", "ada":

		return tokenizer.GetEncoding("r50k_base")

	case "text-ada-001", "text-babbage-001", "text-curie-001", "text-davinci-001", "code-davinci-001":

		return tokenizer.GetEncoding("gpt2")

	default:

		return nil, fmt.Errorf("unknown model: %s", model)

	}

}

func main() {

	model, err := encodingForModel("gpt-4")

	if err != nil {

		log.Fatalf("incorrect model provided: %v", err)

	}

	prompt := tokenizer.TokenString("Give me Golang code to create a binary tree.")

	fmt.Println("Number of tokens (raw text): ", prompt.CountTokens())

	tokens := model.Encode(prompt)

	fmt.Println("NUmber of tokens (encodings): ", tokens.CountTokens())

	fmt.Println("Encoding: ", tokens)

	prompt = model.Decode(tokens)

	fmt.Println("Decoding: ", prompt)

}

```

## Input/Output Cost?

If you need to know the cost for a prompt (input) and the output (completion) use this library: [prompt-complete-cost](https://github.com/ableinc/prompt-complete-cost)

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/ableinc/prompt-token-count

Awesome Lists containing this project

README