Awesome-Text2SQL

Curated tutorials and resources for Large Language Models, Text2SQL, Text2DSL、Text2API、Text2Vis and more.
https://github.com/eosphoros-ai/Awesome-Text2SQL

Last synced: 5 days ago
JSON representation

📖 Survey
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [code
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [code
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
💪 Dataset
- [paper - lily.github.io/spider)]
- [paper
- [paper - lily.github.io/spider)]
- [paper
- [paper - 8zixluQuLa?usp=sharing)]
- [paper - lily.github.io/cosql)] [[dataset](https://yale-lily.github.io/cosql)]
- [paper
- [paper
- [paper - Hsuan-Lee/KaggleDBQA/)] [[dataset](https://github.com/Chia-Hsuan-Lee/KaggleDBQA/tree/main?tab=readme-ov-file#Data-Format)]
- [paper - intsoft/chase)] [[dataset](https://github.com/xjtu-intsoft/chase/tree/page/data)]
- [paper
- [paper
- [paper - ai/Spider2)] [[dataset](https://github.com/xlang-ai/Spider2)]
🔔 Leaderboard
- SeaD+Execution-Guided Decoding - MiniSeek) | **91.2** (2023/11-MiniSeek) | **80.40** (2024/05-ExSL + granite-20b-code) | **71.83** (2024/07-Distillery + GPT-4o) |
- BRIDGE - [N-best List Rerankers + PICARD](https://arxiv.org/pdf/2210.10668.pdf)) | 80.8 (2023/07-Hindsight Chain of Thought with GPT-4 and Instructions) | 69.56 (2024/04-GRA-SQL） | 65.34 (2024/07-Insights AI） |
- HydraNet+Execution-Guided Decoding - [SHiP + PICARD](https://arxiv.org/pdf/2212.08785.pdf)) | 85.6 (2023/10-DPG-SQL + GPT-4 + Self-Correction) | 73.24 (2024/07-ByteBrain) | 68.87 (2024/07-ByteBrain) |
- X-SQL+Execution-Guided Decoding - RESDSQL+T5-1.1-lm100k-xl) | 83.9 (2023/07-Hindsight Chain of Thought with GPT-4) | 72.63 (2024/05-[CHESS](https://arxiv.org/pdf/2405.16755)) ） | 66.69 (2024/05-[CHESS](https://arxiv.org/pdf/2405.16755)) |
- SDSQL - T5-SR) | 82.3 (2023/06-[C3 + ChatGPT + Zero-Shot](https://arxiv.org/pdf/2307.07306.pdf)) | 71.35 (2024/01-MCS-SQL + GPT-4) | 65.45 (2024/01-MCS-SQL + GPT-4) |
- SeqGenSQL+EG - [RESDSQL-3B + NatSQL](https://arxiv.org/pdf/2302.05965.pdf)) | 78.5 (2022/11-SeaD + PQL) | 68.82 (2024/07-Insights AI） | 64.84 (2024/02-PB-SQL v1) |
- WikiSQL - lily.github.io/spider) Exact Match(EM) | [Spider](https://yale-lily.github.io/spider) Exact Execution(EX) | [BIRD](https://bird-bench.github.io/) Reward-based Valid Efficiency Score (R-VES) | [BIRD](https://bird-bench.github.io/) Execution Accuracy (EX) |
- IE-SQL+Execution-Guided Decoding - CatSQL + GraPPa) | 86.2 (2023/08-[DAIL-SQL + GPT-4](https://arxiv.org/pdf/2308.15363.pdf)) | 68.44 (2024/09-[CHASE-SQL + Gemini](https://arxiv.org/abs/2410.01943)) | 72.28 (2024/08-OpenSearch-SQL, v2 + GPT-4o) |
- Text2SQLGen + EG - [S²SQL + ELECTRA ](https://arxiv.org/pdf/2203.06958.pdf)) | 79.9 (2023/02-[RESDSQL-3B + NatSQ](https://arxiv.org/pdf/2302.05965.pdf)) | 65.62 (2024/07-PURPLE + RED + GPT-4o） | 68.87 (2024/07-ByteBrain) |
- SeaD+Execution-Guided Decoding - MiniSeek) | **91.2** (2023/11-MiniSeek) | **69.36** (2024/08-OpenSearch-SQL, v2 + GPT-4o) | **73.00** (2024/09-[CHASE-SQL + Gemini](https://arxiv.org/abs/2410.01943)) |
- SDSQL+Execution-Guided Decoding - [Graphix-3B + PICARD](https://arxiv.org/pdf/2301.07507.pdf)) | 86.6 (2023/08-[DAIL-SQL + GPT-4 + Self-Consistency](https://arxiv.org/pdf/2308.15363.pdf)) | 68.79 (2024/08-ExSL + granite-34b-code) | 72.39 (2024/09-AskData + GPT-4o) |
- HydraNet+Execution-Guided Decoding - [SHiP + PICARD](https://arxiv.org/pdf/2212.08785.pdf)) | 85.6 (2023/10-DPG-SQL + GPT-4 + Self-Correction) | 67.41 (2024/07-[Distillery + GPT-4o](https://arxiv.org/abs/2408.07702)) | 71.83 (2024/07-[Distillery + GPT-4o](https://arxiv.org/abs/2408.07702)) |
- BRIDGE+Execution-Guided Decoding - [G³R + LGESQL + ELECTRA](https://aclanthology.org/2023.findings-acl.23.pdf)) | 85.3 (2023/04-[DIN-SQL + GPT-4](https://arxiv.org/pdf/2304.11015.pdf)) | 66.92 (2024/09-AskData + GPT-4o) | 70.37 (2024/08-ExSL + granite-34b-code) |
- X-SQL+Execution-Guided Decoding - RESDSQL+T5-1.1-lm100k-xl) | 83.9 (2023/07-Hindsight Chain of Thought with GPT-4) | 66.39 (2024/08-Insights AI) | 70.26 (2024/08-Insights AI) |
- SeqGenSQL+EG - [RESDSQL-3B + NatSQL](https://arxiv.org/pdf/2302.05965.pdf)) | 78.5 (2022/11-SeaD + PQL) | 63.68 (2024/08-Arcwise + GPT-4o） | 67.86 (2024/05-ExSL + granite-20b-code) |
💬 Classic Model
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [code
- ![
- ![
- [paper
- ![
- [paper
- [paper
- ![
- [paper
- [code
- ![
- [paper
- [code
- ![
- ![
- [paper
- [paper
- [paper
- [paper
- [paper
- [code
- [paper
- ![
- ![ - us/download/details.aspx?id=54253)
- [paper
- [paper
- ![
- [paper
- [code
- [paper
- [code
- [paper
- [code
- [paper
- [code
- [paper
- [code
- ![
- [paper
- [code
- [paper
- [paper
- [code
- [code
- [paper
- [code
- [paper
- [code
- ![ - 1021.pdf)
- [paper
- [code
- [paper
- [code
- [paper
- [code
- [paper
- [code
- [paper
- [code
- [paper
- [paper
- [code
- [paper
- [code
- [paper
- [paper
- [code
- [paper
- [paper
- ![ - bench.github.io/)
- ![ - bench.github.io/)
- [code
- [code
- [code
- [code
- ![
- [code
- [code
- [code
- ![
- ![ - long.142.pdf)
- ![ - explorer/)
- ![ - main.562.pdf)
- ![
- ![
- ![
- ![
- ![
- [paper
- [paper
- [paper
- ![ - Hsuan-Lee/KaggleDBQA)
- [code
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- [paper
- ![
- [paper
- [code
- ![ - bench.github.io/)
- [code
- ![ - lily.github.io/spider)
- ![ - main.105.pdf)
- ![
- ![
🔥 Base Model
- [paper - 6B/blob/main/README.md)] [[model](https://huggingface.co/THUDM/chatglm-6b)]
- General Language Model
- [paper - lab/stanford_alpaca)] [[model](https://huggingface.co/tatsu-lab/alpaca-7b-wdiff/tree/main)]
- [paper - sys/FastChat)] [[model](https://huggingface.co/lmsys)]
- [paper - 6B/blob/main/README_EN.md)] [[model](https://huggingface.co/THUDM/chatglm2-6b)]
- [code - inc/Baichuan-7B)]
- [code - inc/Baichuan-13B-Base)]
- [paper
- [paper - llama)]
- [paper
- [paper
- [paper
- [code - inc)]
- [paper - 1_5)]
- phi-1 - 1.5 demonstrates a nearly state-of-the-art performance among models with less than 10 billion parameters. 2023/12, They propose [Phi-2](https://huggingface.co/microsoft/phi-2), a 2.7 billion-parameter language model that demonstrates outstanding reasoning and language understanding capabilities, showcasing state-of-the-art performance among base language models with less than 13 billion parameters.
- [model
- [paper
- [code
- [model
- [paper
- [code
- [model
- [paper - started/open_weight_models/)] [[model](https://huggingface.co/mistral-community/Mixtral-8x22B-v0.1)]
- [paper - 3-mini-128k-instruct)]
- [paper - llama/llama3)] [[model](https://huggingface.co/meta-llama)]
- [paper - 110B)]
- [paper - 6659360b33528ced941e557f)]
- [paper - llama)]
- [paper - 6B/blob/main/README.md)] [[model](https://huggingface.co/THUDM/chatglm-6b)]
- [paper
- [paper - 180B)] [[model](https://huggingface.co/tiiuae)]
- [paper
- [paper - 1_5)]
- [paper
- [paper
- [paper - llama/llama3)] [[model](https://huggingface.co/meta-llama)]
- [paper
- [paper - llama/llama3)] [[model](https://huggingface.co/meta-llama)]
💡 Fine-tuning
- [paper - tuning)]
- [paper
- [paper - tuning-v2)]
- [paper
- [paper
- [paper - scut/RLTF)]
- [paper
- [paper
- [paper
- [paper - scut/RLTF)]
- [paper
- [paper
📦 Libraries
🔧 Practice Project
- ![GitHub Repo stars - ai/DB-GPT-Hub/stargazers)
- last commit
- sqlcoder
- ![GitHub Repo stars - ai/sqlcoder/stargazers)
- last commit
- modal_finetune_sql
- ![GitHub Repo stars - llama/modal_finetune_sql/stargazers)
- last commit
- ![GitHub Repo stars - Efficient-Tuning/stargazers)
- last commit
- Datrics Text2SQL
- ![GitHub Repo stars - ai/text2sql/stargazers)
- last commit
🤝 Friendship Links
- eosphoros
- ![GitHub Repo stars - ai)
- last commit
- Awesome-AIGC-Tutorials
- ![GitHub Repo stars - agi/Awesome-AIGC-Tutorials/stargazers)
- last commit
- ![Star History Chart - history.com/#eosphoros-ai/Awesome-Text2SQL)
- ![Star History Chart - history.com/#eosphoros-ai/Awesome-Text2SQL)

Programming Languages

Python 34 Jupyter Notebook 4 Haskell 1 HTML 1 Makefile 1

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

Awesome-Text2SQL

📖 Survey

💪 Dataset

🔔 Leaderboard

💬 Classic Model

🔥 Base Model

💡 Fine-tuning

📦 Libraries

🔧 Practice Project

🤝 Friendship Links