Awesome evaluation Lists | Ecosyste.ms: Awesome

0 "evaluation" Awesome Lists

awesome-semantic-segmentation

:metal: awesome-semantic-segmentation

benchmark deeplearning evaluation semantic-segmentation

10,844 stars
2,470 forks
53 projects

Last updated: 03 Jul 2026

Awesome-LLM-Long-Context-Modeling

📰 Must-read papers and blogs on LLM based Long Context Modeling 🔥

agent awsome-list benchmark blogs compress evaluation large-language-models length-extrapolation llm long-context-modeling

2,146 stars
100 forks
1,902 projects

Last updated: 27 Jul 2026

awesome-llm-eval

Awesome-LLM-Eval: a curated list of tools, datasets/benchmark, demos, leaderboard, papers, docs and models, mainly for Evaluation on LLMs. 一个由工具、基准/数据、演示、排行榜和大模型等组成的精选列表，主要面向基础大模型评测，旨在探求生成式AI的技术边界.

awsome-list awsome-lists benchmark bert chatglm chatgpt dataset evaluation gpt3 large-language-model

647 stars
76 forks
479 projects

Last updated: 26 Jun 2026

awesome-llm-unlearning

A resource repository for machine unlearning in large language models

ai-safety alignment awesome awesome-list evaluation knowledge-erasure large-language-model llm llm-safety llm-unlearning

610 stars
32 forks
756 projects

Last updated: 14 Jul 2026

Awesome-Evaluation-of-Visual-Generation

A list of works on evaluation of visual generation models, including evaluation metrics, models, and systems

awesome benchmark evaluation evaluation-metrics evaluation-system generative-models image-generation video-generation

453 stars
25 forks
837 projects

Last updated: 03 Jul 2026

awesome-ai-leaderboard

A curated list of awesome leaderboard-oriented resources for AI domain

ai-agent artificial-intelligence awesome-list benchmark deep-learning evaluation foundation-model large-ai-model leaderboard machine-learning

369 stars
52 forks
554 projects

Last updated: 07 Jul 2026

awesome-data-contamination

The Paper List on Data Contamination for Large Language Models Evaluation.

awesome-list data-contamination evaluation foundation-models large-language-models llm paper-list pre-trained-language-models pre-trained-model

115 stars
6 forks
268 projects

Last updated: 03 Jun 2026

awesome-ai-eval

☑️ A curated list of tools, methods & platforms for evaluating AI reliability in real applications

ai-evaluation ai-evaluation-framework ai-evaluation-metrics ai-evaluation-tools awesome awesome-list awesome-lists chatgpt claude evaluation

93 stars
23 forks
186 projects

Last updated: 02 Jul 2026

awesome-ai-agent-testing

🤖 A curated list of resources for testing AI agents - frameworks, methodologies, benchmarks, tools, and best practices for ensuring reliable, safe, and effective autonomous AI systems

agent-evaluation agentic-ai ai-agents ai-benchmark ai-safety artificial-intelligence awesome-list benchmark chaos chaos-engineering

40 stars
13 forks
168 projects

Last updated: 13 Jun 2026

awesome-datacentric-llm

Trending projects & awesome papers about data-centric llm studies.

data-centric-ai evaluation llm pre-training

40 stars
2 forks
45 projects

Last updated: 07 Feb 2026

awesome-agent-rl-environments

A curated list of training & evaluation environments for LLM/VLM agents (SWE-Gym, GEM, RAGEN, AgentGym, WebArena, OSWorld, ToolBench…). Updated weekly.

agent agent-rl agentic-ai awesome awesome-list benchmark browser-agent computer-use-agent evaluation grpo

3 stars
0 forks
69 projects

Last updated: 25 May 2026

Keywords

awesome-list 4,378 awesome 3,919 awesome-lists 630 machine-learning 474 list 425 deep-learning 392 resources 334 ai 327 llm 278 hacktoberfest 231 python 231 lists 205 javascript 199 security 181 artificial-intelligence 176 open-source 160 programming 155 blockchain 146 computer-vision 146 large-language-models 133 nlp 128 tools 124 ai-agents 123 curated-list 122 data-science 114 react 110 chatgpt 110 mcp 104 android 98 natural-language-processing 93 devops 89 learning 89 linux 88 awesome-readme 86 developer-tools 85 cybersecurity 85 ios 83 reinforcement-learning 81 papers 81 awesome-resources 80 ethereum 76 css 76 openai 75 robotics 73 rust 69 kubernetes 67 nodejs 66 computer-science 65 generative-ai 64 collection 63 macos 62 survey 61 playground 61 design 61 ai-tools 60 game-development 60 golang 60 free-resources 59 java 58 datasets 58 claude-code 58 getvm 57 web3 57 privacy 56 hacking 55 bitcoin 54 frontend 54 php 54 automation 53 llms 52 claude 52 tutorial 51 prompt-engineering 51 go 50 swift 50 paper 49 web 49 education 49 free 49 github 48 gpt 48 tutorials 48 security-tools 47 data 47 agent 46 research 46 books 46 opensource 46 deep-neural-networks 45 cloud 45 development 45 typescript 45 cryptocurrency 45 dataset 45 api 44 productivity 44 data-visualization 43 html 43 agentic-ai 43 documentation 42 database 42 vue 41 gamedev 41 docker 41 diffusion-models 39 ml 39 collections 39 community 39 software 39 paper-list 38 game 37 web-development 37 agents 37 neural-network 36 iot 35 open-data 35 algorithms 35 testing 34 hands-on 34 aws 34 reactjs 34 courses 34 labex 34 rag 34 crypto 33 self-hosted 33 exercises 33 multimodal 33 hardware 33 anthropic 33 cpp 33 cli 33 flutter 33 software-engineering 32 skills 32 video 32 agent-skills 32 framework 32 react-native 31 defi 31 games 31 graph-neural-networks 31 solidity 31 penetration-testing 31 gemini 31 mlops 31 model-context-protocol 31 marketing 30 projects 30 libraries 30 transformer 30 bioinformatics 30 dotnet 29 prompts 29 ruby 29 microsoft 29 pentesting 29 architecture 29 csharp 28 reverse-engineering 28 saas 28 cryptography 28 mobile 28 smart-contracts 28 ai-agent 27 openclaw 27 tensorflow 27 music 27 angular 27 best-practices 27 object-detection 27 windows 27 slam 27 links 27 science 27 serverless 26 pytorch 26 osint 26 image-generation 26 data-analysis 26 library 26 self-supervised-learning 26 knowledge-graph 25 coding 25 git 25 3d 25 django 25 kotlin 25 nextjs 25 jobs 25 data-mining 25 seo 25 foundation-models 25 learning-resources 25 embedded 25 infosec 25 neural-networks 24 ui 24 devsecops 24 chatbot 24 markdown 24 mathematics 24 sql 24 awsome-list 24 computer-graphics 24 time-series 24 game-engine 23 autonomous-driving 23 interview 23 blog 23 roadmap 23 awesomeness 23 segmentation 23 audio 23 unity 23 chinese 23 mcp-server 23 engineering 23 reasoning 23 apple 23 deeplearning 22 networking 22 programming-language 22 c 22 python3 22 startup 22 federated-learning 22 startups 22 website 22 cloud-computing 22 visualization 22 llama 21 blogs 21 decentralized 21 graphql 21 awsome 21 video-generation 21 gpt-3 21 statistics 21 finance 21 r 21 monitoring 21 plugins 21 benchmark 21 software-development 21 hacktoberfest-accepted 21 apps 20 graph 20 cursor 20 mcp-servers 20 terminal 20 azure 20 deepseek 20 js 20 youtube 20 opendata 20 machinelearning 20 curated 20 text-to-image 19 llm-agents 19 backend 19 embodied-ai 19 langchain 19 speech-recognition 19 transformers 19 data-structures 19 big-data 19 optimization 19 raspberry-pi 19 vibe-coding 19 gpt-4 19 stable-diffusion 19 telegram 18 representation-learning 18 front-end 18 generative-art 18 bugbounty 18 ai-safety 18 prompt 18 cloud-native 18 autonomous-agents 18 laravel 18 guidelines 18 codex 18 aigc 18 swiftui 18 analytics 18 containers 17 pentest 17 data-engineering 17 nerf 17 bash 17 generative-model 17 cheatsheet 17 autonomous-vehicles 17 command-line 17 code 17 quantization 17 animation 17 dart 17 vlm 17 android-development 16 beginner-friendly 16 reddit 16 ros 16 language 16 large-language-model 16 malware-analysis 16 algorithm 16 gis 16 image-processing 16 claude-skills 16 multi-agent 16 distributed-systems 16 spain 16 bert 16 webgl 16 espana 16 microservices 16 knowledge 16 foss 16 articles 16 videos 16 art 15 react-components 15 vuejs 15 vscode 15 graphics 15 anomaly-detection 15 readme 15 resource 15 copilot 15 llmops 15 cms 15 gaming 15 pose-estimation 15 mllm 15 p2p 15 remote-sensing 15 databases 15 technology 15 multimodal-deep-learning 15 performance 15 evm 15 mysql 15 system-design 15 selfhosted 15 leetcode 15 code-generation 15 google 15 awesome-ai 15 multimodal-large-language-models 15 mac 14 npm 14 node 14 dotnet-core 14 generative-adversarial-network 14 software-libre 14 wasm 14 recommender-system 14 3d-graphics 14 frameworks 14 solana 14 webassembly 14 discord 14 podcast 14 detection 14 yolo 14 diffusion 14 drones 14 multimodal-learning 14 deep-reinforcement-learning 14 language-model 14 medical-imaging 14 vision-language-model 14 oss 14 ai-coding 14 android-library 14 icons 14 objective-c 13 svelte 13 cyber-security 13 automl 13 quantum-computing 13 unicorns 13 planning 13 transfer-learning 13 ui-design 13 rl 13 dapp 13 datos-abiertos 13 sysadmin 13 uav 13 threat-intelligence 13 infrastructure 13 ai-security 13 model-compression 13 wordpress 13 ctf 13 rest-api 13 webdevelopment 13 programming-languages 13 bug-bounty 13 ecommerce 13 trading 13 cicd 13 workflow 13 continual-learning 13 sre 13 utilities 13 interview-questions 13 observability 13 open-science 13 sustainability 13 gan 13 storage 13 application 13 microservice 13 search 13 pwa 13 edge-computing 13 semantic-segmentation 13 mobile-development 13 developer 13 privacy-tools 12 software-architecture 12 simulation 12 vector-database 12 minecraft 12 ai-art 12 graphics-programming 12 gpu 12 speech-to-text 12 ros2 12 guide 12 ux 12 fuzzing 12 static-site-generator 12 creative-coding 12 xai 12 search-engine 12 infrastructure-as-code 12 static-analysis 12 healthcare 12 email 12 time-series-analysis 12 compliance 12 image 12 rails 12 elasticsearch 12 web-design 12 cross-platform 12 vision-and-language 12 question-answering 12 webapp 12 neuroscience 12 article 12 chain-of-thought 12 cuda 12 machine-learning-algorithms 12 postgresql 12 es6 12 leadership 12 free-software 12 authentication 12 text-to-video 11 packages 11 podcasts 11 free-tutorials 11 elixir 11 fpga 11 swift-library 11 hosting 11 test-automation 11 qwen 11 anime 11 3d-reconstruction 11 unity3d 11 flutter-apps 11 evaluation 11 knowledge-base 11 writing 11 webpack 11 arduino 11 climate-change 11 few-shot-learning 11 movies 11 vulnerabilities 11 multi-agent-systems 11 geospatial 11 design-systems 11 vr 11 management 11 reading-list 11 hacktoberfest2020 11 math 11 lua 11 students 11 datascience 11 course 11

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome