Projects in Awesome Lists tagged with safe-reinforcement-learning-from-human-feedback | Ecosyste.ms: Awesome

Projects in Awesome Lists tagged with safe-reinforcement-learning-from-human-feedback

A curated list of projects in awesome lists tagged with safe-reinforcement-learning-from-human-feedback .

- Recently synced
- Stars

https://github.com/pku-alignment/safe-rlhf

Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback

ai-safety alpaca beaver datasets deepspeed gpt large-language-models llama llm llms reinforcement-learning reinforcement-learning-from-human-feedback rlhf safe-reinforcement-learning safe-reinforcement-learning-from-human-feedback safe-rlhf safety transformer transformers vicuna

Last synced: 16 May 2025

https://github.com/PKU-Alignment/safe-rlhf

Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback

ai-safety alpaca beaver datasets deepspeed gpt large-language-models llama llm llms reinforcement-learning reinforcement-learning-from-human-feedback rlhf safe-reinforcement-learning safe-reinforcement-learning-from-human-feedback safe-rlhf safety transformer transformers vicuna

Last synced: 09 May 2025