Projects

PRIME

Published: December 01, 2024

Scalable RL solution for advanced reasoning of language models.

UltraFeedback

Published: July 01, 2024

A large-scale, fine-grained, diverse preference dataset (and models).

The implementation and evaluation of Mistral-Interact, a powerful model that proactively assesses task vagueness, inquires user intentions, and refines them into actionable goals before starting downstream agent task execution.

OpenBackdoor

Published: September 17, 2022

NeurIPS 2022 Datasets & Benchmarks. The pipe of Openbackdoor toolkit:

Bingxiang He

Projects

PRIME

UltraFeedback

PRIME

OpenBackdoor