С языковыми моделями любая ошибка может стоить дорого, а на кону часто стоит репутация компании.
Например, недавно мы проверяли поведение LLM/SLM, RAG-систем и AI-агентов на соответствие законодательству РФ и внутренней политике компании.
- Для каждого промта важно было учесть 40 (!) типологий.
- За 2 месяца пришлось обработать 20 000 кейсов.
Поэтому эффективный Red Teaming невозможен без опыта и методологии.