Как в «Юзтех» автоматизировали отбор кандидатов в базе из 300 000 резюме

Компания
Группа компаний «Юзтех» — разработчик IT-продуктов и сервисов, который помогает лидерам рынка на всех уровнях цифровизации больше 18 лет. Компания занимается оптимизацией и автоматизацией бизнес-процессов, реализацией сложных веб- и мобильных приложений, разработкой корпоративных хранилищ данных, созданием решений на основе машинного обучения и компьютерного зрения.


Апрель 2025
Рекрутинг
Инструменты
LLAMA 3
RAG

Задача

Автоматизировать поиск резюме с помощью AI и освободить HR-отдел от рутинной ручной сортировки кандидатов.

Контекст: как было до AI

В базе «Юзтех» более 300 000 резюме. HR-специалисты вручную загружали и просматривали анкеты, ориентировались на ключевые слова, опыт, навыки. Этот процесс отнимал часы. Особенно трудно было с поиском в смежных областях — например, Python-разработчиков и Data Scientists, где технологии могут совпадать, а специализация — быть совершенно разной.

Рутина тормозила эффективность. В итоге в «Юзтех» решили создать собственную систему AI-поиска резюме — внутренний сервис на базе LLM, способный воспринимать свободную форму запроса, различать профессиональные сообщества, выделять ключевые навыки и ранжировать подходящих кандидатов за секунды.

Как работает модель: учитываем запросы эйчара

Представьте, что HR-специалист может задать запрос в любой форме, например, «опытный разработчик Python». Или просто указать набор ключевых слов, таких как «data science, machine learning, TensorFlow».
Модуль обработки естественного языка проанализирует запрос, выделит ключевые навыки и компетенции. И поможет найти похожих кандидатов из базы резюме.

Чтобы такой подход работал, команда добавила этап аналитики резюме. Сервис проверяет его содержание, извлекает ключевые навыки, опыт работы, образование и другие важные параметры. А затем соотносит их с запросом от HR.

На основе этого анализа система ищет в своей базе данных кандидатов с максимально схожим профилем и предлагает HR-специалисту релевантный список альтернативных вариантов.

Решение устроено так:

Резюме или запрос
На вход подается запрос в свободной форме или резюме идеального кандидата для поиска похожего. Например, HR-специалист пишет запрос: «Ищу middle QA инженера с опытом от 1,5 лет в финтехе с умением логировать фронт и бэкенд. Умение корректно локализовать проблему в бизнес-логике приложения. Базовые знания любого языка программирования C#, Java, Kotlin, Swift, Python».

Парсер
Запрос обрабатывается, разделяется на блоки «опыт работы», «навыки», «языки программирования», «уровень позиции».
Классификация
Модуль обрабатывает запрос и определяет комьюнити — тестировщик. Также здесь происходит классификация по другим параметрам — грейдам и скиллам.
Выделение ключевых слов и эмбеддингов
Выделение ключевиков, использование векторов для слов, использование энкодеров из LLM. В нашем случае ключевые слова — middle QA, С#, Python, Kotlin, Swift.

Матчинг
Происходит матчинг по ключевым словам, по эмбеддингам.
LLM
Использование opensource LLM, далее RАG, пост-обработка. На выходе HR-специалист получает список кандидатов, подходящих под запрос.
Интерфейс решения

Сложности с профилями 1С: один стек — три профессии

Во время теста системы возникли проблемы с разработчиками 1С. Выяснилось, что их профессиональный бэкграунд неоднороден. Многие не имеют программистского или математического образования, а их опыт работы сложно классифицировать. Ситуация осложняется тем, что в комьюнити 1С представлены не только разработчики, но и аналитики, и даже архитекторы. Чтобы решение работало успешно, команда создала специализированную модель, учитывающую специфику этого нестандартного комьюнити.

Что внутри системы: стек и логика работы

Бустинговые модели для определения специализации и грейда
Сначала были эксперименты с моделями на основе LLM, но они часто выдавали некорректные ответы. В итоге решили взять бустинговые модели.

Методы, основанные на TFIDF для поиска
Команда придумала способ определения комьюнити, к которому может принадлежать кандидат. Концепция сообщества помогла сузить область поиска подходящих кандидатов. Чтобы выдача была корректной, выбрали метод TFIDF.

LLAMA 3 для уточнения ранжирования и вывода информации о кандидате
Сделали выбор в пользу LLAMA 3, основываясь на размере и качестве модели. Большие LLM требуют значительных вычислительных ресурсов, это может стать препятствием для их использования в малых и средних компаниях. А модель от «Юзтеха» может быть локально установлена на платформе без вложений в железо.

Результаты

Модель за несколько секунд выдает 100 релевантных резюме, найденных в базе из 300 000 кандидатов. А рутинные операции HR-команды и поиск сократились более чем на 70%.

Заменит ли модель HR-специалистов

Несмотря на достижения в автоматизации и точности подбора, полностью заменить HR-специалиста невозможно. Подбор персонала — это не только про резюме и навыки, но и про человечность: эмпатию, интуицию, понимание мотивации кандидата. Искусственный интеллект пока не способен воспроизвести эмоциональный интеллект и гибкость, с которыми работает опытный рекрутер.

Планы

Команда планирует добавить возможность поиска не только IT-специалистов, но и кандидатов из других отраслей — например, металлургов, сталеваров, учителей. Еще планируется реализовать интеллектуального ассистента для мгновенного назначения встреч с учетом загрузки HR-специалиста и возможностей кандидата.

Другие кейсы