Главная
Кейсы
Nedra Digital и AI в геологоразведке

Октябрь 2025

Команда Nedra Digital

ИТ

Как Nedra Digital научила нейросеть генерировать аэрофотоснимки для геологоразведки

Nedra Digital — российский разработчик и интегратор цифрового инженерного ПО для поиска, разработки и эксплуатации нефтегазовых месторождений. Решения Nedra Digital охватывают весь производственный цикл — от разведки до добычи — и создают для бизнеса единое пространство для данных, инженерных расчетов и экономических моделей.

Контекст: нюансы геологоразведки, где каждый пиксель — на вес золота

Геологоразведка — это не только поиск нефти, но и интерпретация тысяч квадратных километров сложного природного и техногенного ландшафта. Каждый объект — лес, болото, водоем или линейное сооружение — влияет на безопасность, сроки и стоимость будущей разработки месторождения.

Чтобы оценить стоимость рубки деревьев и спланировать прохождение профилей тяжелой техникой, нужны высокоточные снимки. В дальнейшем их будут интерпретировать вручную или с помощью компьютерного зрения (CV-моделей).

Первичные данные для анализа с помощью CV поступают из аэрофотосъемки и воздушно-лазерного сканирования. Но у этого подхода есть ограничения:

Снимки делаются редко

Причина в сезонности и высокой стоимости.

Разметка для работы CV трудозатратна

Все происходит в ручном режиме, медленно и требует эксперта.

Сложные объекты плохо распознаются

Например, сложные заболоченные регионы, мелкие извилистые протоки.

Ошибка работы модели может стоить дорого — приводить к росту затрат и в итоге оборачиваться миллиардами рублей упущенной выгоды или потерь. Проблема также в том, что каждая CV-модель создается под конкретный лицензионный участок. Новый лицензионный участок или изменение сезона в данных требует дообучения и адаптации модели. Искусственному интеллекту же для обучения нужны тысячи примеров, а не десятки. Перед командой встал выбор: либо снова запускать дорогостоящую съемку, либо мириться с низкой точностью моделей.

Nedra Digital пошла по третьему пути — создала данные, которых не существует в природе, но которые выглядят как настоящие. Так в 2025 году появилась система генерации синтетических аэрофотоснимков для дообучения CV-моделей в геологоразведке.

Вызов: как создать данные, которых нет

Команда Nedra Digital планировала научиться создавать синтетические аэрофотоснимки, которые выглядели бы как настоящие и при этом сохраняли правдоподобность. Такие данные должны восполнить дефицит обучающих примеров и повысить точность сегментации CV-моделей, которые используют в планировании геологоразведочных работ.

Но было несколько проблем:

Компоненты ландшафта — не шаблонные объекты

Болота, леса разной категории рубки, водоемы и другие примеры – уникальны. Все это осложняется сезонностью снимков.

Простая аугментация не помогает

Недостаточно просто сделать повороты и отражения прошлых снимков — нужно создавать новые сцены, а не копировать старые.

Промпты в SOTA-модели не работают

Если написать что-то вроде «болото в тайге», нейросеть сгенерирует что-то «похожее», но не корректное.

Инструменты

Команда использовала связку диффузионных моделей, LoRA и ControlNet, чтобы добиться сразу нескольких эффектов: «научить» модель стилю аэрофотосъемки, привязать генерацию к маске объекта (чтобы болото не «плавало» в воздухе) и автоматизировать создание промптов через LLM, чтобы они были разнообразными и детализированными.

Для этого команда использовала:

Диффузионные модели (SDXL, Flux) — как основу генерации.
LoRA (Low-Rank Adaptation) — для быстрой и дешевой донастройки под стиль аэрофотоснимки и природные объекты.
ControlNet — чтобы привязать генерацию к конкретной маске (например, к контуру болота).
LLM (GPT-neo, Phi-2, Qwen3 и др.) — для автоматического уточнения и обогащения текстовых промптов.
Метрики FID, KID, LPIPS — чтобы оценивать качество изображений объективно, а не только «на глаз».

Nedra Digital не стремилась найти «лучшую модель» — задача заключалась в том, чтобы собрать рабочее решение в условиях жестких ограничений. Данных было мало, объекты отличались сложными формами, а требования к результату касались не внешней «красоты», а строгой структурной достоверности.

Эволюция подхода: от первых неудач к рабочему решению

Этап 1. От красивой картинки к структурной достоверности

Первые результаты выглядели эффектно, но для геологов были бесполезны: модель копировала стиль аэрофотоснимков, но не улавливала структуру. Без ручной разметки работа не продвигалась.

Ситуацию изменила интеграция ControlNet. Теперь модель получала маску объекта — например, контур болота — и заполняла ее текстурой и окружением. Это резко повысило структурную достоверность изображений и снизило недоверие экспертов.

Этап 2. Когда промпт стал инструментом, а не подсказкой

Сначала казалось, что описания вроде «водный объект на фоне леса» будет достаточно. Но генерация получалась однообразной, слишком шаблонной. Тогда команда запустила LLM (Qwen3-8B, Mistral-7B) для улучшения промптов.

Скрипт анализировал слабые места — недостаток деталей или двусмысленность — и дополнял инструкцию к генерации. В итоге изображения стали разнообразнее и реалистичнее, а метрики LPIPS и KID улучшились на 10–15 %.

Этап 3. Flux vs SDXL: цена и качество

При выборе моделей встал вопрос баланса. Flux обеспечивал потрясающую детализацию, но требовал мощных GPU и генерировал результат за 28 секунд. SDXL справлялся за 3 секунды (1xA100 40 Gb), но уступал в деталях.

Решение оказалось комбинированным: для массовой генерации и MVP использовали SDXL с LoRA, а Flux подключали только там, где нужна была максимальная точность.

Инсайт: в узкоспециализированных задачах важна не «самая крутая» модель, а правильная комбинация инструментов, которые позволяют достичь результата в реальных условиях.

Результаты и перспективы

Команда Nedra Digital добилась не просто роста точности моделей — они изменили логику работы с данными в геологоразведке.

Рост датасета. Объем обучающих данных увеличился в 1000 раз за счет синтетических изображений.
Качество моделей. Точность сегментации (IoU) выросла с 0,7 до 0,89 на валидационной выборке. Для сложных классов — мелких болот и извилистых протоков — качество повысилось на 35 % относительно исходной модели.
Экономия ресурсов. Время подготовки данных сократилось с нескольких месяцев до нескольких дней, а затраты на новые аэрофотосъемки снизились на 70 %, поскольку отпала необходимость «летать ради данных».

Но главный результат — это смена самой логики работы:

Раньше

Собрать baseline CV-модели

Собрать данные

Аугментировать

Обучить CV-модель

Применить

Теперь:

Собрать baseline CV-модели

Взять маску объекта и описание

Адаптировать SDXL (+LoRA + ControlNet)

Сгенерировать данные

Дообучить модель

Обучить CV-модель

Применить

Этот сдвиг открывает перспективы: в будущем систему можно масштабировать на другие классы объектов, ускорять подготовку новых геологоразведочных проектов и делать процесс планирования еще более точным и предсказуемым, а значит — более экономически эффективным.

Инсайты и рекомендации

Не гонитесь за SOTA. В геологии важнее структурная достоверность, чем фотореализм. Иногда достаточно SDXL с LoRA, чтобы решить задачу.

Промпты — часть модели. Уделяйте им столько же внимания, сколько архитектуре. Автоматизация через LLM — ключ к масштабированию.

Метрики нужны, но не все. FID, KID, LPIPS помогают сравнивать модели, но финальное слово остается за экспертом: «А так бывает в природе?». Для генерации изображений вы приводите FID/KID/LPIPS. Это нормальные «общие» метрики, но для доменной достоверности они спорны: FID критикуется за несогласованность с человеческими оценками и слабую чувствительность к некоторым искажениям; в аэросъёмке фичи Inception/ImageNet не идеальны. Поэтому мы использовали специфичные для тематики оценки (например, топологическая непрерывность водных объектов, морфология береговой линии). Здесь важно слепое тестирование с геологами.

Генерация — это не замена, а усилитель. Синтетические данные не отменяют полевые работы, но позволяют быстрее тестировать гипотезы и дообучать модели.

Безопасность — не опция. Все данные, модели и промпты должны храниться в защищенном контуре. Использование открытых API для нефтегаза — это почти табу.

Планы по масштабированию

Следующий шаг для Nedra Digital — расширение системы на новые классы объектов: мониторинг нарушений при рубке леса, техногенные сооружения, категории рубки леса. Уже идут эксперименты с генерацией 3D-слоев — рельефа и высоты древостоя (в работе используется DepthAnythingV2). В перспективе команда намерена автоматизировать весь пайплайн: от маски объекта до готовой дообученной CV-модели.

Это первый кейс в отрасли, где генеративный AI используется не для визуализации, а для создания геологически корректных данных. Подход показал, что это может существенно сократить сроки подготовки, снизить затраты на полевые работы и повысить точность моделей.

Для нефтегазовой сферы это новое направление работы с данными, которое можно масштабировать и на другие задачи, где стоимость ошибок особенно высока.

Хотите решить похожую задачу?

Мы расскажем, с чего начать!

Другие кейсы

P7 и AI‑бот в техподдержке

Увеличение скорости ответа до 1 минуты

Zerocoder и нейрокопирайтер

AI‑контент для SEO‑блога: 30 → 300 публикаций и рост метрик

ВкусВилл и внутреннее AI‑предпринимательство

Хакатон, после которого запустили 26 проектов за 1,5 месяца