Октябрь 2025
Команда Nedra Digital
ИТ
Как Nedra Digital научила нейросеть генерировать аэрофотоснимки для геологоразведки
Nedra Digital — российский разработчик и интегратор цифрового инженерного ПО для поиска, разработки и эксплуатации нефтегазовых месторождений. Решения Nedra Digital охватывают весь производственный цикл — от разведки до добычи — и создают для бизнеса единое пространство для данных, инженерных расчетов и экономических моделей.

Контекст: нюансы геологоразведки, где каждый пиксель — на вес золота

Геологоразведка — это не только поиск нефти, но и интерпретация тысяч квадратных километров сложного природного и техногенного ландшафта. Каждый объект — лес, болото, водоем или линейное сооружение — влияет на безопасность, сроки и стоимость будущей разработки месторождения.

Чтобы оценить стоимость рубки деревьев и спланировать прохождение профилей тяжелой техникой, нужны высокоточные снимки. В дальнейшем их будут интерпретировать вручную или с помощью компьютерного зрения (CV-моделей).

Первичные данные для анализа с помощью CV поступают из аэрофотосъемки и воздушно-лазерного сканирования. Но у этого подхода есть ограничения:
Снимки делаются редко
Причина в сезонности и высокой стоимости.
Разметка для работы CV трудозатратна
Все происходит в ручном режиме, медленно и требует эксперта.
Сложные объекты плохо распознаются
Например, сложные заболоченные регионы, мелкие извилистые протоки.
Ошибка работы модели может стоить дорого — приводить к росту затрат и в итоге оборачиваться миллиардами рублей упущенной выгоды или потерь. Проблема также в том, что каждая CV-модель создается под конкретный лицензионный участок. Новый лицензионный участок или изменение сезона в данных требует дообучения и адаптации модели. Искусственному интеллекту же для обучения нужны тысячи примеров, а не десятки. Перед командой встал выбор: либо снова запускать дорогостоящую съемку, либо мириться с низкой точностью моделей.

Nedra Digital пошла по третьему пути — создала данные, которых не существует в природе, но которые выглядят как настоящие. Так в 2025 году появилась система генерации синтетических аэрофотоснимков для дообучения CV-моделей в геологоразведке.

Вызов: как создать данные, которых нет

Команда Nedra Digital планировала научиться создавать синтетические аэрофотоснимки, которые выглядели бы как настоящие и при этом сохраняли правдоподобность. Такие данные должны восполнить дефицит обучающих примеров и повысить точность сегментации CV-моделей, которые используют в планировании геологоразведочных работ.

Но было несколько проблем:
Компоненты ландшафта не шаблонные объекты
Болота, леса разной категории рубки, водоемы и другие примеры – уникальны. Все это осложняется сезонностью снимков.
Простая аугментация не помогает
Недостаточно просто сделать повороты и отражения прошлых снимков — нужно создавать новые сцены, а не копировать старые.
Промпты в SOTA-модели не работают
Если написать что-то вроде «болото в тайге», нейросеть сгенерирует что-то «похожее», но не корректное.

Инструменты

Команда использовала связку диффузионных моделей, LoRA и ControlNet, чтобы добиться сразу нескольких эффектов: «научить» модель стилю аэрофотосъемки, привязать генерацию к маске объекта (чтобы болото не «плавало» в воздухе) и автоматизировать создание промптов через LLM, чтобы они были разнообразными и детализированными.

Для этого команда использовала:

  • Диффузионные модели (SDXL, Flux) — как основу генерации.
  • LoRA (Low-Rank Adaptation) — для быстрой и дешевой донастройки под стиль аэрофотоснимки и природные объекты.
  • ControlNet — чтобы привязать генерацию к конкретной маске (например, к контуру болота).
  • LLM (GPT-neo, Phi-2, Qwen3 и др.) — для автоматического уточнения и обогащения текстовых промптов.
  • Метрики FID, KID, LPIPS — чтобы оценивать качество изображений объективно, а не только «на глаз».

Nedra Digital не стремилась найти «лучшую модель» — задача заключалась в том, чтобы собрать рабочее решение в условиях жестких ограничений. Данных было мало, объекты отличались сложными формами, а требования к результату касались не внешней «красоты», а строгой структурной достоверности.

Эволюция подхода: от первых неудач к рабочему решению

Этап 1. От красивой картинки к структурной достоверности

Первые результаты выглядели эффектно, но для геологов были бесполезны: модель копировала стиль аэрофотоснимков, но не улавливала структуру. Без ручной разметки работа не продвигалась.

Ситуацию изменила интеграция ControlNet. Теперь модель получала маску объекта — например, контур болота — и заполняла ее текстурой и окружением. Это резко повысило структурную достоверность изображений и снизило недоверие экспертов.

Этап 2. Когда промпт стал инструментом, а не подсказкой

Сначала казалось, что описания вроде «водный объект на фоне леса» будет достаточно. Но генерация получалась однообразной, слишком шаблонной. Тогда команда запустила LLM (Qwen3-8B, Mistral-7B) для улучшения промптов.

Скрипт анализировал слабые места — недостаток деталей или двусмысленность — и дополнял инструкцию к генерации. В итоге изображения стали разнообразнее и реалистичнее, а метрики LPIPS и KID улучшились на 10–15 %.

Этап 3. Flux vs SDXL: цена и качество

При выборе моделей встал вопрос баланса. Flux обеспечивал потрясающую детализацию, но требовал мощных GPU и генерировал результат за 28 секунд. SDXL справлялся за 3 секунды (1xA100 40 Gb), но уступал в деталях.

Решение оказалось комбинированным: для массовой генерации и MVP использовали SDXL с LoRA, а Flux подключали только там, где нужна была максимальная точность.
Инсайт: в узкоспециализированных задачах важна не «самая крутая» модель, а правильная комбинация инструментов, которые позволяют достичь результата в реальных условиях.

Результаты и перспективы

Команда Nedra Digital добилась не просто роста точности моделей — они изменили логику работы с данными в геологоразведке.

  • Рост датасета. Объем обучающих данных увеличился в 1000 раз за счет синтетических изображений.
  • Качество моделей. Точность сегментации (IoU) выросла с 0,7 до 0,89 на валидационной выборке. Для сложных классов — мелких болот и извилистых протоков — качество повысилось на 35 % относительно исходной модели.
  • Экономия ресурсов. Время подготовки данных сократилось с нескольких месяцев до нескольких дней, а затраты на новые аэрофотосъемки снизились на 70 %, поскольку отпала необходимость «летать ради данных».

Но главный результат — это смена самой логики работы:
Раньше:
Собрать baseline CV-модели
Собрать данные
Аугментировать
Обучить CV-модель
Применить
Теперь:
Собрать baseline CV-модели
Взять маску объекта и описание
Адаптировать SDXL (+LoRA + ControlNet)
Сгенерировать данные
Дообучить модель
Обучить CV-модель
Применить
Этот сдвиг открывает перспективы: в будущем систему можно масштабировать на другие классы объектов, ускорять подготовку новых геологоразведочных проектов и делать процесс планирования еще более точным и предсказуемым, а значит более экономически эффективным.
Инсайты и рекомендации

Не гонитесь за SOTA. В геологии важнее структурная достоверность, чем фотореализм. Иногда достаточно SDXL с LoRA, чтобы решить задачу.

Промпты — часть модели. Уделяйте им столько же внимания, сколько архитектуре. Автоматизация через LLM — ключ к масштабированию.

Метрики нужны, но не все.  FID, KID, LPIPS помогают сравнивать модели, но финальное слово остается за экспертом: «А так бывает в природе?». Для генерации изображений вы приводите FID/KID/LPIPS. Это нормальные «общие» метрики, но для доменной достоверности они спорны: FID критикуется за несогласованность с человеческими оценками и слабую чувствительность к некоторым искажениям; в аэросъёмке фичи Inception/ImageNet не идеальны. Поэтому мы использовали специфичные для тематики оценки (например, топологическая непрерывность водных объектов, морфология береговой линии). Здесь важно слепое тестирование с геологами.

Генерация — это не замена, а усилитель. Синтетические данные не отменяют полевые работы, но позволяют быстрее тестировать гипотезы и дообучать модели.

Безопасность — не опция. Все данные, модели и промпты должны храниться в защищенном контуре. Использование открытых API для нефтегаза — это почти табу.

Планы по масштабированию

Следующий шаг для Nedra Digital — расширение системы на новые классы объектов: мониторинг нарушений при рубке леса, техногенные сооружения, категории рубки леса. Уже идут эксперименты с генерацией 3D-слоев — рельефа и высоты древостоя (в работе используется DepthAnythingV2). В перспективе команда намерена автоматизировать весь пайплайн: от маски объекта до готовой дообученной CV-модели.

Это первый кейс в отрасли, где генеративный AI используется не для визуализации, а для создания геологически корректных данных. Подход показал, что это может существенно сократить сроки подготовки, снизить затраты на полевые работы и повысить точность моделей.

Для нефтегазовой сферы это новое направление работы с данными, которое можно масштабировать и на другие задачи, где стоимость ошибок особенно высока.

Хотите решить похожую задачу? Мы расскажем, с чего начать!

Другие кейсы