Как Nedra Digital научила нейросеть генерировать аэрофотоснимки для геологоразведки
Nedra Digital — российский разработчик и интегратор цифрового инженерного ПО для поиска, разработки и эксплуатации нефтегазовых месторождений. Решения Nedra Digital охватывают весь производственный цикл — от разведки до добычи — и создают для бизнеса единое пространство для данных, инженерных расчетов и экономических моделей.
Контекст: нюансы геологоразведки, где каждый пиксель — на вес золота
Геологоразведка — это не только поиск нефти, но и интерпретация тысяч квадратных километров сложного природного и техногенного ландшафта. Каждый объект — лес, болото, водоем или линейное сооружение — влияет на безопасность, сроки и стоимость будущей разработки месторождения.
Чтобы оценить стоимость рубки деревьев и спланировать прохождение профилей тяжелой техникой, нужны высокоточные снимки. В дальнейшем их будут интерпретировать вручную или с помощью компьютерного зрения (CV-моделей).
Первичные данные для анализа с помощью CV поступают из аэрофотосъемки и воздушно-лазерного сканирования. Но у этого подхода есть ограничения:
Снимки делаются редко
Причина в сезонности и высокой стоимости.
Разметка для работы CV трудозатратна
Все происходит в ручном режиме, медленно и требует эксперта.
Сложные объекты плохо распознаются
Например, сложные заболоченные регионы, мелкие извилистые протоки.
Ошибка работы модели может стоить дорого — приводить к росту затрат и в итоге оборачиваться миллиардами рублей упущенной выгоды или потерь. Проблема также в том, что каждая CV-модель создается под конкретный лицензионный участок. Новый лицензионный участок или изменение сезона в данных требует дообучения и адаптации модели. Искусственному интеллекту же для обучения нужны тысячи примеров, а не десятки. Перед командой встал выбор: либо снова запускать дорогостоящую съемку, либо мириться с низкой точностью моделей.
Nedra Digital пошла по третьему пути — создала данные, которых не существует в природе, но которые выглядят как настоящие. Так в 2025 году появилась система генерации синтетических аэрофотоснимков для дообучения CV-моделей в геологоразведке.
Вызов: как создать данные, которых нет
Команда Nedra Digital планировала научиться создавать синтетические аэрофотоснимки, которые выглядели бы как настоящие и при этом сохраняли правдоподобность. Такие данные должны восполнить дефицит обучающих примеров и повысить точность сегментации CV-моделей, которые используют в планировании геологоразведочных работ.
Но было несколько проблем:
Компоненты ландшафта — не шаблонные объекты
Болота, леса разной категории рубки, водоемы и другие примеры – уникальны. Все это осложняется сезонностью снимков.
Простая аугментация не помогает
Недостаточно просто сделать повороты и отражения прошлых снимков — нужно создавать новые сцены, а не копировать старые.
Промпты в SOTA-модели не работают
Если написать что-то вроде «болото в тайге», нейросеть сгенерирует что-то «похожее», но не корректное.
Инструменты
Команда использовала связку диффузионных моделей, LoRA и ControlNet, чтобы добиться сразу нескольких эффектов: «научить» модель стилю аэрофотосъемки, привязать генерацию к маске объекта (чтобы болото не «плавало» в воздухе) и автоматизировать создание промптов через LLM, чтобы они были разнообразными и детализированными.
Для этого команда использовала:
- Диффузионные модели (SDXL, Flux) — как основу генерации.
- LoRA (Low-Rank Adaptation) — для быстрой и дешевой донастройки под стиль аэрофотоснимки и природные объекты.
- ControlNet — чтобы привязать генерацию к конкретной маске (например, к контуру болота).
- LLM (GPT-neo, Phi-2, Qwen3 и др.) — для автоматического уточнения и обогащения текстовых промптов.
- Метрики FID, KID, LPIPS — чтобы оценивать качество изображений объективно, а не только «на глаз».
Nedra Digital не стремилась найти «лучшую модель» — задача заключалась в том, чтобы собрать рабочее решение в условиях жестких ограничений. Данных было мало, объекты отличались сложными формами, а требования к результату касались не внешней «красоты», а строгой структурной достоверности.
Эволюция подхода: от первых неудач к рабочему решению
Этап 1. От красивой картинки к структурной достоверности
Первые результаты выглядели эффектно, но для геологов были бесполезны: модель копировала стиль аэрофотоснимков, но не улавливала структуру. Без ручной разметки работа не продвигалась.
Ситуацию изменила интеграция ControlNet. Теперь модель получала маску объекта — например, контур болота — и заполняла ее текстурой и окружением. Это резко повысило структурную достоверность изображений и снизило недоверие экспертов.
Этап 2. Когда промпт стал инструментом, а не подсказкой
Сначала казалось, что описания вроде «водный объект на фоне леса» будет достаточно. Но генерация получалась однообразной, слишком шаблонной. Тогда команда запустила LLM (Qwen3-8B, Mistral-7B) для улучшения промптов.
Скрипт анализировал слабые места — недостаток деталей или двусмысленность — и дополнял инструкцию к генерации. В итоге изображения стали разнообразнее и реалистичнее, а метрики LPIPS и KID улучшились на 10–15 %.
Этап 3. Flux vs SDXL: цена и качество
При выборе моделей встал вопрос баланса. Flux обеспечивал потрясающую детализацию, но требовал мощных GPU и генерировал результат за 28 секунд. SDXL справлялся за 3 секунды (1xA100 40 Gb), но уступал в деталях.
Решение оказалось комбинированным: для массовой генерации и MVP использовали SDXL с LoRA, а Flux подключали только там, где нужна была максимальная точность.
Инсайт: в узкоспециализированных задачах важна не «самая крутая» модель, а правильная комбинация инструментов, которые позволяют достичь результата в реальных условиях.
Результаты и перспективы
Команда Nedra Digital добилась не просто роста точности моделей — они изменили логику работы с данными в геологоразведке.
- Рост датасета. Объем обучающих данных увеличился в 1000 раз за счет синтетических изображений.
- Качество моделей. Точность сегментации (IoU) выросла с 0,7 до 0,89 на валидационной выборке. Для сложных классов — мелких болот и извилистых протоков — качество повысилось на 35 % относительно исходной модели.
- Экономия ресурсов. Время подготовки данных сократилось с нескольких месяцев до нескольких дней, а затраты на новые аэрофотосъемки снизились на 70 %, поскольку отпала необходимость «летать ради данных».
Но главный результат — это смена самой логики работы:
Раньше
Собрать baseline CV-модели
Собрать данные
Аугментировать
Обучить CV-модель
Применить
Теперь:
Собрать baseline CV-модели
Взять маску объекта и описание
Адаптировать SDXL (+LoRA + ControlNet)
Сгенерировать данные
Дообучить модель
Обучить CV-модель
Применить
Этот сдвиг открывает перспективы: в будущем систему можно масштабировать на другие классы объектов, ускорять подготовку новых геологоразведочных проектов и делать процесс планирования еще более точным и предсказуемым, а значит — более экономически эффективным.
Инсайты и рекомендации
Не гонитесь за SOTA. В геологии важнее структурная достоверность, чем фотореализм. Иногда достаточно SDXL с LoRA, чтобы решить задачу.
Промпты — часть модели. Уделяйте им столько же внимания, сколько архитектуре. Автоматизация через LLM — ключ к масштабированию.
Метрики нужны, но не все. FID, KID, LPIPS помогают сравнивать модели, но финальное слово остается за экспертом: «А так бывает в природе?». Для генерации изображений вы приводите FID/KID/LPIPS. Это нормальные «общие» метрики, но для доменной достоверности они спорны: FID критикуется за несогласованность с человеческими оценками и слабую чувствительность к некоторым искажениям; в аэросъёмке фичи Inception/ImageNet не идеальны. Поэтому мы использовали специфичные для тематики оценки (например, топологическая непрерывность водных объектов, морфология береговой линии). Здесь важно слепое тестирование с геологами.
Генерация — это не замена, а усилитель. Синтетические данные не отменяют полевые работы, но позволяют быстрее тестировать гипотезы и дообучать модели.
Безопасность — не опция. Все данные, модели и промпты должны храниться в защищенном контуре. Использование открытых API для нефтегаза — это почти табу.
Планы по масштабированию
Следующий шаг для Nedra Digital — расширение системы на новые классы объектов: мониторинг нарушений при рубке леса, техногенные сооружения, категории рубки леса. Уже идут эксперименты с генерацией 3D-слоев — рельефа и высоты древостоя (в работе используется DepthAnythingV2). В перспективе команда намерена автоматизировать весь пайплайн: от маски объекта до готовой дообученной CV-модели.
Это первый кейс в отрасли, где генеративный AI используется не для визуализации, а для создания геологически корректных данных. Подход показал, что это может существенно сократить сроки подготовки, снизить затраты на полевые работы и повысить точность моделей.
Для нефтегазовой сферы это новое направление работы с данными, которое можно масштабировать и на другие задачи, где стоимость ошибок особенно высока.
Хотите решить похожую задачу?
Мы расскажем, с чего начать!