Инсайты и рекомендации
Не гонитесь за SOTA. В геологии важнее структурная достоверность, чем фотореализм. Иногда достаточно SDXL с LoRA, чтобы решить задачу.
Промпты — часть модели. Уделяйте им столько же внимания, сколько архитектуре. Автоматизация через LLM — ключ к масштабированию.
Метрики нужны, но не все. FID, KID, LPIPS помогают сравнивать модели, но финальное слово остается за экспертом: «А так бывает в природе?». Для генерации изображений вы приводите FID/KID/LPIPS. Это нормальные «общие» метрики, но для доменной достоверности они спорны: FID критикуется за несогласованность с человеческими оценками и слабую чувствительность к некоторым искажениям; в аэросъёмке фичи Inception/ImageNet не идеальны. Поэтому мы использовали специфичные для тематики оценки (например, топологическая непрерывность водных объектов, морфология береговой линии). Здесь важно слепое тестирование с геологами.
Генерация — это не замена, а усилитель. Синтетические данные не отменяют полевые работы, но позволяют быстрее тестировать гипотезы и дообучать модели.
Безопасность — не опция. Все данные, модели и промпты должны храниться в защищенном контуре. Использование открытых API для нефтегаза — это почти табу.