Ещё несколько лет назад превратить обычное фото в короткое видео можно было только вручную в профессиональном редакторе. Сегодня это делает искусственный интеллект — за десятки секунд и без единого навыка монтажа. Разберём, как это устроено.

Что происходит после загрузки фото

Когда вы загружаете снимок, нейросеть не «дорисовывает» движение наугад. Сначала она анализирует кадр:

  • находит фигуру и её контуры;
  • строит карту глубины — понимает, что ближе к камере, а что дальше;
  • определяет источники света и тени.

Эта карта — основа для всего, что происходит дальше.

Откуда берётся движение

Дальше в работу вступает генеративная модель. Она обучена на огромном количестве видео и «знает», как естественно двигаются объекты. Опираясь на карту глубины, модель достраивает промежуточные кадры так, чтобы движение выглядело плавным и физически правдоподобным.

Чем точнее исходное фото — хороший свет, чёткие контуры — тем убедительнее результат.

Почему это быстро

Раньше подобная обработка занимала часы на мощном компьютере. Современные модели запускаются на серверных видеокартах, а пользователю остаётся только дождаться готового результата — обычно меньше минуты.

Попробовать самому

UMBRA — это AI-студия прямо в Telegram: загрузите фото, выберите сценарий и получите результат за 30–60 секунд. Первая генерация — бесплатно.