viral-press.

Объясняем, почему все об этом говорят

Распознать дипфейк на видео по пяти признакам расфокуса

Рынок синтетического видео вырос до состояния, когда любой пользователь с бесплатной моделью и видеокартой среднего сегмента собирает убедительную подделку за один вечер.

Распознать дипфейк на видео по пяти признакам расфокуса

Анатомия расфокуса: почему нейросети «плывут» на стыках кожи и волос

Любая модель замены лица работает по одной и той же схеме: алгоритм вырезает зону головы из исходного кадра, накладывает сгенерированное лицо и пытается сшить границы обратно. Именно на этом этапе сшивки и появляется тот самый «эффект ореола», который выдаёт подделку даже на статичном кадре.

Граница между лицом и волосами, ушами, шеей — самая проблемная зона. Если присмотреться к зоне у виска, где волосы касаются щеки, или к контуру подбородка, переходящему в шею, у дипфейка виден характерный мягкий ореол: пиксели вокруг границы размыты сильнее, чем остальная картинка. На исходном видео такой расфокус появляется только при настоящем движении камеры или motion blur, а у сгенерированного лица он «приклеен» к самому краю маски и не меняется при повороте головы.

«Ореол» по контуру лица — это первый сигнал, что перед вами результат работы алгоритма маскирования, а не реальная съёмка.

Минимальное разрешение, на котором этот признак читается уверенно, — 1080p. Ниже — начинает вмешиваться естественный шум сжатия, и граница становится нечитаемой. Для анализа лучше всего подходят исходники стримов, скачанные до пережатия платформой: алгоритмы YouTube и VK Video жмут лицо жёстче фона, и артефакты сшивки часто исчезают вместе с деталями кожи.

Зона проверкиЧто искатьПочему появляется
Висок, линия роста волосМягкий «светящийся» контур шириной 1–3 пикселяАлгоритм пытается сгладить резкую границу маски
УшиКонтур уха размыт, пропадают детали раковиныМаска часто не покрывает уши, и они остаются от исходного лица
Шея и подбородок«Ступенька» между текстурами кожи лица и шеиРазные модели лица и шеи имеют разную резкость после блендинга

Если ореол стабилен при повороте головы — это почти гарантированная подмена. На реальном видео при смене ракурса фокус перераспределяется, и граница волос-щеки каждый раз выглядит чуть иначе. У дипфейка перераспределения нет: маска остаётся «наклеенной» с одним и тем же сглаживанием.

Эффект «фарфоровой маски»: распознаем избыточную гладкость и потерю текстуры

Второй по надёжности маркер — текстура кожи. Нейросети обучены на тысячах лиц с разной степенью детализации, но при генерации они стремятся к некоему «усреднённому» идеалу: ровный тон, отсутствие пор, минимальная микроморщинистость. Результат выглядит как ретушь в фотошопе уровня «пластиковый манекен».

При просмотре ролика в 1080p на экране ноутбука или телевизора этот эффект часто не бросается в глаза — зритель видит «хорошую картинку». Но стоит поставить видео на паузу и приблизить зону скулы или лба, разница становится очевидной. У живого человека с хорошим светом и камерой видны поры, мелкие родинки, иногда пушковые волосы. У дипфейка кожа выглядит однородно гладкой, как яичная скорлупа, причём вне зависимости от заявленного «разрешения исходника».

Отсутствие пор на коже при идеально ровном тоне — признак генерации, а не качественной съёмки.

Важный нюанс: настоящее видео с сильным бьюти-фильтром (те самые сглаживания в Instagram и TikTok) тоже убирает поры. Отличие — в стабильности. Фильтр работает по всему кадру одинаково, и кожа размывается вместе с волосами, одеждой, фоном. У дипфейка «заблюрена» только зона сгенерированного лица, а волосы и шея рядом остаются в нормальной резкости. Это создаёт странный эффект «островка»: голова как из другого ролика.

Для быстрой проверки этого признака эксперты MIT Media Lab ещё в 2023 году предлагали простой приём — смотреть на зону под глазами. Здесь текстура кожи наиболее тонкая и неравномерная, и алгоритмам сложнее всего её воспроизвести. Если под глазами у человека абсолютная гладкость, а на лбу видны морщины — это либо чудовищный фильтр, либо лицо на этом кадре сгенерировано.

Технический сбой в ротовой полости: аномалии зубов и языка при активной речи

Рот — самое проблемное место для любой модели генерации видео. Зубы, язык, внутренняя поверхность щёк постоянно двигаются, перекрываются, меняют форму быстрее, чем алгоритм успевает пересчитать кадр. На скорости 30–60 кадров в секунду это создаёт специфические артефакты, которые почти невозможно подделать.

Главный визуальный сигнал — размытие внутренней части рта при разговоре. Зубы выглядят как единое светлое пятно без чётких границ между резцами, язык сливается с задней стенкой, иногда вообще пропадает на 1–2 кадра, а потом «появляется» обратно в другой позиции. Это не дефект сжатия видео — компрессия работает одинаково по всему кадру, и если зубы размыты, а серёжки или часы рядом в фокусе, проблема именно в генерации.

Размытые зубы при чётких украшениях и одежде рядом — почти гарантия того, что лицо на этом кадре сгенерировано.

Второй признак — «плывущая» геометрия зубов. На паузе видно, что у сгенерированного рта зубы каждый кадр немного разные: то между ними появляется щель, которой секунду назад не было, то меняется количество видимых зубов, то один резец внезапно вытягивается длиннее соседнего. У живого человека зубы при разговоре тоже двигаются, но их геометрия стабильна — это физический объект, а не пересчитываемая каждый кадр проекция.

На русскоязычном YouTube в 2024 году было несколько громких разоблачений, где блогеры с миллионными охватами выкладывали «обращения», где у говорящего человека зубы буквально сливались в кашу при активной артикуляции. После волны репостов в профильных телеграм-каналах ролики снимались за час, но скриншоты уже разошлись по соцсетям. Урок простой: если у человека в кадре рот живёт своей жизнью — это повод поставить видео на паузу и проверить остальные четыре признака.

Секрет взгляда: как блики в зрачках выдают искусственную природу видео

Глаза — отдельная история. Алгоритмы генерации научились делать убедительные радужки и зрачки достаточно давно, но вот отражение света в них до сих пор остаётся узким местом. На реальной съёмке блик в зрачке — это отражение конкретного источника света (окно, софтбокс, экран монитора), и он выглядит одинаково в обоих глазах с поправкой на угол обзора.

У дипфейка эта физика ломается. Блики в левом и правом зрачке могут иметь разную форму, разную яркость, а иногда вообще разный цвет — один глаз отражает тёплый свет, второй холодный. При повороте головы настоящий блик плавно скользит по радужке, у сгенерированного лица он либо стоит на месте, либо прыгает рывком.

Разные блики в зрачках одного человека — это физически невозможная ситуация для реальной съёмки и почти обязательный признак подделки.

Второй глазной маркер — направление взгляда. На стоковых видео с дипфейками глаза часто смотрят «сквозь» зрителя: каждый зрачок нацелен в свою точку, создавая эффект лёгкого косоглазия. Это происходит потому, что алгоритм генерирует каждый глаз по отдельности, не сверяясь с физикой парной работы глазных мышц. В живой беседе человек смотрит в камеру обоими глазами, у сгенерированного лица «оба глаза в камеру» получается только в студийных моделях уровня Hollywood-производства.

Для экспресс-проверки этого признака есть приём: увеличить зону глаз и посмотреть на белое поле вокруг радужки. У живого человека склера имеет тонкие капиллярные прожилки, иногда едва заметные, иногда явные. У дипфейка склера часто выглядит как идеально белый фон без каких-либо текстурных деталей, особенно если исходное лицо для замены было снято с мягким светом.

Динамический парадокс: почему резкие повороты головы создают эффект двойного контура

Последний маркер проявляется только в движении, и именно поэтому его чаще всего пропускают. При резком повороте головы или быстром жесте рукой перед лицом края наложенной маски не успевают за исходным видео, и на 2–3 секунды вокруг лица появляется кратковременный «двойной контур» — ghosting, эффект расфокусированного второго лица под основным.

На паузе это выглядит как двоение: контур носа прорисован дважды со смещением в пару пикселей, линия брови слегка раздваивается, ухо выглядит «размазанным» по направлению движения. У живого человека при резком повороте тоже есть motion blur, но он симметричный и затрагивает всё лицо одинаково. У дипфейка двоение асимметрично — оно сильнее на той стороне лица, которая движется быстрее.

Эффект двойного контура при резком повороте — это «визитная карточка» алгоритмов маскирования, у каждой модели свой почерк двоения.

Чтобы поймать этот маркер, нужно смотреть не на само видео, а на его замедленные копии. Любой плеер умеет воспроизводить ролик на скорости 0.25x — этого достаточно, чтобы увидеть двоение на поворотах. Если в замедленном режиме ghosting виден при каждом резком движении — подделка почти гарантирована. Если голова двигается плавно и без артефактов — есть шанс, что перед вами либо оригинал, либо очень качественная модель уровня DeepFaceLab с ручной доводкой.

Стоит учитывать ограничения: при плохом исходном освещении или низком разрешении (ниже 480p) этот признак перестаёт работать — естественный шум и артефакты сжатия маскируют двоение, и даже реальное видео выглядит «размазанным». Поэтому для серьёзной проверки лучше требовать исходник в максимальном качестве, а не экранную копию из Telegram.

Все пять признаков выше работают только в комплексе. Один размытый зрачок или одна неровная граница волос ещё не означают подделку — это может быть дефект сжатия, плохой свет, дешёвая камера. Но если на одном ролике одновременно «фарфоровая» кожа, плывущие зубы, разные блики в глазах и двоение при повороте — это уже не совпадение, а инженерный почерк алгоритма. Для тех, кто работает с видеоконтентом профессионально — от модераторов платформ до SMM-щиков крупных брендов — этот набор признаков давно стал базовым фильтром перед тем, как пускать ролик в эфир. Тем, кто сталкивается с подозрительными видео эпизодически, полезно держать под рукой практический разбор типичных сценариев, где такие проверки применяются к новостным и бытовым кейсам. Главное правило остаётся одним и тем же: ни один визуальный маркер не даёт стопроцентной гарантии, но их совокупность за 30 секунд просмотра отсекает подавляющее большинство дешёвых подделок, которыми сегодня завалены соцсети.

Частые вопросы

Почему у дипфейков часто размыты зубы?
Зубы, язык и внутренняя поверхность рта постоянно меняют форму при речи, что затрудняет их точную генерацию нейросетью на высокой скорости.
Как отличить дипфейк от видео с бьюти-фильтром?
Бьюти-фильтр размывает весь кадр целиком, включая фон и одежду, тогда как дипфейк оставляет «заблюренной» только зону лица, создавая эффект островка.
Почему на видео с дипфейком видны разные блики в глазах?
Алгоритмы генерируют каждый глаз отдельно, не учитывая физику отражения света, поэтому блики могут различаться по форме, яркости или цвету.
В каком качестве видео лучше всего искать признаки дипфейка?
Для уверенного анализа требуется разрешение не ниже 1080p, так как при более низком качестве естественный шум сжатия скрывает артефакты генерации.
Что такое эффект двойного контура на видео?
Это кратковременное двоение краев лица при резких движениях, возникающее из-за того, что наложенная маска не успевает за исходным видео.