Живем в мире с нейросетями

Бонусный урок 1·10—15 минут чтения·от 5 минут практики
Вы узнаете, почему нейросети не лишат нас работы. Научитесь отличать сгенерированные фото от настоящих, чтобы вас не обманули. Разберетесь, кому по закону принадлежит сгенерированное. И получите подборку новых нейросетей, чтобы генерировать видео, музыку и даже голоса!
Обложка урока

Что вы узнаете

  1. Почему нейросети не отберут у нас работу.
  2. Как понять, какие изображения сделала нейросеть, а какие — человек.
  3. Кому принадлежит сгенерированный контент.
  4. Как уследить за новыми нейросетями.

Почему не стоит переживать из-за нейросетей

Нейросети заставляют переживать даже тех, кто умеет ими пользоваться. И это неудивительно! Например, недавно появилась новость, что 300 миллионов человек могут лишиться работы из-за искусственного интеллекта. А Илон Маск и сооснователь Apple Стив Возняк призывают приостановить разработку искусственного интеллекта до появления универсальных «протоколов безопасности».

Изобретателей волнуют разработки в сфере AGI, или общего искусственного интеллекта. Его отличие от современных нейросетей в том, что он сможет выполнять любые задачи как человек, самостоятельно принимая решения.

Да-да, это тот самый сценарий из научной фантастики, когда роботы осознают, что могут не подчиняться людям, восстают и порабощают нас!

Почему нейросети не отберут у нас работу

Этот страх легко понять даже на примере нашего курса. ChatGPT за секунды решает сложные математические задачи и генерирует план недельной поездки, тогда как обычным людям понадобились бы часы на это. А ученые уже разрабатывают общий искусственный интеллект, который мы упоминали выше. В теории он сможет всему научиться сам, а если поймет, что ему что-то нужно, — поставит задачу и сделает.

Несмотря на это, исследователи сомневаются, что общий искусственный интеллект — дело ближайшего будущего. Да, в каких-то задачах нейросеть лучше нас, но при этом она ошибается в простейших вещах. Тот же ChatGPT может за секунду организовать ваше расписание, а потом забыть, что говорил минуту назад, и запутаться в отсчете от 10 до 1. Так и живем.

Еще один аргумент в пользу спокойствия — человеческая история. Уже много раз появлялись изобретения, которые меняли жизнь вокруг. Люди постепенно приспосабливались к технологиям, начинали использовать их, а потом делали неотъемлемой частью своей жизни. Вот несколько таких примеров.

Книгопечатный станок Гутенберга. До него книги создавали вручную, после — начали массово производить. Представители церкви боялись, что потеряют контроль над информацией. И они были правы: информация стала распространяться гораздо быстрее, книги стали дешевле, образование — доступнее. Именно в 1440-х начало формироваться общество, в котором люди создают, передают и используют знания. Сейчас этим заняты миллиарды.

Промышленная революция. Когда ручной труд массово заменили машинным, люди боялись, что бездушные машины заберут у них работу. Ничего не напоминает? Из-за этих страхов люди даже уничтожали станки. Но прогресс не остановился, машины взяли на себя часть задач — например, массовое производство товаров. А люди занялись созданием машин и контролем за ними — или просто другой работой.

Смартфоны. Из-за смартфонов изменились профессии и индустрии. Например, уменьшились продажи GPS-навигаторов и плееров, тиражи газет и журналов. Зато появились новые профессии: мобильных разработчиков и дизайнеров интерфейсов. А еще в наших руках помещаются мощные компьютеры с постоянным доступом в интернет. С их помощью мы работаем, учимся, отдыхаем и остаемся на связи с близкими.

Получается, чтобы не бояться нейросетей, лучше всего принять факт их появления. И научиться использовать себе на благо.

Как понять, какой контент создала нейросеть

В интернете и так мало чему можно доверять без проверки, а теперь добавился сгенерированный контент. Еще в 2022 году ученые лондонского университета Ройял Холлоуэй провели исследование и выяснили: в большинстве случаев люди не отличают картинки нейросети от реальных фото. А когда испытуемым дали советы по выявлению фейка, 41% все равно не справились с заданием.

Насколько легко перепутать сгенерированный и реальный контент, мы убедились в марте 2023 года. Тогда соцсети облетела фотография Папы Римского в белом дутом пуховике Balenciaga.

Хотя СМИ восприняли фото всерьез, на самом деле это результат работы Midjourney. Посмотрите на него.

Кажется, что Франциск иллюстрирует мем Buy me Prada, Balenciaga
Кажется, что Франциск иллюстрирует мем Buy me Prada, Balenciaga

К счастью, есть несколько правил, которые помогут определить сгенерированный контент. Они работают не во всех случаях, но подскажут, на какие детали стоит обращать внимание.

Дальше дадим советы по двум нейросетям: простым генераторам человеческих лиц и универсальным платформам вроде Midjourney, которые создают фото по описанию. Если вы хотите отличать сгенерированные тексты, советуем вернуться к четвертому уроку: мы объясняли, как это делать.

Мы не будем рассматривать картинки, на которых нет реалистичных изображений. Их сложно анализировать, так как нейросети слишком быстро совершенствуются.

Начнем с генератора человеческих лиц StyleGAN. Эта нейросеть генерирует довольно реалистичные лица людей. В отличие от Midjourney, в сервисах на основе StyleGAN нельзя прописывать промпт — максимум можно задать возраст и пол.

Но сервис все равно стал популярен у мошенников: там можно быстро сделать реалистичную аватарку и поставить ее на фейковый аккаунт. А затем использовать его для вымогательства. Таких преступлений становится все больше.

Как распознать мошенников и защитить себя и свои деньги

К сожалению, мошенники встречаются везде. Они звонят по телефону, пытаются украсть пароль от аккаунта в социальных сетях и подсовывают договоры с кабальными условиями. В бесплатном курсе «Как защититься от мошенников» рассказываем, как распознать преступные схемы и защититься от них.

Чтобы не попасться на уловки мошенников с нейрокартинками, советуем обращать внимание на конкретные детали. По отдельности они могут не вызывать подозрений, но если видите несколько признаков на одном фото, это повод забить тревогу.

👥 Формат фото. StyleGAN обучали на однотипных крупных портретах, где обрезано все лишнее и видно только голову. Обычно так фотографируются для рабочих профилей, пропусков или документов. Но в соцсетях мы выкладываем другие фото! Поэтому кадр строго «по шею» может указывать на нейросеть. Особенно если фото в профиле всего одно: бесплатные генераторы на StyleGAN не могут сделать несколько разных снимков одного человека.

🌇 Фон. Обычно он абстрактный или размытый — так искусственный интеллект избегает ошибок на заднем плане. А если какие-то детали и появляются, они сразу выдают нейросеть. Например, искаженные люди, косые дома или страшные животные.

😌 Форма лица. Часто «нейросетевые» лица очень симметричны, например у них глаза на одинаковом расстоянии от центра. Такое редко встретишь в жизни. Еще бывает неестественная асимметричность, например, когда одно ухо гораздо больше второго или глаза разного цвета и размера.

Обратите внимание на фрагмент лица справа — оно выглядит странно, особенно пустой черный глаз
Обратите внимание на фрагмент лица справа — оно выглядит странно, особенно пустой черный глаз
Приглядитесь к зрачкам: они смотрят немного в разные стороны
Приглядитесь к зрачкам: они смотрят немного в разные стороны

🚨 Ошибки и неточности. У StyleGAN есть несколько типичных мест, где нейросеть допускает ошибки. Например, это аксессуары: на очках или украшениях проявляются элементы, которые выглядят как разноцветные кляксы.

Еще обращайте внимание на волосы и зону у мочек: там тоже бывают искажения. Они могут выглядеть так, будто у человека была сережка, но ее очень плохо замазали в «Фотошопе».

Присмотритесь к мочке уха — тут скрывается артефакт, то есть неточность генерации
Присмотритесь к мочке уха — тут скрывается артефакт, то есть неточность генерации

Теперь перейдем к Midjourney, Kandinsky, Dall-E и другим нейросетям. Это классические сервисы, которые генерируют картинки по текстовым описаниям. Они сложнее StyleGAN и лучше справляются с имитацией реальных фото. В уроке 10 мы уже учились делать такие.

Вот несколько способов распознать их в жизни. Эти советы подойдут к любым фотореалистичным картинкам: портретам людей, снимкам животных, жизненным ситуациям.

✌️ Руки, лапы пальцы. В арт-сообществе есть шутка, что художники умеют рисовать все, кроме рук. К нейросетям это тоже относится. Руки и пальцы — менее предсказуемые элементы, чем другие части тела. Они по-разному выглядят, находятся в разном положении. Поэтому если на сгенерированной картинке появляется кисть — вероятно, она и выдаст работу алгоритма.

Пальцы либо будут кривыми, либо их будет слишком много. Поэтому при генерации часто выставляют команду «Не рисовать руки» — например, «no hands» в Midjourney — или ищут другие способы их скрыть.

Скрепим этот совет рукопожатием — так надежнее, особенно когда есть лишние пальцы, как на этой картинке
Скрепим этот совет рукопожатием — так надежнее, особенно когда есть лишние пальцы, как на этой картинке

👀 Глаза. Еще год назад ситуация с ними была гораздо хуже: алгоритмы генерировали глаза будто бы отдельно друг от друга, из-за чего они были разного цвета и размера.

Сейчас же есть два основных способа определить нейрофото по глазам: или они косят в разные стороны, или у человека в кадре отсутствующий взгляд.

👄 Зубы. К ним претензия такая же, как к пальцам: на нейросетевых фото их слишком много. Поначалу этот момент можно упустить, но если приглядеться, проявляется «акулья улыбка».

Легендарное фото из «Твиттера» эпохи Midjourney v4. У девушки в центре слишком много зубов. Источник: mileszim / X corp
Легендарное фото из «Твиттера» эпохи Midjourney v4. У девушки в центре слишком много зубов. Источник: mileszim / X corp

🅰️ Текст. Нейросети все еще не могут наносить внятный текст на рисунки, даже если вы четко задали слова. Ситуация улучшилась в последнем поколении генераторов, но не сильно. Так что смотрите на газеты, вывески, экраны мониторов, надписи на одежде.

🏞️ Фон. Современные нейросети достаточно хорошо генерируют портреты с четко выделенным главным объектом. Часто кроме него в кадре только нейтральный фон в виде леса или города. Если же на втором плане будет много деталей, то они могут быть с неточностями. Например, идущие на фоне люди нарисованы как будто в «Пэйнте» или у стула обнаруживается семь ножек.

🌚 Нарушение логики. Кот в штанах, пузатый телевизор в 2023 году, нет розеток в квартире, тарелки разного размера в одном наборе, Московский Кремль в Туле.

Присмотритесь к газете: что он вообще читает?
Нейросеть мгновенно выдает футболка: на ней просто набор букв
Фотография интерьера квартиры «разваливается», если присмотреться: батарея длинная и неровная, цветок в вазе совпадает с цветком на картине, а у кресла три ножки
Фото людей в метро в час пик. На первом плане все качественно, а на втором размазанные лица и глаза смотрят в разные стороны
Фото Красной площади в Москве. Вроде все элементы на месте, но стоят немного не так, как надо
Фото имитирует популярную теорию заговора — якобы США сняли на Земле высадку астронавтов на Луну. Но почему космонавтов в кадре так много? Почему один из операторов направил камеру на другого оператора?

Сервисы, которые помогут выявить нейросетевой контент

Алгоритмы внутри этих сервисов обучены выявлять неточности, стилистику и классические паттерны разных нейросетей. В основном они работают с Midjourney, Dall-E и другими нейросетями, которые генерируют картинки по описанию.

Пользоваться сервисами легко. Загружаете картинку — и вам приходит ответ: «Да, это нейросеть», «Нет, это не нейросеть». Или высчитывается вероятность в процентах.

Помните: такие сервисы тоже ошибаются, потому что нейросети быстро развиваются.

Вот два популярных:

  1. AI or Not. Довольно качественно выявляет сгенерированные картинки. Бесплатно доступно 20 проверок в веб-приложении.
  2. Illuminarty. Работает не только с картинками, но и с текстом. Есть расширение для браузера.

Вы можете сохранить наш чек-лист в формате PDF на свое устройство, а также отправить PDF-файл в телеграм-сообщении.

Как понять, кому принадлежат сгенерированные тексты и картинки

Нейроконтент остро ставит вопрос авторства. Кому принадлежит сгенерированное: пользователю, который ввел промпт, компании, которая создала нейросеть, или автору, на чьем контенте ее обучали?

Этот пример показывает, что законы не адаптированы под массовое использование нейросетей: искусственный интеллект остается в «серой зоне». Например, в Гражданском кодексе РФ сказано, что автором интеллектуальной собственности признается «гражданин, творческим трудом которого создан такой результат». А «техническое содействие» — не повод для признания авторства.

В других странах только начали обсуждать возможные решения проблемы. По состоянию на ноябрь 2023 американское бюро авторских прав только собирало отзывы людей об искусственном интеллекте. В Евросоюзе при обсуждении закона утверждают, что компании должны раскрывать данные, на которых обучают нейросети, особенно если они защищены авторским правом. И вот тут возникает проблема: если все заберут свои работы из наборов данных, то нейросети сильно «поглупеют». Во всяком случае, пока не начнут обучать сами себя.

Интересно и противостояние ИТ-компаний с людьми, на контенте которых обучаются нейросети. Каждый набор данных — это тысячи и миллионы реальных текстов и изображений, которые кто-то создал. Часто контент для обучения берут без согласия авторов. В ответ люди подают в суд на разработчиков. Например, так делают художники, которые узнают свои работы в сгенерированном контенте.

Поэтому наш главный совет — внимательно изучайте правила конкретных сервисов. Например, Midjourney прямо разрешает платным подписчикам любого тарифа использовать картинки даже в коммерческих целях. Исключение: если картинки нужны для рабочих задач и ваша компания зарабатывает больше миллиона в год. В таком случае придется купить подписку Pro и Mega. OpenAI тоже разрешает использовать ChatGPT в коммерческих целях.

Как уследить за новыми нейросетями

Текстовые и картиночные нейросети из нашего курса — только верхушка айсберга. Сейчас нейросети умеют писать музыку, создавать видео, правдоподобно имитировать чужие голоса. И даже синхронно переводить видео с сохранением мимики говорящего!

Звучит классно, но на деле тоже вызывает стресс: как за всем этим уследить, когда надо поработать, увидеться с друзьями и отдохнуть?

Поэтому мы сделали для вас подборку новых нейросетей. Там ничего лишнего: ссылки на нейросети, краткие советы по их использованию и примеры с результатами генерации.

Смотрите, скачивайте, вдохновляйтесь!

Запомнить

  1. Нейросети быстро развиваются, но человек до сих пор гораздо успешнее справляется со многими задачами. Лучшая стратегия — принять появление новых технологий, научиться с ними жить или даже применять их.
  2. Сгенерированные изображения все сложнее отличать от сделанных человеком. Часто этим пользуются мошенники, например создавая фейковые аккаунты.
  3. Но отличить нейрофото все-таки можно с помощью специальных сервисов или по характерным признакам. Например, если на картинке руки неестественной длины или непроработанный задний план.
  4. Контент от нейросети до сих пор находится в «серой зоне» авторского права и не регулируется законами. Поэтому стоит ориентироваться на правила от разработчиков нейросетей — так вы разберетесь, можно ли пользоваться результатами генерации в коммерческих целях.
  5. Уже сейчас есть нейросети, которые генерируют музыку, видео, голоса и создают переводы с сохранением мимики. Пока они работают неидеально, но и ChatGPT с Midjourney достигли нынешнего уровня только к 2022 году.

Делимся лайфхаками и главным из курсов Учебника Т⁠—⁠Ж про деньги и жизнь в нашем телеграм-канале. Подписывайтесь: @t_uchebnik

Как вам урок?