Текст: Таша Ортис
В последнее время происходит все больше скандалов, связанных с нейросетями: от рисования расистского аниме до отмены стримеров за интерес к дипфейк-порно. Искусственный интеллект появился в нашей жизни еще в прошлом веке и сейчас окружает повсюду: когда мы ищем слово в гугл-переводчике, используем умную колонку или попадаем на таргетированную рекламу в соцсетях. Но несколько лет назад нейросети перестали быть фоновыми помощниками, превратившись чуть ли не в угрозу человечеству и конкурентов в борьбе за рабочие места. Или нет? Чтобы сделать вывод, нужно как следует разобраться в теме (если вы еще не).
Что вообще умеют нейросети? ChatGPT, к примеру, может вести диалог с пользователем и составлять осмысленные тексты, сделать выжимку из литературы, придумать сценарий тиктока или предложить рецепт пасты. Всеобщее внимание к чату привлек подробный рассказ в Твиттере студента РГГУ о том, как он защитил диплом, написанный чат-ботом за 23 часа. Это привело к возмущению не только в соцсетях, но и в Госдуме, где предложили аннулировать работу.
Нашлись и люди, поддержавшие Александра, предположившие, что навык работы с нейросетями для современного мира более ценен, чем умение написать диплом.
Увлекающийся новыми технологиями дизайнер Аммар Реши в качестве эксперимента создал детскую книжку для ребенка своих друзей. Книга целиком генерировалась с помощью искусственного интеллекта — ее текст создавал ChatGPT. Для иллюстраций Реши использовал Midjourney, тщательно отбирая из сотни изображений те тридцать, которые и вошли в книгу. Так появилась сказка про девочку, которая исследует технологии, — «Алиса и Искорка». Готовую книгу Реши опубликовал на Amazon, где выставил цену 9 долларов за бумажную версию. Весь процесс создания, от идеи до печати, занял 72 часа — Реши подробно описал алгоритм действий в Твиттере.
Это вызвало море негодования от писателей и художников. Главная претензия, как и прежде, была в том, что использование нейросетей для иллюстраций является кражей труда настоящих художников. Люди критиковали также и качество самого произведения: в тексте нашли много сюжетных дыр, а в иллюстрациях — типичные для нейросетей ляпы. Реши поблагодарил всех за мнение, объяснил, что в первую очередь хотел испытать возможности нейросетей, и обещал подробнее изучить вопрос.
Нейросети можно использовать не только для статичных изображений, но и для анимации: команда Corridor Digital (американская производственная студия, создающая вирусные ролики на тему поп-культуры) объединила работу Stable Diffusion, Dreambooth, Davinci Resolve и живых актеров, чтобы создать полноценный мультфильм. На ютуб-канале Corridor Crew можно посмотреть подробности.
При работе над новым видео Linkin Park художники Мацей Куциара и Pplpleasr также использовали искусственный интеллект. Клип приурочен к выходу юбилейного переиздания альбома Meteora и снят на не издававшуюся ранее песню с голосом покончившего с собой вокалиста Честера Беннингтона. Видео отсылает к другому рисованному клипу — Breaking the Habit. Тот целиком сделан с помощью классической анимации и, возможно, поэтому фанатам нравится больше.
Нейросети потребляют огромное количество информации, поэтому людей стал волновать вопрос: что же происходит с ней дальше? Небольшой скандал произошел вокруг нейросети Lensa от российских разработчиков Prisma Labs. Для получения изображения в нейронку нужно было загрузить 10–20 своих фото. Сама компания уверяет, что удаляет все загруженные фото спустя 24 часа, но пользователи стали беспокоиться о своих данных, разговоры шли даже о предоставлении российским властям данных для системы распознавания лиц.
В то же время других пользователей взволновала тема китайской цензуры и расизма от сайта Different Dimension Me и нейронки фоторедактора Meitu, которые превращали любое загруженное изображение человека в аниме-адаптацию.
Работа Different Dimension Me породила множество мемов: люди принялись заливать в нейросеть портреты Тесака и Леонида Каневского, а также высмеивать политический строй партии Китая: сайт не позволял создать аниме-версию Си Цзиньпина, что заставило юзеров вспомнить старый мем «на площади Тяньаньмэнь ничего не произошло» (данные о жестоко подавленной серии акций протеста на площади Тяньаньмэнь в Пекине тщательно цензурируются Коммунистической партией Китая).
Также люди быстро заметили, что ИИ чаще всего не в состоянии обработать фото человека с темным цветом кожи: в лучшем случае человек получал изображение белого персонажа. В худшем — результат мог быть непредсказуемым.
Позже алгоритмы Different Dimension Me изменились, и сейчас нейросеть работает в разы лучше.
Meitu с самого начала обходился без оскорбительных изображений, но неожиданные трактовки загруженных фото также присутствовали. Фурсона Тимоти Лири:
Легкость создания аниме-портретов не могла не привести к спекуляции: «Авито» наводнили одинаковые объявления с предложением изобразить заказчика за демократичные 200–300 рублей. Особого недовольства в среде художников это не вызвало, в отличие от работ нейросетей посложнее.
В начале 2022 года пользователей заворожила сеть Midjourney. Вслед за этим дебаты в интернете вызвала работа Джейсона Аллена, занявшая первое место в ярмарочном конкурсе изобразительного искусства. Как выяснилось после победы, картину автор не писал, а сгенерировал с помощью нейросетей и распечатал на холсте. Аллен несколько недель настраивал алгоритмы нейросети, чтобы «Театр пространственной оперы» вышел достаточно впечатляющим.
Недовольных художников сравнивают с луддитами. Но на самом деле проблема глубже, чем простой страх потерять работу.
Для обучения нейросетей используют огромное количество изображений, в том числе и стилизованные работы художников. На платформе Enpainter можно обработать фотографию в стиле творцов прошлого, таких как Ван Гог и Пикассо (правда, скачать понравившееся изображение можно только за деньги), а Artbreeder позволяет генерировать картинки в стиле современных сетевых художников, вводя их имена в текстовой промт. Авторское право не может распространяться на выработанный стиль, но распространяется на сами работы, используемые в ходе обучения ИИ. Вопрос лишь в том, как регулировать это законодательно.
В своем твиттере популярная художница Deb JJ Lee указывает на воровство своего стиля с помощью нейросетей.
Возвращаясь к луддитам, да, многие авторы действительно чувствуют, что их обкрадывают, воруя стиль, и что в будущем нейросети могут справляться с большинством задач художников. Даже в тематических сообществах, посвященных играм и сериалам, все чаще появляется созданный нейросетями фан-арт. А недавно разразился скандал на Artstation, одной из главных платформ для профессиональных художников. На сайте стали появляться сгенерированные нейросетями изображения, тесня работы настоящих авторов, потративших на их рисование десятки часов. Это не могло не вызвать ответную реакцию, сайт наполнился постами с протестным логотипом и гневными сообщениями. К слову, пока серьезная площадка для профессионалов и гейм-дизайнеров отмалчивалась, Fur Affinity — сайт с рисунками антропоморфных животных — запретил пользователям выкладывать сгенерированный арт в целях уважения к реальным авторам.
Протестами в интернете не ограничилось: в начале года группа художников (среди них Сара Андерсен, известная в интернете своими стилизованными жизненными комиксами) подала в суд на Stability AI, Midjourney, а также платформу DeviantArt, которая недавно создала свой генератор DreamUp.
Все три компании используют в своей работе огромную базу данных, включая изображения, защищенные авторским правом. И хотя представители Stability AI заявляют, что задействуют их на основании принципа добросовестного использования, истцы просят суд запретить нейросетям обрабатывать работы художников без согласия.
В отличие от нейросетей, обрабатывающих готовые фотографии, Midjourney работает в формате дискорд-бота (Discord — система обмена сообщениями), и для создания картинки боту следует отправить четкое текстовое описание на английском. От умения правильно сформулировать свою идею и зависит результат. Вместо полноценных предложений лучше использовать слова и короткие фразы через запятую, не перегружая запрос. Представьте, будто бы пытаетесь донести информацию до маленького ребенка, уговаривая того не пририсовывать вашему персонажу лишние конечности.
Помимо текстового промта, придется поработать и с остальными настройками: уровнем стилизации, разрешением изображения и скоростью генерации.
Дизайн одежды и аксессуаров Midjourney тоже под силу — вот нашумевшие цифровые кроссовки от Nike и Balmain в стиле рококо.
А вот такие обложки для нового Vogue Singapore создал Варун Гупта, художник, работающий с помощью нейросетей.
Другая популярная нейросеть, DALL-E, появилась в 2021 году, а год спустя разработчики представили более точный алгоритм — DALL-E 2. Доступ к рабочему пространству сайта можно получить по приглашению, и в начале проекта к нему было очень сложно присоединиться: по словам создателей, возможности нейросети настолько впечатляющие, что они опасаются создания дипфейков и провокаций.
Насколько хорошо работает DALL-E, пусть каждый решает сам, а пока что можно использовать его сильно упрощëнную версию — Craiyon. Но годится она в основном для развлечения и создания одновременно пугающих и смешных результатов. Чтобы получить картинку, нужно ввести короткое описание на английском в окошке для текста.
Что-то похожее пытались сделать в Сбербанке, когда создавали текстового бота ruDALL-E Malevich, но по какой-то причине результаты до сих пор выходят не только слабыми, но и скучными.
Если хочется потратить время на поиск идеальной иллюстрации, на помощь приходит практически полностью бесплатная сеть Artbreeder, которая генерирует портреты людей в разных стилях, изображения животных (настоящих и антропоморфных), абстрактные рисунки, концепт-арты и пейзажи. Ее функционал сложнее, зато поддается хорошей калибровке, позволяя редактировать получающиеся изображения.
Их можно создавать несколькими путями: с помощью ввода текста, рисования черновика, скрещивая стоковые фото или используя работы, сгенерированные другими пользователями сайта (или совмещая все эти приемы). Точности добавляет слайдер с параметрами AI, отвечающий за то, насколько вольно искусственный интеллект распорядится вашими данными, и Seed, элемент случайности, чтобы юзер не получал один и тот же результат (как, например, при использовании Meitu). В зависимости от потребностей под картинку можно добавить другие ползунки, в том числе от других пользователей.
Раньше результат работы можно было получить только в плохом качестве, но сейчас, благодаря Topaz Gigapixel AI, можно увеличить разрешение получившегося арта до 4к пикселей.
Если мы говорим об авторских правах художников на их творения, которые обрабатывает нейросеть, то что на счет лиц реальных людей? А если речь идет о порнографии?
Один из последних скандалов разразился после того, как зритель стримера Брэндона Atrioc Эвинга заметил у него на трансляции подозрительную вкладку. Оказалось, что Брэндон оформил подписку на сайт, где с помощью ИИ и дипфейков генерировались эротические видео и фото с его коллегами — молодыми девушками, работающими на Твиче. Стримерши осудили поведение Брэндона, и тот временно отошел от дел, а одна из них, QTCinderella, подала в суд на сам сайт.
Но если с дипфейками для большинства людей все очевидно, с компиляцией фото все сложнее.
Об успехах нейросетей в мире порнографии неискушенные пользователи узнали благодаря завирусившимся твитам юзера под ником Heartereum, и, судя по тегам в аккаунте с остальными его работами, изображения были созданы с помощью Stable Diffusion — программного обеспечения с открытым исходным кодом.
Один из самых жутких моментов — наблюдение пользователей о лицах моделей, которые выглядят очень юно, что наводит на мысли о возможном использовании нейросетью детских фото в генерации конечного изображения.
В декабре 2022 года краудфандинговая площадка Kickstarter ужесточила правила, касающиеся проектов, связанных с искусственным интеллектом, и запретила сбор средств на нейросеть Unstable Diffusion, которая позволила бы генерировать еще более откровенные изображения. В ответ на это разработчики выпустили довольно поэтичное заявление, сказав, что небольшой кучке противников инноваций их не запугать. Создатели Unstable Diffusion продолжают сбор средств и собираются выполнить все свои обещания по развитию нейросети. Пока что пробную версию можно тестировать в их дискорд-боте. Цензурные примеры работ Unstable Diffusion:
А вот другая эротик-нейронка pornpen.ai иногда выдает чистый хоррор. Кстати, о хорроре…
В такой таинственной области, как искусственный интеллект, не могло обойтись без интернет-легенд. Художница Стеф Суонсон, работающая в сети под ником Supercomposite, работала с нейросетью Stable Diffusion, отсылая запросы с отрицательным значением — в таком случае вместо использования текстовой подсказки ИИ пытается создать изображение, противоположное запросу. Если верить подробному рассказу в Твиттере, то, введя запрос «Брандо» и «минус один», художница получила расплывчатый логотип с надписью Digita pntics.
Художница предположила, что если ввести в запрос название полученного логотипа, то появится изображение Марлона Брандо, однако вместо актера ИИ сгенерировал изображение жуткой женщины — Лоаб.
Совмещение ее портретов с другими изображениями приводило к неуютным и зачастую кровавым результатам.
Картинки, полученные путем скрещивания получившихся хоррорных результатов и новых изображений, все еще оставляли в себе жуткие черты Лоаб.
Supercomposite объясняет феномен возникновения Лоаб наличием в нейросетях скрытого пространства: благодаря внесенным данным ИИ знает, как выглядят те или иные вещи, но, сталкиваясь с абстрактным запросом (в данном случае — придумать нечто противоположное фотографии Марлона Брандо или логотипу), вынужден обращаться к скрытым данным, буквально придумывая изображения из хаотичных образов. И, судя по всему, воображение у нейросетей богатое на ужасы.
Еще одного криптида создал стример Гай Келли, когда решил ввести в DALL-E выдуманное им слово — «крунгус». В результате нейросеть сгенерировала образ чудища и теперь генерирует этот же образ всякий раз, когда пользователи вводят слово «крунгус» в запрос.
Иногда даже на имеющихся данных ИИ может выстроить пугающий образ — вот так Midjourney представляет «перевал Дятлова».
Пугающие изображения можно создавать — и немерено. Тут пользователь Реддита дал нейросети подсказку в виде запроса «хоррор-игра» и продолжал генерировать варианты.
Недовольство большей части арт-комьюнити вовсе не означает, что все художники настроены радикально против искусственного интеллекта и не могут использовать его в своих целях. Нейросети могут избавить от долгого подбора референсов и повысить уровень понимания между художником и заказчиком, когда последний сможет создать черновой концепт-арт своими руками. Кто-то из художников предпочитает генерировать подмалевок под работу –– благо сделать это можно быстро, на ходу меняя детали и цвета. А ИИ на сайте ClipDrop поможет создать освещение на рисунке.
Дизайнеры часто используют уже упомянутые Midjourney и Artbreeder для генерации необходимых элементов. С помощью Fontjoy можно подобрать сочетающиеся между собой шрифты, а uKit создаст новый лендинг сайта. А еще можно зайти на WebScore, где искусственный интеллект покажет, насколько ваш сайт привлекателен для посетителей.
Да, вероятно, нас ждет большое количество изменений — и в законодательстве некоторых стран, и в сфере рынка художественных услуг. Жизнь становится все более прозрачной, корпорации и государство знают о нас все больше, и иногда это действительно косвенно приводит к негативным последствиям, таким как социальный рейтинг в Китае или розыск оппозиционеров по системе распознавания лиц в России. Но вот насчет рабочих мест паниковать пока рано: искусственный интеллект хоть и обучается с удивительной скоростью, но многие вещи еще вызывают у него сложности. Чтобы уметь создавать красивые изображения, все еще нужны люди с усидчивостью и вкусом, и неважно, с помощью чего они создают изображение — нейросети или фотошопа.