Гід The Village«Так даже лучше»: Как выглядят известные минские здания, которые создала нейросеть, а не архитекторы
Дворец с функцией вертикального взлета и посадки
Весь мир носится с новой нейросетью MidJourney, которая рисует очень реалистичные картины по запросам пользователей. The Village Беларусь тоже протестировал «бездушную железку» и попросил ее нарисовать знаковые здания Минска.
MidJourney — это одновременно и название лаборатории, и название самой нейросети. Руководит проектом Дэвид Хольц. Совсем недавно наработки выложили в открытый доступ: теперь любой может воспользоваться ей и проверить, насколько искусственный интеллект прокачался в возможностях. Интернет тем временем визжит от восторга и заявляет, что услуги профессиональных художников больше не нужны: нейросеть нарисует не хуже, но куда быстрее и притом бесплатно (или за очень небольшую сумму).
Как это все работает? Сначала надо завести себе аккаунт на Discord — гибриде мессенджера и социальной сети. После этого подключить сервер MidJourney и через бота формировать ему запросы.
Бесплатно можно сгенерировать 25 картинок, причем на один запрос приходит сразу 4 предварительных результата — и вот это уже 4 из ваших 25 попыток. То есть, бесплатно можно получить до 6 картин в хорошем качестве и большом разрешении. Каждый предложенный нейросетью вариант можно улучшать, дорабатывать, «допиливать напильником». При этом добавляются новые детали, прорисовываются светотени, текстуры, — после доработки картина выглядит намного лучше. Если позволяют оставшиеся попытки, одну и ту же картину можно улучшать до бесконечности.
Мы проверили и MidJourney, и некоторые другие нейросети, которые умеют формировать изображения по запросам.
Вот так, по мнению MidJourney, выглядит «гиперреалистичное изображение Национальной Библиотеки в Минске»: четыре варианта на выбор.
Мы попросили нейросеть улучшить вариант номер три (слева внизу), и вот что из этого вышло. На наш взгляд, здание больше подошло бы Ашхабаду или другой столице в краю восточных диктатур, где любят стиль «дорого-мраморно-богато».
Попробуйте угадать, что вот это такое нарисовала сеть. Это могла быть и студия, где Азаренок раскручивает тайные пружины политики, и пустые этажи торгового центра «Столица», потому что Лукашенко поручил там продавать только беларуские товары. Но MidJourney считает, что именно так выглядит Dana Mall.
Попросив улучшить второе изображение, мы получили вот такую картину. Нейросеть зачем-то нарисовала потрескавшуюся плитку и дальние стены в духе мультика «Холодное сердце». Но хотя бы примерно угадала с цветом всего здания.
А что вот это за минский объект, вам точно не угадать. На самом деле запрос звучал так: «Несуразный огромный дом Чижа на набережной Свислочи в Минске». Хотя можно заподозрить, что мы ввели запросы «небоскребы клипарт скачать» или «День России в российской России».
Очевидно, более-менее запросу отвечала только четвертая картинка, — ее мы и попросили улучшить. На выходе получился дворцово-замковый комплекс со смесью готики и ампира среди пейзажного парка — а вот Свислочи и вовсе не видать.
А вот такие варианты нейросеть предложила по запросу «Дворец Независимости в Минске и вертолет Лукашенко неподалеку». Видно, что в варианте №2 искусственный интерллект MidJourney решил, что Лукашенко незачем иметь отдельный вертолет — пусть лучше сам дворец обладает функцией вертикального взлета и посадки.
По похожей системе работает нейросеть DALL-E, созданная американской компанией OpenAI (один из основателей — Илон Маск). Ее запустили в начале 2021-го, а в апреле этого года выкатили версию 2. Но испытать ее «здесь и сейчас» затруднительно: можно только оставить заявку на включение в список одижидания. Но можно протестировать первую версию и другие нейросети, созданные на ее основе.
Нейросеть Craiyon (в названии зашифровано слово crayon — «карандаш» и «ai» — «искусственный интеллект») работает на базе DALL-E-mini и, в принципе, тоже создает картинки по текстовым запросам. В отличие от MidJourney, тут результат выдачи более фотореалистичен: алгоритм обучался на сотнях миллионов реальных фотографий и текстовых описаний.
Вот так, например, нейросеть представляет себе Национальную библиотеку Беларуси. Несмотря на «вмятины» в поверхностях, в целом задние выглядит очень и очень узнаваемо.
А вот это, по версии Craiyon, Музей истории ВОВ. Его каноничный вид на фото — с лицевой стороны, с куполом. Но главный вход-то в музей расположен с обратной стороны — и вот этот обратный, но при этом главный вход получился узнаваемым. Только что скульптуры с солдатом не хватает.
Нейросеть ruDALL-E — это тот самый DALL-E, на которым поработали айтишники из российского «Сбера». У «русской Далле» есть разновидности «под Малевича» и «Под Кандинского».
Тут уже сложно сказать, на чем обучалась нейросеть, потому что на реальные минские здания нарисованные объекты похожи меньше всего, — почти как у MidJourney, — но детализация сильно отстает.
Вот это, например, Национальная библиотека Беларуси. С настоящей библиотекой ее роднит, пожалуй, только количество этажей.
А вот это дворец Независимости. В действительности он находится далеко от реки, но нейросеть решила, что лучше стоять прямо на берегу. Мало ли: жильцу придется убегать на катере.
Здесь на картинке — отель под народным названием «Некемпински», в котором нынче квартирует беларуская дочка «Сбера» — «Сбер банк». Голого бетона примерно столько же — но на этом сходство и заканчивается.
Ладно, этот объект можно угадать хотя бы по цвету. Да, это Красный костел. Архитектурный стиль, правда, совсем другой, но выглядит самобытно.
А завершим обзор этой нейросети вот такой картинкой. В окружении многоэтажек и троллейбусных проводов под названием, в котором можно разглядеть буквы «МЕДШЕКА», по версии российской нейросети нарисован ресторан «Поедем, поедим». Который на самом деле стоит у Куропатского леса.
The Village Беларусь три года назад уже рассказывал про эту нейросеть. Сервис называется GauGAN (созвучно с фамилией художника Гогена) и, по утверждениям, обучена примере миллиона фотографий с Flickr, причем только тех, что имеют открытую лицензию. Но работает она не по текстовому запросу, а по художественному. Надо прямо в окне графического редактора что-то нарисовать — а нейросеть уже потом попытается воссоздать из вашего «пэйнта» нормальное изображение. Сначала мы попытались нарисовать Красный костел, а потом — Ворота Минска на Привокзальной площади. А на основе нашего художества электронный «Гоген» (название нейросети созвучно фамилии художника) попытался восстановить «исходный» вид зданий.
Известный блогер Чилик показал в твиттере, как еще могли бы выглядеть минские здания, если бы их рисовали нейросети.