banner banner banner
Рисуем на пару с нейросетью! Создаем шедевры фотографии, живописи, рисунка
Рисуем на пару с нейросетью! Создаем шедевры фотографии, живописи, рисунка
Оценить:
Рейтинг: 0

Полная версия:

Рисуем на пару с нейросетью! Создаем шедевры фотографии, живописи, рисунка

скачать книгу бесплатно


«Высокореалистичный портрет поразительно красивой женщины примерно 28 лет, которая сфотографирована по грудь. Она идеально выглядит, очень чувственна, элегантно одета, но имеет немного (разочарованное и усталое выражение глаз: 0.7); в руке у нее (бокал вина: 1.8). (Подводка для глаз: 1.1); (реалистичная кожа: 1.2); живые выразительные глаза с (реалистичными зрачками: 1.3); (волнистые волосы платинового цвета: 1.4); (выразительный рот с утонченными губами: 1.5). В целом, в образе женщины есть что-то загадочное и притягательное. Идеальные настройки камеры для тускло освещенного бара. Малая глубина резкости. HQ, 4k, -testp, -beta -beta -beta».

A highly realistic chest-deep portrait of a strikingly beautiful woman of about 28 years old. She looks perfect, she is very sensual, dressed elegantly, but has a bit (disappointed and tired expression in her eyes: 0.7). She has (a glass of wine: 1.8) in her hand. (Eyeliner: 1.1); (realistic skin: 1.1); lively expressive eyes with (realistic pupils: 1.3); (wavy blonde platinum hair: 1.4); (expressive mouth with refined lips: 1.5). There's something mysterious and captivating in the overall image of the woman. Perfect camera settings for a dim-lit bar space. Shallow DOF. HQ, 4k, -testp, -beta -beta -beta.

Параметры для генерации изображения: Model – Dreamer Photorealistic V2, Style – Photography: Realistic / Cannon EOS 5D Mark IV, -ar2:3, Guidance Scale – 9.0, Sampler – Euler A, Steps – 40.

Рис. 16. Портрет женщины с бокалом

Портрет получился чудесный, и отличить изображение от настоящей фотографии довольно трудно (если, конечно, сильно не всматриваться – тогда будут заметны некоторые ляпы). Нам повезло ничего не напортачить с числовыми показателями, поэтому, если вы захотите поэкспериментировать в промптах с числами, смело это делайте, ну а мне, гуманитарию, все-таки проще и привычнее управляться со словами.

Изображения с человеческими лицами можно совершенствовать до бесконечности, добиваясь все большего правдоподобия и выразительности, но иногда полезно остановиться, на какое-то время отложить снимки, а потом окинуть их свежим взглядом – тогда вдруг ясно высветятся недостатки, которых мы не заметили в процессе работы, и придут свежие идеи о том, как улучшить фотографию. Поэтому предлагаю вам отдохнуть от портретов и поработать с каким-нибудь другим жанром – уверяю, это будет не менее интересно и познавательно.

Глава 5. Уличная фотография

Вам не кажется, что мы засиделись дома в окружении своих питомцев или в студии, погруженные в создание натюрмортов и портретов? Не пора ли нам выйти на улицу – подышать свежим воздухом, а заодно попробовать себя в жанре уличной фотографии?

Уличная фотография – это очень динамичная и откровенная форма фотоискусства, разновидность социальной фотографии, которая предполагает создание снимков в общественных местах (на улицах, тротуарах, площадях, в зданиях, переулках) с целью запечатлеть правдивые моменты современной жизни, а также сцены взаимодействия между людьми. Фотограф пытается передать атмосферу, сущность, характер улицы, взаимодействуя с окружающей средой и людьми и ставя перед собой цель получить естественные и спонтанные кадры. В жанре уличной фотографии ценится реальность момента, а не талантливая режиссура сцены, поэтому такие снимки часто делаются при помощи телеобъектива (наверное, чтобы не смущать участников событий). Работа в этом жанре может стать отличной тренировочной площадкой для фотографов, поскольку позволяет им совершенствовать навыки в композиции и умении рассказывать истории.

Однако если фотограф умеет подсмотреть историю и «рассказать» ее с помощью готового снимка, то нам для начала нужно самим придумать ситуацию или описать интересный момент, свидетелем которого когда-то стали. Давайте словами «нарисуем» уютную сцену кормления птиц на площади или бульваре – вы наверняка не раз ее наблюдали – и опишем детали этой картины в промпте.

Так как из-за обилия объектов композиция на этот раз будет сложнее предыдущих, то приготовьтесь к тому, что поначалу ИИ будет выдавать нам совсем не такие качественные изображения, как в более простых снимках. Пока что для него еще очень сложно реалистично изобразить фигуру человека в различных ракурсах и адекватно передать черты лица. Запаситесь терпением, несколькими десятками баллов (credits) и раз за разом просите машину улучшить снимок, сделав его как можно более похожим на настоящее фото.

Сегодня мы познакомимся с одним важным инструментом для того, чтобы дать ИИ понять, на что именно ему нужно обратить внимание при генерации изображения – это функция «вес слова». Как мы с ней работаем? В полях Prompt и NegativePrompt выделяем скобками те слова, которые вам кажутся наиболее важными, при этом чем больше скобок окружают слово или словосочетание, тем больший вес оно приобретает в «глазах» нейросети. Допустим, запись может выглядеть так: (реалистичное лицо), ((гладкая текстура кожи)), (((идеально нарисованные пальцы))) и т.д. Непосредственно в тексте эти слова будут автоматически выделяться разными цветами – синим, красным и т.п.

Ну что, начинаем работать? В этот раз мы с самого начала пропишем наши «условия» как в поле Prompt, так и в NegativePrompt. Тем самым мы сразу дадим нейросети понять, что мы желаем и чего не желаем видеть на снимке. Ну а слова в скобках уже сами будете выделять: вы лучше знаете, что для вас важнее.

Шаг 1

«Высокореалистичная уличная фотография: на переднем плане молодой человек в костюме, сидя на корточках, кормит голубей. Птицы гуляют по мощеной площади. На заднем плане на площади европейского города работает фонтан. Совершенная анатомия лица, идеальные реалистичные руки и пальцы, идеальная текстура кожи человека. Высокореалистичная текстура зданий, тротуара, воды в фонтане и фигур людей. Композиция с энергичным, необычным ракурсом. Естественный уличный свет днем после 17 часов, непрямые лучи солнца дают мягкое, но в то же время динамичное освещение картины. Длинный телеобъектив установлен под широким углом, чтобы создать глубину и ощущение перспективы в кадре. Увеличение масштаба с помощью зум-объектива, чтобы показать мужчину в центре кадра: акцент на его фигуре. -ar 3:2, high res, 8k, -testp, -beta -beta -beta».

Highly realistic street photography: in the foreground, a young man in a suit feeds pigeons while squatting. Birds walk on the paved square. In the background a fountain is working in the square of a European city. Perfect face anatomy, ideal realistic hands and fingers, perfect human-like skin texture. Highly realistic texture of buildings, pavement, fountain water, and people’s figures. A composition with an energetic, unusual angle. Natural street light in the afternoon, after 5 p.m. , the indirect rays of the sun give a soft, but at the same time dynamic lighting of the picture. The long telephoto lens is mounted at a wide angle to create depth and a sense of perspective in the frame. Zoom in to show the man as the center of the shot: focus on his solitary figure. -ar 3:2, HQ, -testp,8k, -beta -beta -beta.

NegativePrompt

«Уродливое нереалистичное лицо человека, неестественная поза человека, ужасно смоделированные руки и пальцы, нереалистично нарисованная вода в фонтане, нереалистичные птицы».

Ugly unrealistic human face, unnatural human posture, poorly modeled hands and fingers, unrealistically drawn water in the fountain, unrealistic birds.

В основном промпте мы ввели термин, употребляемый при работе с нейросетью: -ar 3:2. Вы наверняка догадались, что буквы -ar – это не что иное, как сокращение от AspectRatio – «формат изображения». И хотя эта функция есть в отдельном поле приложения, но если теперь вы вдруг увидите в сети промпт с такими символами, то будете знать, что они означают.

Еще вы, наверное, заметили, что мы прямо на первом этапе работы ввели специальные символы, характерные для промптов, которые обычно прописывали в конце. Мы это сделали для того, чтобы нейросеть с самого начала принялась улучшать качество снимка и в конце довела его до совершенства.

Рис. 17. Мужчина, кормящий птиц на городской площади

Итак, вот что у меня получилось примерно с двадцатой попытки получить мало-мальски вразумительное изображение при постоянных изменениях и дополнениях в окнах Prompt и NegativePrompt: довольно адекватная (хотя и пустоватая на среднем плане) композиция, анатомически верная фигура сидящего на корточках человека, человеческое (слава богу!) лицо с чертами, не вызывающими ступора. Строение кисти, правда, немного настораживает, ну да ладно, в глаза вроде не сильно бросается, исправим в дальнейшей работе.

Лицо мужчины окончательно приобрело свой человеческий вид после того, как я перевел его в высокое разрешение. Чтобы сделать это, вам нужно на странице снимка с его описаниями (в разделе History вашего личного кабинета) нажать внизу желтую кнопку High-resfix («перевод в высокое разрешение»), на которой пока что в красном поле написано Unlock («разблокировать»). Когда вы разблокируете эту функцию путем просмотра рекламы, вам станет доступна шкала с тремя режимами улучшения качества снимка: Followoriginal, Normal, MoreCreative («Близко к оригиналу», «Нормальный», «Более творческий»). Можете поэкспериментировать с каждым из них, а можете сразу выбрать третий, он дает самое высокое качество.

Так как изображение человека – самая «опасная зона» при работе с нейросетью, то на остальные ляпы пока можно не обращать внимания, хотя их здесь предостаточно: птички неопределенной породы; какие-то плоские, почти картонные дома; явно рисованный фонтан и летающая над ним птица – судя по размерам, не меньше орла.

Теперь будем исправлять и улучшать изображением, придавая ему максимально близкое сходство с настоящим снимком. Для этого нам необходимо задать настройки для фотоаппарата – так до нейросети скорее дойдет, что мы хотим получить фотографию, а не образчик реалистического рисунка.

Шаг 2

«Canon 5DS R, объектив Canon EF 70-200mm f/2.8L IS II USM, штатив. 1/200 с, f/7.1, ISO 200, зум установлен на фокусное расстояние 105 мм».

Canon 5DSR, aCanonEF 70-200mmf/2.8LISIIUSMlens; tripod. 1/200 s, f/7.1, ISO 200, the lens zoom is set to 105mm focal length.

Рис. 18. Мужчина, кормящий птиц на городской площади

Итак, давайте посмотрим, есть ли у нас улучшения… Да, фотография однозначно стала более качественной! Благодаря неглубокому полю резкости, полученному в результате установки диафрагмы в режим f/7.1, у изображения появился объем, что позволило, как говорят фотографы, «отбить» мужчину от фона и выдвинуть его зрительно на первый план. Лицо персонажа теперь более живое, улучшилась анатомия его правой кисти – строение пальцев больше не вызывает вопросов. Фонтан стал более реалистичным и уже не выглядит как иллюстрация к сказке Андерсена. Улетел орел, паривший над фонтаном – пожелаем ему доброго пути! У строений благодаря «воздуху» на снимке появился объем, и они больше не создают впечатление картонных коробок.

Словом, мы еще раз убедились в том, что использование числовых настроек камеры сразу поднимает снимок на новый качественный уровень! Нейросеть сама ведь состоит из набора цифровых символов, поэтому иногда число может дать ей более понятную (и гораздо более краткую, чем словесное описание) инструкцию. Так что советую разобраться с базовыми установками фотоаппарата на уровне экспозиции (выдержка + диафрагма + светочувствительность) и ознакомиться с основными типами объективов.

Шаг 3

«Мгновенная и одновременно вневременная сцена, изображающая мирную сторону человеческого существования, с мечтательной, теплой и нежной атмосферой. Идеально подходит для тех, кто ищет творческого вдохновения в минуты спокойствия, мира и гармонии».

An instant and, simultaneously, timeless scene, portraying the peaceful side of human existence, with a dreamy, warm and gentle atmosphere. Perfect for those who look for artistic inspiration in a moment of tranquility, peace and harmony.

Рис. 19. Мужчина, кормящий птиц на городской площади

Ну что, как вам последняя фотография? На мой взгляд, она замечательная. Солнце словно опустилось еще ниже, и освещение стало идеальным, приглушив здания на фоне изображения и высветив птиц, который наконец-то приобрели… ха-ха, чуть было не сказал: человеческий облик! – приобрели естественный вид – по крайней мере, в плане окраса. У фонтана появилась чудесная воздушная прозрачность, почти ощущается прохлада воды, создавая атмосферу покоя и умиротворения, о которых идет речь в заключительной части нашего промпта.

***

Сейчас мы с вами познакомимся с одной интересной, веселой функцией, которая называется Shuffle («перетасовка», «перемена мест»): с ее помощью все объекты на изображении смешиваются в кучу, переставляются с место на место, и в результате получается совершенно иная композиция – зачастую с новыми персонажами и предметами.

Для того чтобы совершить такую операцию, сначала убедитесь, что в поле Prompt у вас написан текст полученного изображения (помните, вы можете его сюда поместить путем клонирования – Clone). Далее, в разделе Mode выбираем режим TexttoImage, и в появившемся ниже поле ControlLayer нажимаем справа на плюсик в кружочке. Перед нами появляется чистое поле, в которое мы помещаем наш снимок с кормлением птиц – для этого в рабочем кабинете вы должны его скачать в галерею и уже оттуда переместить в окно ControlLayer. Когда снимок загрузиться, из нескольких квадратов, расположенных над этим окном, выбираем Shuffle, а потом на «шкале условия» (Conditional scale) устанавливаем числовое значение от 0.0 до 2.0. Чем выше число, тем более драматическими окажутся изменения – единички вполне достаточно для того, чтобы удивить нас результатом. Далее, устанавливаем галочку в квадратике ниже шкалы, чтобы избежать предварительной обработки изображения, и внизу нажимаем на большую желтую кнопку Add («добавить»), в которой мелким шрифтом предупреждают, что за данную услугу с нас снимут дополнительный балл. После этого нас снова возвращают на страницу редактирования, где мы нажимаем на кнопку StartDrawing и ожидаем результата.

У меня в результате перетасовки получилась такое вот идиллическое фото.

Рис. 20. Кормление птиц на площади

Практическое задание: составьте детальный промпт с описанием этой фотографии по схеме: особенности композиции + настройки фотоаппарата и освещение + художественное содержание. Для выделения важных деталей пользуйтесь скобками или числовыми значениями.

Написав основной текст, составьте NegativePrompt. Для этого попросите ИИ убрать из снимка все нереалистичные детали, которые есть в изображении, и изменить то, что считаете нужным.

Сгенирируйте столько снимков, сколько необходимо для получения качественного результата. Не забудьте переводить удачные снимки в высокое разрешение (High-resfix) по схеме, описанной в начале главы.

Поздравьте себя с отличной выполненной работой!

Знаете, на свежем воздухе так хорошо, что хочется задержаться здесь подольше. Почему бы нам в следующей главе еще не побродить по улицам и не поснимать, допустим, здания и прочие архитектурные сооружения? – теперь уже в качестве полноправных фотоперсонажей.

Глава 6. Архитектурная фотография

Как я и обещал, сегодня мы вновь выйдем на улицу и поснимаем дома или другие строения – лестницы, мосты и т.д. Иными словами, попрактикуемся в архитектурной фотографии.

Архитектурная фотография – это жанр, где объектом съемки являются уличные сооружения, здания или их отдельные части – двери, окна, ступени, а цель работы – подчеркнуть визуальные качества и художественные достоинства объектов. Фотограф, работающий с архитектурой, стремится не только запечатлеть эстетику постройки и наглядно продемонстрировать ее функциональное значение, но и раскрыть уникальную историю, выявить тайную сущность сооружения. В архитектурных снимках акцент часто делается на линиях и формах домов, особое внимание уделяется свету, тени и перспективе. Фотограф стремится точно передать детали, цвета и материалы архитектурного объекта, чтобы продемонстрировать его особенности и передать ощущение места и атмосферы. Стилю архитектурной фотографии обычно присущи реализм, глубина и ощущение пространства.

Работа с нейросетью хороша тем, что мы можем себе позволить посетить любой уголок мира и «сфотографировать» все что угодно. Сейчас я предлагаю мысленно перенестись в Венецию и сделать снимок одного из ее потрясающих видов. Венецианские дворцы на весь мир славятся своей красотой и великолепно подходят для экспериментов в области архитектурной фотографии.

Ну что, приступим? Только для начала в поле AspectRatio выберем формат 1:1, так как квадратная форма кадра иногда помогает более выгодно подчеркнуть детали зданий, улиц и городских ландшафтов.

Шаг 1

«Высокореалистичное фото венецианской архитектуры с красивыми палаццо и собором с большим куполом. Здания стоят прямо у голубой воды канала. На переднем плане гондола, привязанная к «пали» – одному из особых венецианских столбов, которые выглядывают из воды. Очень реалистичная водная поверхность и отражения в канале. В кадре нет людей. Небо разных оттенков синего, покрытое эффектными облаками, составляет важную часть композиции. Совершенная, реалистичная текстура неба, воды и зданий. Снимок передает суть зданий посредством светотени, композиции и перспективы. Снято с небольшого расстояния. Время – позднее утро, около полудня».

A highly realistic photo of Venetian architecture with its beautiful palazzos and a cathedral with a big dome. The buildings stand right near the blue water of a canal. There’s a gondola in the foreground, tied to a “pali”, one of the special Venetian poles sticking out of water. Highly realistic water surface and reflections in the canal. No people in the frame. The sky of different tones of blue is covered with dramatic clouds, it forms an important part of the composition. Perfect and highly realistic textures of the sky, water and buildings. Perfect balance of colors, light and shadow. The shot captures the essence of buildings through chiaroscuro, composition and perspective. Taken from a short distance. It's late morning time, around noon.

Рис. 21. Венеция: вид на собор

Если вы никогда не были в Венеции, то теперь хотя бы представляете, как она выглядит – согласитесь, хотелось бы проснуться и, выглянув из окна, увидеть чудесную воду канала и гондолы возле старинного палаццо. На этом изображении можно заметить, что стены кое-где обшарпаны или кирпич потемнел от времени, но это лишь придает городу необъяснимое очарование подлинной старины.

Надо отметить, что ИИ максимально точно создал снимок по описанию. Напоминаю: если вы хотите видеть именно то, что заказывали, то в поле GuidanceScale следует установить бегунок на шкале на отметке выше 7.0: чем больше число, тем точнее нейросеть будет следовать вашему промпту.

Если же вас полностью устроил получившийся снимок, то перед тем, как его усовершенствовать, при этом оставив нетронутой композицию и основные детали, не забудьте в режиме ImagetoImage зайти в поле PromptStrength и установить на шкале как можно меньший числовой показатель – примерно до 3.5, потому что при более высоких числах нейросеть будет проявлять повышенную творческую самостоятельность.

Шаг 2

«Sony Alpha A7 IV, объектив Sigma 24-70mm f/2.8 Art DG DN HSM; фокусное расстояние 70 мм. ISO 100, f/11, 1/80 с. Равномерное освещение строений, что позволяет детально рассмотреть богатые детали архитектуры. Фото освещено естественным солнечным светом, смягченным облаками. Акцент на куполе церкви. Необычный ракурс; средняя глубина резкости».

SonyAlphaA7 IV, Sigma 24-70mmf/2.8 ArtDGDNHSMlens; focallength 70 mm. ISO 100, f/11, 1/80 s. The lighting on the building is even, allowing the rich details of the architecture to be visible. The shot is lit with natural sun light softened with clouds. Focus on the dome of the church; unusual angle; shallow DOF.

Здесь снова появилось понятие «глубина резкости» (DOF), давайте вспомним, как она регулируется с помощью настроек диафрагмы (числа f-stops):

f/22 – глубокая глубина резкости, все в фокусе;

f/11 – средняя глубина резкости, некоторые элементы размыты;

f/8 – глубина резкости меньше средней, фон все еще размыт;

f/4 – малая глубина резкости, фокус на основном объекте.

Рис. 22. Венеция: вид на собор

После настроек в фотоаппарате наш снимок кажется немного поблекшим, но это совершенно естественно: в изображении появилась воздушная прослойка, которая слегка размывает очертания предметов и приглушает краски. Кроме того, в полдень, при прямых солнечных лучах гораздо труднее сделать такой отчетливый, контрастный снимок, какой сгенерировала нейросеть в первый раз. Так что купол теперь не нависает на Венецией, драматически противостоя давлению неба с перенасыщенными красками, а возносится к легким облакам. Если вы это ощущаете благодаря фотографии, то, значит, мы свою задачу выполняем правильно!

Ну а сейчас «нанесем на картину последние штрихи» и попробуем описать настроение, передать словами атмосферу этого изображения – пусть ИИ пошевелит своими нейронами, еще больше «оживляя» снимок с помощью наших финальных подсказок.

Шаг 3

«Захватывающий и незабываемый вид. Старинные венецианские палаццо с их кое-где обшарпанными стенами – словно метафора хрупкости рукотворной красоты перед лицом неумолимого хода времени. В то же время купол, вознесшийся к небу – символ гордого, бессмертного человеческого духа. Все эти дома – как отдельные ноты, каждое со своим характером, но благодаря каналу они слились в один благозвучный аккорд: вода, наполняющая Венецию, и является той вечной незримой связью, которая позволяет зданиям гармонично сосуществовать друг с другом и вести свой безмолвный монолог. HQ, 8k, -testp, -upbeta -beta -upbeta».

A breathtaking, unforgettable view. Ancient palazzos with their here and there shabby walls are like a metaphor of the fragility of man-made beauty in the face of the inexorable passage of time. At the same time, the dome rising to the sky is a symbol of the proud, immortal human spirit. The houses are like separate notes, each with their own character, but thanks to the canal they merged into one euphonious chord: the water that fills Venice is that eternal invisible connection that allows the buildings to harmoniously coexist with each other and conduct their silent monologue. HQ, 8k, -testp, -upbeta -beta -upbeta.

Рис. 23. Венеция: вид на собор

Изображение стало более отчетливым и фактурным – так бывают, когда на солнце набегает облако. У собора словно поменялся характер, правда? Здания стали более фактурными, в них прибавилось естественных неровностей; резче проступила зелень на балкончиках и окнах – словом, фото наполнилось тихой, неприметной жизнью, как мы и написали в последней части промпта.

***

Венеция не всегда выглядит столь величественно. Стоит свернуть с Гранд-канала в сторону, и вы очутитесь в узком «проливе» между зданиями. Здесь царит иная, загадочная атмосфера и стоит удивительная тишина, особенно ранним утром, когда город только просыпается. Давайте сделаем снимок утренней Венеции – спокойной, чуть скрытой в тумане.

Prompt

«Реалистичная фотография венецианского палаццо с его красивыми архитектурными деталями: балконами и арочными окнами. Здание обращено к каналу с зеленой водой, в кадре нет людей. Снято с небольшого расстояния. На среднем плане рядом с палаццо стоят пустые гондолы. На заднем плане мы видим фасады других палаццо из камня, мрамора и гранита. Раннее утро, легкий туман. Кадр освещен мягким утренним светом, который создает романтическое настроение. Необычный ракурс; акцент на ближайшем к зрителю палаццо; эффект мягкого боке, малая глубина резкости. Canon 6D Mark II с объективом CanonTS-E 45 мм f/2,8. Камера на штативе направлена на палаццо, угол наклона объектива – 10 градусов, а зум объектива установлен на фокусное расстояние 25 мм. 1/80 с, f/7.1, ISO 400. Неяркий свет раннего утра, умиротворение в природе, зыбкая тишина в воздухе перекликаются со скромным нефасадным видом города: они словно высвечивают тайную связь зданий друг с другом и с каналом. High res, 4k, -testp, -upbeta beta -beta».


Вы ознакомились с фрагментом книги.
Для бесплатного чтения открыта только часть текста.
Приобретайте полный текст книги у нашего партнера:
Полная версия книги
(всего 10 форматов)