banner banner banner
Генеративный искусственный интеллект #Forge&flux
Генеративный искусственный интеллект #Forge&flux
Оценить:
Рейтинг: 0

Полная версия:

Генеративный искусственный интеллект #Forge&flux

скачать книгу бесплатно

Генеративный искусственный интеллект #Forge&flux
Александр Юрьевич Чесалов

Эта книга – идеальное учебное пособие для школьников и студентов, желающих познакомиться с передовыми технологиями искусственного интеллекта. Автор мастерски объясняет простым и доступным языком подходы работы с ИИ, делая их понятными для тех, кто не обладает глубокими теоретическими знаниями. Особое внимание уделено модели Flux.1, которая стала прорывом в генеративном ИИ, и системе Stable Diffusion WebUI Forge, предоставляющей бесплатный и мощный инструмент для создания уникальных изображений.

Александр Чесалов

Генеративный искусственный интеллект #Forge&flux

Введение

Прошел всего год с того момента, когда я работал над книгой «Невероятный искусственный интеллект Easy Diffusion 3.0». В ней я высказал свое мнение о том, что постичь мир удивительного искусственного интеллекта возможно только тогда, когда мы с вами cможем увидеть положительные результаты его работы, созданные при нашем непосредственном участии. Эти результаты должны быть понятны и объяснимы каждому человеку, а также они должны быть этичны, непредвзяты и не нарушать закон. Сейчас мое мнение осталось неизменным, с небольшой поправкой лишь на то, что мы должны с вами помимо всего прочего получать максимальное удовлетворение от раскрытия наших интеллектуальных и творческих потенциалов, реализованных в совместной работе с искусственным интеллектом. Согласитесь, когда мы занимаемся любимой работой – эта работа вдвойне эффективнее и полезнее для всех.

Как вы уже знаете, на сегодняшний день генеративный искусственный интеллект может делать многое, например: написать текст нового стихотворения или даже целого рассказа, воспроизвести его различными голосами знаменитых актеров, написать новую музыку или песню, проанализировать большое количество числовых данных и составить прогноз на будущее, играть с нами или сразу с тысячью людей в компьютерные игры. Вообще говоря, его возможности, по большей части, ограничиваются лишь нашей с вами фантазией и, к сожалению, затратами на их реализацию.

Пожалуй, одной из самых впечатляющих способностей генеративного искусственного интеллекта, на мой взгляд, является его умение создавать уникальные и невероятные изображения. Эти изображения могут быть воплощением трехмерного мира фантастического будущего в компьютерной игре или быть виртуальной симуляцией окружающего нас мира. Изображения могут быть трехмерными или двумерными, а также могут быть выполнены в различных стилях живописи знаменитых художников разных эпох. Но самое интересное то, что на этих изображениях могут появиться существа или предметы, не существующие в нашем мире, которые тем не менее можно материализовать, например, с помощью 3D-принтера.

Книга, которую вы держите в руках, является учебным пособием по работе с системой генеративного искусственного интеллекта Stable Diffusion WebUI Forge, при помощи которой вы научитесь создать невероятные фотореалистичные изображения из текстовых описаний и графических изображений.

На момент написания и публикации этой книги, наиболее популярной моделью, которую поддерживает Stable Diffusion WebUI Forge и при помощи которой создаются уникальные изображения является FLUX.1.

В 2024 году модель FLUX.1 стала прорывной технологией в генеративном искусственном интеллекте, оставив позади себя все остальные модели от лидеров рынка. Десятки Интернет-сервисов стали рекомендовать ее, как наиболее производительную и эффективную при создании изображений. И, как вы уже поняли, именно этой модели уделяется основное внимание в этой книге.

Модель FLUX.1 была создана в 2024 году бывшими инженерами из компании Stability AI, которые занимались разработкой и развитием знаменитой модели Stable Diffusion [1 - Фетисов В. Стартап Black Forest Labs представил ИИ-генератор изображений FLUX.1 – он отлично справляется с прорисовкой рук человек. [Электронный ресурс] 3dnews.ru URL: https://3dnews.ru/1109014/startap-black-forest-labs-predstavil-iigenerator-izobrageniy-flux1-on-otlichno-spravlyaet-s-prorisovkoy-ruk-cheloveka (дата обращения: 11.09.2024)]. Робин Ромбах (Robin Rombach), Андреас Блаттманн (Andreas Blattmann), Доминик Лоренца (Dominik Lorenz) и Патрик Эссер (Patrick Esser) объединили свои усилия в работе над новым проектом FLUX.1 и создали новую компанию Black Forest Lab[2 - We are Black Forest Labs. [Электронный ресурс] blackforestlabs.ai URL:https://blackforestlabs.ai/our-team/ (дата обращения: 11.09.2024)].

Black Forest Lab предлагает нам три версии модели FLUX.1[3 - FLUX.1. A new era of creation. [Электронный ресурс] blackforestlabs.ai URL:https://blackforestlabs.ai/ (дата обращения: 11.09.2024)]:

FLUX.1 [pro] – самая мощная версия реализация коммерческой модели доступная к использованию через API у партнеров компании или в индивидуальном порядке.

FLUX.1 [dev] – немного облегченный вариант первой модели не для коммерческого использования. Варианты реализации модели можно найти на сайте huggingface.co .

FLUX.1 [schnell] – самая быстрая реализация модели с открытым исходным кодом, которая так и называется «быстрая / нем. schnell». Она предназначена для использования на локальных компьютерах. Исходный код можно найти на сайте GitHub. Варианты реализации модели можно найти сайте huggingface.co .

По очень смелой оценке инженеров Black Forest Lab, данная модель боле производительна чем все разновидности модели Stable Diffusion, Midjourney и DALL-E[4 - [Электронный ресурс] blackforestlabs.ai URL:https://blackforestlabs.ai/announcing-black-forest-labs/].

С помощью этой книги мы научимся с вами пользоваться Stable Diffusion WebUI Forge и работать с невероятно мощной моделью FLUX.1, как инструментом творчества. Вы сможете самостоятельно установить, настроить и удалить совершенно бесплатную программу и ее компоненты на свой компьютер, а также подключить к ней различные дополнительные модули, которые значительно расширят ее возможности по созданию и обработке изображений. Но, самое главное, управляя различными функциями и параметрами через удобный пользовательский интерфейс, вы научитесь создавать уникальные и неповторимые изображения, которые вы сможете использовать в своей учебе или для развлечений.

Эта книга написана как учебное пособие для школьников старших классов и студентов первых курсов ВУЗов, а также для всех тех, кто хочет получить дополнительные знания и опыт по работе с системами генеративного искусственного интеллекта.

Для целей дальнейшего продвижения и наглядности получаемых результатов работ я придумал хештег #FORGE&FLUX, который, в том числе, стал частью названия этой книги.

По требованию издателя, большинство ссылок на сайты программ, дополнительные модули и модели перемещены в список литературы.

Приятного вам чтения и продуктивной работы!

Ваш Александр Чесалов.

Самые популярные системы создания изображений

На сегодняшний день существует достаточно большое количество различных платных и бесплатных программ, которые на базе технологий генеративного искусственного интеллекта создают невероятно красивые изображения. Некоторые из этих программ можно загрузить и установить на свой домашний или рабочий компьютер и работать с ними автономно без подключения к сети. Тем не менее большинство из них находятся в сети Интернет. Множество сайтов предоставляют различные on-line-сервисы по созданию изображений с применением различных моделей искусственного интеллекта. Эти сайты в основном используют модели для генерации изображений Stable Diffusion, Midjourney, Kandinsky и многие другие.

На мой взгляд, наибольшей популярностью пользуются следующие программы и сервисы:

Midjourney – очень популярная система генеративного искусственного интеллекта, созданная одноименной компанией Midjourney. Искусственный интеллект Midjourney – это web-сервис в сети Интернет, который позволяет создавать очень красивые изображения, при этом не задействуя вычислительные ресурсы вашего компьютера. Для ее использования у вас должна быть установлена программа Discord – удобный мессенджер для групповой работы, который часто используют игроки по всему миру. Основной недостаток программы заключается в том, что не так давно Midjourney стала полностью платной [5 - Announcing Black Forest Labs. Сайт программы Midjourney: https://www.midjourney.com (дата обращения: 11.09.2024)].

Stablecog – это очень простой в использовании, но в то же время очень удобный web-сервис. К сожалению, он платный. Тем не менее – это мой любимый сервис. В день можно создать двадцать бесплатных изображений. Если вы долго не работали с сервисом после регистрации, ваши баллы за пропущенные дни суммируются.

Не так давно в Stablecog появилась модель FLUX.1 [6 - Сайт программы Stablecog: https://stablecog.com/generate (дата обращения: 11.09.2024)].

Leonardo.Ai – это красочный web-сервис в сети Интернет, предоставляющий доступ к одноименной нейросети Leonardo.Ai. С ее помощью вы можете создавать изображения из текста и других изображений. К достоинствам Leonardo.Ai можно отнести удобный в использовании интерфейс работы. К недостаткам – это ограничение на число создаваемых изображений в день. Изображения создаются очень быстро и качественно, но пока вы научитесь делать что-то качественное, пройдет достаточно много времени. Если вы захотите потратить больше времени на работу с этой программой, готовьтесь заплатить за дополнительные функции. Очень часто Leonardo.Ai сравнивают с Midjourney, но кто из них лучше – это решать только вам [7 - Сайт программы Leonardo.Ai: https://leonardo.ai (дата обращения: 11.09.2024)].

Easy Diffusion – полностью бесплатная система искусственного интеллекта, которая объединила в себе возможности использования Midjourney и Stable Diffusion. Easy Diffusion предлагает вам удобный и простой web-интерфейс, который позволяет не только создавать очень красивые изображения, но и подключать к ее работе различные дополнительные модули и модели. По умолчанию в программе уже предустановлена нам известная модель Stable Diffusion.

К еще одному достоинству программы можно отнести то, что она очень просто устанавливается на компьютер или ноутбук и работает с не очень мощными видеокартами. К недостатку программы можно отнести только затрачиваемое вами время на создание изображений. Например, если изображение в Dreamstudio.ai создается за 20 секунд, то в Easy Diffusion на создание может уходить до 120 секунд.

Еще раз обращу ваше внимание на то, что Easy Diffusion – это простая к установке сборка программных пакетов (или, другими словами, дистрибутив) системы генеративного искусственного интеллекта Stable Diffusion для различных операционных систем.

К сожалению, вы можете скачать дополнительно с сайта www.civitai.com (где есть очень много полезных моделей) новую модель FLUX.1 (хотя, много вариантов ее реализации там уже выложили). Я проверил и на момент написания этой книги, там нет ни одной работающей с Easy Diffusion [8 - Сайт программы Easy Diffusion (дистрибутива программы): https://github.com/easydiffusion/easydiffusion (дата обращения: 11.09.2024)].

Подробно об Easy Diffusion я рассказываю в своей книге «Невероятный искусственный интеллект Easy Diffusion 3.0»[9 - Сайт книги «Невероятный искусственный интеллект Easy Diffusion 3.0»: https://ridero.ru/books/neveroyatnyi_iskusstvennyi_intellekt_easy_diffusion_3_0/ (дата обращения: 11.09.2024)].

Dreamstudio.ai – это web-сервис, созданный компанией Stability AI, которая разработала одну из самых известных нейросетевых моделей под названием Stable Diffusion. Web-сервис очень удобный и позволяет создавать любые изображения очень быстро. Это происходит потому, что сервис Dreamstudio.ai использует очень мощные сервера для генерации изображений. Другими словами, ваш компьютер не задействуется в процессе создания изображений, что является существенным достоинством программы. В то же время недостатком использования Dreamstudio.ai является ограничение на число создаваемых картинок[10 - Сайт программы Dreamstudio.ai: https://beta.dreamstudio.ai/dream (дата обращения: 11.09.2024)]


Вы ознакомились с фрагментом книги.
Для бесплатного чтения открыта только часть текста.
Приобретайте полный текст книги у нашего партнера:
Полная версия книги
(всего 10 форматов)