Выбрать главу

Важно учитывать, что излишнее усиление может приводить к порче картинки - к порче и искажению её графики. Более всего характерно для обычных сетей, в XL выражено заметно слабее, там оно зависит конкретно от того, что за параметр усиливаешь, например, если цветность, с ней можно и переборщить, а если фантазию («fantasy» - слово, влияющее только на сюжет), ничего плохого в большинстве сетей не произойдёт, ну а в некоторых отдельных может быть качество графики и подупадёт, но не порядок. В многих обычных сетях всё равно что усиливать, при избыточном усилении картинка портится, и порой радикально, в них я принял себе за правило исходно не ставить более 3-х плюсов. Всего лишь трёх. Три никогда не приводили у меня к проблемам, 4 – сложно сказать, более 4-х уже значительно повышают вероятность сильно ухудшить графическое качество изображения. Тем не менее, гарантии, что это обязательно произойдёт, тоже нет, иногда и пять, и шесть плюсов у меня принималось как будто даже без мелких отрицательных последствий. Кстати, не стоит забывать о перерисовщиках. С их помощью некоторые испорченные переусилением изображения, если таковое всё же произошло, есть шанс нормализовать, как минимум те, у которых возникли проблемы с чёткостью, размазыванием цветов, шумами или зернистостью. Что касается минусов, ими можно пользоваться без каких-либо ограничений в каких угодно сетях. Картинку портит чрезмерное усиление, а они означают усиление всегда менее 1.

Функция flux усиление не поддерживает. Во всяком случае при моих экспериментах с ней реакции на усиление у неё было ровно ноль. Правда я проверял это именно в день её добавления в Dezgo, может быть со временем поддержку усиления в неё и добавят. Но по-моему скорее всего нет, она работает иначе, чем прочие функции Dezgo, более чётко реагирует на ваши тексты, есть ощущение, что она и не нуждается в усилениях.

О некоторых настройках подробнее

Текст для генерации картинок (промпты)

Здесь я чуть подробнее расскажу о настройке «prompt» функций. Той, в окно которой вы задаёте текст, описывающий контент генерируемой или перерисовываемой картинки. В русском сегменте интернета вследствие неё тексты для генерации картинок собственно и называют «промптами», только я бы не сказал, что для русского языка данное название удобно для произношения, далее я всё же преимущественно буду называть эти тексты «текстами». Или буду использовать слово «prompt» для уточнения. Когда моё руководство было уже практически готово, я вдруг заметил, что Dezgo осчастливил нас очередным новшеством – на его сайте появилась ссылка «Blog» (blog.dezgo.com). Перейдя по ней, я нашёл кое-что интересное, в том числе на тему текстов. И пришлось мне дополнять свою писанину ещё одной главой. Ну, тут я постараюсь быть максимально краток. В первую очередь стоит сказать, тексты, задаваемые ИИ (искусственному интеллекту) характеризуются длиной, и она измеряется в специальных единицах – так называемых «токенах». Кажется, этот термин используется для миллиона разных вещей, включая криптовалюты, так что не надо путать, тут у него иное значение. Токен – в данном случае это именно единица длины и ничего более, величину она имеет переменную, в среднем равняясь четырём символам, однако многие слова являются самостоятельными токенами (то есть любое из них любой длины равно одному токену). Почему это для нас важно? Потому что все генераторы изображений с искусственным интеллектом, основанные на Stable Diffusion (включая и Dezgo), имеют ограничение текстов по длине, после которого слова просто игнорируются. В настоящее время это ограничение составляет 77 токенов. Как определить число токенов в вашем тексте, раз они неизмеримы простыми средами (вы же не знаете, какие слова равны одному токену, а какие нет)? Dezgo предлагает вам для этого пользоваться специальным сайтом – онлайн токенизатором: novelai.net/tokenizer.

Второй момент: словам в начале текста придается большее значение, чем словам в конце. Если вам не нравится получившаяся картинка, вы можете изменить порядок слов, а не менять текст полностью. В качестве примера на сайте приводятся две картинки – созданная по тексту «1 girl, classroom» и по «classroom, 1 girl». На первой картинке школьница крупным планом, на второй – школьный класс, где за одной из парт сидит школьница, то есть она гораздо более мелко нарисована, там она не главный объект, главный объект именно помещение класса.

Третий момент: если вы используете для генерации картинок сторонние тексты из интернета, составленные для других нейросетей (не для Dezgo), следует учитывать, что Dezgo не поддерживает их особый синтаксис вроде квадратных скобок, нескольких круглых скобок, и т.п. Проще говоря, в Dezgo в качестве специальных команд используются плюсики и минусики, а в других сетях применяются иные механизмы – где-то заключение в квадратные скобки, где-то в множество круглых «(((1 girl, classroom)))». В Dezgo все подобные специальные команды работать не будут.