Выбрать главу

Сайт Dezgo: dezgo.com Сайт, куда Dezgo направляет за справкой: www.reddit.com/r/stablediffusion/wiki/tutorials Блог Dezgo: blog.dezgo.com

Особенности рисования людей

Есть у меня ощущение, что людей Dezgo рисует иначе, чем всё прочее. На основании того, что я наблюдаю, я бы предположил, для него рисунок состоит из элементов двух типов - фона и объектов, и сии типы зачастую рисуются совершенно по-разному. При этом из всех видов объектов (человек, животное, автомобиль и т.п.) для рисования людей в нём предусмотрено несопоставимо больше различных механизмов. Людей он способен рисовать наиболее качественно, часто может воссоздавать и моделировать в 3d, у него имеются текстуры тел, одежд и так далее. Человек так или иначе ключевой объект внимания нейросетей. Потому их возможности при рисовании его и чего-либо иного несопоставимы. Правда, как ни странно, в случае Dezgo это не всегда в плюс. Например, у его XL функций качество графики картинок с людьми очень часто ниже приемлемого (на мой вкус), а у всех прочих картинок нет. Почему, бог его знает, я могу только гадать. Моё главное предположение – дело в бесплатности. На формирование фона, думаю, уходит гораздо меньше ресурсов, затрачивается гораздо меньше интеллектуальных операций, он намного экономичнее. Вследствие чего на него выделяется всегда одно и то же количество ресурсов. Его качество в целом стабильно, почти ни от чего не зависит, не изменчиво. А про объекты того же не скажешь. Особенно про людей. Наблюдается ли та же ситуация в платном режиме – интересный вопрос, на который у меня нет ответа. В общем, я бы выделил два проблемных момента, каковые следует учитывать при работе с Dezgo и возможно с другими нейросетями:

1) Зависимость качества от крупности плана. У иных сетей она носит критический характер. Крупный план человека – это в любой сети Dezgo красиво. Лицо во весь экран – великолепно. От головы до верха груди – замечательно. По пояс – очень хорошо. А далее уже начинаются варианты. Чем мельче человек в кадре, тем хуже он выглядит, становится меньше чёткость, проседает качество графики, при совсем мелких планах расплывается и деформируется лицо. В разных сетях это проявляется при разной крупности, в каких-то уже менее чем по пояс, в каких-то, когда человек входит в кадр более чем по бёдра, или по колено, порой и в полный рост покажут нормально, и более чем в полный, с зазором свободного пространства, допустим, от головы до верха кадра. Так или иначе, эта проблема есть у всех сетей Dezgo, и в целом весьма заметна. Наиболее она проявляется при горизонтальной (ландшафтной) ориентации картинок, то есть когда их ширина двукратно более высоты. При такой ориентации все объекты выходят значительно меньше размерами (исключая лежачие позы). По пояс в вертикальной ориентации и в горизонтальной – совсем не одно и то же, в первой человек будет намного крупнее. И значит в одной и той же сети проблемы мелкого плана начнут проявляться в ландшафтной ориентации гораздо ранее (на гораздо более крупных планах). Я в экспериментах с Dezgo фактически отказался от рисования людей в ландшафтной ориентации, при том что люблю именно её. Наиболее подвержены потере качества при мелких планах картинки, рисуемые в полном реализме (когда человек выглядит словно настоящий на фото), наименее – нарисованные в мультяшных 2d стилях. Если же говорить о сетях XL функций Dezgo, есть у них проблема совсем уж странного свойства. У большинства из них при недостаточной крупности плана резко ухудшается общее качество графики. Начинается размытие, сильное зашумление (шумы – это сторонняя информация, в графике выглядит словно грязь на однотонных областях вроде кожи, и так же как зернистость и нечёткость линий). Вид просто мерзкий. Подчеркну, всё это характерно для рисования преимущественно именно людей. Всё, что может быть нарисовано просто как фон (то есть почти всё кроме людей) не имеет выраженных проблем зависимости от крупности плана. По моим ощущениям не имеет. В том числе в ландшафтной ориентации. Безусловно, что угодно крупно рисуется красивее. Но критического проседания качества при мелкой отрисовке элементов фона как правило нет. В общем, при рисовании людей в Dezgo всегда надо следить за крупностью плана, ловить приемлемую и стремиться делать её по возможности больше (если вы хотите чтобы люди у вас выглядели красиво).