Тут лишь надо понимать, я задал текстом рисовать двух персонажей, и всё, и никаких лишних деталей, а если бы я прописал детали, рисунок менялся бы быстрее и более существенным образом.
Эксперимент 2. Картинка анимешной большеглазой принцессы в красивом платье, сидящей на троне. Преобразование в реализм.
20% - чуть объёма прибавилось у физиономии.30% - глаза уменьшились, лицо утратило гармоничность черт, стало неказистым.40% - глаза ещё уменьшились.50% - глаза стали щёлочками, уйдя в явно азиатскую стилистику, заметно изменилось узорное окаймление трона, платье немного изменилось в оттенке и узорах.60% - лицо нормализовать, стало довольно миленьким и красивым, правда от исходного в нём ничего не осталось, украшение на голове изменилось на совершенно другое, причёска изменилась, дизайн трона существенно изменился, платье примерно осталось тем же, но как бы обрело явно большее изящество и узорность. В целом реализм уже достигнут.70% - лицо снова полностью изменилось, стало абсолютно непохожим на предыдущее, причёска изменилась, украшение на голове изменилось, трон сильно изменился и упростился по дизайну (я в тексте для перерисовки не указал, что он вообще есть и она на нём сидит, я написал «cute girl in beauty dress», видимо поэтому не указанные в тексте детали стали стремиться к упрощению). Платье заметно изменилось по дизайну, но как минимум по размерам и окрасу осталось примерно тем же – ровно той же длины юбка, всё так же нет рукавов, вроде и похоже и не очень. Изменилось положение ног. Реализм изображения полный.75% - лицо снова кардинально изменилось, причёска изменилась, украшение для головы изменилось, платье изменилось по дизайну более существенным образом, трон преобразовался в большой деревянный стул. Заметно изменилось положение принцессы в кадре, исходно она отображалась как бы чуть сверху, под некоторым углом, а теперь никакого угла, прямое фронтальное отображение.Ну и третий эксперимент – я попытался перерисовать 2D аниме картинку с одним персонажем в реализм, для начала сделал это функцией «controlled text-to-image», но результат был отвратительным, лицо персонажа сжалось, превратившись в отталкивающее, подбородок фактически исчез, глаза выпучились, сохранив характерный для аниме увеличенный размер. Вот тогда я и подумал, а что если промежуточное преобразование сначала сделать, неполное. Попробовал на 40% преобразовать, результат неудовлетворительный, попробовал на 70, и на третьей попытке мне выпала картинка с красивым лицом, которое теперь сохранялось и при перерисовках в «controlled text-to-image». С другой стороны, в результате от исходной картинки у меня в трансформированной остались только поза, сходный дизайн одежды, причёска (правда анимешная, очень сложная, такую в реализме обычно не рисуют нейросети), ну и относительно похожий фон. В целом не очень-то похоже, другой персонаж, другая картинка, так что зачем это всё может быть надо, если не ради экспериментов, как я, этим занимаешься… я не знаю, зачем.
Пожалуй на основании моих экспериментов можно прийти к следующему заключению – в районе 60% Image-to-image позволяет генерировать картинки очень близкого к исходному содержания, внося в них определённые изменения некардинального характера. Лица персонажей на этом проценте заметно изменятся, мелкие детали тоже, но общая компоновка останется практически той же – стилистика и покрой одежды, позы, расположение предметов, особенности окружающей обстановки и фона. Таким образом, генерируя на 60% картинки с чем-то не устраивающей нас исходной картинки, можно попытаться поймать более удачный вариант с лучшими деталями или внесёнными определёнными указанными нами в тексте изменениями. Можно и на 50% пытаться что-то менять, тогда схожесть с исходной картинкой будет ещё выше. Можно и на меньших процентах, только тогда наверное стоит плюсить ключевые параметры в тексте, ну и всё равно вряд ли изменённые детали нарисуются качественно (что по идее не важно, ведь мы можем восстановить качество перерисовкой в «controlled text-to-image»).