Pony Diffusion V6 – универсальная модель, способная создавать впечатляющие не фотореалистичные изображения различных антропоморфных, животных и гуманоидных видов и их взаимодействий на основе простых текстовых запросов.
Важная информация
Обязательно загружайте эту модель с параметром clip skip 2 (или ‑2 в некоторых программах), иначе вы получите изображения низкого качества.
Модель поддерживает широкий спектр стилей и эстетик, но предлагает шаблон основного запроса, который позволяет генерировать качественные изображения без использования отрицательных запросов и с настройками по умолчанию.
Используйте теги:score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up, ваше описание, tag1, tag2
(Ранее версии Pony Diffusion использовали более простой модификатор качества score_9. В V6 XL длинная версия связана с проблемой обучения, которую уже нельзя было исправить. Вы можете использовать score_9, но его эффект будет слабее по сравнению с полной строкой).
Модель спроектирована так, чтобы в большинстве случаев не требовать отрицательных запросов и других модификаторов качества, таких как “hd”, “masterpiece” и т.д.
Специальные теги
Эта модель способна распознавать множество популярных и малоизвестных персонажей из сериалов.
Если вас интересует конкретно стиль пони, рекомендую использовать один из следующих шаблонов:
"anthro/feral pony, остальная часть запроса"
"source_pony, остальная часть запроса"
Модель обучена на комбинации текстовых запросов и тегов и способна понимать оба формата, так что описывать желаемый результат обычным языком работает в большинстве случаев. Тем не менее, вы можете добавить некоторые теги после основного запроса для усиления эффекта.
Рекомендации
Рекомендуется использовать метод Euler a с 25 шагами и разрешением 1024px, хотя модель в целом поддерживает большинство разрешений SDXL.
Модель иногда генерирует псевдоподписи, которые сложно удалить даже с отрицательными запросами. К сожалению, это проблема обучения, которую автор планирует исправить.
Технические детали
Модель была обучена на примерно 2.6 миллионах изображений, эстетически оцененных на основе личных предпочтений автора, с соотношением примерно 1:1 между наборами данных аниме/мультфильмов/фурри/пони и соотношением 1:1 между безопасными/сомнительными/явно откровенными рейтингами. Примерно 50% всех изображений были снабжены высококачественными, детализированными описаниями, что обеспечивает очень сильные возможности работы с естественным языком.
Все изображения были обучены как с описаниями (когда они доступны), так и с тегами. Имена художников были удалены, и исходные данные были отфильтрованы. Любой явный контент, связанный с несовершеннолетними персонажами, был отфильтрован.