Нейронка рисует алфавит
Забайтился на видос, где Chat GPT попросили нарисовать Алфавит и он нарисовал дичь.
Подумал, "ну я то подойду к вопросу грамотно, через промт"
Ну да, ну да...
Диалог с ChatGPT
Я:
напиши промт для генерации картинки русского алфавита, где на каждую букву нарисовано своё животноеChat GPT:
Пример промта для Midjourney / Stable Diffusion:
«Постер “Русский алфавит и животные” — белый фон, ровная сетка из 33 ярких квадратов-карточек (по 5–7 в ряд).
В каждой карточке:
• крупная русская буква (шрифт без засечек) + рядом/поверх неё дружелюбный мультяшный зверь, имя которого начинается на эту букву:
А — аист, Б — белка, В — волк, Г — гусь, Д — дятел, Е — енот, Ё — ёж, Ж — жираф, З — заяц, И — игуана, Й — йоркширский терьер, К — кошка, Л — лиса, М — медведь, Н — носорог, О — овца, П — пингвин, Р — рысь, С — слон, Т — тигр, У — утка, Ф — фламинго, Х — хамелеон, Ц — цапля, Ч — черепаха, Ш — шакал, Щ — щука, Ы — (стилизуй саму букву как весёлое мифическое существо), Ъ и Ь — преврати сами буквы в забавных зверьков, Э — эму, Ю — юла-рыба (луна-рыба), Я — як.
• никаких подписей кроме букв.
Стиль: плоская векторная иллюстрация, мягкая пастель, чистые линии, дружелюбная детская эстетика, лёгкая тень под карточками, 8K UHD, high-detail, bright, cheerful».Я:
А теперь сгенерируй на этот запрос изображение

Результат вы видите...
Можно заметить, как Chat GPT думает сверху вниз, сначала всё более менее, а под конец какая-то ерунда.
Но давайте мы посмотрим, а как Chat GPT сделает тот же алфавит но на родном Английском языке:



Как мы видим, выбор его родного английского языка не помог ему и качество осталось таким же, а по ощущениям, даже похуже.
И мы даже китайский попробовали:

А давайте попросим нарисовать одно животное на одну букву:


Итог:
Chat GPT не может нормально удерживать контекст всех деталей картинки, если деталей много. Если попросить его нарисовать что-то одно, то он нарисует это нормально.
Вывод, чтобы получить адекватный рисунок, не надо перегружать описание большим количеством элементов.