WordPress блок для генерації картинок за допомогою штучного інтелекту

Cтворення картин штучним інтелектом не нове явище, проте якість генерованих ними зображень завжди залишала бажати кращого. Звісно галузь невпинно розвивається, нейромережі збирають все більше даних та з кожним днем роблять маленьки кроки вперед. Сервіси, що пропонують подібні послуги набирають популярності, а картини згенеровані штучним інтелектом починають сперечатись за перемогу в конкурсах з картинами реальних художників.

Потроху дані сервіси починають інтегруватись і в галузь розробки веб-сайтів. Нещодавно в магизині блоків та плагінів для WordPress з’явився блок Block Diffusion, інтегрований із сервісом Replicate, що дозволяє генерувати зображення за текстовим запитом. Сервіс використовує Stable Diffusion для створення зображень на основі текстових підказок. Згодом блок обіцяє додати декілька інших опцій.

Модель було навчено на LAION-5B, відкритому навчальному наборі даних AI, що містить понад п’ять мільярдів пар зображення-текст. Він має певні обмеження, оскільки він не може досягти ідеальної фотореалізмності або відтворити читабельний текст. Також можуть виникати труднощі з відтворенням облич і людей.

Налаштування

Щоб користуватись блоком необхідно ввести API ключ сервісу Replicate. Щоб зареєструватись в самому сервісі можна потрібно мати Github аккаунт (інших способи поки що недоступні). Далі після реєстрації сервіс автматично генерує ключ який необхідно ввести в налаштування блоку. Після цього вам буде доступно до 30-40 генерувань зображення безкоштовно.

Оскільки для генерації картини яку ви задумали можна знадобитись чимало спроб то цього може вистачити хіба що для ознайомлення з можливостями сервісу. Далі вартість буде становити 0,01 долара США за зображення.

Якість генерованих зображень

На генерування одного зображення необхідно біля 10 секунд, що є дужим хорошим результатом в порівнянні до більшості подіюних сервісів, яким потрібно до кількох хвилин. Імоврність того що ви одразу отриммаєте бажаний результат вкрай мала, тому прийдеться повоторити генерацію кілька разів. Тому економія часу з даним сервісом доволі відчутна. Досить часто сервіс береться за відтворення людських облич проте якість їх доволі невисока.

Підтримка української мови

Сервіс розпізнає текстові запити українською мовою проте якість такого розпізнавання дуже невисока. Швидше за все вам доведеться вводити запит англійською мовою, а також зробити якомога чіткіший запит.

Що далі?

Плагін Block Diffusion є особистим побічним проектом розробника, і він не планує перетворювати його на комерційний проект.

Немає планів блокувати будь-які функції преміум плагіном. Усі функції будуть додаватись до безплатної версії на wordpress.org. Згодом я планую додати всі функції, які підтримує Replicate, а також додаткові функції спеціально для спільноти WordPress

Kevin Batdorf