Кто лучше вайбкодит?

В интернете можно найти сотни бенчмарков, по которым сравнивают нейросети: одни гоняют их по решению университетских задач и математических головоломок, другие проверяют логику и здравый смысл, третьи оценивают практическое применение: способность писать код, создавать тексты или генерировать идеи.
Почему бы не провести своё исследование?

Спойлер: на мой вгляд, Google справился лучше всех.

Задача: собрать лендинг для конференции Digital Learning с новым дизайном.

Условия:
1. Один плохой промпт (мы же хотим написать ИИшке «сделай хороший сайт для конференции» и чтобы она сделала, правда?);
2. Дал ссылку на лендинг конференции (чтобы было понятно, что за мероприятие, какая программа и условия);
3. Не больше 2 итераций правок (с бесконечными правками всё что угодно можно довести до идеала);
4. Нужна только главная страница сайта.

Участники:Google Gemini (с Antigravity (да, не совсем честно)), DeepSeek, GPT-5.1 (OpenAI) и Grok.

Результаты есть в видео в шапке. При клике на ссылки выше можно «пощупать» сайты самим.

По каким критериям сравнивал?
1. Дизайн (субъективно)
2. Функциональность (наличие багов и прикольные/полезные/сложные функции)
3. Адекватность информации*
4. Скорость работы
*Конечно, правильно было бы разделить запрос на 2 части: в начале составить текст и отредактировать его, а потом попросить использовать этот текст в лендинге. Но с таким подходом любая нейросеть напишет адекватный текст.

🎨 Дизайн
Мне понравились все варианты.
Больше всех постарался Google: добавил кучу ховеров и анимаций, уместно использовал шрифты, «трендово» применил бенто-стиль (если бы вместо смайликов нарисовал иконки – цены бы ему не было).

С точки зрения мобильной версии – все справились хорошо, кроме ChatGPT. Адаптив там есть, но весь кривой.

⚙️ Функциональность и баги
Тут очевидное лидерство за Google (ну кто бы сомневался, т.к. я использовал Antigravity).

Всё работало с самого начала без багов. Отдельный плюс за удобную систему фильтров. В дополнительных итерациях добавил фотографии спикеров (ему, как и всем остальным, пришлось кидать ссылки на фотки) + воспользовавшись «инициативой» платформы, добавил чат с ИИ (промпт писал тоже Google, и над ним явно нужно поработать), но фишка классная.

DeepSeek сделал таймер обратного отсчёта (скопировал идею с оригинального сайта). Но если идея хорошая, почему бы и не скопировать?
Но был единственным, у кого были баги и после первой итерации, и после второй всё исправить не удалось.

ChatGPT добавил очень неудобную (но сложную) форму для заявок. Плюс за сложность, минус за UX.

📝 Адекватность информации
Тут не справились все.

DeepSeek более-менее постарался брать информацию с сайта, а не выдумывать всё полностью (не то чтобы получилось хорошо, но лучше, чем у других).

Grok вообще не заморачивался и накидал шаблон – дальше заполняй сам (вот тут поменяй имя на нужное тебе, сюда ссылку на фотку, дальше тему укажи, хочешь добавить ещё выступления – скопируй блок). Интересное сделал ИИ – рутину, человек, пожалуйста, делай сам.

⚡️ Скорость работы
Google, ChatGPT и Grok справились практически одновременно. А вот DeepSeek думал в несколько раз дольше, и контекст оказался слишком большим. Пришлось просить его продолжать.

А чья работа больше всего понравилась вам?

———-

Алексей Миляев и команда сообщества Digital Learning

Related Posts