Claude vs ChatGPT vs Gemini - погонял месяц на боевых задачах

Все эти бенчмарки - херня. MMLU, HumanEval, цифры в графиках. На бумаге Gemini рвёт всех. На практике - ну такое.

Я месяц гонял три модели на своих реальных задачах. Без научпопа. Вот что вышло.

Условия теста

Подписки на всех трёх - Claude Pro, ChatGPT Plus, Gemini Advanced. 60 баксов в месяц улетело. Не жалко, эксперимент окупился.

Задачи - мои настоящие, из работы:

Лендинг для юристов. Скормил всем трём одинаковый бриф.

ChatGPT выдал что-то приличное, но гладкое до тошноты. Как будто 200 копирайтеров одновременно это писали.

Gemini - формально правильно, но без души. Сухо. Будто методичку Минтруда читаешь.

Claude (Sonnet 4.5) - неожиданно живой текст. С метафорами, с ритмом. Заголовок "Банкротство - не приговор. Это перезагрузка" - его идея.

Клиент выбрал вариант Claude. Заплатил 70К. 1:0 в пользу Claude.

Рефакторил парсер Авито. Старый код - лапша на 400 строк.

Claude в Claude Code разобрал на модули за один заход. Тесты прошли с первого раза.

ChatGPT (с o1) тоже справился, но пришлось три раза просить "а вот тут переделай". Долго думает.

Gemini - упал на середине, сказал "слишком много контекста". В 2026, блять, с заявленным 2М контекстом. Спасибо, до свидания.

Claude 2:0.

Финотчёт на 80 страниц, нужно вытащить ключевые цифры по дочкам.

ChatGPT начал галлюцинировать на 40-й странице. Придумал выручку, которой не было.

Claude справился, но с горем пополам - некоторые таблицы переврал.

Gemini 2.5 Pro - идеально. Все цифры на месте, с указанием страниц. Здесь его 2М контекста реально работают.

Gemini 1:0 в этой категории.

Если коротко: для серьёзных картинок все трое сосут у Midjourney v7 и Flux Pro.

Но если выбирать из этих трёх - Gemini 3 Pro Image (Nano Banana Pro) ощутимо лучше. ChatGPT-овский DALL-E 4 - мыло. Claude картинки не делает вообще.

Мой друг Денис снимает рилсы про автомобили. 180К подписчиков. Я ему дал сравнить вслепую - три сценария от трёх моделей.

Угадал автора Claude с первого раза. "Это явно не нейронка писала, тут шутки про БМВ-шников живые".

Спойлер: нейронка. Просто Claude.

Если бы пришлось выбрать одну - Claude. Без раздумий.

Дальше будет разбор Claude Code vs Cursor vs Bolt - там тоже неожиданные результаты. Подписывайся, не пропусти.