Claude vs ChatGPT vs Gemini — погонял месяц на боевых задачах
Не синтетика, а реальные задачи: код, тексты, анализ PDF, картинки. Кто реально побеждает в 2026.
Все эти бенчмарки — херня. MMLU, HumanEval, цифры в графиках. На бумаге Gemini рвёт всех. На практике — ну такое.
Я месяц гонял три модели на своих реальных задачах. Без научпопа. Вот что вышло.
Условия теста
Подписки на всех трёх — Claude Pro, ChatGPT Plus, Gemini Advanced. 60 баксов в месяц улетело. Не жалко, эксперимент окупился.
Задачи — мои настоящие, из работы:
- Написать лендинг для клиента (юристы по банкротству)
- Отрефакторить 400 строк Python
- Разобрать PDF с финотчётом на 80 страниц
- Сгенерить 10 картинок для соцсетей
- Написать сценарий для рилса на 60 секунд
Тексты — Claude рвёт
Лендинг для юристов. Скормил всем трём одинаковый бриф.
ChatGPT выдал что-то приличное, но гладкое до тошноты. Как будто 200 копирайтеров одновременно это писали.
Gemini — формально правильно, но без души. Сухо. Будто методичку Минтруда читаешь.
Claude (Sonnet 4.5) — неожиданно живой текст. С метафорами, с ритмом. Заголовок "Банкротство — не приговор. Это перезагрузка" — его идея.
Клиент выбрал вариант Claude. Заплатил 70К. 1:0 в пользу Claude.
Код — Claude Code побеждает, но Cursor с GPT-5 близко
Рефакторил парсер Авито. Старый код — лапша на 400 строк.
Claude в Claude Code разобрал на модули за один заход. Тесты прошли с первого раза.
ChatGPT (с o1) тоже справился, но пришлось три раза просить "а вот тут переделай". Долго думает.
Gemini — упал на середине, сказал "слишком много контекста". В 2026, блять, с заявленным 2М контекстом. Спасибо, до свидания.
Claude 2:0.
PDF и большой контекст — Gemini внезапно красавчик
Финотчёт на 80 страниц, нужно вытащить ключевые цифры по дочкам.
ChatGPT начал галлюцинировать на 40-й странице. Придумал выручку, которой не было.
Claude справился, но с горем пополам — некоторые таблицы переврал.
Gemini 2.5 Pro — идеально. Все цифры на месте, с указанием страниц. Здесь его 2М контекста реально работают.
Gemini 1:0 в этой категории.
Картинки — никто из них не Midjourney
Если коротко: для серьёзных картинок все трое сосут у Midjourney v7 и Flux Pro.
Но если выбирать из этих трёх — Gemini 3 Pro Image (Nano Banana Pro) ощутимо лучше. ChatGPT-овский DALL-E 4 — мыло. Claude картинки не делает вообще.
Сценарий для рилса
Мой друг Денис снимает рилсы про автомобили. 180К подписчиков. Я ему дал сравнить вслепую — три сценария от трёх моделей.
Угадал автора Claude с первого раза. "Это явно не нейронка писала, тут шутки про БМВ-шников живые".
Спойлер: нейронка. Просто Claude.
Итог по баксам и пользе
- Claude Pro — оставил. Использую 80% времени.
- ChatGPT Plus — оставил для голосового режима и DALL-E. Иногда быстрее.
- Gemini Advanced — оставил только из-за больших PDF и Deep Research.
Если бы пришлось выбрать одну — Claude. Без раздумий.
Дальше будет разбор Claude Code vs Cursor vs Bolt — там тоже неожиданные результаты. Подписывайся, не пропусти.