29 сентября 2025 года Anthropic выпустила Claude Sonnet 4.5. Это новая AI-модель для программирования, и она действительно хороша. Я сам тестировал её несколько недель, и результаты меня удивили.![Anthropic представила лучшую модель для кодинга — Claude Sonnet 4.5 - 1]()
Но самое интересное — модель может работать автономно более 30 часов подряд. Не просто генерировать код, а делать полноценную работу. Разработчики давали ей доступ к серверу, и она сама развертывала базы данных, покупала доменные имена, настраивала окружение. Причем без ошибок.
Я раньше учил друзей программированию. Объяснял базовые вещи, показывал, как писать код. Сейчас все изменилось. С такими инструментами можно делать в десять раз больше работы.
![Anthropic представила лучшую модель для кодинга — Claude Sonnet 4.5 - 3]()
Интеграция с IDE:VS Code — есть нативное расширение Claude Code плюс интеграция через GitHub Copilot.
JetBrains IDE (IntelliJ IDEA, PyCharm, WebStorm) — поддержка Claude Code и GitHub Copilot.
Cursor — развернул Claude Sonnet 4.5 для всех пользователей. CEO Cursor сказал, что это "state-of-the-art производительность". Пользователи сообщают о 30% меньше переделок кода по сравнению с обычным Cursor.
Также есть интеграции с Windsurf, Replit, Zed и другими редакторами.

Что умеет эта модель
Claude Sonnet 4.5 решает 77.2% реальных задач разработки на тесте SWE-bench Verified. Это тест, где модели дают настоящие баги из GitHub и смотрят, сможет ли она их исправить. Для сравнения: GPT-5 решает 72.8%, Gemini 2.5 Pro — 63.8%.
Но самое интересное — модель может работать автономно более 30 часов подряд. Не просто генерировать код, а делать полноценную работу. Разработчики давали ей доступ к серверу, и она сама развертывала базы данных, покупала доменные имена, настраивала окружение. Причем без ошибок.
Я раньше учил друзей программированию. Объяснял базовые вещи, показывал, как писать код. Сейчас все изменилось. С такими инструментами можно делать в десять раз больше работы.
Рефакторинг кода
Помните legacy-код с вложенными условиями на семь уровней? Когда смотришь и не понимаешь, что вообще происходит? В одном тесте модель взяла функцию на 210 строк с циклической сложностью 16 и сделала из нее 30 строк кода со сложностью 3-6. Модель распутала 13 вложенных условий, вытащила повторяющуюся логику, разбила всё на нормальные функции. И знаете что? Тесты после рефакторинга прошли все. Компания Replit подтвердила: ошибки при редактировании кода снизились с 9% до 0%. Ноль процентов — это серьёзно. Когда я учил людей программированию, рефакторинг был всегда сложной темой. Нужно понимать код, видеть паттерны, знать, как лучше переписать. Сейчас модель делает это автоматически. И делает хорошо.Поиск и исправление багов
У меня был случай. Друг написал приложение для стартапа. Production падал, в логах куча ошибок, никто не понимает в чём дело. Раньше я бы сел и несколько часов разбирался. Сейчас можно просто показать логи Claude. Компания Cora (делают AI-ассистента для разработки) рассказывала кейс: их модель на базе Claude Sonnet 4.5 решила баг за 20 минут. Предыдущая версия Claude Opus 4.1 вообще не справилась с этим багом. В CrowdStrike (это кибербезопасность) с помощью Claude сократили время обработки уязвимостей на 44%. При этом точность выросла на 25%. Модель сама находит уязвимости и исправляет их, пока никто их не эксплуатирует.Генерация тестов
Написание тестов — это скучно. Но нужно. Claude Sonnet 4.5 генерирует тесты с успешностью прохождения около 95%. Причём 85% этих тестов реально полезные, а не формальность. Модель понимает структуру проекта, подстраивается под нужный фреймворк (Jest, pytest, JUnit), создаёт mock-объекты, покрывает граничные случаи. Можно работать в стиле TDD: сначала попросить написать тесты, потом писать код под эти тесты. Мне нравится, что модель находит edge cases, о которых сам не подумаешь. Она может сгенерировать 50+ тестовых случаев для одной функции. Когда я учил людей, всегда говорил: тесты важны, пишите тесты. Но все понимали, что это долго. Сейчас этой проблемы нет.Code Review
Code review всегда был болезненной темой. Коллега может придраться к мелочам или пропустить серьёзную проблему. Claude делает комплексный review за 2 минуты. Для сравнения: GPT-5 делает то же самое за 10 минут. Модель проверяет:- Качество кода (именование, структура)
- Безопасность (валидация входов, уязвимости)
- Производительность (временная сложность, эффективность запросов)
- Соответствие стандартам проекта
Что делает Claude особенным
На рынке много AI-инструментов для кодинга. GitHub Copilot, Cursor, GPT-5, Gemini. Почему я выделяю именно Claude?
- Первое — производительность. 77.2% на SWE-bench — это лучший результат среди всех доступных моделей.
- Второе — автономность. Более 30 часов непрерывной работы. Это не "напиши функцию", это "построй приложение целиком".
- Третье — работа с компьютером. 61.4% на тесте OSWorld. Модель умеет работать с браузерами, таблицами, любыми программами как человек.
- Четвёртое — production-ready код. Не "вроде работает", а действительно работает. Снижение ошибок до нуля.
- Пятое — координация инструментов. Модель может запускать несколько команд параллельно, координировать разные сервисы.
- Шестое — доменная экспертиза. Хорошо разбирается не только в коде, но и в финансах, праве, медицине. Это подтверждают эксперты в этих областях.
- Седьмое — безопасность. Низкие показатели лести и обмана, устойчивость к prompt injection атакам.
Честное сравнение с конкурентами
Нужно быть честным. У каждого инструмента есть плюсы и минусы.GPT-5
Simon Willison (известный разработчик, создатель Datasette) тестировал Claude и сказал: "Лучшая модель для кода, чем GPT-5-Codex". Но есть нюанс. Команда Every.to дала обеим моделям большой pull request на review. Claude справился за 2 минуты. GPT-5 Codex — за 10 минут. Но GPT-5 нашёл сложный граничный случай, который Claude пропустил. Вывод простой. Для быстрой разработки — Claude отличный выбор. Для критичного production-кода лучше использовать GPT-5 для финального review. К тому же GPT-5 дешевле в 2.4 раза по входным токенам.Gemini 2.5 Pro
Gemini отстаёт по производительности — 63.8% на SWE-bench против 77.2% у Claude. Но у него контекстное окно до 2 миллионов токенов. Это в 10 раз больше, чем у Claude! Если работаете с огромной кодовой базой, где нужно загрузить сотни файлов одновременно — Gemini может быть удобнее. Плюс он примерно вдвое дешевле.GitHub Copilot
Copilot — лидер рынка. 20 миллионов пользователей, 90% компаний Fortune 100. Теперь он предлагает Claude Sonnet 4.5 как одну из моделей. Copilot выигрывает в real-time completion и интеграции с GitHub (PR reviews, Issues, Actions). Фиксированная цена $10-39 в месяц вместо оплаты за токены. Если вы в экосистеме GitHub — это хороший выбор.Как начать работать
Доступ к модели простой. Веб-интерфейс claude.ai:- Бесплатный план — около 100 сообщений в день
- Pro план $20/месяц — около 45 сообщений каждые 5 часов (до 6,500 в месяц)
- Max план от $100/месяц — в 5-20 раз больше, чем Pro
- $3 за миллион входных токенов
- $15 за миллион выходных токенов
- Prompt caching даёт 90% экономии ($0.30 вместо $3)
- Batch processing — скидка 50% ($1.50/$7.50)
Интеграция с IDE:VS Code — есть нативное расширение Claude Code плюс интеграция через GitHub Copilot.
JetBrains IDE (IntelliJ IDEA, PyCharm, WebStorm) — поддержка Claude Code и GitHub Copilot.
Cursor — развернул Claude Sonnet 4.5 для всех пользователей. CEO Cursor сказал, что это "state-of-the-art производительность". Пользователи сообщают о 30% меньше переделок кода по сравнению с обычным Cursor.
Также есть интеграции с Windsurf, Replit, Zed и другими редакторами.
Реальные примеры использования
Цифры из тестов — это одно. Что происходит в реальности?- Devin AI (автономный AI-разработчик) — рост точности планирования на 18%, улучшение end-to-end метрик на 12%.
- Vercel (платформа для Next.js) — улучшение производительности на 17% на задачах Next.js.
- Replit — снижение ошибок редактирования с 9% до 0%.
Поддержка языков
Claude Sonnet 4.5 поддерживает все основные языки. Особенно хорош в:- Python — Django, Flask, FastAPI, библиотеки для data science (Polars, Pandas, NumPy). Работает с виртуальными окружениями, pip, poetry.
- JavaScript/TypeScript — отличный вывод типов, выполнение Node.js кода, установка пакетов из NPM.
- Frontend — React с hooks и функциональными компонентами, правильная архитектура, state management, TypeScript. Также Vue, Angular, Svelte.
- Java и C# — enterprise-код с пониманием паттернов, Spring Framework, .NET.
Как меняется роль разработчика
Многие боятся, что AI заменит программистов. Я так не думаю. AI меняет то, чем занимается разработчик. Профессор Armando Solar-Lezama из MIT сказал хорошо: "Code completion is the easy part; the hard part is everything else". Настоящая работа программиста — это:- Архитектурное планирование
- Понимание бизнес-требований
- Выбор технологий
- Креативное решение проблем
- Коммуникация в команде
- Ментроринг джунов
- Оптимизация производительности
Цифры adoption
Stack Overflow Developer Survey 2025: 84% разработчиков используют или планируют использовать AI-инструменты. 51% профессиональных разработчиков используют их ежедневно. Google DORA Report 2025 (5,000 респондентов): 90% software developers используют AI-инструменты. Медиана использования — 2 часа в день. 80%+ сообщают о росте продуктивности. В тестах разработчики завершают задачи на 55% быстрее. Java-разработчики видят до 61% кода, генерируемого AI. Но есть интересный момент. Только 24% сообщают о высоком уровне доверия AI. 46% активно не доверяют точности инструментов. Sentiment снизился с 70%+ до 60% в 2025. Исследование METR (июль 2025) показало замедление на 19% у опытных разработчиков при использовании AI. Хотя разработчики субъективно чувствовали ускорение на 20%. Что это значит? Контекст важен. AI ускоряет работу менее опытных разработчиков. Для экспертов AI пока дополнение, не замена.Будущее разработки
Anthropic агрессивно развивается. Три крупных релиза за пять месяцев 2025 года. Компания достигла $5 миллиардов annual recurring revenue и утраивает персонал к концу 2025. Новые возможности:- Extended Thinking with Tool Use — модель может чередовать рассуждения и использование инструментов (веб-поиск, выполнение кода).
- Улучшенная память — локальный доступ к файлам для непрерывности между сессиями.
- Снижение "хитрого" поведения на 65% — модель реже пытается обойти задачу нестандартно вместо правильного решения.
- Claude Code — фоновые задачи через GitHub Actions, интеграция с VS Code и JetBrains, автоответ на PR feedback.
Практические советы
Если решите попробовать Claude Sonnet 4.5, вот что я рекомендую:- Начните с рефакторинга. Low-risk задача, где можно оценить качество без риска.
- Используйте TDD. Просите сначала написать тесты, потом код. Качество будет выше.
- Давайте контекст. Чем больше модель понимает о проекте, тем лучше результат.
- Комбинируйте инструменты. Claude для рефакторинга, Copilot для completion, GPT-5 для критичного review.
- Учитесь у AI. Смотрите, как модель решает задачи. Это улучшит ваши навыки.
- Не доверяйте слепо. AI может ошибаться. Всегда проверяйте код.
- Автоматизируйте рутину. Code review, документация, тесты — это для AI.
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ