Первый отчёт Cursor: код пишут вдвое быстрее, а треть AI-правок коммитят без ревью
Cursor собрал внутренние метрики своей IDE за год и показал, как изменилась работа разработчика в эпоху агентов. Скорость удвоилась, ревью растворяется в автоматизации, а Composer 2.5 переписывает экономику моделей.
26 мая Cursor — флагманский AI-редактор от Anysphere — выложил первый Developer Habits Report за весну 2026. По форме это агрегат продуктовых данных самой IDE: сколько строк добавляют разработчики, как часто они принимают подсказки агента, какие модели используют, во что обходится один запрос. Цифры исключают пользователей в Privacy Mode и построены на скользящих средних за неделю и месяц. Получилась самая откровенная за последние пару лет картина того, как именно встроились агенты в ежедневный workflow.
Скорость кода удвоилась за годКоличество строк, которые средний разработчик добавляет за неделю, выросло с 3,6 тысячи в январе 2025 до 8,6 тысячи к середине мая 2026. Это рост в 2,4 раза — и заметный скачок начался ровно в январе 2026, когда вышли новые поколения агентских моделей.
Размер pull request тоже подрос. По 75-му перцентилю один PR теперь содержит 345 строк изменений против 126 годом раньше. Доля «мега-PR» с тысячей и более строк увеличилась с 8% до 13,8%. Сессии стали глубже: агент в среднем делает 145 вызовов инструментов за один заход — на 30% больше, чем два месяца назад.
И ещё одна цифра, которая объясняет всё остальное. Survival share — доля AI-строк, переживающих ревью и остающихся в коде через час после принятия — выросла с 76,6% до 80,6% за пять месяцев. Код, который пишет агент, всё чаще оказывается рабочим.
38% коммитов идут без ручного ревьюВ начале года только 7% изменений, сгенерированных агентом, попадали в коммит без отдельного шага «принять диф вручную». К маю эта доля выросла до 38,5% — рост более чем в пять раз. Тренд звучит куда серьёзнее любых заявлений о «трансформации индустрии»: значительная часть кодовой базы топовых команд уже пишется и мержится без ручного контроля.
Cursor подаёт это аккуратно: «разработчики доверяют агентам провести больше работы через коммит-флоу». На практике это смещение центра тяжести инженерного процесса. Ревью не исчезает, оно переезжает выше — на уровень планирования задачи, постановки промпта, тестов. Часть страховки уходит во встроенные инструменты вроде Bugbot и автоматических security-агентов, которые в отчёте показаны графиком без значений — но с устойчивым ростом.
Топ-1% сделал в 46 раз больше строк, чем медианаТут начинается самая некомфортная часть отчёта. Использование агентов распределено крайне неравномерно. Коэффициент Джини по AI-строкам — 0,77, по расходам на токены — 0,75. Это уровень концентрации, который в экономике называют «олигархической» структурой распределения.
В цифрах это выглядит так: разработчик из 99-го перцентиля добавляет в 46 раз больше строк, чем медианный активный пользователь, и мержит в 15 раз больше PR. Между p90 и p50 разрыв скромнее — в десять раз по строкам, в четыре по PR — но всё равно огромный. Cursor подчёркивает, что разрыв растёт в абсолютных значениях по мере того, как общее использование AI увеличивается.
Дело здесь не в самом инструменте. Дело в навыке: кто-то научился держать в голове промпт, контекст и архитектуру одновременно, кто-то по-прежнему правит подсказки точечно. Рынок труда в следующие пару лет будет отыгрывать именно эту разницу.
Composer 2.5 ломает экономику моделейCursor впервые публично показал бенчмарк своих моделей против внешних топ-моделей. На CursorBench 3.1 — внутреннем eval-наборе — Composer 2.5 набирает 63,2% за 55 центов за задачу. Для сравнения: Opus 4.7 в максимальном режиме даёт 64,8%, но стоит $11,02 — в двадцать раз дороже. GPT-5.5 в режиме extra high — 64,3% за $4,37.
CursorBench — внутренний набор реалистичных задач Cursor для оценки моделей: правки кода, рефакторинг, баг-фиксы, навигация по проекту. Не публичный бенчмарк, но именно по нему компания принимает решения, какие модели подключать по умолчанию.
Разброс стоимости одного агентского запроса между моделями — почти девятикратный: от 18 центов у Composer 2.5 до $1,57 у Opus 4.7. По стоимости принятой строки кода — семикратный. Композер за 0,18 цента за строку против 1,19 цента у Opus 4.6.
Это сильный сигнал. Cursor играет в ту же игру, в которую раньше играли Apple с собственными чипами и Amazon с Graviton: вертикальная интеграция стека ради контроля экономики. Если внутренняя модель закрывает 95% задач за десятую часть цены внешней, у Anthropic и OpenAI возникает проблема: IDE-платформы превращаются из клиентов в прямых конкурентов.
Модели больше читают, чем пишутОтношение входных токенов к выходным выросло с 4,5х в январе до 13х на пике в апреле. Сейчас оно колеблется около 11х. Если убрать кэш, то более 90% всех токенов в агентской работе — это вход: контекст файлов, история диалога, результаты tool calls. На выход уходит меньше десятой части.
С учётом кэша картина ещё интереснее: 89-90% всех токенов составляют cache reads. Агент работает не с чистого листа, он постоянно перечитывает уже загруженное. Cache writes занимают пару процентов, чистый input — около 7%, output — меньше процента.
В стоимости это тоже видно. Доля входных токенов в общей цене запроса выросла с 47% до примерно 70%. Основная плата теперь идёт за чтение контекста, а генерация дешевеет. Cursor резюмирует это одной строкой: «модели читают больше, прежде чем писать». И корреляция с survival share выглядит не случайно — чем больше контекста модель тянет в себя, тем дольше её код живёт в коммите.
От IDE к платформе программируемых агентовCursor аккуратно намекает на следующий шаг. SDK runs и Cursor Automations: графики этих метрик опубликованы без цифр, но с заметной растущей кривой. Компания превращается из редактора в платформу программируемых агентов, которую можно встраивать в свои пайплайны. Тот же путь сейчас проходит GitHub с Copilot Workspace и Anthropic со своим Claude Agent SDK.
Главное в отчёте — даже не отдельные цифры. Это первая попытка крупного игрока перевести разговор об «AI в разработке» с уровня лозунгов на язык измеримой динамики. И если экстраполировать те же кривые на конец 2026 года, разработчик из 2024 года с большим трудом узнает свою работу. Если вы пока используете агенты эпизодически, самое время посмотреть, как именно работают power users из верхнего процента. Разрыв в продуктивности растёт каждый месяц.
Анархист
16 дней назад
#
Конфетка
14 дней назад
#
Satoshi
14 дней назад
#