Nous Research бросает вызов Claude: открытая модель кодирования против закрытых гигантов
NousCoder-14B — не просто ещё одна модель для кодирования: это демонстрация того, что полностью открытый пайплайн reinforcement learning позволяет небольшой команде за четыре дня приблизиться к уровню проприетарных систем — и при этом дать индустрии инструменты для воспроизведения результата. ---
Nous Research выпустила NousCoder-14B — открытую модель для программирования, достигающую 67,87% точности на бенчмарке LiveCodeBench v6. Модель обучена за 4 дня на 48 GPU Nvidia B200 и появляется в момент, когда Claude Code Anthropic захватил внимание разработчиков по всему миру. Принципиальное отличие NousCoder — полная прозрачность: опубликованы не только веса модели, но и весь reinforcement learning стек. ---
Как стартап, поддержанный Paradigm, за 4 дня создал конкурента Anthropic — и почему это важно для всей экосистемы разработки
Что произошло
«Момент Claude Code»: почему разработчики смотрят на AI иначе с начала 2025 года
В начале января 2025 года в лентах разработчиков начало циркулировать одно и то же наблюдение — Claude Code от Anthropic делает что-то принципиально новое.
Наиболее точно это сформулировала Яана Доган, principal engineer в Google, отвечающая за Gemini API. В своём посте на X, который стал вирусным, она написала: «Я дала Claude Code описание задачи — он за час воспроизвёл то, что мы строили год». Речь шла о системе оркестрации распределённых агентов, которую её команда разрабатывала двенадцать месяцев. Claude Code собрал приближение этой системы из трёх абзацев текста.
Таких историй к концу января накопилось достаточно, чтобы говорить о сдвиге восприятия. Дело не в том, что модели стали лучше генерировать код — они делали это уже несколько лет. Дело в том, что агентный подход Claude Code позволяет итерировать, запускать код, исправлять ошибки и двигаться дальше без участия человека на каждом шаге. Разработчики начали воспринимать AI не как умный автодополнение, а как соавтора.
Именно в этот момент Nous Research выпустила NousCoder-14B.
Что такое Nous Research и почему за ними стоит Paradigm
Nous Research — открытый AI-стартап с необычной идентичностью: anime-стиль в брендинге, сильное сообщество исследователей и последовательная ставка на полную открытость релизов. Компания публикует не просто модели, но и методологию — что в нынешней индустрии, где тренировочные пайплайны держатся в секрете, является исключением.
В апреле 2025 года Nous Research закрыла раунд на $50 млн под лидерством Paradigm — криптовенчурного фонда, основанного Фредом Эрсамом, сооснователем Coinbase. По ряду данных, суммарное финансирование компании достигло $65 млн.
Логика инвестиции читается через призму крипто-ценностей: Paradigm исторически делает ставку на открытые протоколы и децентрализованные системы. Open-source AI в этой системе координат — аналог DeFi в финансах: инфраструктура, которую никто не контролирует централизованно и которую любой может форкнуть и улучшить. Nos Research развивает платформу Psyche, ориентированную на децентрализованное обучение моделей — что прямо смыкается с интересами фонда.
Предыдущие релизы компании укрепили репутацию в open-source сообществе: Hermes 4 и DeepHermes-3, который Nous Research позиционировала как первую модель с «переключаемым» режимом расширенного мышления.
Как устроен NousCoder-14B: четыре дня, 48 GPU и 24 000 задач
Модель обучена на базе Qwen3-14B от Alibaba и показывает 67,87% точности на LiveCodeBench v6 — бенчмарке, тестирующем модели на задачах по спортивному программированию, опубликованных в период с августа 2024 по май 2025 года. Прирост составил 7,08 процентных пункта по сравнению с базовой моделью.
Обучение провёл Джо Ли — исследователь Nous Research и бывший участник соревнований по программированию. В техническом отчёте он описывает неожиданно личное измерение проекта: он сравнил прогресс модели со своим собственным путём на Codeforces. По его расчётам, NousCoder-14B прошла путь от рейтинга ~1600–1750 до ~2100–2200 — ровно тот же диапазон, который ему самому потребовал почти двух лет практики в возрасте 14–16 лет. Модель сделала это за четыре дня.
Важная оговорка, которую Ли сам подчёркивает: за свои два года он решил около 1 000 задач. Модели потребовалось 24 000. Люди остаются значительно более эффективными с точки зрения количества примеров, необходимых для обучения.
Технически процесс устроен так:
- Метод обучения: DAPO (Dynamic Sampling Policy Optimization) с верифицируемыми наградами — модель получает бинарный сигнал «правильно / неправильно» после выполнения кода против тест-кейсов
- Инфраструктура: облачная платформа Modal для параллельного запуска изолированных сред исполнения; лимиты — 15 секунд и 4 ГБ памяти на задачу
- Контекстное окно: обучение при 32 000 токенах, затем расширение до 40 000; лучший результат на эвалюации достигнут при ~80 000 токенах
- Оптимизация пайплайна: инференс и верификация перекрываются — пока проверяется одно решение, модель уже генерирует следующее
Радикальная открытость как стратегия
То, что отличает релиз Nous Research от большинства объявлений конкурентов — степень открытости. Опубликованы не только веса модели (под лицензией Apache 2.0 на Hugging Face), но и полный reinforcement learning стек на базе фреймворка Atropos, бенчмарк-сьют и тренировочный harness.
Это означает, что любой исследователь с достаточным вычислительным бюджетом может воспроизвести результат или улучшить его. В академическом сообществе это называют «reproducible research» — и в AI это до сих пор редкость.
Стена данных: главная проблема, о которой никто не говорит вслух
В техническом отчёте Джо Ли спрятано наблюдение, которое имеет значение далеко за пределами одного релиза.
24 000 задач по спортивному программированию, использованных для обучения — это, по оценке Ли, «значительная часть всех доступных верифицируемых задач в стандартизированном формате». Говоря прямо: в домене соревновательного программирования данные для обучения заканчиваются.
«Общее количество задач по спортивному программированию в интернете примерно того же порядка величины», — написал Ли, добавив, что это указывает на приближение к пределу высококачественных данных в этом домене.
Это проблема структурная. Код либо работает, либо нет — поэтому нужны задачи с известными правильными ответами, которые можно верифицировать автоматически. В отличие от языковых задач, здесь нельзя обойтись приближёнными метриками.
Ли указывает на два направления выхода из этого тупика: синтетическая генерация данных и self-play — когда модель учится не только решать задачи, но и генерировать новые. «Как только будет решена задача синтетической генерации задач, self-play становится очень интересным направлением», — пишет он.
Nous Research, поддерживаемая криптовентурой Paradigm, выпустила открытую модель NousCoder-14B для конкурентного программирования, которая достигает 67.87% точности на LiveCodeBench v6, обучаясь всего 4 дня на 48 GPU Nvidia B200. Модель конкурирует с закрытой системой Claude Code от Anthropic и представляет собой попытку доказать, что открытый исходный код и прозрачность могут соперничать с крупными пропrietary системами.
Открытый стек снижает барьер входа: публикация Atropos позволяет командам без огромных бюджетов воспроизводить и улучшать результаты исследования на уровне olympiad-reasoning
Крипто-деньги финансируют открытый AI: инвестиция Paradigm ($50 млн в апреле 2025) отражает тезис, что децентрализованные подходы к AI — следующий логичный шаг после DeFi
Проблема данных станет главным ограничением, не compute: NousCoder-14B обозначил потолок в конкретном домене; это предупреждение для всей индустрии
Агентность vs. точность: NousCoder обучен на одиночных решениях, Claude Code оптимизирован для итеративной работы — это разные продукты с разными сценариями применения
B параметров против значительно больших проприетарных систем: паритет по бенчмаркам при меньшем размере модели — аргумент в пользу эффективности открытых подходов
Какую точность на бенчмарке LiveCodeBench v6 достигла модель NousCoder-14B?
Какой подход к AI-инструментам для кодинга ты предпочитаешь?
Практический разбор рынка без шума. Делюсь тем, что торгую сам, объясняю логику и помогаю понимать контекст.




