Cursor опублікував технічний звіт Composer2: середовище RL повністю імітує реальні сценарії користувачів, оцінка базової моделі підвищилася на 70%

BlockBeatNews

Згідно з моніторингом 1M AI News, Cursor опублікував технічний звіт Composer 2, вперше розкривши повний план тренування. Базова модель Kimi K2.5 побудована на архітектурі MoE, з загальною кількістю параметрів 1.04 трильйона та активними параметрами 32 мільярди. Тренування проходить у два етапи: спочатку подальше попереднє тренування на кодових даних для посилення знань кодування, потім — масштабне підкріплювальне навчання для покращення здатності кодування від кінця до кінця. Середовище RL повністю імітує реальні сценарії використання Cursor, включаючи редагування файлів, операції в терміналі, пошук коду та виклики інструментів, що дозволяє моделі навчатися у умовах, близьких до виробничого середовища.

Звіт також одночасно опублікував методику створення власного бенчмарку CursorBench: збір завдань із реальних сесій кодування інженерної команди, а не штучне конструювання. Базова модель Kimi K2.5 отримала лише 36.0 балів на цьому бенчмарку, але після двоетапного тренування Composer 2 досягла 61.3 балів, що становить зростання на 70%. Cursor заявляє, що її вартість виведення значно нижча за API передових моделей GPT-5.4 та Claude Opus 4.6, забезпечуючи парето-оптимум між точністю та витратами.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів