Gate News новость, 10 апреля, Tencent Hunyuan выпустила серию фундаментальных моделей для воплощённого интеллекта HY-Embodied-0.5, причём версия на 2B параметров уже официально открыта. Эта серия моделей предназначена для воплощённых интеллектуальных агентов в реальном мире, и особое внимание уделяется улучшению способностей к пространственно-временному восприятию и воплощённому рассуждению; их можно применять в таких сценариях, как прогнозирование среды, выполнение интерактивных действий и планирование задач.
Семейство моделей включает две версии: 2B и 32B. Версия 2B ориентирована на устройства на периферии и лёгкие развертывания, а версия 32B используется для сложных задач рассуждения и интеллектуальных решений более высокого уровня. В технической архитектуре HY-Embodied-0.5 вводит механизм Mixture-of-Transformers (MoT), чтобы реализовать распределённые вычисления для различных модальностей; за счёт потенциальных Token усиливается способность к формированию репрезентаций восприятия. В сочетании с постсамообучением и постобучением с автогенерацией и методами дистилляции на основе политики достигается согласованная оптимизация возможностей моделей разного размера.
Что касается производительности, то серия моделей демонстрирует выдающиеся результаты в 22 тестах-бенчмарках: модель 2B превосходит SOTA-модели того же масштаба в 16 задачах, а версия 32B уже приближается к уровню передовых решений, демонстрируя сильные способности к обобщению воплощённого интеллекта и практический потенциал для применения.