Gate News 消息,3 月 17 日,Mistral AI 今日发布 Leanstral,这是首个专为形式化验证工具 Lean 4 设计的开源代码 Agent。该模型的核心创新在于,AI 生成代码的同时可输出可被 Lean 4 自动校验的形式化证明,从而绕开传统 AI 代码生成中人工审查的瓶颈环节。
Leanstral 采用稀疏 MoE 架构,拥有 120B 总参数和 6B 激活参数,以 Apache 2.0 协议开源,并针对 lean-lsp-mcp 进行了专项训练优化。用户可在 Mistral Vibe 中通过命令 /leanstall 零配置启动,或通过免费 API 端点 labs-leanstral-2603 调用,同时支持下载权重进行自部署。
Mistral 同步发布了新评估基准 FLTEval,以 Lean 4 社区的费马大定理形式化项目为测试场景。性能对比数据显示:Leanstral pass@2 以 36 美元成本得分 26.3,超过成本 549 美元的 Claude Sonnet 4.6(23.7 分);pass@16 以 290 美元成本得分 31.9,领先 Sonnet 8 分,而 Claude Opus 4.6 需 1,650 美元才能达到 39.6 分。在开源模型中,Qwen3.5-397B-A17B 需运行 4 次才能达到 25.4 分,仍低于 Leanstral pass@2 的表现。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
World ID 4.0 上线:集成 Tinder 与 Zoom,触达 1800 万已验证用户
人类工具公司(Tools for Humanity)推出 World ID 4.0,通过关键轮换和分层选项来增强其生物识别验证系统。拥有 1800 万用户的它,已与 Tinder 和 Zoom 集成。尽管 WLD 代币价值下跌 97%,该公司仍支持通过融资来扩展业务。
GateNews1小时前
Curve Finance 因 rsETH 被黑而暂停 LayerZero 基础设施
Curve Finance 因涉及 rsETH 的安全事件,已暂时暂停其 LayerZero 基础设施。该协议正在调查该问题,部分跨链桥接操作受到影响,而其他操作将继续照常进行。
GateNews10小时前
Monad 联合创始人建议对抵押品存入实施动态上限以降低遭受黑客攻击的风险
Keone Hon 建议,汇集式借贷协议应当在抵押资产增加方面实施渐进式的利率限制,以减轻黑客攻击期间的风险。他认为,这样做可能已经避免了重大损失,正如 rsETH 存款人所经历的情况所示。
GateNews16小时前
SGB在Solana网络上推出USDC铸造服务
SGB 支持在 Solana 上进行即时的 USDC 铸造与赎回,通过实时结算改进跨境支付。
服务面向机构,移除中介,并支持 7x24 的流动性与资金库管理。
扩展计划包括更多稳定币与零售端访问,li
CryptoFrontNews17小时前
Morpho 在 Kelp DAO 和 LayerZero 事件后暂停 Arbitrum 上 MORPHO OFT 跨链桥
Morpho 协会已因近期 Kelp DAO 和 LayerZero Bridge 出现问题,暂时暂停了 Arbitrum 上用于 MORPHO 代币的 OFT 跨链桥,等待确认 rsETH 事件的成因。
GateNews18小时前
Spark Protocol 1 月下架 rsETH 证明审慎,而 Aave 正面临 ETH 流动性危机
Spark Protocol 通过下架低使用量资产并收紧抵押品的策略,起初遭遇了一定的反弹,但在市场动荡期间证明是明智之举。尽管保持更高的利率上限,SparkLend 仍能确保流动性;而 Aave 则面临显著风险。
GateNews21小时前