DeepSeek lança em open-source o TileKernels, biblioteca de kernels de GPU para o treino e a inferência de grandes modelos

Notícia de Gate, 23 de Abril — A DeepSeek lançou em open-source o TileKernels sob a licença MIT, uma biblioteca de kernels de GPU escrita em TileLang para o treino e a inferência de grandes modelos de linguagem. O TileLang é uma linguagem específica de domínio desenvolvida pela equipa tile-ai para expressar kernels de GPU de alto desempenho em Python. A DeepSeek afirmou que a maioria dos kernels da biblioteca se aproximou dos limites de desempenho do hardware em densidade de computação e largura de banda de memória, com partes já implementadas em operações internas de treino e inferência.

A biblioteca inclui seis categorias de kernels: MoE (mixture of experts) gating e routing, incluindo seleção de especialistas Top-k, mapeamento token-para-especialista, e expandir/reduzir fundidos com normalização de pesos; quantização que suporta formatos FP8, FP4 e E5M6 com quantização por token, por bloco e por canal, incluindo operações fundidas SwiGLU+quantização; transposição em lote; Engram gating com propagação forward/backward de RMSNorm fundida e redução do gradiente de pesos; Manifold HyperConnection com normalização Sinkhorn e split/apply mistos; e interfaces de alto nível de autograd que envolvem kernels de baixo nível em camadas treináveis.

Engram e Manifold HyperConnection são componentes proprietários da arquitectura do modelo da DeepSeek, com detalhes de implementação divulgados publicamente pela primeira vez. A biblioteca requer GPUs de arquitectura NVIDIA SM90 ou SM100 (H100/H200 ou série Blackwell), CUDA Toolkit 13.1 ou superior, e PyTorch 2.10 ou superior.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

ether.fi Conclui Reforço de Segurança da Ponte Cross-Chain weETH, Bloqueia o Multisig da LayerZero e Eleva o Limite do DVN para 4/4

Mensagem da Gate News, 24 de Abril — a ether.fi concluiu o reforço de segurança a nível de protocolo para a ponte cross-chain weETH na maioria das cadeias de implementação, sem que tenham sido identificadas vulnerabilidades. As atualizações eliminam proativamente potenciais riscos e concedem à ether.fi controlo total sobre todos os parâmetros de segurança da ponte.

GateNews31m atrás

Pyth Network muda para um modelo orientado por receitas e elimina o Pythnet até 2026

Mensagem da Gate News, 23 de abril — A Pyth Network (PYTH), um fornecedor de infraestruturas de dados para criptomoedas, anunciou uma grande reformulação do seu modelo económico, passando de um sistema de incentivos baseado em tokens para uma estratégia de crescimento orientada por receitas. De acordo com a proposta OP-PIP-100, a infraestrutura existente da rede,

GateNews4h atrás

Perspetiva do Preço da ADA à medida que a Cardano concretiza um Acordo Tokenizado na LSE

Principais conclusões A Cardano tokenizou um produto de resseguro Hannover Re e listou-o na Bolsa de Valores de Londres, expandindo a utilização da blockchain em mercados institucionais regulados. O preço do ADA mantém-se dentro de um cunho descendente, com o suporte em $0.2400 ainda intacto, enquanto a resistência perto de $0.2550 e $0.2824 l

CryptoNewsLand5h atrás

Energy Web Lança Cloud de Compute Verificado para Verificação de Mercados do Mundo Real

Mensagem do Gate News, 23 de Abril — A Energy Web está a construir infraestruturas descentralizadas para verificar lógica empresarial e afirmações em mercados do mundo real, como registos ambientais, sistemas de créditos de carbono e fluxos de conformidade da cadeia de abastecimento. Fundado em 2017 como a Energy Web Foundation, uma organização sem fins lucrativos suíça

GateNews5h atrás

Shytoshi Kusama Regressa ao X Após Silêncio de 13 Dias, Anuncia Discussão Comunitária de Sábado enquanto a SHIB Desliza 1,8%

Mensagem do Gate News, 23 de Abril — Shytoshi Kusama, embaixador-chefe do ecossistema Shiba Inu, regressou hoje ao X após um silêncio de 13 dias que começou a 9 de Abril. Ele confirmou uma discussão comunitária agendada para sábado, sinalizando novos desenvolvimentos pela frente. A sua bio atualizada agora diz: "A seguir: Vamos marcar uma data para o Rapto usando apenas prova dentro das escrituras. Vemo-nos no sábado enquanto começa o próximo turno."

GateNews6h atrás

A Girin Labs lança uma carteira de pagamentos em XRP com integração da Doppler Finance, permitindo liquidações XRPL em tempo real

Notícia da Gate, 23 de abril — A Girin Labs lançou a Girin Wallet, integrando a camada de rendimento de nível institucional da Doppler Finance para permitir pagamentos em XRP e RLUSD em transacções do dia a dia. Os utilizadores já podem gastar XRP e RLUSD em qualquer comerciante que aceite Visa, com transacções a liquidar instantaneamente em t

GateNews6h atrás
Comentar
0/400
Nenhum comentário