Profundo
Desbloquee el rendimiento máximo de FP8 en GPU de Hopper



Descripción
DeepGemm, de Deepseek, es una biblioteca de código abierto para núcleos GEMM FP8 altamente optimizados en GPU de Hopper. Limpie la base de código (~ 300 LOC), compilada con JIT, sin dependencias pesadas.