Use Cases - transformerengine

Developers training large-scale Transformer models on NVIDIA GPUs can leverage FP8 precision to reduce memory usage and accelerate training.

Deploying Transformer models for inference on supported NVIDIA GPUs benefits from optimized kernels and lower memory footprint.