Skip to content

Hugging Face

Items tagged with “Hugging Face”.

huggingface.co

Inférence LoRA rapide pour Flux avec Diffusers et PEFT

Cet article explique comment une recette d’optimisation Hugging Face accélère l’inférence LoRA sur Flux avec Diffusers et PEFT, avec des gains allant jusqu’à ~2,3x et en détaillant le hot-swapping, la quantification FP8 et les techniques de gestion mémoire.