Defending against Prompt Injection with Structured Queries (StruQ) and Preference Optimization (SecAlign)

Seeded from: BAIR Blog Recent advances in Large Language Models (LLMs) enable exciting LLM-integrated applications. However, as LLMs have improved, so have the attacks against them. Prompt injection attack is listed as the #1 threat by OWASP to LLM-integrated applications, where an LLM input contains a trusted prompt (ins Read more: http://bair.berkeley.edu/blog/2025/04/11/prompt-injection-defense/

More resources

02 sept 2025 developer.nvidia.com

Reducir costos de implementación de modelos manteniendo el rendimiento con intercambio de memoria de GPU

Utiliza el intercambio de memoria de GPU (hot-swapping de modelos) para compartir GPUs entre varios LLM, reducir costos de GPU ociosas y mejorar el autoescalado manteniendo los SLA.

Nvidia LLM GPU

29 ago 2025 developer.nvidia.com

Ajuste fino de gpt-oss para Precisión y Rendimiento con Entrenamiento Consciente de Cuantización (QAT)

Guía de afinado fino de gpt-oss usando SFT + QAT para recuperar precisión FP4 manteniendo la eficiencia, con upcasting a BF16, MXFP4, NVFP4 y despliegue con TensorRT-LLM.

Nvidia LLM Benchmark

29 ago 2025 developer.nvidia.com

Cómo los modelos de lenguaje pequeños son la clave para una IA agentica escalable

Explica cómo los modelos de lenguaje pequeños permiten IA agentica más rentable y flexible junto a LLMs, mediante NVIDIA NeMo y Nemotron Nano 2.

Nvidia LLM

27 ago 2025 developer.nvidia.com

Cómo Escalar tus Agentes LangGraph en Producción de un Solo Usuario a 1,000 Compañeros

Guía para desplegar y escalar agentes LangGraph en producción usando NeMo Agent Toolkit, pruebas de carga y despliegue por fases para cientos a miles de usuarios.

Nvidia LLM

25 ago 2025 developer.nvidia.com

NVFP4 Entrena con Precisión de 16 Bits y Velocidad y Eficiencia de 4 Bits

NVFP4 es un formato de datos de 4 bits que ofrece precisión similar a FP16 con el rendimiento y la eficiencia de memoria de 4 bits, extendido al preentrenamiento de grandes modelos de lenguaje. Este perfil aborda experimentos a nivel 12B, estabilidad y colaboraciones industriales.

Nvidia LLM

12 ago 2025 huggingface.co

TextQuests: Evaluar LLMs en Juegos de Aventura Basados en Texto

TextQuests es un benchmark que evalúa agentes LLM en 25 juegos clásicos de ficción interactiva, enfatizando razonamiento de contexto largo y exploración autónoma.

Hugging Face LLM Benchmark