NVIDIA утверждает, что видеокарты GeForce RTX 50 ускоряют работу моделей рассуждения, таких как DeepSeek-R1. По мнению компании, эти модели способны решать сложные задачи, включая анализ данных, математику и программирование, а использование RTX-ускорения повышает их производительность на локальных ПК.
Модели рассуждения представляют собой новый класс языковых моделей, которые тратят больше времени на анализ задач. NVIDIA заявляет, что такой подход позволяет получать более точные результаты, а тестовое масштабирование помогает динамически распределять вычислительные ресурсы.
DeepSeek-R1 создан на основе 671-миллиардной модели Mixture-of-Experts (MoE), использующей несколько экспертных моделей. NVIDIA утверждает, что для повышения скорости работы разработчики применили методику дистилляции, благодаря чему появились более компактные версии модели — от 1,5 до 70 миллиардов параметров.

Компания заявляет, что видеокарты GeForce RTX 50, построенные на архитектуре NVIDIA Blackwell и оснащенные тензорными ядрами пятого поколения, позволяют моделям работать быстрее, чем на других потребительских GPU. RTX-ускорение снижает задержки и дает возможность запускать AI-модели локально без подключения к облачным сервисам.
NVIDIA отмечает поддержку RTX-ускорения в таких инструментах, как Llama.cpp, Ollama, LM Studio, AnythingLLM, Jan.AI, GPT4All и OpenWebUI. Также пользователи могут обучать модели на своих данных с помощью Unsloth. Компания заявляет, что сочетание DeepSeek-R1 и GeForce RTX 50 позволит обрабатывать данные быстрее и эффективнее.