Блог: 1С, Искусственный Интеллект, ChatGPT, GigaChat
Qwen 3.6 27B MTP
Тест нейросети Qwen 3.6 27B с технологией MTP (Multi-Token Prediction): запускаем модель локально на двух видеокартах RTX 5070 Ti и проверяем, как Multi-Token Prediction удваивает скорость генерации без потери качества.
Компания Anthropic закрыла свой знаменитый take-home экзамен для инженеров-оптимизаторов.
Причина простая и немного пугающая: их модель Claude Opus 4.5 решила его лучше, чем любой кандидат-человек — всего за ~2 часа.
RTX 3090 vs 2x RTX 5060 Ti: Какой GPU выбрать для инференса LLM?
Сравнение RTX 3090 и 2x RTX 5060 Ti для инференса больших языковых моделей. Плюсы, минусы, цены и рекомендации – быстрое руководство.
LLM Inference Benchmark – как измерить производительность языковых моделей на локальном железе
Узнайте, как оценить производительность языковых моделей на вашем железе с помощью LLM Inference Benchmark. Подробный гайд и исходники.
AI Products: новый сервис сопоставления номенклатуры для 1С v1.0.1
AI Products представляет сервис сопоставления номенклатуры для 1С, использующий локальный LLM Qwen3-4B и embeddings Qwen3-embedding в Qdrant. Тестовый доступ – 1 неделя.