Блог: 1С, Искусственный Интеллект, ChatGPT, GigaChat

Qwen 3.6 27B MTP

Тест нейросети Qwen 3.6 27B с технологией MTP (Multi-Token Prediction): запускаем модель локально на двух видеокартах RTX 5070 Ti и проверяем, как Multi-Token Prediction удваивает скорость генерации без потери качества.

Компания Anthropic закрыла свой знаменитый take-home экзамен для инженеров-оптимизаторов.

Причина простая и немного пугающая: их модель Claude Opus 4.5 решила его лучше, чем любой кандидат-человек — всего за ~2 часа.

RTX 3090 vs 2x RTX 5060 Ti: Какой GPU выбрать для инференса LLM?

Сравнение RTX 3090 и 2x RTX 5060 Ti для инференса больших языковых моделей. Плюсы, минусы, цены и рекомендации – быстрое руководство.

LLM Inference Benchmark – как измерить производительность языковых моделей на локальном железе

Узнайте, как оценить производительность языковых моделей на вашем железе с помощью LLM Inference Benchmark. Подробный гайд и исходники.

AI Products: новый сервис сопоставления номенклатуры для 1С v1.0.1

AI Products представляет сервис сопоставления номенклатуры для 1С, использующий локальный LLM Qwen3-4B и embeddings Qwen3-embedding в Qdrant. Тестовый доступ – 1 неделя.

Блог: 1С, Искусственный Интеллект, ChatGPT, GigaChat

Подписывайся и задавай вопросы в моих каналах

Qwen 3.6 27B MTP

Компания Anthropic закрыла свой знаменитый take-home экзамен для инженеров-оптимизаторов.

RTX 3090 vs 2x RTX 5060 Ti: Какой GPU выбрать для инференса LLM?

LLM Inference Benchmark – как измерить производительность языковых моделей на локальном железе

AI Products: новый сервис сопоставления номенклатуры для 1С v1.0.1

RTX 3090 vs 2x RTX 5060 Ti: Какой GPU выбрать для инференса LLM?