вторник, 2 июня 2026 г.

AI Digest: MiniMax M3 с контекстом 1 млн токенов и Nvidia готовит PC 2 для локальных LLM

MiniMax представила модель M3 с контекстом 1 млн токенов и архитектурой Sparse Attention. Nvidia анонсировала Nemotron 3 Ultra и чип RTX Spark для локального инференса. Microsoft и Nvidia совместно разрабатывают «PC 2» для запуска LLM на персональных устройствах. Появился готовый workflow для дизайн-мозгоштурма с использованием Claude Code и gpt-image-2.

Модельные релизы и архитектуры

MiniMax анонсировали модель M3 с контекстом 1 млн токенов

MiniMax выпустили модель M3 с поддержкой миллиона токенов контекста и мультимодальностью. Веса модели вместе с научной статьей обещают опубликовать через 10 дней. Пока протестировать новинку можно бесплатно в OpenCode. Стоимость API составляет $1.2 за миллион входных и $4.8 за выходных токенов, первую неделю действует скидка 50% на запросы до 512к токенов. Подробности в канале ai_newz.

Источники: ai_newz
MiniMax M3: 1M контекст и архитектура Sparse Attention

Модель M3 обходит GPT-5.5 и Gemini 3.1 Pro в coding-бенчмарках и поддерживает нативную мультимодальность. Контекстное окно достигает 1 млн токенов, архитектура MiniMax Sparse Attention снижает вычисления на токен в 20 раз. Тестировать модель можно бесплатно в OpenCode, веса и техотчёт обещают через 10 дней. Источник

Источники: ai_for_devs

Железо для локального инференса

Nvidia и Microsoft готовят «PC 2» для локальных LLM

Nvidia и Microsoft объявили о концепции «PC 2» — новой платформы для ноутбуков и ПК на суперчипе RTX Spark. Архитектура Arm объединяет GPU, CPU и 128 ГБ общей памяти, обеспечивая запуск локальных LLM на 120 миллиардов параметров в формате FP4. Планируется глубокая интеграция с Windows для персональных ассистентов наподобие OpenClaw или Hermes с доступом к данным приложений. Ожидается, что массовое внедрение займет время из-за необходимости адаптации разработчиков и итераций над чипом, но концепция направлена на доступный селф-хостинг интеллектуальных агентов. Подробности анонса в канале автора.

Источники: seeallochnaya
Nvidia анонсировала Nemotron 3 Ultra и чип RTX Spark

На Computex 2026 Nvidia представила суперчип RTX Spark для ноутбуков с GPU Blackwell, CPU Grace и 128 ГБ единой памяти. Производительность достигает 1 петафлопа, что сопоставимо с RTX 5070, первые устройства от партнеров выйдут осенью. Вместе с железом анонсирована модель Nemotron 3 Ultra на 550 миллиардов параметров с MoE-архитектурой и скоростью инференса свыше 300 токенов в секунду. Модель полностью open-source и станет доступна 4 июня на Hugging Face. Подробнее в источнике.

Источники: ai_for_devs

Практические сценарии использования

Workflow для дизайн-мозгоштурма: Claude Code и gpt-image-2

Автор описывает процесс генерации интерфейсов через AI. Раньше использовался Claude Code для создания вариаций компонентов в HTML канвасе, теперь для правок применяется gpt-image-2 в ChatGPT. Модель хорошо изменяет элементы на скриншотах, не затрагивая остальной дизайн. Сгенерированные иконки и фоновые изображения выгружаются отдельными файлами и передаются агенту для вёрстки. Подробнее

Источники: ai_volution

Модельные релизы и архитектуры

MiniMax анонсировали модель M3 с контекстом 1 млн токенов

MiniMax M3: 1M контекст и архитектура Sparse Attention

Железо для локального инференса

Nvidia и Microsoft готовят «PC 2» для локальных LLM

Nvidia анонсировала Nemotron 3 Ultra и чип RTX Spark

Практические сценарии использования

Workflow для дизайн-мозгоштурма: Claude Code и gpt-image-2