вторник, 2 июня 2026 г.
AI Digest: MiniMax M3 с контекстом 1 млн токенов и Nvidia готовит PC 2 для локальных LLM
MiniMax представила модель M3 с контекстом 1 млн токенов и архитектурой Sparse Attention. Nvidia анонсировала Nemotron 3 Ultra и чип RTX Spark для локального инференса. Microsoft и Nvidia совместно разрабатывают «PC 2» для запуска LLM на персональных устройствах. Появился готовый workflow для дизайн-мозгоштурма с использованием Claude Code и gpt-image-2.
Модельные релизы и архитектуры
-
MiniMax анонсировали модель M3 с контекстом 1 млн токенов
MiniMax выпустили модель M3 с поддержкой миллиона токенов контекста и мультимодальностью. Веса модели вместе с научной статьей обещают опубликовать через 10 дней. Пока протестировать новинку можно бесплатно в OpenCode. Стоимость API составляет $1.2 за миллион входных и $4.8 за выходных токенов, первую неделю действует скидка 50% на запросы до 512к токенов. Подробности в канале ai_newz.
Источники: ai_newz
-
MiniMax M3: 1M контекст и архитектура Sparse Attention
Модель M3 обходит GPT-5.5 и Gemini 3.1 Pro в coding-бенчмарках и поддерживает нативную мультимодальность. Контекстное окно достигает 1 млн токенов, архитектура MiniMax Sparse Attention снижает вычисления на токен в 20 раз. Тестировать модель можно бесплатно в OpenCode, веса и техотчёт обещают через 10 дней. Источник
Источники: ai_for_devs
Железо для локального инференса
-
Nvidia и Microsoft готовят «PC 2» для локальных LLM
Nvidia и Microsoft объявили о концепции «PC 2» — новой платформы для ноутбуков и ПК на суперчипе RTX Spark. Архитектура Arm объединяет GPU, CPU и 128 ГБ общей памяти, обеспечивая запуск локальных LLM на 120 миллиардов параметров в формате FP4. Планируется глубокая интеграция с Windows для персональных ассистентов наподобие OpenClaw или Hermes с доступом к данным приложений. Ожидается, что массовое внедрение займет время из-за необходимости адаптации разработчиков и итераций над чипом, но концепция направлена на доступный селф-хостинг интеллектуальных агентов. Подробности анонса в канале автора.
Источники: seeallochnaya
-
Nvidia анонсировала Nemotron 3 Ultra и чип RTX Spark
На Computex 2026 Nvidia представила суперчип RTX Spark для ноутбуков с GPU Blackwell, CPU Grace и 128 ГБ единой памяти. Производительность достигает 1 петафлопа, что сопоставимо с RTX 5070, первые устройства от партнеров выйдут осенью. Вместе с железом анонсирована модель Nemotron 3 Ultra на 550 миллиардов параметров с MoE-архитектурой и скоростью инференса свыше 300 токенов в секунду. Модель полностью open-source и станет доступна 4 июня на Hugging Face. Подробнее в источнике.
Источники: ai_for_devs
Практические сценарии использования
-
Workflow для дизайн-мозгоштурма: Claude Code и gpt-image-2
Автор описывает процесс генерации интерфейсов через AI. Раньше использовался Claude Code для создания вариаций компонентов в HTML канвасе, теперь для правок применяется gpt-image-2 в ChatGPT. Модель хорошо изменяет элементы на скриншотах, не затрагивая остальной дизайн. Сгенерированные иконки и фоновые изображения выгружаются отдельными файлами и передаются агенту для вёрстки. Подробнее
Источники: ai_volution