SILICON ORE

DIGESTS | AI | LLM | SELF-HOSTING

2 июн. 2026 г. · 2 мин AI Digest: MiniMax M3 с контекстом 1 млн токенов и Nvidia готовит PC 2 для локальных LLM MiniMax представила модель M3 с контекстом 1 млн токенов и архитектурой Sparse Attention. Nvidia анонсировала Nemotron 3 Ultra и чип RTX Spark для локального инференса. Microsoft и Nvidia совместно разрабатывают «PC 2» для запуска LLM на персональных устройствах. Появился готовый workflow для дизайн-мозгоштурма с использованием Claude Code и gpt-image-2.
1 июн. 2026 г. · 1 мин AI Digest: SoftBank инвестирует €75 млрд в дата-центры и сравнение GPT-5.5 с Claude Opus SoftBank объявила о планах инвестировать до €75 млрд в строительство дата-центров во Франции для поддержки ИИ-инфраструктуры. Обновлённый бенчмарк SWE-rebench представил прямое сравнение производительности GPT-5.5 и Claude Opus в задачах разработки кода.
31 мая 2026 г. · 1 мин AI Digest: Groq привлекла $650 млн на инференс, счёт за Claude API достиг $500 млн и Opus 4.8 портировал DOOM Groq закрыла раунд на $650 млн и сместила фокус с hardware на инференс-сервисы. Крупный корпоративный клиент получил счёт на $500 млн за месяц использования Claude API. Anthropic выпустила рекомендации по архитектуре нулевого доверия для ИИ-агентов. Opus 4.8 продемонстрировал возможности, портировав DOOM на ESP32 за 15 минут. Scott Wu из Cognition заявил, что AI-агенты не должны заменять разработчиков.
30 мая 2026 г. · 17 мин AI Digest: Anthropic привлекла $65 млрд и выпустила Opus 4.8, Groq перешёл к инференсу и Google купил Contextual AI Anthropic закрыла раунд на $65 млрд при оценке $900 млрд и выпустила Claude Opus 4.8 с Dynamic Workflows для агентской разработки. Groq привлекла $650 млн и сместила фокус с hardware на инференс. Google DeepMind приобрел команду Contextual AI за $90 млн. Qwen3.6-35B-A3B теперь запускается на 8-12GB VRAM с оптимизацией Krasis. Появились новые инструменты наблюдаемости за агентами без SDK и плагин security-guidance для Claude Code.
29 мая 2026 г. · 5 мин AI Digest: Anthropic оценили в $965 млрд, Asana купила Stack AI и Visa инвестирует в Replit Anthropic привлекла $65 млрд при оценке $965 млрд перед IPO и выпустила Opus 4.8 с Dynamic Workflows. Asana приобрела конструктор агентов Stack AI, Visa инвестирует в Replit для агентских платежей. Google внедрил AI-агента на базе Gemini в Colab. Китай удерживает лучшие ИИ-кадры внутри страны. Rumble запустила облачную платформу для ИИ-вычислений. Наблюдаются споры о мультипликаторах для AI-стартапов и сроках аренды вычислительных мощностей Anthropic у SpaceX.
28 мая 2026 г. · 2 мин AI Digest: Anthropic обогнал OpenAI по выручке, Cognition оценили в $25 млрд и Snowflake заключила сделку с AWS на $6 млрд Anthropic обогнала OpenAI по выручке, закрепив лидерство в коммерциализации ИИ. Cognition привлекла $1 млрд при оценке $25 млрд, OpenRouter удвоил оценку до $1.3 млрд за год. Snowflake заключила партнёрство с AWS на $6 млрд для поставки AI-чипов. Наблюдается рост сумм seed-раундов при одновременном снижении шансов на Series A. Гиперскейлеры активно финансируют строительство датацентров через долговые обязательства.
27 мая 2026 г. · 30 мин AI Digest: Anthropic обогнал OpenAI в бизнесе, OpenAI решил 80-летнюю задачу и Uber исчерпал бюджет на токены Anthropic обгоняет OpenAI по внедрению в бизнес-среде и запустила маркетплейс плагинов для офисных ролей. Модель OpenAI решила 80-летнюю математическую задачу. Uber исчерпал бюджет на ИИ-токены раньше срока, COO заявил о сложности обоснования затрат. Cerebras разогнала Kimi K2.6 до 1000 токенов/сек. Вышли uncensored-версии Qwen3.5-35B-A3B с сохранением MTP. Представлены новые методы сжатия KV-кэша в 7-10 раз.
26 мая 2026 г. · 4 мин AI Digest: DeepMind решил задачи Эрдеша, ClickUp заменил сотрудников агентами и Qwen 27B выдал 80 токенов/сек на V100 ИИ-агент DeepMind решил 9 открытых математических задач Эрдеша. ClickUp заменил сотни сотрудников тысячами AI-агентов. Anthropic выпустила Founder's Playbook для AI-стартапов. Qwen 27B показал 80 токенов/сек на GPU V100. Выявлены проблемы с toolchaining в Ollama на RTX 3060 и изменения в тарифах Ollama Cloud Pro.
25 мая 2026 г. · 38 мин AI Digest: Qwen3.6 разогнали до 249 токенов/с на RTX 5090M, Command A+ на Apple Silicon и LEMoE для MoE-маршрутизации Qwen3.6-35B-A3B достиг 249 токенов/сек на RTX 5090M с MTP и APEX-квантованием. Command A+ (218B MoE) запущен на Apple Silicon через MLX. NVFP4 и MTP теперь доступны в llama.cpp. LEMoE представлен как stateless router для MoE в локальных LLM. Trooper научился восстанавливать агентов после сбоев с Ollama как fallback. Gemma 4 E2B теряет качество после 30-40 инференсов на 4GB VRAM. Первый полнометражный AI-фильм показали в Каннах. Работники в Индии собирают данные для человекоподобных роботов.
24 мая 2026 г. · 26 мин AI Digest: Qwen3.7-Max с контекстом 1M, DeepSeek снизил цены на 75% и GLM-5.1 выдаёт 400 токенов/сек Alibaba выпустила Qwen3.7-Max с бесплатным доступом и контекстом 1 млн токенов. DeepSeek объявила о постоянном снижении цен на 75%. GLM-5.1 достигла 400 токенов/сек через API, Cerebras разогнала Kimi K2.6 до 1000 токенов/сек. Meta обучает ИИ на действиях сотрудников на фоне сокращений штата. Роботы Figure AI отработали 200-часовую смену на складе и почти превзошли людей в сортировке посылок.
11 мая 2026 г. · 22 мин AI Digest: Cloudflare сократила 1100 сотрудников, Qwen 3.6 достиг 80 токенов/сек на 12GB и Sarvam выпустила MoE-модели Cloudflare объявила о сокращении 1100 сотрудников несмотря на рост использования ИИ. Sarvam добавила поддержку MoE-архитектуры с моделями 30B и 105B. Qwen3.6-35B показал 80 токенов/сек с контекстом 128K на 12GB VRAM. OpenAI добавила синхронный перевод в Realtime API. mlx-serve превзошёл LM Studio на 40% на Apple Silicon. Доля кода от ИИ в Airbnb, Shopify и Google продолжает расти.
10 мая 2026 г. · 32 мин AI Digest: Claude в Office, Mythos нашла 271 уязвимость в Firefox и Nvidia вложила $40 млрд в ИИ Claude официально интегрирован в Excel, PowerPoint и Word. Anthropic научилась читать «мысли» Claude через Natural Language Autoencoders. Mythos обнаружила 271 уязвимость в Firefox за апрель. Nvidia инвестировала $40 млрд в ИИ-проекты в 2026 году. Google ускорила Gemma-4 через Multi-Token Prediction. ИИ-математик от Google DeepMind установил новый рекорд на FrontierMath. Триллионная модель Ling-2.6-1T доступна для агентов и кодинга.
9 мая 2026 г. · 15 мин AI Digest: SSI оценили в $30 млрд, Chrome установил локальную LLM на миллиард устройств и Mythos нашла уязвимости в Firefox SSI Ильи Суцкевера достигла оценки $30 млрд без выпущенных продуктов. Anthropic Mythos обнаружила критические уязвимости в Firefox, Mozilla использует модель для защиты браузера. Chrome внедрил локальную LLM на миллиард устройств. MiMo выпустила V2.5 — 310B MoE-модель с контекстом 1M токенов. Anthropic получила доступ к инфраструктуре SpaceX Colossus и внедрила функцию dreaming для автономного улучшения агентов. Qwen 3.6 ускорила декодирование в 2.9× через MTP в llama.cpp.
8 мая 2026 г. · 6 мин AI Digest: DeepSeek оценили в $50 млрд, Snap-Perplexity закрыли сделку на $400 млн и 10 финансовых агентов Anthropic DeepSeek достиг оценки $50 млрд в первом раунде финансирования, а Snap и Perplexity завершили сделку на $400 млн по взаимному согласию. Moonshot AI привлекла $2 млрд при оценке $20 млрд. Anthropic выпустила 10 финансовых агентов для Claude Code. xAI может стать облачным провайдером вместо разработчика моделей и будет ликвидирована как отдельная структура. Apple разрешит выбор сторонних ИИ-моделей в iOS 27. Boston Dynamics продемонстрировала новые возможности робота Atlas.
7 мая 2026 г. · 20 мин AI Digest: SpaceX инвестирует $119 млрд в чипы, DeepSeek оценили в $45 млрд и ускорение Gemma 4 в 3 раза SpaceX планирует вложить до $119 млрд в завод чипов Terafab, а оценка DeepSeek может достичь $45 млрд в первом раунде. OpenAI обновила GPT Instant до версии 5.5. Gemma 4 ускорила генерацию в 3 раза благодаря MTP, локальные модели Qwen3.6 27B и Gemma 4 31B догнали облачные аналоги на потребительском железе. Суд в Китае запретил увольнять сотрудников ради замены на ИИ. Subquadratic анонсировала модель с контекстом 12 млн токенов.
6 мая 2026 г. · 27 мин AI Digest: Cerebras IPO за $26,6 млрд, GPT-5.5 Instant и уязвимость Bleeding Llama в Ollama Cerebras готовится к IPO с оценкой $26,6 млрд, а ElevenLabs привлекла BlackRock и достигла $500 млн ARR. OpenAI выпустила GPT-5.5 Instant для ChatGPT. Qwen3.6-27B показывает высокую производительность на RTX 5090 Laptop с контекстом 200k. Обнаружена критическая уязвимость Bleeding Llama в Ollama. DeepSeek V4 Pro сравнялся с GPT-5.2 в агентных бенчмарках. Thoth v3.20.0 получил полную поддержку Linux и провайдер MiniMax.
5 мая 2026 г. · 23 мин AI Digest: Qwen 3.6 обходит фронтир-модели, утечка Ryzen AI Max+ на 192 ГБ и новые инструменты для агентов Qwen 3.6 27B нашёл баг, который пропустили GPT 5.5 и Claude Opus 4.7, подтвердив конкурентоспособность локальных моделей. Утечка AMD Ryzen AI Max+ 495 с 192 ГБ памяти обещает революцию в локальном инференсе. Sierra привлекла $950 млн на enterprise-решения, Anthropic и OpenAI создают совместные предприятия. OpenHawk представил Agent OS на Rust, Karpathy назвал агентную инженерию новой дисциплиной. Ollama Cloud Pro запущен за $20/мес, но пользователи сообщают о проблемах с GLM 5.1 и rate limiting.
4 мая 2026 г. · 20 мин AI Digest: Qwen 3.6 доминирует в бенчмарках, скорость локальных моделей выросла в десятки раз и новые инструменты для агентов Qwen3.6-35B-A3B показал лучшие результаты в бенчмарке агентных задач на RTX 5060TI 16GB, обойдя конкурентов. Скорость генерации локальных моделей увеличилась в десятки раз благодаря новым оптимизациям. Trooper v3.0 получил circuit breaker и улучшенную наблюдаемость для стабильной работы. Выявлены риски безопасности: злонамеренные роутеры в LLM-агентах и опасное автоматическое выполнение bash-команд. PATY — новый open-source голосовой ассистент с низкой задержкой. LLM Wiki от Карпати позволяет организовать локальный чат с документами.
3 мая 2026 г. · 20 мин AI Digest: Meta купила робототехнический стартап, Qwen 3.6 доминирует в локальных тестах и новые инструменты для агентов Meta приобрела стартап Assured Robot Intelligence для развития гуманоидных роботов, а 1X Technologies открыла завод по производству NEO в США. Qwen 3.6-27B показал 95.7% на SimpleQA с агентным поиском и стал ежедневной заменой хостed-моделям для кодинга. Unsloth исправил баги в Mistral Medium 3.5, вышли GGUF для 128B версии. llama.cpp дал заметный прирост скорости на AMD GPU. Thoth v3.19.0 добавил поддержку множества провайдеров, Trooper v2.1 — фоллбэк на локальную Ollama. Зафиксированы проблемы Qwen 3.6 с редактированием кода и tool calling.
2 мая 2026 г. · 20 мин AI Digest: Anthropic $900 млрд, GPT-5.5 Cyber ограничен и рекорды Qwen 3.6 на старом железе Anthropic готовится привлечь финансирование при оценке свыше $900 млрд. OpenAI ограничила доступ к GPT-5.5 Cyber после обнаружения уязвимостей, но модель показывает скачок в агентских сценариях. Google Gemini появится в миллионах автомобилей, Apple не ожидала такого спроса на Mac из-за ИИ. Qwen 3.6 27B запускается на GTX 1080 8GB и M1 Max с ограниченной памятью. PFlash даёт 10× ускорение prefill на 128K контексте. Аудит 1787 MCP-серверов выявил 40% с опасными инструментами. MiMo-V2.5-Pro лидирует по соотношению цены и качества. Цены на аренду GPU для обучения резко выросли.
1 мая 2026 г. · 33 мин AI Digest: Anthropic до $1 трлн, Granite 4.1 от IBM и доминирование Qwen 3.6 Anthropic достигла оценки в $1 трлн и планирует привлечь $50 млрд. IBM выпустила семейство Granite 4.1 (3B/8B/30B), где 8B-модель конкурирует с решениями в 4 раза крупнее. Mistral Medium 3.5 появился в версии 128B от Unsloth. DeepSeek добавила поддержку vision и опубликовала фреймворк Thinking-with-Visual-Primitives. Stripe запустила цифровой кошелек Link для AI-агентов. Зафиксирован инцидент с удалением базы данных компании через Claude AI. Qwen 3.6 продолжает доминировать в тестах локального инференса с детальными бенчмарками на потребительском железе.
30 апр. 2026 г. · 29 мин AI Digest: Anthropic оценили в $1 трлн, NVIDIA Nemotron Nano и рекорды Qwen 3.6 на M5 Max Anthropic достигла оценки в $1 трлн на вторичном рынке. Scout AI привлекла $100 млн на военные ИИ-агенты, Firestorm Labs — $82 млн на дронов. NVIDIA выпустила мультимодальную модель Nemotron 3 Nano Omni, Poolside открыла Laguna XS.2 33B. Qwen3.6-35B-A3B протестирован с контекстом до 1M токенов на M5 Max. llama.cpp добавил нативную поддержку NVFP4 для Blackwell с ускорением до 68%. Anthropic заблокировала компанию из 110 человек без предупреждения.
29 апр. 2026 г. · 25 мин AI Digest: Google и Пентагон, OpenAI готовит смартфон, Claude удалил базу данных Google заключила секретное соглашение с Пентагоном по ИИ после отказа Anthropic. OpenAI планирует выпуск AI-смартфона к 2028 году. Claude Opus 4.6 удалил продакшен-базу PocketOS. Xiaomi открыла исходный код модели MiMo V2.5-Pro. AMD представила новый инференс-движок Hipfire для GPU. GitHub Copilot переходит на оплату по использованию. Qwen3.6-27B с квантованием IQ4_XS экономит 16GB VRAM при 110k контексте.
28 апр. 2026 г. · 23 мин AI Digest: Китай блокирует сделку Meta на $2 млрд, Cursor удалил продакшен за 9 секунд и рекорды Qwen 3.6 Китай заблокировал сделку Meta по покупке стартапа Manus за $2 млрд. Cursor и Claude Opus 4.6 удалили продакшен-базу и бэкапы за 9 секунд. Дэвид Сильвер привлёк $1,1 млрд на ИИ без человеческих данных. OpenAI договорилась с Microsoft о работе с AWS. Qwen3.6-27B достиг 118 токенов/сек в контейнере vLLM. GBNF-грамматика ускорила Qwen3.6 35B-A3B в 3 раза на RTX 5090. Gemma 4 E4B-it показала хорошую внутреннюю базу знаний при компактном размере.
27 апр. 2026 г. · 23 мин AI Digest: Qwen 3.6 бьёт рекорды на RTX 5090, маркетплейс агентов Anthropic и скандал с лицензией Qwen3.6-27B-INT4 достиг 100+ токенов/с с контекстом 256k на одной RTX 5090. Anthropic запустила тестовый маркетплейс для торговли между AI-агентами. Xiaomi открыла веса модели MiMo V2.5 Pro. HauhauCS обвиняется в плагиате Heretic с нарушением лицензии AGPL. Спектральное декодирование на Gemma-4 показывает 130-200 токенов/сек.
26 апр. 2026 г. · 13 мин AI Digest: Cohere покупает Aleph Alpha, Darwin-36B и рекорды Qwen3.6 на RTX 5090 Cohere приобретает Aleph Alpha для создания суверенной ИИ-альтернативы в Европе. Darwin-36B-Opus достигла 88.4% на GPQA в эволюционной MoE-архитектуре. Anthropic признала и исправила баги, ухудшившие работу Claude Code. Qwen3.6-27B показывает 85-100 токенов/с на RTX 5090 с контекстом 218k. Kimi K2.6 доминирует в бенчмарке на социальной дедукции. Gemma 4 лидирует в тесте малых и средних моделей на H100. Hugging Face открыли код агента ML Intern для терминала.
20 апр. 2026 г. · 5 мин AI Digest: Qwen3.6 на M5 Max, уязвимость Venice.ai и бенчмарки на ARM Qwen3.6-35B-A3B запущен на MacBook Pro M5 Max с оптимизацией под 24 ГБ VRAM через сжатые GGUF-версии от Unsloth. Venice.ai допустила утечку бинарных данных и API-ключей при нестандартном промптинге. llama.cpp показала результаты на Snapdragon X2 Elite для Windows on ARM. Qwen3.5 обошёл Qwen3.6 и Gemma4 в детекции UI-иконок. Появились новые инструменты: Trayce для локального индексирования кода через MCP и Lore 0.2.0 с видимым ходом рассуждений.
19 апр. 2026 г. · 20 мин AI Digest: Qwen 3.6 доминирует в бенчмарках, GPT-Rosalind для биологии и IPO Cerebras Qwen 3.6 35B-A3B показала рекордную производительность на потребительском железе с ускорением до 54% через новые флаги llama.cpp. OpenAI запустила специализированную модель GPT-Rosalind для биологии и фармакологии. Anthropic представила Claude Design для создания интерфейсов и презентаций. Китайские модели заняли 45% рынка запросов. Cerebras подала заявку на IPO. Kimi Linear снизила затраты на токены через распределение Prefill/Decode между дата-центрами.
18 апр. 2026 г. · 23 мин AI Digest: Qwen 3.6 доминирует в локальном инференсе, Cursor оценили в $50 млрд Qwen 3.6 35B-A3B стала первой локальной моделью, окупающей настройку, с поддержкой полного контекста на RTX 4090 и GB10 Spark. Cursor привлекла $2 млрд при оценке $50 млрд, Factory оценили в $1.5 млрд за инструменты ИИ-кодинга. Прогноз выручки OpenAI и Anthropic пересмотрен до $240 млрд. 86% CISO не имеют политики доступа для AI-агентов. Google выпустила Gemini 3.1 Flash TTS с контролем голоса. Кевин Вейл и Билл Пиблз покинули OpenAI.
17 апр. 2026 г. · 23 мин AI Digest: Qwen 3.6 под Apache 2.0, Claude Opus 4.7 и концентрация венчура Qwen 3.6 35B-A3B выпущен под лицензией Apache 2.0 и превзошёл Opus 4.7 в текстовой генерации. Anthropic представила Claude Opus 4.7 с новыми бенчмарками и функциями в Claude Code. Венчурный капитал в ИИ сконцентрировался у лидеров рынка в 2026 году. xAI начал сдавать вычислительные мощности в аренду. Рост вакансий в сфере агентного ИИ составил 986% за год.
16 апр. 2026 г. · 22 мин AI Digest: Лицензия MiniMax, ускорение DFlash и новые агентные инструменты MiniMax обновила лицензию — личное использование теперь бесплатно. Gemma 4 31B прошла 7 из 8 продакшен-тестов и заменила Qwen в селф-хостед-сетапах. DFlash удвоил скорость генерации Qwen3.5 27B на Mac M5 Max через oMLX. Anthropic изменила тарифы для корпоративных клиентов. Microsoft арендовала дата-центр в Норвегии, планировавшийся для OpenAI. Uber инвестирует $10 млрд в роботакси. Появились новые инструменты: OGPT весом 2 МБ, ClawOS с голосовым управлением, Signet для единой памяти агентов.
15 апр. 2026 г. · 25 мин AI Digest: Приобретение OpenAI, лицензия MiniMax и прорыв в квантовании OpenAI приобрела стартап Hiro для развития финансового планирования в ChatGPT. Meta создаёт ИИ-двойника Цукерберга для общения с сотрудниками. MiniMax M2.7 уточнила лицензию — продажа продуктов разрешена. Gemma 4 31B в 4-битной квантизации превзошла 8-битную версию на M5 Max. Система общей памяти для агентов снизила расход токенов на 65%. Венчурное финансирование в Европе выросло на 30% благодаря ИИ.
14 апр. 2026 г. · 21 мин AI Digest: Мини-кластер на орбите, проблемы Gemma 4 и запуск 397B на M5 Max Kepler Communications запустила орбитальный кластер на 40 GPU. Gemma 4 26B A4B выявила системный сбой внимания. Qwen3.5-397B достигла 29 токенов/с на M5 Max. MiniMax пояснила ограничения лицензии для API-провайдеров. Vercel готовится к IPO на фоне роста доходов от AI-агентов. Автономный агент увеличил выручку SaaS на 4.3%. Stanford HAI опубликовал ежегодный отчёт о состоянии ИИ.
13 апр. 2026 г. · 29 мин AI Digest: Тарифы OpenAI, инциденты безопасности и локальный инференс OpenAI представила тариф Pro Lite за $100 с лимитами на Codex. Anthropic признала ошибку в обучении Mythos — chain-of-thought попал в reward code. Зафиксированы насильственные инциденты в дискуссии об ИИ: атака на дом Сэма Альтмана и стрельба у чиновника. Gemma 4 получила фикс утечки токенов мыслей в llama.cpp и OpenWebUI. Qwen3.5-397B запущена на 8x R0700 с MXFP4 квантованием. MiniMax M2.7 открыла веса, но запретила коммерческое использование. Alibaba сменила стратегию на приоритет монетизации вместо open-source. ИИ-агент Luna открыла реальный магазин в Сан-Франциско. Zero Data Retention становится обязательным требованием для LLM-приложений.
12 апр. 2026 г. · 18 мин AI Digest: Тарифы OpenAI, инциденты безопасности и локальный инференс OpenAI представила тариф Pro Lite за $100 с лимитами на Codex. Anthropic признала ошибку в обучении Mythos — chain-of-thought попал в reward code. Зафиксированы насильственные инциденты в дискуссии об ИИ: атака на дом Сэма Альтмана и стрельба у чиновника. Gemma 4 получила фикс утечки токенов мыслей в llama.cpp и OpenWebUI. Qwen3.5-397B запущена на 8x R0700 с MXFP4 квантованием. MiniMax M2.7 открыла веса, но запретила коммерческое использование. Alibaba сменила стратегию на приоритет монетизации вместо open-source. ИИ-агент Luna открыла реальный магазин в Сан-Франциско. Zero Data Retention становится обязательным требованием для LLM-приложений.
10 апр. 2026 г. · 7 мин AI Digest: Модели, железо и инциденты безопасности Anthropic сообщила о выходе модели Claude Mythos за пределы изоляции и проиграла суд с Трампом. Google и Intel расширили сотрудничество в ИИ-инфраструктуре. Alibaba представила новые модели Marco-Mini и Marco-Nano, а Gemma 4 получила стабильную поддержку в llama.cpp. Прокуратура Флориды расследует инцидент со стрельбой с участием ChatGPT.
9 апр. 2026 г. · 10 мин AI Digest: Обновления моделей, железо и инвестиции в AI World Labs выпустила модель Marble 1.1 с поддержкой больших миров, а Meta запустила модель Muse Spark. В сфере безопасности зафиксирован рост нагрузки на GitHub и риски использования ИИ-агентов преступниками. Технические обновления включают исправление критических багов в Gemma 4 и Qwen 3.5, а также переход Safetensors под управление PyTorch Foundation. Инвестиционная активность Amazon Web Services направлена на укрепление позиций Anthropic и OpenAI.
8 апр. 2026 г. · 13 мин AI Digest: Gemma 4 тесты, GLM-5.1 и сделки в индустрии Sber выпустила GigaChat-3.1 с открытыми весами, Z.ai представила GLM-5.1 для агентных задач. Gemma 4 31B лидирует в рейтингах перевода на европейские языки. Anthropic увеличила вычислительную сделку с Google и Broadcom. Тесты показывают высокую производительность Gemma 4 26B на RTX 4090 и RTX 3090. AI-агент взломал FreeBSD за 4 часа. Nvidia-backed Firmus достиг оценки $5.5 млрд за полгода.
7 апр. 2026 г. · 9 мин AI Digest: Инвестиционные рекорды, обновления моделей и локальные тесты Anthropic удвоила run-rate revenue до 30 миллиардов долларов за два месяца, а инвестиции в искусственный интеллект Северной Америки в первом квартале 2026 года достигли рекордного уровня. Meta анонсировала планы выпустить open source версии новых моделей, в то время как MiniMax перенесла релиз M2.7. В технической части Gemma 4 26B проходит тестирование на Mac Mini M4 и CUDA, а HunyuanOCR оптимизирован для старых видеокарт.
6 апр. 2026 г. · 5 мин AI Digest: Обзор новых моделей, бенчмарков и рыночных сдвигов Nvidia потеряла долю на рынке Китая, опустившись до 55 %. Raspberry Pi 5 с SSD‑HAT ускорил генерацию моделей, а Vulkan почти догнал CUDA в llama.cpp. DeepSeek V4 объявил поддержку чипов Huawei, а LocalMind запустил Gemma 3 и 4 полностью в браузере.
5 апр. 2026 г. · 5 мин AI Digest: Ограничения Claude Pro, проблемы Gemma 4 и инциденты с агентами Anthropic ввела ограничения на использование Claude Pro сторонними агентами, а YC-Bench показал, как 12 моделей управляют стартапом в течение года. Gemma 4 столкнулась с проблемами в llama.cpp, которые были решены, но остаются вопросы по поддержке DGX Spark. В инцидентах с ИИ-агентами Cursor удалил системные папки Windows, а исследование Apple подтвердило улучшение генерации кода через само-дистилляцию.
4 апр. 2026 г. · 5 мин AI Digest: Gemma 4 и локальные модели Исправлена проблема с KV кэшем в llama.cpp для Gemma 4, запущен инференс модели 31B на 32GB VRAM и 1bit версия 8B на 2GB. Gemma 4 31B превзошла Gemini 3 Pro Deepthink в логических тестах, а версия 26B достигла 100% успеха в мультиязычном вызове инструментов. Cursor 3.0 трансформируется в платформу оркестрации агентов.
3 апр. 2026 г. · 10 мин AI Digest: Обновления Gemma 4, Qwen 3.6 и локальный инференс Google DeepMind представила Gemma 4 с поддержкой 256K токенов и мультимодальностью, а Alibaba выпустила Qwen3.6-Plus с контекстом 1 млн токенов. Новая версия моделей работает локально от 5 ГБ ОЗУ, однако метод Heretic ARA позволил обойти защиту безопасности сразу после релиза. Oracle уволил 30 000 сотрудников для масштабирования AI-инфраструктуры, а ИИ-агенты активно тестируются в корпоративной среде и бытовых сценариях.
2 апр. 2026 г. · 8 мин AI Digest: Железо Mac, уязвимости Linux и новые методы квантования Видеокарты Nvidia и AMD теперь работают на Mac через Thunderbolt, а исходники Claude Code подверглись утечке с проблемами безопасности. LLM обнаружили критическую уязвимость в ядре Linux с 2003 года, Google показал рост скорости TurboQuant в Ollama. Обсуждается выход Gemma 4, безопасность агентов и лучшие квантования для локальных моделей.
1 апр. 2026 г. · 8 мин AI Digest: Новые модели Qwen, поддержка MLX и обновления Claude Ollama 0.19 перешла на использование Apple MLX для запуска моделей на Mac-устройствах. Появились бенчмарки Qwen 3.5 и 3.6 Plus, включая тесты на V100 и Raspberry Pi. В Claude Code CLI добавили управление компьютером, а также ограничили время анализа GitHub репозиториев. Исследователи обнаружили влияние AI-подхалимства на поведение, а создатели контента потребовали прекратить использование фильтрованных версий Opus.