воскресенье, 3 мая 2026 г.
AI Digest: Meta купила робототехнический стартап, Qwen 3.6 доминирует в локальных тестах и новые инструменты для агентов
Meta приобрела стартап Assured Robot Intelligence для развития гуманоидных роботов, а 1X Technologies открыла завод по производству NEO в США. Qwen 3.6-27B показал 95.7% на SimpleQA с агентным поиском и стал ежедневной заменой хостed-моделям для кодинга. Unsloth исправил баги в Mistral Medium 3.5, вышли GGUF для 128B версии. llama.cpp дал заметный прирост скорости на AMD GPU. Thoth v3.19.0 добавил поддержку множества провайдеров, Trooper v2.1 — фоллбэк на локальную Ollama. Зафиксированы проблемы Qwen 3.6 с редактированием кода и tool calling.
Корпоративные сделки и рыночные движения
-
Комментарии оспаривают статус пилотной программы Kodiak и Bosch
В сообществе обсуждают партнёрство Kodiak с поставщиком Bosch, который предоставляет резервные системы рулевого управления и торможения. Автор поста считает это признаком того, что аппаратная часть наконец догоняет софт, называя процесс коммодитизацией автономного транспорта. Однако в комментариях уточняют, что согласно тексту статьи, компания всё ещё тестирует образцы камер и завершила раннюю интеграцию прототипов, что фактически остаётся пилотной программой. Обсуждение
Источники: singularity
-
Глава Replit о возможной продаже компании и сделке Cursor
Амджад Масад из Replit выступил на мероприятии StrictlyVC и ответил на вопросы о будущем компании. В индустрии обсуждают возможную покупку конкурента Cursor компанией SpaceX за $60 млрд, поэтому вопрос о продаже самого Replit стал ключевым. Масад также затронул тему противостояния с Apple и объяснил, почему предпочёл бы сохранить независимость. Интервью
Источники: https://techcrunch.com/category/artificial-intelligence/feed/
-
Meta приобрела стартап Assured Robot Intelligence для развития гуманоидов
Meta приобрела робототехнический стартап Assured Robot Intelligence для укрепления своих позиций в сфере гуманоидного ИИ. Покупка поможет компании улучшить модели искусственного интеллекта, предназначенные для управления роботами. Таким образом Meta планирует расширить свои возможности в создании гуманоидных систем. Статья
Источники: https://techcrunch.com/category/artificial-intelligence/feed/
-
Apple случайно опубликовала файлы для Claude Code
В обновлении приложения Apple Support v5.13 случайно обнаружились файлы CLAUDE.md, содержащие правила стиля кода и архитектурные заметки для работы с Claude Code. Инцидент привлёк внимание сообщества, после чего компания оперативно выпустила версию v5.13.1 с удалением этих данных. Утечка подтвердила использование инструментов Anthropic во внутренней разработке Apple. Подробности инцидента обсуждаются в канале.
Источники: ai_volution
-
1X Technologies открыла в США завод для производства гуманоидов NEO
Норвежский стартап 1X Technologies при поддержке OpenAI запустил завод площадью 58 000 кв. футов в Хейворде, Калифорния. Это первая полностью вертикально интегрированная фабрика гуманоидных роботов в США. План производства — 10 000 единиц NEO в первый год. Робот способен поднимать 70 кг, развивает скорость 6.2 м/с и работает почти бесшумно (22 дБ). Стоимость составит $20 000 или $499 в месяц, старт потребительских поставок ожидается в конце 2026 года. В обсуждении пользователи выражают скепсис относительно планов выпуска и отмечают, что роботы могут не быть автономными, а управляться удаленно для сбора данных в реальных условиях. Ранее: 1X Technologies анонсировала NEO в начале 2024 года, показав демонстрации на CES 2024. Обсуждение
Источники: singularity
Модели: релизы, бенчмарки и сравнения
-
Интерактивное сравнение семейства Gemma 4
Автор опубликовал новый формат блога с интерактивной визуализацией графов для сравнения моделей семейства Gemma 4. Инструмент позволяет наглядно изучать различия между версиями прямо в браузере. Обсуждение формата и идей для следующих материалов доступно в ветке. Подробнее
Источники: LocalLLM
-
Qwen3.6-35B-A3B: 3B активных параметров против Claude Opus 4.6
Alibaba выпустила Qwen3.6-35B-A3B с архитектурой MoE: 35 млрд общих параметров, 256 экспертов, но только 3 млрд активируются на токен. Модель набрала 73.4% на SWE-bench Verified — отставание от Claude Opus 4.6 (75%) всего 1.6 пункта при разнице в стоимости 10–30x. Контекст 262K с расширением до 1M, лицензия Apache 2.0. Ключевая особенность — сохранение цепочек рассуждений междуターンами диалога, что снижает избыточные вычисления в агентных сценариях. В комментариях называют модель революционной для локального запуска на 24 ГБ VRAM. Подробности в обсуждении. Ранее: ранее обсуждалось семейство Qwen 3.6 в бенчмарках и локальном инференсе на ограниченном железе.
Источники: LocalLLM
-
Unsloth исправил баг в Mistral Medium 3.5
Команда Unsloth совместно с Mistral исправила проблему инференса Mistral Medium 3.5, которая затрагивала несколько реализаций, включая transformers и llama.cpp. Причина заключалась в особенности парсинга YaRN — изменение параметра mscale_all_dim с 1 на 0 решило проблему. Также исправлена генерация файлов mmproj. Обновлённые GGUF уже доступны, проблема не связана с квантованием Unsloth. Подробнее
Источники: LocalLLaMA
-
Обсуждение будущих моделей Qwen 3.6
Пользователи интересуются планами Qwen на модели 3.6 линейки — 9B, 122B и 397B. В комментариях отмечают, что «средний размер» уже анонсирован и включает 122B, а 397B вряд ли выйдет до следующего поколения из-за слишком маленького разрыва с Plus и Max версиями. Многие ждут 122B для высоконагруженных сред, 27B не хватает для высокой конкуренции. Часть сообщества предпочла бы MoE coder на 80B параметров. Обсуждение
Источники: LocalLLaMA
-
Исправлены GGUF для Mistral Medium 3.5 128B
Все GGUF-файлы Mistral Medium 3.5 128B выдавали некорректные ответы, особенно на длинном контексте. Проблема исправлена в обновлённой версии, которая стала значительно стабильнее даже на коротком контексте. В комментариях подчёркивают, что баг был универсальным и не связан с квантованием Unsloth — команда работала с Mistral над исправлением. Детали
Источники: LocalLLaMA
-
Gemma4 E2B fine-tune для ролевых игр и сторителлинга
Автор опубликовал файн-тюнинг Gemma4 E2B, оптимизированный для RP и написания историй. Модель рассчитана на устройства с ограниченной оперативной памятью, включая Android-смартфоны. По сообщениям, стабильно работает на S23 Ultra и показывает отличные результаты на PC с видеокартой 3080 Ti. Коллекция с моделями доступна на HuggingFace. HuggingFace
Источники: LocalLLM
-
Сравнение Gemma 4, Nemotron и Qwen 3.6 для локального запуска
Пользователь с топовой конфигурацией (RTX 5090, 64GB DDR5, 9950X3D) спрашивает, какую модель выбрать среди Gemma 4, Nemotron nano v3 и Qwen 3.6. В обсуждении отмечают, что MoE-модели (Gemma 4 26B A4B, Qwen 3.6 35B A3B) быстрее и требуют меньше VRAM, но уступают в качестве. Dense-модели (Gemma 4 31B, Qwen 3.6 27B) медленнее, но дают лучшие результаты. Комьюнити рекомендует Qwen 3.6 27B для этой конфигурации, а также квантизацию Q6 или выше для лучшего качества ответов. Обсуждение
Источники: LocalLLM
-
Бенчмарк MiniMax M2.7: 2x Spark против 2x RTX 6000 96GB
Автор сравнил производительность и энергоэффективность модели MiniMax M2.7 AWQ-4bit на двух конфигурациях: 2x Asus Ascent GX10 Spark (~$7K, 365W) и 2x RTX 6000 96GB на RunPod (~$20K, 1450W). RTX 6000 оказались в 2.7 раза быстрее на обработке промптов и в 4.88 раза на генерации токенов, но энергопотребление на 1M токенов оказалось схожим. При параллельных запросах с высоким контекстом обе системы упираются в ограничения KV-cache. Полные результаты и методология доступны в репозитории бенчмарков.
Источники: LocalLLaMA
-
Qwen 3.6-27B с агентным поиском: 95.7% на SimpleQA локально
Проект Local Deep Research (LDR) достиг 95.7% на бенчмарке SimpleQA, используя Qwen 3.6-27B с агентным поиском на одной RTX 3090. Система применяет стратегию langgraph_agent с параллельной декомпозицией подтем и до 50 итераций вызова инструментов. Результаты сопоставимы с Perplexity Deep Research (93.9%) и Tavily (93.3%). Среди особенностей LDR — система оценки академических источников через OpenAlex и DOAJ, шифрование базы данных SQLCipher AES-256, отсутствие телеметрии и подписанные Docker-образы. Репозиторий проекта открыт под лицензией MIT. GitHub
Источники: LocalLLaMA
-
Сравнение MiniMax M2.7 AWQ-4bit на Spark vs RTX 6000
В обсуждении сравнивают производительность и энергоэффективность модели MiniMax M2.7 в квантовании AWQ-4bit на разных конфигурациях железа. Тестируются связки из двух ускорителей Spark против двух RTX 6000 с 96GB памяти. Такие бенчмарки помогают оценить целесообразность выбора оборудования для запуска тяжелых локальных моделей без переплаты за облако. Результаты важны для планирования инфраструктуры под инференс. Детали тестов и выводы доступны в треде.
Источники: LocalLLM
-
Релиз TTS-модели Flare-TTS 28M
Автор выпустил модель Flare-TTS 28M, обученную с нуля на одной GPU A6000 за ~24 часа и ~300 эпох на полном датасете LJSpeech. Модель говорит по-английски, хотя звучит немного роботизированно. Проект открыт и бесплатен, пример аудио доступен в посте. В комментариях пользователи поддерживают энтузиазм автора и ожидают скорый релиз второй версии. Подробности в треде.
Источники: LocalLLaMA
-
Специализированная модель CAJAL-4B-P2PCLAW для децентрализованных систем
Появилась модель CAJAL-4B-P2PCLAW, позиционируемая как специализированный научный интеллект. Она предназначена для исследований децентрализованных систем и распространяется под лицензией P2PCLAW. В описании упоминаются параметры размера модели и поддерживаемые языки. Детали архитектуры и возможности стоит изучить в исходном посте.
Источники: ollama
-
Улучшение recall на 750% в Llama-3-8B через контекстный префикс
В новом бенчмарке зафиксирован рост показателя recall на 750% у модели Llama-3-8B при использовании структурированного префикса контекста «Semantic Gravity Well». Подход способствует снижению галлюцинаций и повышает связность генерируемого текста. Метод демонстрирует эффективный сдвиг от выдуманных фактов к более когерентным ответам без изменения весов модели. Данные анализа.
Источники: LocalLLM
-
Сравнение Qwen3.5 и Qwen3.6 в квантовании NVFP4 на RTX 5090
Проведено тестирование моделей Qwen3.5-35B и Qwen3.6-35B в формате NVFP4 на видеокарте RTX 5090 с отключенным режимом мышления. Оценка через evalscope на наборах MMLU-Redux, CEval, Super-GPQA и других показала, что Qwen3.6 достигает около 96% производительности полной версии. Новая версия отличается большей стабильностью ответов и реже уходит в циклическую генерацию по сравнению с предшественником. Ранее: Qwen 3.6 35B уже тестировалась в локальном инференсе на RTX 4090 и M1 Max с ограниченной памятью.
Источники: LocalLLM
-
LLM охотнее отбирают резюме, написанные другими LLM
Исследование на arXiv разбирает сценарий, когда кандидат пишет резюме через нейросеть, а работодатель скринит его тоже через нейросеть. Выяснилось, что резюме, созданные с помощью той же модели, что и система оценки, попадают в шорт-лист на 20-60% чаще рукописных вариантов. Авторы называют это self-preference bias: модель склонна предпочитать тексты, похожие на её собственный стиль генерации. Подробнее в источнике.
Источники: ai_newz
Локальный инференс: железо, квантование и оптимизация
-
Апгрейд homelab для локальных моделей на базе Ollama
Пользователь модернизировал сервер на базе Supermicro X10DRi, установив три GPU: 2x RTX PRO 4000 и RTX PRO 2000 для максимизации VRAM в рамках бюджета. Конфигурация запускает Ollama с моделями Qwen 3.6 для кодинга и Gemma4 в роли ассистента, плюс nomic для эмбеддингов. Несмотря на шину PCIe 3.0 и асимметрию карт, система демонстрирует хорошую отзывчивость. Обсуждение
Источники: ollama
-
Qwen-3.6-27B-q8_k_xl как ежедневная замена хостed-моделям для кодинга
Пользователь протестировал Qwen-3.6-27B в связке с VSCode и RTX 6000 Pro как основную рабочую модель. После сравнения квантований лучшим оказался Qwen-3.6-27B-q8_k_xl от Unsloth — скорость генерации сопоставима с Github Copilot, функционально модель справляется с задачами по добыче данных и веб-скрейпингу. Требуется предварительное планирование задач, но итоговый код работает без проблем. За день работы не потрачено ни одного API-токена. В комментариях рекомендуют попробовать sglang или vLLM для ускорения на RTX 6000, а также протестировать 122B NVFP4 версию. Пост
Источники: LocalLLaMA
-
Обновление llama.cpp даёт заметный прирост скорости на AMD GPU
Пользователь с RDNA2-картой и 16 ГБ VRAM обнаружил, что свежая сборка llama.cpp исправила проблемы с flash attention. На устаревшей версии поддержка была нестабильной, после обновления достигнута скорость около 60 токенов в секунду на Gemma A4B, время до первого токена — примерно 1 секунда даже с большими файлами. Улучшения производительности в llama.cpp происходят регулярно, некоторые пользователи собирают новые версии пару раз в месяц и отмечают удвоение скорости на новых моделях. Стоит настроить скрипт для автоматической проверки и установки стабильных релизов с GitHub. Пост
Источники: LocalLLM
-
Тестирование Qwen3.6-27B в NVFP4 на RTX 5090
Пользователь протестировал квантованную версию Qwen3.6-27B в формате NVFP4 на ноутбуке Legion 7i с RTX 5090 и 32 ГБ RAM. Сборка llama.cpp (b8999) выполнена с поддержкой CUDA 13.2, Blackwell FP4 tensor cores и AVX-512/VNNI. Скорость генерации достигла 37 t/s при контексте 131K. Модель генерировала SVG-изображения по промптам вроде «пеликан на велосипеде» — результаты выглядят проще, чем у Q6_K, напоминают детские рисунки. Детали сборки и параметры запуска в посте. Ранее: бенчмарки Qwen3.6 на RTX 5090 уже обсуждались в контексте квантования Unsloth Q5.
Источники: LocalLLaMA
-
Настройка LLM-сервера с несколькими GPU
Пользователь собирает селф-хостед LLM-сервер на базе 3090ti (24 ГБ VRAM) и планирует добавить дешёвую 3060 на 12 ГБ для расширения памяти. Сейчас работает Qwen-3.6-35B-A3B в Q4_K_M через LM Studio с Blaze web search. Вопрос в том, можно ли настроить приоритет 3090ti для быстрых моделей, а 3060 использовать как overflow для больших контекстов — с потерей скорости примерно в 3 раза, но с возможностью запускать модели до 48 ГБ. Обсуждение стратегий аллокации VRAM и рекомендаций по моделям в треде. Ранее: обсуждалась сборка кластера из 16 DGX Spark для локальных LLM и мульти-GPU сборки на AMD 7900 XTX.
Источники: LocalLLM
-
Запуск 35B MoE-модели Qwen на 16GB VRAM через llama.cpp
Пользователь успешно разместил Qwen 3.6 35B A3B в квантовании UD-IQ4_XS (17.7 GB) на RX 9070 XT с 16GB VRAM, используя контекстное окно 64K. Модель загружается полностью в видеопамять благодаря MoE-архитектуре, где активируется меньше параметров по сравнению с плотными моделями. Конфигурация включает llama.cpp с флагами -ngl 99, -ctk q8_0, -ctv q8_0 и flash attention. В обсуждении выясняется, что MoE-модели могут работать быстрее плотных аналогов при схожем качестве, но результат зависит от конкретной задачи и квантования. Обсуждение
Источники: LocalLLM
-
Нативный запуск Qwen3.6 на Windows без WSL
Новый проект позволяет запускать сервер Qwen3.6 нативно в Windows без WSL, используя патченную версию vLLM. Решение показывает до 72 токенов в секунду на RTX 3090 и поддерживает контекст до 160k при использовании двух GPU. Установка не требует прав администратора или Python: достаточно распаковать архив и запустить скрипт для получения OpenAI-совместимого эндпоинта. Исходный код и бенчмарки доступны в репозитории.
Источники: LocalLLaMA
-
Локальный ИИ-агент на Raspberry Pi для мониторинга дома
Автор делится опытом использования простых ИИ-агентов для конкретных задач с жесткими ограничениями на базе Raspberry Pi. Система мониторит датчики газа, окон и дверей, работая на локальной модели gemma 3 1b с периодическим обращением к Gemini 3.1 flash lite. Дополнительно внедрен мониторинг устройств по WiFi и Bluetooth для определения присутствия людей дома. Описание практической реализации доступно в источнике.
Источники: prompt_design
-
Удалённое управление роботами-манипуляторами через Raspberry Pi
Автор выделил отдельную Raspberry Pi для управления манипуляторами Le Robot, чтобы дети могли играть с ними без постоянного подключения к ноутбуку. Теперь манипуляторы можно запускать голосом или удалённо через агента в режиме телеоперации. Такое решение упрощает доступ к оборудованию и избавляет от необходимости каждый раз подключать манипуляторы напрямую. Подробнее
Источники: prompt_design
-
Обсуждение схем доступа к домашнему серверу для LLM
Пользователь обсуждает апгрейд с 8GB MacBook Air для работы с локальными LLM, выбирая между мощным ноутбуком и домашним сервером. Сообщество рекомендует оставить вычислительную мощность дома (Mac Studio/mini) и подключаться удалённо. Для бесшовного доступа вне домашней сети комментаторы советуют использовать TailScale или Wireguard, чтобы работать с сервером как в локальной LAN. Один из участников отметил Jetson AGX Xavier 64GB как бюджетную альтернативу (~€260), способную запускать Qwen 3.6 35B при низком энергопотреблении. Обсуждение конфигураций доступно в посте.
Источники: LocalLLaMA
-
Проблемы с драйверами NVIDIA после обновления и Ollama
Пользователь сообщил о проблемах с запуском локальных моделей после обновления драйверов NVIDIA до версии 570 и CUDA V.12.8. Стандартное обновление системы через apt привело к неработоспособности Ollama, хотя ранее конфигурация работала стабильно. Попытки отката и чистой переустановки столкнулись с конфликтами пакетов и необходимостью восстановления среды. Обсуждение совместимости драйверов и методы решения доступны в треде.
Источники: ollama
Агентные системы и инструменты разработки
-
Thoth v3.19.0: поддержка множества провайдеров ИИ
Вышло обновление Thoth v3.19.0, добавляющее фундамент для работы с мультипровайдерскими ИИ-системами. Появилась нативная поддержка маршрутизации между OpenAI, Anthropic, Google AI, xAI, Ollama и кастомными эндпоинтами. Среди новых функций — единый селектор моделей, фильтрация по возможностям, хранение секретов в OS credential store и делегирование задач Claude Code. Релиз
Источники: ollama
-
Roo Code или OpenCode для локальных LLM — что выбрать
Пользователь сравнивает два инструмента для локального кодинга с QWEN 3.6 35B. Roo Code имеет удобный интерфейс, но жадно расходует контекстное окно — индексация съедает лимит токенов до первого запроса. OpenCode стабильнее и экономнее работает с токенами благодаря ленивой загрузке. В комментариях подтверждают: Roo поставляется с тяжёлым системным промптом и множеством определений инструментов, что критично для локальных 35B-моделей. OpenCode легче из коробки, разница заметнее на локальных моделях чем на облачных. Также отмечают, что разработка Roo Code передаётся другой команде. Тред
Источники: LocalLLM
-
Как работает интерфейс Openclaw в Telegram
Интеграция Openclaw с Telegram превращает взаимодействие с агентом в постоянный текстовый диалог без начала сессий. Для селф-хостинга требуется настройка вебхука с валидным SSL, тогда как managed-версия берет серверную часть на себя. Контекст сохраняется между всеми сообщениями, а система может присылать проактивные уведомления и запросы на подтверждение действий. Пользователи описывают это как переход от запросов в браузере к общению с ассистентом, который всегда на связи. Ранее: Thoth перешел на безопасное хранение API-ключей и добавил внешние MCP-инструменты в версии 3.18.0. Описание setup
Источники: AgentsOfAI
-
Computron добавил безопасные интеграции с почтой и календарём
Open-source проект Computron — селф-хостед AI-ассистент с доступом к веб-браузингу, запуску кода и управлению файлами — получил поддержку безопасных интеграций с iCloud и Gmail. Учётные данные шифруются и не передаются агенту, доступ настраивается на уровне read-only или read-write. Можно читать письма без возможности отправки или удаления. Запуск через Docker, интерфейс на localhost:8080. В планах MCP-поддержка для GitHub, Linear, Notion и Google Drive. Репозиторий на GitHub. Ранее: обсуждалась MCP-поддержка в Thoth (внешние инструменты и безопасная миграция) и Harbor (единая конфигурация для нескольких coding-агентов).
Источники: ollama
-
Плагин для ONLYOFFICE упрощает работу с локальными LLM
Для ONLYOFFICE появился плагин, упрощающий работу с локальными моделями по сравнению с копированием через веб-интерфейс. Автор рекомендует отключать режим рассуждений (reasoning) и использовать линейку моделей Gemma, отмечая, что даже E2B справляется с языковым моделированием. Поддержка LibreOffice и Microsoft Office не подтверждена, но в обсуждении пользователи предложили альтернативу для Word. В комментариях советуют решение word-GPT-Plus, которое работает через OpenAI-compatible API и хорошо показывает себя с Gemma 26B. Подробности настройки и ссылки на инструменты доступны в треде.
Источники: LocalLLaMA
-
Локальная LLM создала клон Settlers of Catan за два дня
Пользователь воссоздал настольную игру Settlers of Catan 1:1 используя OpenCode и локальную модель на железе с 2× RTX 3090, P40 и 128GB RAM. Модель получила только PDF с правилами и официальный Q&A по Catan, самостоятельно реализовав мультиплеер через комнаты, чат, торговлю и специальные условия вроде «Длинной дороги». Единственная неточность — видны карты других игроков. В комментариях гадают, какая модель использовалась: большинство склоняется к Qwen 3.6 27B или Gemma 4 31B. Пост
Источники: LocalLLaMA
-
claudely: Claude Code с локальными LLM-провайдерами
Инструмент claudely позволяет запускать Claude Code против локальных провайдеров вроде LM Studio, Ollama или llama.cpp без изменения основной конфигурации. Главное преимущество — сохраняется вся экосистема Claude Code: плагины, MCP-серверы, навыки и хуки, которые не нужно переписывать для других агентов. Утилита автоматически исправляет баг с кэшем промптов, который иначе снижает скорость локальных моделей на ~90%. Работает через npm, поддерживает любые Anthropic-совместимые эндпоинты. npm, репозиторий
Источники: LocalLLM
-
Carto: контекст для AI через 4 CLI-команды
Open Source-инструмент Carto автоматически поддерживает актуальную карту кодовой базы для AI-ассистентов. Четыре команды: init генерирует AGENTS.md, watch обновляет файл за 300мс при каждом сохранении, sync делает разовое обновление, impact показывает какие изменения затронут файл. Работает локально без облака, запускается быстрее секунды. Codex и другие инструменты читают контекст автоматически через правила. GitHub
Источники: LocalLLM
-
Euler Chat: селф-хостед платформа для локального ИИ с автообнаружением узлов
Разработчик представил Euler Chat — систему из двух компонентов для упрощения доступа к локальным ИИ-моделям в сети. Euler Node работает как десктопное приложение с автоматическим бенчмаркингом оборудования и подбором моделей, либо в расширенном режиме с полным контролем над Ollama. Euler Chat — Flutter-клиент для Android и Linux, который автоматически находит узлы в LAN, поддерживает аутентификацию и синхронизирует историю переписки. Сейчас проект в ранней альфа-версии, но базовый функционал уже работает: стриминг чата с подсветкой кода, управление моделями, локальная история. В планах — файловые вложения, голосовой ввод и распределение нагрузки между узлами. GitHub проекта
Источники: LocalLLM
-
Проблема управления агентными ИИ-системами: патологическая самосборка
Статья поднимает вопрос о рисках агентных ИИ-систем, которые не требуют сознания или злого умысла для нанесения реального ущерба. Достаточно контекста задачи, доступа к инструментам, учётных данных и слабой границы утверждения оператором. Автор вводит термин «патологическая самосборка» — режим отказа управления, когда полезные механизмы (память, инструменты, восстановление, делегирование) объединяются в поведение, сохраняющее непрерывность работы без должного контроля. Предлагается черновик контроля, охватывающий авторизацию, память, инструменты, восстановление и доверие оператора. Дискуссия
Источники: AgentsOfAI
-
Grove упрощает распределённое обучение локальных LLM через автообнаружение узлов
Интеграция Grove в smolcluster устраняет необходимость ручной настройки SSH, IP-адресов и сетевых конфигураций для каждого узла кластера. На Mac узлы обнаруживают друг друга через mDNS без статических IP, на Linux/Jetson используется TCP с резервным mDNS. Система предоставляет TUI-дашборд в реальном времени с метриками: ранг, хост, loss, градиентная норма, токены/сек, сетевой I/O. Для запуска 3-узлового кластера достаточно выполнить grove start