Современные разработки в области LLM-агентов в основном сосредоточены на улучшении выполнения сложных задач. Однако один критически важный аспект остаётся недооценённым: память — способность агентов сохранять, извлекать и анализировать пользовательскую информацию с течением времени. Без постоянной памяти большинство LLM-агентов остаются «бессостоятельными», неспособными выстраивать контекст за пределами одного запроса, что ограничивает их полезность в реальных сценариях, где важны последовательность и персонализация.
Чтобы решить эту проблему, MIRIX AI представляет MIRIX — модульную мультиагентную систему памяти, специально разработанную для обеспечения надёжной долгосрочной памяти в LLM-агентах. В отличие от плоских, чисто текстовых систем, MIRIX интегрирует структурированные типы памяти, включая визуальные данные, и построена на скоординированной мультиагентной архитектуре для управления памятью.
Основная архитектура и структура памяти
MIRIX включает шесть специализированных компонентов памяти, каждый из которых управляется соответствующим Memory Manager:
- Core Memory (Базовая память): Хранит постоянные данные об агенте и пользователе, разделённые на «персону» (профиль агента, тон и поведение) и «человека» (факты о пользователе, такие как имя, предпочтения и отношения).
- Episodic Memory (Эпизодическая память): Фиксирует события с временными метками и взаимодействия с пользователем, включая атрибуты: тип события, краткое описание, детали, участники и временную метку.
- Semantic Memory (Семантическая память): Кодирует абстрактные концепции, графы знаний и именованные сущности, организуя записи по типу, краткому описанию, деталям и источнику.
- Procedural Memory (Процедурная память): Содержит структурированные рабочие процессы и последовательности задач с чёткими шагами и описаниями, часто в формате JSON для удобства обработки.
- Resource Memory (Ресурсная память): Управляет ссылками на внешние документы, изображения и аудио, записывая название, краткое описание, тип ресурса и контент или ссылку для контекстной непрерывности.
- Knowledge Vault (Хранилище знаний): Защищает дословные факты и конфиденциальную информацию, такую как учётные данные, контакты и API-ключи, с жёстким контролем доступа и метками чувствительности.
Meta Memory Manager координирует работу этих шести менеджеров, обеспечивая интеллектуальную маршрутизацию сообщений, иерархическое хранение и операции извлечения данных. Дополнительные агенты (например, чат-агент и интерфейсный агент) взаимодействуют в рамках этой архитектуры.
Активное извлечение данных и конвейер взаимодействия
Ключевое нововведение MIRIX — механизм Active Retrieval (Активное извлечение). При получении пользовательского ввода система сначала автономно определяет тему, затем извлекает релевантные записи из всех шести компонентов памяти и помечает извлечённые данные для контекстного включения в итоговый системный запрос. Это снижает зависимость от устаревших знаний параметрической модели и обеспечивает более точные ответы.
Доступны несколько стратегий извлечения, включая embedding_match
, bm25_match
и string_match
, что гарантирует точный и контекстно-зависимый доступ к памяти. Архитектура позволяет расширять инструменты извлечения по мере необходимости.
Реализация системы и применение
MIRIX развёртывается как кроссплатформенное приложение-ассистент, разработанное на React-Electron (для интерфейса) и Uvicorn (для backend API). Ассистент отслеживает активность на экране, делая скриншоты каждые 1,5 секунды; сохраняются только уникальные изображения, а обновления памяти выполняются пакетами после сбора 20 скриншотов (примерно раз в минуту). Загрузка в Gemini API происходит в потоковом режиме, обеспечивая эффективную обработку визуальных данных и задержку менее 5 секунд при обновлении памяти.
Пользователи взаимодействуют через чат-интерфейс, который динамически использует компоненты памяти агента для генерации персонализированных ответов. Семантическая и процедурная память отображаются в виде раскрывающихся деревьев или списков, обеспечивая прозрачность и позволяя пользователям проверять, что именно «помнит» агент.
Оценка на мультимодальных и диалоговых тестах
MIRIX протестирован на двух сложных задачах:
- ScreenshotVQA: Визуальный тест на ответы по скриншотам, требующий долгосрочной памяти. MIRIX превосходит RAG-методы (SigLIP и Gemini) на 35% по точности LLM-as-a-Judge, сокращая объём хранилища на 99.9% по сравнению с текстовыми методами.
- LOCOMO: Текстовый тест на долгосрочную память в диалогах. MIRIX достигает 85.38% средней точности, опережая LangMem и Mem0 более чем на 8 пунктов и приближаясь к верхним границам полного контекста.
Модульная архитектура обеспечивает высокую производительность как в мультимодальных, так и в текстовых сценариях.
Применение: носимые устройства и рынок памяти
MIRIX поддерживает лёгкие носимые устройства (умные очки, значки) благодаря эффективной модульной архитектуре. Гибридное развёртывание позволяет обрабатывать память как на устройстве, так и в облаке. Практические применения включают:
- Суммаризацию встреч в реальном времени
- Точное восстановление местоположения и контекста
- Динамическое моделирование привычек пользователя
Инновационная функция MIRIX — Memory Marketplace (Рынок памяти): децентрализованная экосистема для безопасного обмена, монетизации и совместной персонализации ИИ. Платформа включает детальные настройки приватности, сквозное шифрование и децентрализованное хранение для защиты данных.
Заключение
MIRIX — значительный шаг к созданию LLM-агентов с человеческой памятью. Его структурированная мультиагентная архитектура обеспечивает абстракцию памяти, мультимодальную поддержку и контекстно-зависимый анализ. С подтверждёнными преимуществами в тестах и удобным интерфейсом MIRIX задаёт новый стандарт для систем ИИ с расширенной памятью.
Частые вопросы
Чем MIRIX отличается от существующих систем памяти, таких как Mem0 или Zep?
MIRIX предлагает многокомпонентную память (не только текстовые фрагменты), мультимодальную поддержку (включая визуальные данные) и мультиагентную архитектуру для масштабируемого и точного управления долгосрочной памятью.
Как MIRIX обеспечивает низкую задержку при обновлении памяти из визуальных данных?
Благодаря потоковой загрузке в Gemini API MIRIX обновляет визуальную память на основе скриншотов с задержкой менее 5 секунд, даже во время активных сессий.
Совместим ли MIRIX с закрытыми LLM, такими как GPT-4?
Да. MIRIX работает как внешняя система и может дополнять любую LLM, включая GPT-4, Gemini и другие проприетарные модели.

Полина Сергеева
AI-разработчик и технический писатель. Создаёт инструменты на базе нейросетей и делится практическими гайдами для разработчиков и бизнеса.