Referencia de configuración de memoria

Esta página enumera cada control de configuración para la búsqueda de memoria de OpenClaw. Para resúmenes conceptuales, consulte:

Memory overview

Cómo funciona la memoria.

Builtin engine

Backend SQLite predeterminado.

QMD engine

Sidecar con prioridad local.

Memory search

Canalización y ajuste de búsqueda.

Active memory

Subagente de memoria para sesiones interactivas.

Todos los ajustes de búsqueda de memoria se encuentran en agents.defaults.memorySearch en openclaw.json a menos que se indique lo contrario.

Selección de proveedor

Clave	Tipo	Predeterminado	Descripción
`provider`	`string`	autodetectado	ID de adaptador de incrustación como `bedrock`, `deepinfra`, `gemini`, `github-copilot`, `local`, `mistral`, `ollama`, `openai` o `voyage`; también puede ser un `models.providers.<id>` configurado cuyo `api` apunte a uno de esos adaptadores
`model`	`string`	proveedor predeterminado	Nombre del modelo de incrustación
`fallback`	`string`	`"none"`	ID del adaptador de respaldo cuando falla el principal
`enabled`	`boolean`	`true`	Activar o desactivar la búsqueda en memoria

Orden de detección automática

Cuando no se establece provider, OpenClaw selecciona el primero disponible:

local
Seleccionado si memorySearch.local.modelPath está configurado y el archivo existe.
github-copilot
Seleccionado si se puede resolver un token de GitHub Copilot (variable de entorno o perfil de autenticación).
openai
Seleccionado si se puede resolver una clave de OpenAI.
gemini
Seleccionado si se puede resolver una clave de Gemini.
voyage
Seleccionado si se puede resolver una clave de Voyage.
mistral
Seleccionado si se puede resolver una clave de Mistral.
deepinfra
Seleccionado si se puede resolver una clave de DeepInfra.
bedrock
Seleccionado si se resuelve la cadena de credenciales del SDK de AWS (rol de instancia, claves de acceso, perfil, SSO, identidad web o configuración compartida).

ollama es compatible pero no se detecta automáticamente (establézcalo explícitamente).

Ids de proveedor personalizados

memorySearch.provider puede apuntar a una entrada de models.providers.<id> personalizada. OpenClaw resuelve el propietario api de ese proveedor para el adaptador de incrustación mientras conserva el id del proveedor personalizado para el manejo del punto final, la autenticación y el prefijo del modelo. Esto permite que las configuraciones con varias GPU o varios hosts dediquen las incrustaciones de memoria a un punto final local específico:

{
  models: {
    providers: {
      "ollama-5080": {
        api: "ollama",
        baseUrl: "http://gpu-box.local:11435",
        apiKey: "ollama-local",
        models: [{ id: "qwen3-embedding:0.6b" }],
      },
    },
  },
  agents: {
    defaults: {
      memorySearch: {
        provider: "ollama-5080",
        model: "qwen3-embedding:0.6b",
      },
    },
  },
}

Resolución de clave de API

Las incrustaciones remotas requieren una clave de API. Bedrock utiliza en su lugar la cadena de credenciales predeterminada del SDK de AWS (roles de instancia, SSO, claves de acceso).

Proveedor	Var. de entorno	Clave de configuración
Bedrock	Cadena de credenciales de AWS	No se necesita clave de API
DeepInfra	`DEEPINFRA_API_KEY`	`models.providers.deepinfra.apiKey`
Gemini	`GEMINI_API_KEY`	`models.providers.google.apiKey`
GitHub Copilot	`COPILOT_GITHUB_TOKEN`, `GH_TOKEN`, `GITHUB_TOKEN`	Perfil de autenticación mediante inicio de sesión de dispositivo
Mistral	`MISTRAL_API_KEY`	`models.providers.mistral.apiKey`
Ollama	`OLLAMA_API_KEY` (marcador de posición)	—
OpenAI	`OPENAI_API_KEY`	`models.providers.openai.apiKey`
Voyage	`VOYAGE_API_KEY`	`models.providers.voyage.apiKey`

Configuración de punto de conexión remoto

Para puntos de conexión personalizados compatibles con OpenAI o para anular los valores predeterminados del proveedor:

URL base de API personalizada. Anular clave de API. Encabezados HTTP adicionales (fusionados con los valores predeterminados del proveedor).

{
  agents: {
    defaults: {
      memorySearch: {
        provider: "openai",
        model: "text-embedding-3-small",
        remote: {
          baseUrl: "https://api.example.com/v1/",
          apiKey: "YOUR_KEY",
        },
      },
    },
  },
}

Configuración específica del proveedor

Gemini

Clave	Tipo	Predeterminado	Descripción
`model`	`string`	`gemini-embedding-001`	También admite `gemini-embedding-2-preview`
`outputDimensionality`	`number`	`3072`	Para Embedding 2: 768, 1536 o 3072

OpenAI-compatible input types

Los endpoints de incrustación compatibles con OpenAI pueden optar por campos de solicitud input_type específicos del proveedor. Esto es útil para modelos de incrustación asimétricos que requieren diferentes etiquetas para incrustaciones de consultas y documentos.

Key	Type	Default	Description
`inputType`	`string`	unset	`input_type` compartido para incrustaciones de consultas y documentos
`queryInputType`	`string`	unset	`input_type` en tiempo de consulta; anula `inputType`
`documentInputType`	`string`	unset	`input_type` de índice/documento; anula `inputType`

{
  agents: {
    defaults: {
      memorySearch: {
        provider: "openai",
        remote: {
          baseUrl: "https://embeddings.example/v1",
          apiKey: "env:EMBEDDINGS_API_KEY",
        },
        model: "asymmetric-embedder",
        queryInputType: "query",
        documentInputType: "passage",
      },
    },
  },
}

Cambiar estos valores afecta la identidad de la caché de incrustación para la indexación por lotes del proveedor y debe ir seguido de una reindexación de la memoria cuando el modelo ascendente trata las etiquetas de manera diferente.

Bedrock

Configuración de incrustación de Bedrock

Bedrock utiliza la cadena de credenciales predeterminada del AWS SDK; no se necesitan claves de API. Si OpenClaw se ejecuta en EC2 con un rol de instancia habilitado para Bedrock, simplemente configure el proveedor y el modelo:

{
  agents: {
    defaults: {
      memorySearch: {
        provider: "bedrock",
        model: "amazon.titan-embed-text-v2:0",
      },
    },
  },
}

Clave	Tipo	Predeterminado	Descripción
`model`	`string`	`amazon.titan-embed-text-v2:0`	Cualquier ID de modelo de incrustación de Bedrock
`outputDimensionality`	`number`	predeterminado del modelo	Para Titan V2: 256, 512 o 1024

Modelos compatibles (con detección de familia y dimensiones predeterminadas):

ID del modelo	Proveedor	Dimensiones predeterminadas	Dimensiones configurables
`amazon.titan-embed-text-v2:0`	Amazon	1024	256, 512, 1024
`amazon.titan-embed-text-v1`	Amazon	1536	—
`amazon.titan-embed-g1-text-02`	Amazon	1536	—
`amazon.titan-embed-image-v1`	Amazon	1024	—
`amazon.nova-2-multimodal-embeddings-v1:0`	Amazon	1024	256, 384, 1024, 3072
`cohere.embed-english-v3`	Cohere	1024	—
`cohere.embed-multilingual-v3`	Cohere	1024	—
`cohere.embed-v4:0`	Cohere	1536	256-1536
`twelvelabs.marengo-embed-3-0-v1:0`	TwelveLabs	512	—
`twelvelabs.marengo-embed-2-7-v1:0`	TwelveLabs	1024	—

Las variantes con sufijo de rendimiento (por ejemplo, amazon.titan-embed-text-v1:2:8k) heredan la configuración del modelo base.

Autenticación: La autenticación de Bedrock utiliza el orden estándar de resolución de credenciales del AWS SDK:

Variables de entorno (AWS_ACCESS_KEY_ID + AWS_SECRET_ACCESS_KEY)
Caché de tokens SSO
Credenciales de token de identidad web
Archivos de credenciales y configuración compartidos
Credenciales de metadatos de ECS o EC2

La región se resuelve desde AWS_REGION, AWS_DEFAULT_REGION, la amazon-bedrock del proveedor baseUrl, o por defecto es us-east-1.

Permisos IAM: el rol o usuario de IAM necesita:

{
  "Effect": "Allow",
  "Action": "bedrock:InvokeModel",
  "Resource": "*"
}

Para el privilegio mínimo, limitar InvokeModel al modelo específico:

arn:aws:bedrock:*::foundation-model/amazon.titan-embed-text-v2:0

Local (GGUF + node-llama-cpp)

Key	Type	Default	Description
`local.modelPath`	`string`	descargado automáticamente	Ruta al archivo de modelo GGUF
`local.modelCacheDir`	`string`	node-llama-cpp default	Dir. de caché para modelos descargados
`local.contextSize`	`number \| "auto"`	`4096`	Tamaño de la ventana de contexto para el contexto de incrustación. 4096 cubre fragmentos típicos (128–512 tokens) limitando la VRAM que no es de pesos. Reduzca a 1024–2048 en hosts con restricciones. `"auto"` usa el máximo entrenado del modelo — no recomendado para modelos de 8B+ (Qwen3-Embedding-8B: 40 960 tokens → ~32 GB VRAM vs ~8.8 GB a 4096).

Modelo predeterminado: embeddinggemma-300m-qat-Q8_0.gguf (~0.6 GB, descargado automáticamente). Las fuentes de código fuente aún requieren aprobación de compilación nativa: pnpm approve-builds y luego pnpm rebuild node-llama-cpp.

Use la CLI independiente para verificar la misma ruta de proveedor que usa la Gateway:

openclaw memory status --deep --agent main
openclaw memory index --force --agent main

Si provider es auto, local se selecciona solo cuando local.modelPath apunta a un archivo local existente. Las referencias de modelos hf: y HTTP(S) todavía se pueden usar explícitamente con provider: "local", pero no hacen que auto seleccione local antes de que el modelo esté disponible en el disco.

Tiempo de espera de incrustación en línea

Anule el tiempo de espera para los lotes de incrustación en línea durante la indexación de memoria.

Sin configurar, se usa el valor predeterminado del proveedor: 600 segundos para proveedores locales/autoalojados como local, ollama y lmstudio, y 120 segundos para proveedores alojados. Aumente esto cuando los lotes de incrustación locales limitados por CPU estén sanos pero lentos.

Configuración de búsqueda híbrida

Todo bajo memorySearch.query.hybrid:

Clave	Tipo	Predeterminado	Descripción
`enabled`	`boolean`	`true`	Habilitar búsqueda híbrida BM25 + vectorial
`vectorWeight`	`number`	`0.7`	Peso para las puntuaciones vectoriales (0-1)
`textWeight`	`number`	`0.3`	Peso para las puntuaciones BM25 (0-1)
`candidateMultiplier`	`number`	`4`	Multiplicador del tamaño del grupo de candidatos

Clave	Tipo	Predeterminado	Descripción
`mmr.enabled`	`boolean`	`false`	Habilitar re-clasificación MMR
`mmr.lambda`	`number`	`0.7`	0 = máxima diversidad, 1 = máxima relevancia

Clave	Tipo	Predeterminado	Descripción
`temporalDecay.enabled`	`boolean`	`false`	Habilitar impulso de recencia
`temporalDecay.halfLifeDays`	`number`	`30`	La puntuación se reduce a la mitad cada N días

Los archivos perennes (MEMORY.md, archivos sin fecha en memory/) nunca sufren decaimiento.

Ejemplo completo

{
  agents: {
    defaults: {
      memorySearch: {
        query: {
          hybrid: {
            vectorWeight: 0.7,
            textWeight: 0.3,
            mmr: { enabled: true, lambda: 0.7 },
            temporalDecay: { enabled: true, halfLifeDays: 30 },
          },
        },
      },
    },
  },
}

Rutas de memoria adicionales

Clave	Tipo	Descripción
`extraPaths`	`string[]`	Directorios o archivos adicionales para indexar

{
  agents: {
    defaults: {
      memorySearch: {
        extraPaths: ["../team-docs", "/srv/shared-notes"],
      },
    },
  },
}

Las rutas pueden ser absolutas o relativas al espacio de trabajo. Los directorios se escanean de forma recursiva en busca de archivos .md. El manejo de enlaces simbólicos depende del backend activo: el motor incorporado ignora los enlaces simbólicos, mientras que QMD sigue el comportamiento del escáner QMD subyacente.

Para la búsqueda de transcripciones entre agentes con ámbito de agente, use agents.list[].memorySearch.qmd.extraCollections en lugar de memory.qmd.paths. Esas colecciones adicionales siguen la misma forma { path, name, pattern? }, pero se fusionan por agente y pueden preservar nombres compartidos explícitos cuando la ruta apunta fuera del espacio de trabajo actual. Si la misma ruta resuelta aparece tanto en memory.qmd.paths como en memorySearch.qmd.extraCollections, QMD mantiene la primera entrada y omite el duplicado.

Memoria multimodal (Gemini)

Indexe imágenes y audio junto con Markdown usando Gemini Embedding 2:

Clave	Tipo	Predeterminado	Descripción
`multimodal.enabled`	`boolean`	`false`	Habilitar la indexación multimodal
`multimodal.modalities`	`string[]`	—	`["image"]`, `["audio"]` o `["all"]`
`multimodal.maxFileBytes`	`number`	`10000000`	Tamaño máximo de archivo para la indexación

Formatos admitidos: .jpg, .jpeg, .png, .webp, .gif, .heic, .heif (imágenes); .mp3, .wav, .ogg, .opus, .m4a, .aac, .flac (audio).

Caché de incrustación

Clave	Tipo	Predeterminado	Descripción
`cache.enabled`	`boolean`	`false`	Almacenar en caché las incrustaciones de fragmentos en SQLite
`cache.maxEntries`	`number`	`50000`	Incrustaciones en caché máximas

Evita volver a incrustar texto sin cambios durante la reindexación o actualizaciones de transcripciones.

Indexación por lotes

Clave	Tipo	Predeterminado	Descripción
`remote.nonBatchConcurrency`	`number`	`4`	Incrustaciones en línea paralelas
`remote.batch.enabled`	`boolean`	`false`	Habilitar API de incrustación por lotes
`remote.batch.concurrency`	`number`	`2`	Trabajos por lotes paralelos
`remote.batch.wait`	`boolean`	`true`	Esperar a que se complete el lote
`remote.batch.pollIntervalMs`	`number`	—	Intervalo de sondeo
`remote.batch.timeoutMinutes`	`number`	—	Tiempo de espera del lote

Disponible para openai, gemini y voyage. El lote de OpenAI suele ser el más rápido y económico para grandes reposiciones.

remote.nonBatchConcurrency controla las llamadas de incrustación en línea utilizadas por proveedores locales/autohospedados y proveedores hospedados cuando las API por lotes del proveedor no están activas. Ollama tiene como valor predeterminado 1 para la indexación no por lotes para evitar abrumar hosts locales pequeños; establezca un valor más alto en máquinas más grandes.

Esto es independiente de sync.embeddingBatchTimeoutSeconds, que controla el tiempo de espera de las llamadas de incrustación en línea.

Búsqueda en memoria de sesión (experimental)

Indexar las transcripciones de sesión y exponerlas a través de memory_search:

Clave	Tipo	Predeterminado	Descripción
`experimental.sessionMemory`	`boolean`	`false`	Habilitar la indexación de sesiones
`sources`	`string[]`	`["memory"]`	Agregar `"sessions"` para incluir transcripciones
`sync.sessions.deltaBytes`	`number`	`100000`	Umbral de bytes para reindexar
`sync.sessions.deltaMessages`	`number`	`50`	Umbral de mensajes para reindexar

Aceleración de vectores SQLite (sqlite-vec)

Clave	Tipo	Predeterminado	Descripción
`store.vector.enabled`	`boolean`	`true`	Usar sqlite-vec para consultas de vectores
`store.vector.extensionPath`	`string`	incluido (bundled)	Anular ruta de sqlite-vec

Cuando sqlite-vec no está disponible, OpenClaw vuelve automáticamente a la similitud de coseno en proceso.

Almacenamiento del índice

Clave	Tipo	Predeterminado	Descripción
`store.path`	`string`	`~/.openclaw/memory/{agentId}.sqlite`	Ubicación del índice (admite el token `{agentId}`)
`store.fts.tokenizer`	`string`	`unicode61`	Tokenizador FTS5 (`unicode61` o `trigram`)

Configuración del backend QMD

Establezca memory.backend = "qmd" para habilitar. Todos los ajustes de QMD se encuentran bajo memory.qmd:

Clave	Tipo	Predeterminado	Descripción
`command`	`string`	`qmd`	Ruta del ejecutable QMD; establezca una ruta absoluta cuando el servicio `PATH` difiera de su shell
`searchMode`	`string`	`search`	Comando de búsqueda: `search`, `vsearch`, `query`
`includeDefaultMemory`	`boolean`	`true`	Auto-indexar `MEMORY.md` + `memory/*/.md`
`paths[]`	`array`	—	Rutas adicionales: `{ name, path, pattern? }`
`sessions.enabled`	`boolean`	`false`	Indexar transcripciones de sesión
`sessions.retentionDays`	`number`	—	Retención de transcripciones
`sessions.exportDir`	`string`	—	Directorio de exportación

searchMode: "search" es solo léxico/BM25. OpenClaw no ejecuta sondas de preparación de vectores semánticos ni mantenimiento de incrustaciones de QMD para ese modo, incluso durante memory status --deep; vsearch y query siguen requiriendo preparación de vectores de QMD e incrustaciones.

OpenClaw prefiere las formas actuales de colección QMD y consulta MCP, pero mantiene funcionando las versiones anteriores de QMD probando indicadores de patrones de colección compatibles y nombres de herramientas MCP más antiguos cuando es necesario. Cuando QMD anuncia soporte para múltiples filtros de colección, las colecciones de la misma fuente se buscan con un proceso QMD; las compilaciones antiguas de QMD mantienen la ruta de compatibilidad por colección. Misma fuente significa que las colecciones de memoria duradera se agrupan, mientras que las colecciones de transcripciones de sesión permanecen como un grupo separado para que la diversificación de fuentes aún tenga ambas entradas.

Calendario de actualización

Clave	Tipo	Predeterminado	Descripción
`update.interval`	`string`	`5m`	Intervalo de actualización
`update.debounceMs`	`number`	`15000`	Eliminar rebote de cambios de archivo
`update.onBoot`	`boolean`	`true`	Actualizar cuando se abre el gestor QMD de larga duración; también controla la actualización de inicio opcional
`update.startup`	`string`	`off`	Actualización opcional al iniciar la puerta de enlace: `off`, `idle` o `immediate`
`update.startupDelayMs`	`number`	`120000`	Retraso antes de que se ejecute la actualización `startup: "idle"`
`update.waitForBootSync`	`boolean`	`false`	Bloquear la apertura del gestor hasta que se complete su actualización inicial
`update.embedInterval`	`string`	—	Cadencia de incrustación separada
`update.commandTimeoutMs`	`number`	—	Tiempo de espera para comandos QMD
`update.updateTimeoutMs`	`number`	—	Tiempo de espera para operaciones de actualización de QMD
`update.embedTimeoutMs`	`number`	—	Tiempo de espera para operaciones de incrustación de QMD

Límites

Clave	Tipo	Predeterminado	Descripción
`limits.maxResults`	`number`	`6`	Máx. resultados de búsqueda
`limits.maxSnippetChars`	`number`	—	Limitar longitud del fragmento
`limits.maxInjectedChars`	`number`	—	Limitar caracteres totales inyectados
`limits.timeoutMs`	`number`	`4000`	Tiempo de espera de búsqueda

Ámbito

Controla qué sesiones pueden recibir resultados de búsqueda QMD. Mismo esquema que session.sendPolicy:

{
  memory: {
    qmd: {
      scope: {
        default: "deny",
        rules: [{ action: "allow", match: { chatType: "direct" } }],
      },
    },
  },
}

La configuración predeterminada incluida permite sesiones directas y de canal, mientras que sigue denegando grupos.

El valor predeterminado es solo MD. match.keyPrefix coincide con la clave de sesión normalizada; match.rawKeyPrefix coincide con la clave sin procesar incluyendo `agent:

:`.

Citas

memory.citations se aplica a todos los backends:

Valor	Comportamiento
`auto` (predeterminado)	Incluir pie de página `Source:

Las actualizaciones de arranque de QMD utilizan una ruta de subproceso de una sola vez durante el inicio de la puerta de enlace. El administrador de QMD de larga duración sigue siendo propietario del observador de archivos normal y los temporizadores de intervalo cuando la búsqueda de memoria se abre para uso interactivo.

Ejemplo completo de QMD

{
  memory: {
    backend: "qmd",
    citations: "auto",
    qmd: {
      includeDefaultMemory: true,
      update: { interval: "5m", debounceMs: 15000 },
      limits: { maxResults: 6, timeoutMs: 4000 },
      scope: {
        default: "deny",
        rules: [{ action: "allow", match: { chatType: "direct" } }],
      },
      paths: [{ name: "docs", path: "~/notes", pattern: "**/*.md" }],
    },
  },
}

Soñar (Dreaming)

La función de soñar (Dreaming) se configura bajo plugins.entries.memory-core.config.dreaming, no bajo agents.defaults.memorySearch.

La función de soñar se ejecuta como un barrido programado y utiliza fases internas ligera/profunda/REM como detalle de implementación.

Para ver el comportamiento conceptual y los comandos de barra, consulte Dreaming.

Configuración de usuario

Clave	Tipo	Predeterminado	Descripción
`enabled`	`boolean`	`false`	Habilitar o deshabilitar el proceso de soñar (dreaming) por completo
`frequency`	`string`	`0 3 * * *`	Cadencia opcional de cron para el barrido completo de soñar (dreaming)
`model`	`string`	modelo predeterminado	Invalidación opcional del modelo del subagente Dream Diary

Ejemplo

{
  plugins: {
    entries: {
      "memory-core": {
        subagent: {
          allowModelOverride: true,
          allowedModels: ["anthropic/claude-sonnet-4-6"],
        },
        config: {
          dreaming: {
            enabled: true,
            frequency: "0 3 * * *",
            model: "anthropic/claude-sonnet-4-6",
          },
        },
      },
    },
  },
}