Markdown 格式化
Markdown 格式化
Section titled “Markdown 格式化”OpenClaw 通过将出站 Markdown 转换为共享的中间表示(IR),然后渲染特定频道的输出来对其进行格式化。IR 在保留源文本完整的同时携带样式/链接范围,从而使分块和渲染在各频道间保持一致。
- 一致性: 一次解析步骤,多个渲染器。
- 安全分块: 在渲染之前拆分文本,以确保行内格式从不跨越分块。
- Channel fit: 将同一个 IR 映射到 Slack mrkdwn、Telegram HTML 和 Signal 样式范围,而无需重新解析 Markdown。
- 解析 Markdown -> IR
- IR 是纯文本加上样式范围(粗体/斜体/删除线/代码/剧透)和链接范围。
- 偏移量是 UTF-16 代码单元,因此 Signal 样式范围与其 API 对齐。
- 仅当渠道选择加入表格转换时,才会解析表格。
- 分块 IR(格式优先)
- 分块发生在渲染之前的 IR 文本上。
- 行内格式不会跨分块拆分;范围会按分块进行切片。
- 按渠道渲染
- Slack: mrkdwn 标记(加粗/斜体/删除线/代码),链接作为
<url|label>。 - Telegram: HTML 标签(
<b>、<i>、<s>、<code>、<pre><code>、<a href>)。 - Signal: 纯文本 +
text-style范围;当标签不同时,链接变为label (url)。
- Slack: mrkdwn 标记(加粗/斜体/删除线/代码),链接作为
输入 Markdown:
Hello **world** — see [docs](https://docs.openclaw.ai).IR(示意图):
{ "text": "Hello world — see docs.", "styles": [{ "start": 6, "end": 11, "style": "bold" }], "links": [{ "start": 19, "end": 23, "href": "https://docs.openclaw.ai" }]}- Slack、Telegram 和 Signal 出站适配器从 IR 进行渲染。
- 其他渠道(WhatsApp、iMessage、Microsoft Teams、Discord)仍使用纯文本或 其各自的格式规则,并在启用时在分块前应用 Markdown 表格转换。
Markdown 表格在聊天客户端中的支持并不一致。请使用 markdown.tables 来控制每个渠道(以及每个账户)的转换。
code:将表格渲染为代码块(大多数渠道的默认设置)。bullets:将每一行转换为项目符号(Signal + WhatsApp 的默认设置)。off:禁用表格解析和转换;原始表格文本将原样通过。
配置键:
channels: discord: markdown: tables: code accounts: work: markdown: tables: off- 分块限制来自渠道适配器/配置,并应用于 IR 文本。
- 代码围栏被保留为带有尾随换行符的单一块,以便渠道正确渲染它们。
- 列表前缀和引用块前缀是 IR 文本的一部分,因此分块不会在前缀中间拆分。
- 内联样式(粗体/斜体/删除线/行内代码/剧透)绝不会跨块拆分;渲染器会在每个块内重新打开样式。
如需了解有关跨渠道分块行为的更多信息,请参阅 Streaming + chunking。
- Slack:
[label](url)-><url|label>;裸 URL 保持裸露。解析期间禁用自动链接以避免重复链接。 - Telegram:
[label](url)-><a href="url">label</a>(HTML 解析模式)。 - Signal:
[label](url)->label (url),除非标签与 URL 匹配。
Spoiler markers (||spoiler||) 仅针对 Signal 进行解析,它们会映射到 SPOILER 样式范围。其他渠道将其视为纯文本。
如何添加或更新渠道格式化程序
Section titled “如何添加或更新渠道格式化程序”- 解析一次: 使用共享的
markdownToIR(...)助手,配合适合渠道的选项(自动链接、标题样式、引用块前缀)。 - 渲染: 实现一个带有
renderMarkdownWithMarkers(...)和样式标记映射(或 Signal 样式范围)的渲染器。 - 分块: 在渲染之前调用
chunkMarkdownIR(...);渲染每个块。 - 连接适配器: 更新渠道出站适配器以使用新的分块器和渲染器。
- 测试: 添加或更新格式测试,如果渠道使用分块,则添加出站传递测试。
- Slack 尖括号标记 (
<@U123>,<#C123>,<https://...>) 必须被保留;安全地转义原始 HTML。 - Telegram HTML 需要对标签外的文本进行转义以避免标记损坏。
- Signal 样式范围取决于 UTF-16 偏移量;不要使用码点偏移量。
- 保留围栏代码块的尾随换行符,以便闭合标记位于各自的行上。