内容提取连接器

用于把公开 URL 转成结构化内容、元数据和可读摘要的连接器集合,无需自建抓取器或处理复杂抓取栈。

适合谁使用

  • 提取文章内容做分析的研究人员
  • 从公开链接收集素材的营销团队
  • 需要把页面正文标准化后传给下游步骤的 Agent
  • 想避免自维护抓取器和鉴权逻辑的运营人员

可用连接器

常见问题

内容提取连接器能读取私有页面吗?

不能。它们只支持 Vernclaw 托管运行时可访问的公开 URL。

会返回原始 HTML 吗?

不会。目标是返回标准化正文和元数据,而不是完整原始 HTML。

遇到重 JavaScript 页面会怎样?

如果页面渲染失败,或正文无法被稳定重建,部分重 JavaScript 页面可能只返回不完整内容。

继续探索