中文概览
content-extract 解决的是 agent 工作流里很常见但容易失败的一步:把网页变成可复查、可继续处理的 Markdown。它会先尝试普通抓取,再在微信、知乎等容易反爬或内容混乱的页面上降级到 MinerU 解析,并要求输出保留原始来源和解析产物路径。
它适合用在资料整理、网页摘要、公众号文章沉淀、研究报告输入和内容复用工作流里。不适合用来绕过登录、验证码或付费墙;如果页面本身不可访问,仍然需要提供可访问链接或导出文件。
先复制命令或下载 SKILL.md,再放入你的 AI 编程环境。
打开来源仓库,确认技能说明、权限边界和是否适合当前任务。
用一个小任务跑通结果,再决定是否长期保留在工作流中。
content-extract 解决的是 agent 工作流里很常见但容易失败的一步:把网页变成可复查、可继续处理的 Markdown。它会先尝试普通抓取,再在微信、知乎等容易反爬或内容混乱的页面上降级到 MinerU 解析,并要求输出保留原始来源和解析产物路径。
它适合用在资料整理、网页摘要、公众号文章沉淀、研究报告输入和内容复用工作流里。不适合用来绕过登录、验证码或付费墙;如果页面本身不可访问,仍然需要提供可访问链接或导出文件。