mcp-webresearch

mcp-webresearch:为 Claude 提供实时网络研究能力的 MCP 服务器。

mcp-webresearch
mcp-webresearch能力展示

mcp-webresearch 解决方案概述

mcp-webresearch 是一个专为 Claude 设计的 MCP 服务器,旨在赋予 AI 模型实时网络信息检索能力。它通过集成 Google 搜索和网页内容提取工具,使 Claude 能够轻松地进行任何主题的研究。该解决方案提供 search_google(执行搜索)、visit_page(提取网页内容)和 take_screenshot(网页截图)等工具,并维护包含搜索查询、访问页面和时间戳的完整研究会话。

通过在 Claude Desktop 中配置 mcp-webresearch,开发者可以利用 agentic-research 提示词,引导 Claude 进行深入的、迭代式的网络研究,并始终引用来源 URL。截图等资源会保存为 MCP 资源,方便访问。mcp-webresearch 极大地增强了 Claude 的研究能力,为开发者提供了强大的信息检索和分析工具。

mcp-webresearch 核心能力

实时网络搜索与提取

mcp-webresearch 允许 AI 模型(特别是 Claude)执行实时的 Google 搜索,并提取搜索结果。它通过 search_google 工具实现,该工具接受一个查询字符串作为参数。这个功能使 AI 模型能够访问最新的信息,克服了其固有的知识截止日期限制。模型可以根据搜索结果动态调整其响应,提供更准确和相关的答案。例如,当用户询问“最新的气候变化报告说了什么?”时,Claude 可以使用 mcp-webresearch 搜索相关报告,并提取关键发现,从而提供基于最新数据的回答。这极大地增强了 AI 模型在需要实时信息的场景中的实用性。技术实现上,该功能依赖于与 Google 搜索 API 的集成,并使用网页抓取技术提取搜索结果中的相关内容。

网页内容访问与分析

该 MCP 服务器能够访问指定的网页并提取其内容,通过 visit_page 工具实现。该工具接受一个 URL 作为参数,并返回网页的文本内容。这使得 AI 模型能够深入分析网页内容,例如新闻文章、博客帖子或研究论文。例如,如果用户要求 Claude 总结一篇特定的新闻文章,Claude 可以使用 mcp-webresearch 访问该文章的 URL,提取文章内容,并生成一个简洁的摘要。此外,该工具还支持可选的 takeScreenshot 参数,允许捕获网页的屏幕截图,这对于需要视觉上下文的场景非常有用。技术实现上,该功能依赖于 Playwright 库,该库提供了一个可靠的跨浏览器自动化 API,用于访问和操作网页。

研究会话跟踪与资源管理

mcp-webresearch 维护一个研究会话,跟踪搜索查询、访问的页面、提取的内容、屏幕截图和时间戳。这为 AI 模型提供了一个上下文记忆,使其能够更好地理解用户的研究目标,并避免重复搜索或访问相同的页面。例如,如果用户首先搜索“量子计算”,然后搜索“量子计算的应用”,mcp-webresearch 可以识别出这两个查询之间的关联,并优先显示与量子计算应用相关的搜索结果。此外,该服务器将捕获的网页屏幕截图保存为 MCP 资源,用户可以通过 Claude Desktop 应用访问这些资源。这提供了一种方便的方式来回顾研究过程中的关键信息。技术实现上,该功能使用内存数据结构来存储研究会话信息,并使用文件系统来存储屏幕截图。

集成优势

mcp-webresearch 通过标准输入/输出与 Claude Desktop 集成,无需复杂的网络配置。只需将配置添加到 claude_desktop_config.json 文件中,Claude Desktop 即可自动启动该 MCP 服务器。这种简单的集成方式降低了使用 MCP 的门槛,使得更多的开发者和用户能够轻松地将实时网络研究能力集成到他们的 AI 模型中。此外,mcp-webresearch 提供了一个 agentic-research 提示词,指导 Claude 如何有效地进行网络研究,包括从广泛的搜索开始、优先考虑高质量的来源、迭代地改进研究方向以及引用来源。这使得用户能够充分利用 mcp-webresearch 的功能,并获得最佳的研究结果。