$ loading_

MCP DS Toolkit Server — askskill

$ ~/registry/mcp/yasserelhaddar-mcp-ds-toolkit-server

MCP

MCP DS Toolkit Server

通过自然语言完成数据加载、模型训练与实验跟踪的数据科学工具

许可证

MIT License

来源

third_party_registry

更新于

2026-06-17

// 安全评估需留意

本机运行进程
开源可审计
有许可证· MIT License

总评

该工具材料显示其为开源、无密钥、未声明远程端点的独立数据科学 MCP 服务，整体未见明确高风险红旗。主要风险点在于其声明具备训练模型与处理数据的本地执行/数据访问能力，以及社区采用度低、维护状态未知，建议在隔离环境中审阅源码后使用。

凭证密钥低风险

材料明确标注“无”密钥/环境变量，未见要求提供 API key、Token 或其他敏感凭证；基于现有信息，凭证泄露或滥用面较低。

网络外发低风险

未声明任何远程端点，描述中也未显示需要将数据发送到外部服务；按材料事实看，暂无明确的用户数据外发路径。

代码执行需留意

系统检查项已明确包含 executes-code，且工具声明可加载数据、训练模型、跟踪实验，这通常意味着会在本机执行计算任务或启动相关处理流程。该能力属于此类 MCP 工具的常规高权限面，应注意资源消耗、命令执行边界及隔离运行。

数据访问需留意

描述显示其具备“load data”和实验跟踪能力，通常意味着需要读取本地数据文件并可能写入模型产物、日志或实验记录。材料未说明精确访问范围，暂未见明显过度授权证据，但仍应视为具备本地数据读写能力并限制其工作目录。

来源供应链需留意

正面因素是开源且采用 MIT 许可证，源码可审计，这显著降低了供应链不透明风险；但来源为 third_party_registry，社区采用度仅 0 star，维护状态未知，代表成熟度与持续维护信号偏弱，建议先审查仓库内容与依赖清单。

安全建议

先审阅 GitHub 仓库源码、依赖清单与安装脚本，确认不存在未声明的网络请求或危险执行路径。
在容器或受限账户中运行，并限制 CPU、内存、磁盘配额，避免训练/数据处理任务影响宿主机。
仅向其暴露最小必要的数据目录，避免授予整个用户目录或敏感项目路径。
上线前进行一次实际流量与文件访问监测，验证其确无额外外联和越权读写行为。

审计模型: gpt-5.4 · 2026-06-17

// 安装

复制安装指令，让 AI 自动完成配置 · 推荐新手

"MCP DS Toolkit Server" 暂无可直接复制的安装信息，请查看页面文档或源码仓库。

// 用法示例

快速训练分类模型

输入

加载 sales_train.csv，识别目标列 churn，完成数据清洗、特征编码与训练/验证集划分，比较逻辑回归、随机森林和 XGBoost 的效果，并输出最佳模型的评估指标与特征重要性。

预期产出

返回建模流程摘要、各模型对比结果、最佳模型评估指标及关键特征说明。

探索数据并生成分析结论

输入

读取 user_behavior.xlsx，分析缺失值、异常值和主要分布特征，按渠道与地区做分组统计，找出影响转化率的关键变量，并给出后续分析建议。

预期产出

输出数据质量检查结果、分组分析摘要、关键影响因素和可执行建议。

跟踪实验与复现结果

输入

对 customer_risk 数据集进行三组模型实验，分别调整特征集合与超参数，记录每次实验的配置、指标和结论，并汇总成可复现的实验报告。

预期产出

生成实验跟踪记录、结果对比表以及便于复现的总结报告。

// 文档

该资产暂无文档说明

可前往源码仓库查看用法与示例。

前往源码仓库 ↗

// 功能相似

MCP 工具

MCP Toolkit

通过自然语言统一操作数据库、文件系统与 GitHub，提高开发与运维效率。

—装→

MCP 工具

MCP Data Science

用自然语言完成数据加载、清洗、可视化、建模与报告生成全流程。

—装→

MCP DS Toolkit Server

// 用法示例

// 文档

// 功能相似

MCP Toolkit

MCP Data Science

DIY Tools MCP Server

Toolhouse MCP Server

openai-mcp

MCP Tool Server