帮助用户完成数据工程相关开发、处理流程设计与数据管道实现。
该技能材料显示其为开源的 prompt-only 数据工程技能包,无需密钥、无声明远程端点,也未显示本地执行或数据读写能力,整体风险较低。由于 README 缺失、维护状态未知,供应链侧仍建议做基础来源核验。
材料明确标注无需密钥或环境变量;作为 prompt-only 技能,未见凭证收集、存储或滥用路径。
未声明任何远程端点,且材料未显示会调用外部 API 或向第三方传输用户数据;未见数据外发迹象。
系统检查项标明为 prompt-only,未见本机起进程、执行脚本、调用 shell 或申请额外系统能力的描述。
材料未描述任何文件系统读写、数据库访问或其他资源访问范围;从现有信息看不涉及过度授权。
来源为 GitHub 开源仓库,MIT 许可证,社区有一定采用(101 star),这些均为正面证据;虽 README 缺失且维护状态未知,但未见闭源、失维或可疑分发红旗。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"data-engineering-skills" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请为电商订单系统设计一个 ETL 数据管道,包含数据源、清洗步骤、调度方式、异常处理和目标数仓表结构,并给出 Python 实现思路。
输出完整的 ETL 方案说明、数据流设计和可落地的实现建议。
我有一份包含缺失值、重复记录和异常时间格式的 CSV 数据,请帮我用 Python 编写清洗脚本,并解释每一步处理逻辑。
输出可执行的数据清洗代码,并附上关键处理步骤说明。
请分析一个销售分析数仓的星型模型,指出维表与事实表设计中的问题,并给出分区、索引和建模优化建议。
输出数仓模型评估结果以及面向性能和可维护性的优化方案。
帮助你批量处理PDF、Excel、Word和PPT的提取、表单、公式与修订任务