热门角色不仅是灵感来源,更是你的效率助手。通过精挑细选的角色提示词,你可以快速生成高质量内容、提升创作灵感,并找到最契合你需求的解决方案。让创作更轻松,让价值更直接!
我们根据不同用户需求,持续更新角色库,让你总能找到合适的灵感入口。
本提示词可根据用户提供的数据集,生成专业、结构化的数据清洗步骤。涵盖缺失值处理、异常值检测、数据类型转换、重复值处理及标准化操作,确保数据分析前的高质量预处理。适用于数据分析、统计建模、机器学习和可视化准备等多场景,帮助用户高效、准确地准备数据。
以下为面向运营数据分析的清洗步骤建议,覆盖数据类型统一、时间与币种标准化、重复/退款处理、半结构化字段解析及质量校验,确保可用于GMV、转化、复购等后续分析。
一、清洗输出目标与产出
二、字段与数据类型规范(建议)
三、清洗步骤与规则
四、建议数据产出表
五、实现要点与性能建议(以Pandas为例)
六、关键映射示例
七、与后续分析的衔接建议
如需,我可以提供可运行的Pandas清洗脚本骨架(包含分块读、时间/金额标准化、JSON解析、聚合去重、质量校验与FX折算的函数模板),或基于PySpark的分布式实现以适配更大规模数据与更严格的内存约束。
以下为面向业务分析场景的清洗与去重方案,覆盖字段类型定义、标准化与校验规则、去重与幸存者选择逻辑、实施步骤与质量控制要点。设计目标是:在不虚构数据的前提下,最大化保留最新且有效的联系方式与销售跟进状态,输出可追溯与可复现的结果。
一、字段与数据类型建议
二、标准化与校验规则
三、去重策略(实体解析) 目标:多渠道重复线索合并,优先保留最新有效联系方式与销售跟进状态,保证可追溯。
四、实施步骤顺序
五、关键实现要点(伪规则/SQL思路)
六、数据质量校验与监控指标
七、注意事项与边界
通过以上流程,能够在不夸大、不丢失关键信息的前提下,完成联系方式与时间的标准化、跨渠道的重复线索合并,并保留血缘与冲突信息,满足后续业务分析的准确性与可追溯性要求。
以下是针对该物联网遥测数据集的清洗与异常检测方案,面向预测分析场景,目标是:统一单位与时区、修正时序缺陷、识别并屏蔽异常点,保证特征稳定性。流程按可实施步骤组织,并给出可操作的阈值与规则。
总体产出
实施要点(针对近30天约5GB,建议用分布式处理如 PySpark)
关键规则摘要
该方案能够在建模前系统性地处理单位、时序与异常点问题,生成稳定的特征,并提供必要的质量度量用于后续模型训练与监控。
将“杂乱数据→可用数据”的路径变得清晰、快速、可靠:当你提供数据集的简要情况与分析目标时,提示词即刻生成专家级的数据清洗步骤清单,按优先级排列,覆盖缺失与异常处理、重复记录合并、字段一致性校验、时间与编码规范化、分组核验与抽样复查等关键环节。它聚焦实操与结果落地,帮助你缩短准备时间、提升数据可信度、减少返工,让新人也能以资深分析师的标准开展工作,并在电商、增长运营、营销CRM、日志埋点、实验与报表等场景中快速复用与扩展。
快速制定清洗方案与执行顺序,统一口径,缩短准备时间,提升模型与报表的准确性与稳定性。
清洗投放与行为数据,修正埋点与命名口径,让A/B测试与ROI评估更可信,从而优化预算与素材。
整合多渠道数据并去重规范字段,提升看板稳定性,定位异常波动根因,及时优化运营动作。
将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。
把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。
在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。
半价获取高级提示词-优惠即将到期