热门角色不仅是灵感来源,更是你的效率助手。通过精挑细选的角色提示词,你可以快速生成高质量内容、提升创作灵感,并找到最契合你需求的解决方案。让创作更轻松,让价值更直接!
我们根据不同用户需求,持续更新角色库,让你总能找到合适的灵感入口。
本提示词旨在对用户提供的数据集进行专业的分布特征诊断,识别潜在的数据质量问题(如偏态、异常值、缺失模式),并提供针对性的预处理与统计分析建议。适用于数据科学家、分析师在数据探索阶段快速评估数据质量,为后续建模或决策提供依据。
以下为针对“电商用户复购行为样本(180天用户粒度)”的标准化数据质量诊断与可落地预处理建议。重点围绕分布形态、异常值、缺失、分类型频次、多变量关系及与复购相关的关键特征,并给出可复现流程,便于后续30/60天复购模型与运营分层使用。
一、范围核验与时间对齐(防止泄漏)
二、分布形态分析(偏度、峰度)与可视化建议
三、异常值检测与处理建议
四、缺失值模式分析与填补策略
五、分类型变量频次与分桶建议
六、多变量关系与关键特征识别(与复购相关)
七、营销分组与设备渠道的差异与混杂控制
八、可落地的预处理与采样流程(复现导向)
九、与复购相关的重点特征与初步假设(用于重点检验)
十、必要的质量检查清单(上线前必须通过)
十一、可视化与报告最小集合(便于沟通与复现)
十二、具体参数建议小结
以上流程既可支持建模前的质量评估,也能直接落地为预处理/抽样管道,并与A/B实验和人群运营分层顺畅衔接。后续若提供抽样输出或字段样例,我可给出精确的阈值、图表示例与代码片段。
以下为面向“新一版风控评分卡与放款策略试点”的数据分析与方案说明。基于您提供的事实信息(例如:default_90d阳性率约6%、employment_length缺失约22%、income/loan_amount右偏重尾、存在负收入与dti>1、渠道间评分分布差异明显等),本文不虚构未提供的数值结果,而给出可复用的计算口径、分析步骤、检验方法、分箱与策略建议,确保在实际跑数后可落地执行与复核。
一、基于业务阈值的违规/边界样本占比与稽核建议
简要SQL示例(样例口径,落地需替换表名与字段)
二、标签不均衡(~6%阳性)处理:采样/代价敏感对比
三、连续变量的WOE/分箱建议与稳定性评估
Python示例(optbinning) from optbinning import OptimalBinning X = df["dti"].clip(lower=0, upper=1.2) y = df["default_90d"] optb = OptimalBinning(name="dti", dtype="numerical", monotonic_trend="descending", min_bin_size=0.05) optb.fit(X, y) bin_table = optb.binning_table.build()
四、渠道、地区的分层稳定性与潜在偏见提示
五、异常值检测与分布形态分析(含数值分位、离散程度)
六、可复用的数据清洗、异常处理与特征变换步骤(可直接落地) 步骤顺序建议:
七、多变量关系与交互探索(支持特征工程与分策略)
八、离线训练与灰度A/B建议
九、需要特别核实与避免泄露的字段
十、交付物清单(建议)
如需,我可以根据真实跑数结果,将上述模板中的“比例、PSI、IV、KS、PR-AUC、阈值点”等填入具体数值,产出最终策略建议与上线包。
以下为基于所给数据结构与业务背景的“周报级监控模板”与方法建议,聚焦核心指标、事件定义、检测算法、可恢复性判断与面向运营的可视化/阈值配置。内容按可直接实现与扩展的顺序组织。
一、数据与事件建模(5分钟粒度)
二、核心指标(设备/站点/站点类型/固件版本)
三、缺失值可恢复性评估
四、尖峰与阶跃异常检测与合并的操作规则
五、固件与站点类型的差异对比与维护定位
六、可视化与周报模板(快速概览)
七、计算实现要点(78M行规模)
八、阈值与抑制窗口建议(首版,后续以数据校准)
九、产出与运营动作
十、校准与验证
上述方案覆盖“缺失模式、异常点与漂移”的检测与量化,并给出面向告警与质控的可操作规则与可视化模板。建议先在1–2周历史数据上离线跑通事件化与阈值校准,再上线周报与实时预警。
将通用AI一键化为“数据集分布分析专家”,帮助业务与数据团队在最短时间内获得可落地的分布洞察与行动建议。典型目标包括:1)快速识别数据是否可用与可信(异常值、缺失、偏态、极端点、类别不均衡等);2)为建模、A/B实验、画像分层、指标复盘提供标准化的分布报告与可视化建议;3)给出可执行的预处理与采样策略,减少试错成本;4)用一致、专业、清晰的表达输出多语言报告,提升跨团队沟通效率与决策信心;5)把分析从“人依赖”变成“流程化”,在分钟级完成原本需要数小时的工作,促进从试用到团队级规模化使用。
快速完成数据探索与分布诊断,选择合适的特征变换与抽样策略,提前暴露风险与偏差,加速建模迭代与上线
根据智能建议挑选图表与维度,生成易读的管理报告与监控看板,更快发现趋势与异常,支持业务复盘
洞察用户分布与长尾行为,制定分群策略、触达节奏与实验方案,用数据驱动转化率、留存与活跃提升
将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。
把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。
在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。
半价获取高级提示词-优惠即将到期