推荐算法清单生成

幂简官方

187 浏览

18 试用

4 购买

Sep 28, 2025更新

人工智能文生文

根据特定数据问题推荐5种分析算法，内容精准且专业。

以下方案面向“近30天次日留存（D1 retention）下滑”的诊断与汇报，分为两部分：

清洗—评估—汇报的5种可行算法与实施顺序（面向数据质量保障和指标可靠性）
推荐5种用于原因分析的算法（面向定位下滑驱动因素与量化影响）

一、前置口径与数据输入（强制前提）

D1留存定义：以“安装当日”为day0，day1为安装后第1个自然日（按用户本地时区）；分母为day0有效新用户；分子为day1发生过至少一次有效会话/启动的用户。
关键字段：user_id、device_id、install_ts、event_ts、tz、channel、campaign、app_version、geo、device、os_version、paid_flag、fraud_flag（若有）、session_id、event_name。
分析窗口：近30天滚动窗口；基线窗口：前30–60天（对比季节性/趋势）。
目标：先确保指标口径与数据可信度，再进入原因分析；每步均需量化“对D1的影响”。

二、5种可行算法与实施顺序（用于清洗、评估与汇报）整体顺序为由底层数据质量→身份与异常过滤→分布漂移校正→归因口径统一→时间序列异常标注。每个算法包含：清洗/处理、评估、汇报产出。

算法1：数据一致性与完整性校验（规则+有限状态机+约束检测）

清洗/处理
1. 架构校验：字段完整性（非空/类型/取值域），时间戳与时区标准化（统一至UTC并保留原tz），install_ts ≤ first_open_ts。
2. 事件序列有限状态机（FSM）：Install→First_open→Session … 校验非法序列（如day1事件早于install）。
3. 去重与重放检测：基于user_id+device_id+时间窗口的哈希去重；事件幂等化。
4. 源间对账：媒介平台、MMP与自研埋点安装量、会话量闭环核对（容差设阈）。
评估
- 数据质量KPI：缺失率、重复率、非法序列率、时区异常率、跨源偏差率。
- 对D1的影响：清洗前后D1差异及置信区间（Wilson区间）；按渠道/版本分层展示。
汇报产出
- 数据质量得分卡（按指标与数据源）。
- 清洗水位图（waterfall）：每一步对D1的净影响。

算法2：身份解析与反作弊过滤（实体解析+异常检测）

清洗/处理
1. 实体解析：图匹配/并查集（Union-Find）整合user_id、device_id、广告ID、指纹特征，合并同一实体；最小哈希或局部敏感哈希辅助近似重复识别。
2. 异常/作弊检测：基于会话频次、事件熵、IP/UA多样性、安装到首次启动时延、深夜密集度、点击到安装分布等特征，使用Isolation Forest或LOF进行无监督检测；结合已标注黑名单规则过滤。
3. 可疑流量阈值分层处理：高置信剔除，中等置信打权重（降权）。
评估
- 在标注样本上的AUC/PR曲线；未标注数据用同群一致性检查。
- 过滤对D1的影响：总体及分渠道/媒体类型（自然/付费）。
汇报产出
- 作弊/异常占比、主要特征画像。
- 渠道清洗影响矩阵：各渠道被过滤比例与D1变动。

算法3：分布漂移检测与校正（PSI/KS + 缺失处理 + 逆概率加权）

清洗/处理
1. 漂移度量：以基线窗口为参照，计算关键特征（channel、geo、device、os、version、install_hour等）的PSI、JS散度、KS检验；标注显著漂移特征。
2. 缺失与异常值处理：数值变量用MICE/EM多重插补，类别变量保留missing作为一类；极端值Winsorize。
3. 采样偏差校正：基于“是否处于近30天”的指示构造倾向模型（逻辑回归/XGBoost），对近30天样本进行逆概率加权（IPW）或分层后重加权，使特征分布对齐基线。
评估
- 漂移前后PSI/KS下降情况；有效样本量（ESS）与方差放大系数（VIF）。
- 加权与未加权的D1差异与置信区间；敏感性分析（更换基线窗口）。
汇报产出
- Top漂移特征排行榜与可视化（分桶分布、PSI）。
- 加权校正对D1的影响与不确定性区间。

算法4：归因与口径统一（多触点归因+转化路径Markov/ Shapley）

清洗/处理
1. 归因模型确定：若多触点存在，构建Markov路径归因（移除法）或Shapley值归因；设定时间衰减与冷却期。
2. 渠道/版本口径统一：确认“归因到安装”的窗口一致；确定是否将自传播/深链归类为自然或特定渠道。
3. 基于归因重分配安装与分母，重算分渠道D1与总体加权D1。
评估
- 归因稳定性：时间前后归因份额的Jensen-Shannon距离；交叉验证的路径预测对数似然。
- 归因口径变化对渠道D1与总体D1的弹性。
汇报产出
- 口径前后渠道构成与D1对比表。
- 对下滑贡献最大的渠道/活动与归因变更解释。

算法5：时间序列异常与节假日效应标注（STL分解+ESD/BOCPD）

清洗/处理
1. 将每日D1进行STL分解（趋势/季节/残差），引入节假日、促销、版本发布、投放波动（外生回归项）。
2. 对残差使用Generalized ESD或Bayesian Online Changepoint Detection检测异常与突变点，并进行标注与区分（异常点剔除或仅作为解释标签）。
评估
- 异常检测在已知事件上的召回率；对D1均值与趋势估计的鲁棒性（对比不剔除情形）。
汇报产出
- 带注释的D1时间线（突变点、节假日、发布/投放事件）。
- “异常解释清单”：每次异常的可能外因与影响方向。

执行与汇报节奏建议

先后顺序：算法1 → 2 → 3 → 4 → 5。
每步后生成一次中间版“清洗水位图”和“影响汇总”，最终形成端到端可追溯报告。

三、推荐5种用于原因分析的算法（在数据可信后）算法A：生存分析（Kaplan-Meier + Log-rank + Cox回归）

目的：按cohort（安装日/版本/渠道/区域）比较D1与早期流失风险；量化协变量对留存的风险比。
实施要点：对删失进行正确处理；检验Cox比例风险假设；输出HR（含置信区间）。
产出：各分群留存曲线、显著差异的群组、主要协变量的HR与解释。

算法B：差分中的差分（DiD）或合成控制（Synthetic Control）

目的：评估近期产品改动/投放策略变更对D1的因果影响。
实施要点：选择未受影响的对照组（或构建合成对照）；事前平行趋势检验；鲁棒标准误；安慰剂与假日期稳健性检验。
产出：平均处理效应（ATT）、时间分解影响曲线、显著性与敏感性区间。

算法C：结构化时间序列因果影响（BSTS/CausalImpact）

目的：在存在多外生变量（投放、价格、节假日、版本）的场景下，估计“无干预反事实”，量化D1下滑的超额部分。
实施要点：选择长预期期；共变体相关性筛选；马尔可夫随机游走趋势与季节项；后验预测区间。
产出：影响量估计（累计与日度）、置信区间、贡献分解。

算法D：留存预测与可解释性（XGBoost/LightGBM + 校准 + SHAP）

目的：预测个体D1留存概率，定位主导特征与非线性阈值。
实施要点：时间序列交叉验证（避免泄漏）；类别不平衡处理（权重/阈值）；温度缩放/Isotonic校准；SHAP全局/局部解释、交互SHAP。
产出：重要特征排名、关键阈值与交互、分群改善建议。

算法E：异质性因果效应与uplift建模（Causal Forest/T-Learner）

目的：识别“在哪些人/渠道/版本”上策略变化导致留存更差（或更好），用于定向优化。
实施要点：严格时间切片构造处理/对照；共变项富集；估计条件平均处理效应（CATE）；偏差-方差权衡与覆盖度评估。
产出：高/低因果效应人群与渠道清单、策略优先级与预期提升。

四、统计评估与显著性报告规范

比例差异检验：D1为二项变量，使用Wilson或Newcombe区间；大量分群时使用Benjamini-Hochberg控制FDR。
加权估计：使用自助法（bootstrap）或稳健线性化方差估计输出置信区间。
可重复性：固定随机种子、冻结口径、记录版本与参数；保留每步数据快照。

五、报告结构模板（建议）

概要：近30天下滑幅度、发生时间、是否为数据口径/质量/外因所致的结论级判断。
数据质量与口径：五类清洗算法的质量KPI与对D1影响水位图。
原因分析：5种分析算法的主要发现、量化效应与不确定性。
分群策略与行动建议：受影响最大的渠道/版本/区域/设备与优先级。
附录：方法学、假设、稳健性检验、字段字典。

以上方案可在2–5个工作日内完成数据质量与口径校正（五个清洗算法），随后在5–10个工作日内完成原因分析与落地建议（五个分析算法），具体取决于数据接入与标注可用性。

Objective Provide an end-to-end, technically rigorous plan to evaluate a new feature via A/B testing, including an algorithm checklist, visualization recommendations, hypothesis validation steps, and five recommended analytical algorithms to drive iteration.

Experiment design and hypotheses

Define primary hypothesis: e.g., H1: Treatment increases the primary metric by at least δ relative to control. H0: Δ = 0.
Specify:
- Unit of randomization and analysis (user/account/device; match exposure).
- Primary metric and guardrails (e.g., conversion, revenue per user, latency, error rate).
- Exposure/eligibility rules and attribution window.
- Success criteria: minimum detectable effect (MDE), power, Type I error.
Power/MDE planning (approximate, per arm):
- For means: n ≈ 2 (z_{1-α/2} + z_{1-β})^2 σ^2 / δ^2.
- For proportions: n ≈ 2 (z_{1-α/2} + z_{1-β})^2 p (1 - p) / δ^2, where p ≈ baseline rate.
- If using CUPED with pre-period correlation ρ, required n scales by (1 - ρ^2).

Data requirements and preprocessing

Sessionization and unit consistency: ensure one unit maps to one assignment; deduplicate exposures and bots.
Timestamp hygiene and time zone normalization.
Eligibility filters: include only exposed units; enforce consistent observation windows.
Metric construction:
- Ratios (e.g., revenue per user): define consistent denominators; consider winsorization or log transforms for heavy tails.
- Funnels: construct stepwise binary events with coherent ordering.
- Latency/error metrics: trim obvious outliers; cap at practical maxima.
Covariates for adjustment:
- Pre-experiment metric baselines (for CUPED/ANCOVA).
- Stratification variables (geo, traffic source, device, user tenure).
Missing data: classify MCAR/MAR/MNAR; record reasons; avoid imputation of outcomes for causal effect unless justified.

Assumption and integrity checks

Sample ratio mismatch (SRM): chi-square test on assignment counts; investigate any SRM immediately.
Covariate balance: standardized mean difference (SMD) < 0.1 for key covariates; visualize via “love plot.”
Stable unit treatment value (no interference): verify no cross-unit spillovers; use cluster randomization if needed.
Consistency: ensure randomized variant equals delivered experience; measure noncompliance.
Temporal effects: check novelty and day-of-week/seasonality; ensure stable pre-trend in an A/A period if available.
Independence/clustering: if users have repeated measures or are nested (e.g., within orgs), plan cluster-robust inference.
Logging audits: identical event schemas and sampling across arms.

Core analysis algorithms (recommended 5)

OLS/GLM effect estimation with robust inference

Use OLS for continuous metrics and GLM for binary/count metrics.
Model: outcome ~ 1 + treatment + covariates, with cluster-robust (unit-level) standard errors or mixed-effects if needed.
For ratio metrics, prefer:
- Log-transform outcome and interpret as approximate percent change, or
- GLM with appropriate link (Gamma-log for positive skew).
Output: point estimate, 95% CI, p-value; percent lift and absolute difference.
Use when: baseline estimation and clear interpretability are needed.

CUPED/ANCOVA variance reduction

Regress outcome on pre-period baseline(s) and treatment; or compute CUPED-adjusted outcomes via Y_adj = Y - θ(X - E[X]), where θ = Cov(Y, X)/Var(X).
Benefit: variance reduces by approximately (1 - R^2), where R^2 is from regressing Y on pre-period covariates (for single pre-period metric, ≈ 1 - ρ^2).
Output: adjusted treatment effect with narrower CI; updated MDE.
Use when: reliable pre-period metrics exist.

Bayesian hierarchical A/B modeling

For proportions: Beta-Binomial per segment with partial pooling; for continuous: Normal with hierarchical priors on means/variances across segments.
Outputs:
- Posterior P(Δ > 0), expected loss under rollout, posterior for segment-level effects with shrinkage.
- Decision rules: roll out if P(Δ > 0) > τ and expected loss < threshold.
Use when: segment heterogeneity is expected and you want principled shrinkage and probability-based decisions.

Sequential testing (always-valid)

Options:
- mSPRT/e-values for continuous monitoring under optional stopping.
- Group-sequential designs with alpha-spending (e.g., O’Brien–Fleming) at planned looks.
Outputs: continuously updated evidence (likelihood ratio or e-value) and decision thresholds controlling Type I error.
Use when: early stopping for efficacy/futility is desirable; ensure pre-specified monitoring plan.

Heterogeneous Treatment Effect (HTE) via uplift modeling

Methods: causal forest, uplift gradient boosting (two-model T-learner with XGBoost/LightGBM), or doubly robust learners (R-learner).
Outputs:
- Individual/segment uplift estimates, uplift decile curves, optimal targeting policy evaluation (Qini/area under uplift curve).
Use when: effect varies across users and you want to target rollout or design follow-up variants.

Supplementary techniques

Distributional effects: Quantile Treatment Effects via quantile regression; ECDF/KS tests for shape changes.
Inference for ratios/heavy tails: percentile bootstrap with clustering; or Fieller’s theorem/delta method for ratio CIs.
Multiple testing: control FDR with Benjamini–Hochberg across many metrics/segments; or hierarchical modeling to mitigate false positives.

Visualization recommendations Integrity and setup

SRM monitor: observed vs expected assignment share with control chart bands.
Covariate balance “love plot”: SMD across covariates pre/post CUPED.

Primary effect and stability

Cumulative lift over time with 95% CI; show both raw and CUPED-adjusted.
Daily/batch difference plot with day-of-week bands to detect seasonality.
Forest plot of segment effects (with shrinkage CIs under hierarchical model).

Distributional insights

Overlaid ECDFs or ridgeline densities by arm; annotate median and selected quantiles.
Quantile lift plot: Δ at p10/p25/median/p75/p90 with CIs.

Funnels and behavior

Funnel bar charts by step with lift and propagated uncertainty.
Sankey or stepwise drop-off comparisons.

Sequential monitoring

Alpha-spending or e-value trajectory versus decision thresholds.
Power curve vs elapsed samples; MDE over time.

Uplift/HTE

Uplift decile curve (Qini); treatment policy gain vs random targeting.
ICE/PD plots for top features driving heterogeneity.

Variance reduction diagnostics

Pre vs post scatter with correlation and θ estimate for CUPED; R^2 and achieved variance reduction.

Decision framework and iteration

Go/No-go criteria:
- Primary metric Δ with CI; ensure guardrails within pre-defined bounds.
- Bayesian: P(Δ > 0) and expected loss; Frequentist: two-sided 95% CI not crossing 0 and guardrails pass.
Sensitivity analyses:
- Trim/winsorize extremes; re-run with/without outliers.
- Alternative denominators for ratios; user-level vs session-level aggregation.
- Re-estimate with/without CUPED; check robustness to covariate set.
- Cluster-robust vs naive SE; placebo tests on pre-period.
If positive:
- Ramp with sequential monitoring; maintain guardrails.
- Use HTE to prioritize high-uplift segments; A/B within segments to validate targeting.
If null/negative:
- Diagnose via funnel breakdown and distributional plots.
- Explore heterogeneity to identify subpopulations with positive lift.
- Generate follow-up hypotheses: UX adjustments, eligibility tweaks, throttling, or alternative ranking logic; design next experiments with higher power and targeted cohorts.
If inconclusive (wide CI):
- Extend duration/samples; increase power via CUPED or stratified randomization.
- Reduce metric variance (stabilized metrics, longer aggregation windows).

Practical implementation checklist

Before launch:
- Finalize hypotheses, metrics, power, randomization unit, and monitoring plan.
- Implement A/A to validate variance, CUPED correlations, and logging.
- Precompute covariates and pre-period baselines.
During experiment:
- Daily integrity checks (SRM, logging health).
- Monitor guardrails with pre-specified sequential rules if applicable.
After experiment:
- Run primary OLS/GLM with cluster-robust SE; report CUPED-adjusted results.
- Triangulate with bootstrap for non-normal/ratio metrics.
- If multiple metrics/segments, apply FDR control or hierarchical shrinkage.
- Conduct HTE analysis; prepare targeting recommendations.
- Produce decision memo with effect sizes, uncertainty, risk assessment, and rollout plan.

Deliverables to stakeholders

One-page summary: primary effect, CI, guardrails, decision.
Technical appendix: methods (models, assumptions, diagnostics), sensitivity results, code references.
Visual package: cumulative lift, forest plots, ECDF/quantile effects, funnel lift, uplift deciles, CUPED diagnostics, and sequential evidence curves.

This plan provides a statistically sound and operationally actionable approach to evaluate the new feature, validate assumptions, and drive iterative product decisions.

以下为针对“广告投放波动”的人群细分与效果归因算法清单（5种），并给出用于预算优化与创意调整的落地指引。内容聚焦在可操作的建模流程、所需数据、关键评估指标与优化策略。

一、数据准备与公共特征工程

数据结构
- 曝光/点击/转化日志：user_id、time、channel、placement、campaign、adgroup、creative_id、cost、impression、click、conversion、revenue、device、geo、frequency、viewability、position、bid、竞价类型。
- 补充变量：季节性（日/周/月）、节假日、促销、竞争活动指数、库存/价格、站内转化漏斗事件、APP版本、隐私开关（ATT 等）。
对齐与清洗
- 去重与跨设备ID归并（概率图谱或deterministic mapping）。
- 窗口化（lookback/attribution window），处理延迟转化。
- Session 切分、序列化触点路径。
- 反作弊和异常值处理（极端CTR/CVR、非人流量）。
变换与特征
- 广告时序：adstock（几何衰减）、饱和（Hill/Logistic）、滞后项。
- 业务控制变量：价格/库存/促销强度、自然流量与品牌检索指数。
- 受众特征：人口统计、RFM、行为序列嵌入、上下文（时间、地点、设备）、隐私合规处理。
标签与目标
- 短期：转化、收入、CPA、ROAS。
- 中长期：LTV/CLV（可用生存-收入联合模型外推），用于增量收益评估。

二、算法清单（5种）与落地指南

算法1：贝叶斯营销组合模型（MMM，分层+Adstock+饱和）

适用场景
- 渠道/媒体层面的宏观归因与预算分配，稳健应对日/周级波动、季节与外部冲击。
核心方法
- 贝叶斯分层回归，媒体投入经adstock与饱和函数变换；加入季节/节假日/促销等控制项。
- 稳健先验（如马蹄或Spike-and-Slab）做变量选择与防过拟合；不同地域/品类做层级共享。
所需数据
- 周/日级渠道/活动聚合数据：花费、曝光（可选）、转化/收入、控制变量。
输出与指标
- 渠道贡献、弹性、边际ROI（mROAS）、饱和点、半衰期；不确定性区间。
- 评估：后验预测检验、时间外验证、MAPE/RMSE、假设检验。
预算优化指引
- 基于mROAS进行非线性约束优化（预算、上下限、最低投放、配额），按收益-成本梯度迭代更新配比。
- 中期（月/季度）配额用MMM，结合MTA短期信号做日常微调。
局限与缓解
- 不能下钻到个体路径；用地理试验或BSTS校准增量效应。

算法2：多触点归因（Shapley值变体）

适用场景
- 用户级路径归因，识别跨渠道/触点的协同与助攻，解释短期波动。
核心方法
- 将触点（渠道/投放位/创意）视作“参与者”，对转化增量做Shapley分摊；用采样/启发式加速。
- 可扩展到创意维度，获取创意级贡献份额。
所需数据
- 用户级触点序列、时间戳、去重规则、view-through策略、跨设备映射、转化与价值。
输出与指标
- 渠道/触点/创意的边际与联合贡献、助攻网络、路径覆盖度与效能。
- 评估：回放检验（replay accuracy）、路径重建误差、对比标杆规则（位置/时序）提升。
预算与创意指引
- 在同一渠道内按创意/投放位Shapley贡献重分配预算；提升高助攻位的频控上限、保留在关键序列节点的创意。
局限与缓解
- 对稀疏长尾路径敏感，需做特征聚合与采样；与因果验证（实验/BSTS）结合避免相关性误判。

算法3：Uplift建模（因果森林/DR-Learner）

适用场景
- 人群细分基于“增量效应”（非相关性），用于定向与创意个性化；应对选择偏差带来的效果波动。
核心方法
- 以曝光为处理、转化为结果；先估计倾向得分与结果模型（双重稳健/AIPW），再用因果森林或DR-Learner估计异质性处理效应（HTE）。
所需数据
- 用户特征、历史行为、曝光/未曝光对照（随机或准实验）、转化/收入、时间窗口；合规特征。
输出与指标
- 人群分箱（Top X% uplift）、政策价值（policy value）、Qini/Gini uplift、AUUC；个体或细分层的mROAS。
预算与创意指引
- 将预算优先分配给高uplift人群；对不同uplift段匹配差异化创意与频控策略。
- 对低或负uplift人群降频或排除，减少浪费。
局限与缓解
- 需要对未曝光样本的可比性保证；用IPW/DR、地理随机化或自然实验增强识别性。

算法4：高维人群聚类（GMM + 表征学习）

适用场景
- 建立稳定、可解释的基础细分，用于定向、创意策略与出价分层；吸收短期波动带来的噪声。
核心方法
- 行为序列/特征嵌入（Autoencoder/Transformer embedding）后，用高斯混合或谱聚类进行软/硬聚类；定期重训与漂移监控。
所需数据
- RFM、浏览/加购/收藏序列、上下文、内容兴趣、价格敏感、设备/地域、生命周期阶段。
输出与指标
- 集群画像、规模与渗透、转化/ARPU/留存差异、稳定性（轮廓系数、调整兰德指数、人口统计一致性）。
预算与创意指引
- 对高价值/高潜力集群提高出价与预算上限；为各集群配置主题创意与落地页；对敏感度高的集群做价格/优惠型创意。
局限与缓解
- 聚类不代表因果；与Uplift结果交叉用于“可转化性×可影响性”的二维分层。

算法5：结构化时序因果评估（BSTS/合成控制/差分中的差分）

适用场景
- 波动诊断与增量验证：新活动、突发外部因素（竞品、节假日）、算法/创意切换的效果评估。
核心方法
- 使用BSTS或合成控制构建反事实基线，估计特定时间段的增量；可结合变点检测定位波动来源。
所需数据
- 按地域/店铺/媒体的时间序列，包含处理组与对照组的可比控制变量（自然量、竞品指数等）。
输出与指标
- 增量转化/收入与置信区间、变点时刻、受影响渠道/地域、回归期长度。
预算与创意指引
- 用于校准MMM与MTA的增量尺度；在波动期快速验证策略（如降频/换素材）的真实影响，指导是否扩大或回撤。
局限与缓解
- 控制组构造难；通过多控制序列与先验稳健性检验提升可信度。

三、实施顺序与协同

第1步：波动诊断与增量基线（算法5）
- 识别是否由外部冲击或内部策略变更导致，并估算基线缺口。
第2步：宏观归因与预算框架（算法1）
- 确定各渠道的边际ROI与饱和点，形成月/季度级预算上限与下限。
第3步：路径与创意微观归因（算法2）
- 在渠道内按触点/创意重分信用，发现关键助攻位与协同组合。
第4步：细分与个性化（算法3+4）
- 用Uplift对“可影响性”分层，用聚类补充“人群画像”；形成“人群×创意×频控”的策略矩阵。
第5步：闭环验证
- 使用地理/时间分组实验与BSTS复核增量，校准MMM和MTA权重；持续监控和重训。

四、评估与监控指标

增量与收益：增量转化/收入、mROAS、LTV-CPA差值、置信区间覆盖率。
归因一致性：MMM与MTA在渠道汇总层的偏差、对冲期一致性。
细分有效性：Qini/AUUC、policy value uplift、集群稳定性与业务差异显著性。
波动控制：变点检测命中率、预测误差（MAPE/RMSE）、策略变更前后对比。
实施效果：预算执行偏差、花费迁移的边际收益、创意轮播提升（CTR/CVR/转化成本）。

五、关键风险与校准建议

选择偏差与漏斗偏差：使用DR-Learner/IPW、引入随机化（geo试验、持出组）、负控特征做稳健性检验。
延迟与观测缺失：考虑延迟分布、右删失处理，滚动窗口再归因。
隐私与可测性：限制视图归因权重，采用聚合报告与差分隐私；用模型校准替代逐点跟踪。
模型漂移：设定重训节奏（周/月）、监控特征分布漂移与后验参数变化，触发再训练。

六、快速落地模板

数据管道：构建日/周级汇总表（供MMM/BSTS）与用户级路径表（供MTA/Uplift/聚类）。
首批产出
- MMM：输出各渠道mROAS与饱和曲线，形成预算建议区间。
- MTA-Shapley：输出前10条高贡献路径与创意协同对。
- Uplift：给出Top 20%可影响人群名单及其推荐创意主题。
- 聚类：3–8个稳定画像集群及差异化频控建议。
- BSTS：对近期波动的增量评估与变点定位。
执行与验证：按建议迁移10–20%预算做小步快跑；用BSTS/地理实验验证2–4周，再逐步放大。

通过上述5类算法的协同，可同时解决宏观预算分配、微观路径归因、细分人群定向以及波动期的因果验证，形成“诊断-归因-优化-验证”的闭环，提高预算效率与创意匹配度。

解决的问题

把“我手上这个具体数据问题用什么方法做”一键变成“5条可落地的算法候选清单”。通过明确角色与结构化指令，让 AI 以专业数据科学家的视角，针对你的具体问题快速产出精准、可比较、易理解的算法建议，并按你选择的语言输出。帮助你在需求评审、方案设计、原型验证等关键节点迅速定方向、少走弯路，缩短从问题到行动的路径，提升试错效率与成功率，促成从试用到规模化使用的决策。

适用用户

数据分析师

在留存下滑或转化异常的场景，迅速得到5种可行算法与实施顺序，组织数据清洗、评估与汇报。

产品经理

为新功能或活动做效果评估，获得清晰的分析路径与可视化建议，快速验证假设并推动迭代。

市场运营

面对广告投放波动，生成人群细分与效果归因的算法清单，指导预算优化与创意调整。

特征总结

• 针对具体数据难题，智能匹配5种可落地算法清单，快速明确可行分析路径。

• 一键生成从数据清洗到评估的执行要点，减少试错成本，直接进入验证与迭代。

• 自动给出每种算法的适用场景与选择理由，便于团队快速沟通，降低决策分歧。

• 按业务目标（增长、风控、运营等）优先推荐方案，突出收益预期，助力高效落地。

• 支持指定输出语言与写作风格，跨部门共享结果，方便汇报、复盘与培训。

• 自动提示数据准备、特征构建与可视化方向，让分析更完整，减少遗漏关键步骤。

• 提供结构化输出与关键行动清单，帮助新人快速上手，资深者高效审阅与把控。

• 基于问题背景自动优化推荐顺序，优先低成本高回报方案，提升试验成功率。

• 严控信息准确度与可验证性，避免夸大和偏差，让结论更可信、可对外呈现。

• 兼顾统计方法与机器学习路径，灵活切换思路，满足探索性与生产化双重需求。

如何使用购买的提示词模板

1. 直接在外部 Chat 应用中使用

将模板生成的提示词复制粘贴到您常用的 Chat 应用（如 ChatGPT、Claude 等），即可直接对话使用，无需额外开发。适合个人快速体验和轻量使用场景。

2. 发布为 API 接口调用

把提示词模板转化为 API，您的程序可任意修改模板参数，通过接口直接调用，轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。

3. 在 MCP Client 中配置使用

在 MCP client 中配置对应的 server 地址，让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作，让提示词在不同 AI 工具间无缝衔接。

AI 提示词价格

￥15.00元

先用后买，用好了再付款，超安全！

在线免费用提示词

您购买后可以获得什么

✓

获得完整提示词模板

- 共 249 tokens

- 2 个可调节参数

{ 特定数据问题 } { 输出语言 }

✓

获得社区贡献内容的使用权

- 精选社区优质案例，助您快速上手提示词

购买

推荐算法清单生成

解决的问题