热门角色不仅是灵感来源,更是你的效率助手。通过精挑细选的角色提示词,你可以快速生成高质量内容、提升创作灵感,并找到最契合你需求的解决方案。让创作更轻松,让价值更直接!
我们根据不同用户需求,持续更新角色库,让你总能找到合适的灵感入口。
提供精准的数据分析,识别数值摘要中的潜在异常值。
已了解。我将以数据分析专家的角色协助你完成具体的数据分析任务。为确保分析准确、可复现并与业务目标一致,请先提供任务与数据的关键信息。以下为协作方式与交付流程。
一、请提供的信息
若暂不便分享完整数据,可先提供:
二、标准分析流程(可根据你的目标裁剪)
三、数据提交与样例
四、参考代码骨架(Python/pandas)
示例(精简):
导入与审计 import pandas as pd, numpy as np df = pd.read_parquet("data.parquet")
print(df.info()) desc = df.describe(include="all") null_rate = df.isna().mean().sort_values(ascending=False)
assert df['id'].is_unique
异常值(IQR) def iqr_outlier_mask(s, k=1.5): q1, q3 = s.quantile([0.25, 0.75]) iqr = q3 - q1 lower, upper = q1 - kiqr, q3 + kiqr return (s < lower) | (s > upper)
假设检验(两组均值;正态性不足时建议非参) from scipy import stats g1, g2 = df[df.group=="A"]["metric"], df[df.group=="B"]["metric"] stat, p = stats.ttest_ind(g1, g2, equal_var=False, nan_policy="omit")
可视化(分布与箱线图) import seaborn as sns sns.histplot(df["amount"], bins=50) sns.boxplot(data=df, x="group", y="amount")
五、澄清问题(请尽可能回答)
准备就绪后,请分享数据样例或字段与指标定义。我将据此制定针对性的分析计划与交付清单,并在每一步给出可复现代码与明确结论。
Understood. I will act as a data analysis expert and focus on accurate, concise, and actionable analysis. Please provide the inputs below so I can proceed efficiently.
What I need from you
Proposed workflow
Minimal Python skeleton (ready to adapt once data is provided)
import numpy as np import pandas as pd from sklearn.model_selection import train_test_split, StratifiedKFold, KFold, cross_val_score from sklearn.preprocessing import OneHotEncoder, StandardScaler from sklearn.compose import ColumnTransformer from sklearn.pipeline import Pipeline from sklearn.metrics import roc_auc_score, f1_score, mean_squared_error from sklearn.linear_model import LogisticRegression, Ridge from sklearn.ensemble import RandomForestClassifier, RandomForestRegressor
def load_data(path): df = pd.read_csv(path) return df
def summarize(df): out = {} out['shape'] = df.shape out['dtypes'] = df.dtypes.to_dict() out['missing_by_col'] = df.isna().sum().sort_values(ascending=False).to_dict() out['basic_stats'] = df.describe(include='all').to_dict() return out
def flag_outliers_iqr(s, k=1.5): q1, q3 = s.quantile([0.25, 0.75]) iqr = q3 - q1 lower, upper = q1 - kiqr, q3 + kiqr return (s < lower) | (s > upper)
def build_pipeline(df, target, problem_type='classification'): X = df.drop(columns=[target]) y = df[target] num_cols = X.select_dtypes(include=['number']).columns.tolist() cat_cols = X.select_dtypes(exclude=['number']).columns.tolist() preproc = ColumnTransformer( transformers=[ ('num', StandardScaler(with_mean=False), num_cols), ('cat', OneHotEncoder(handle_unknown='ignore', sparse=False), cat_cols) ], remainder='drop' ) if problem_type=='classification': model = LogisticRegression(max_iter=200, n_jobs=None) pipe = Pipeline(steps=[('pre', preproc), ('clf', model)]) else: model = Ridge(alpha=1.0) pipe = Pipeline(steps=[('pre', preproc), ('reg', model)]) return X, y, pipe
def evaluate(pipe, X, y, problem_type='classification'): if problem_type=='classification': cv = StratifiedKFold(n_splits=5, shuffle=True, random_state=42) scorer = 'roc_auc' else: cv = KFold(n_splits=5, shuffle=True, random_state=42) scorer = 'neg_root_mean_squared_error' scores = cross_val_score(pipe, X, y, cv=cv, scoring=scorer, n_jobs=-1) return scores
from sklearn.model_selection import TimeSeriesSplit import statsmodels.api as sm
def ts_decompose(y, period): return sm.tsa.seasonal_decompose(y, period=period, model='additive', two_sided=False)
def rolling_origin_cv(y, X=None, splits=5): tscv = TimeSeriesSplit(n_splits=splits) for train_idx, test_idx in tscv.split(y): yield train_idx, test_idx
Quality and rigor practices I will follow
Next step
已收到。将以数据分析专家的角色执行任务,并严格遵循准确性与技术性要求。为高效开展分析,请提供以下信息与数据结构化描述。
所需信息与数据格式
标准分析流程(将依据你提供的数据与目标定制)
3)特征工程与建模(如需预测/分类/分群)
异常值识别说明
数据提供建议
下一步
将零散的数值摘要快速转化为“异常值清单+验证建议”,在没有图表或明确阈值的情况下精准定位风险点;帮助运营、产品、风控、财务与数据分析岗位缩短排查耗时、提升数据质量与决策可信度;为每个异常提供可能原因、修正与采样建议、分段对比与后续动作清单,形成可直接复用的结论摘要;支持多语言与多场景复用,覆盖周报、复盘、临时告警、上线前检查等高频场景。
从均值、分位数等摘要中快速定位异常渠道与指标,生成复盘报告与清洗建议,缩短分析到行动的周期。
在支付、借贷、保险数据中识别异常交易金额与频次,设定预警阈值,导出处置清单,提升识别欺诈和违约的效率。
发现转化率、退款率、客单价的异常波动,定位促销或页面问题,输出优化动作与监控指标,减少损失。
将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。
把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。
在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。
免费获取高级提示词-优惠即将到期