生成统计测试所需假设的清单,内容专业清晰并具有业务实用性。
以下为常见均值类 t 检验的关键假设。请根据具体设计选择相应版本并核查假设是否满足。 一、通用假设(适用于所有 t 检验) - 随机性与独立性:样本来自适当的随机抽样/随机分配。观测值在适用单元间相互独立(配对设计除外,见下)。 - 测量尺度:响应变量为连续或近似连续的区间尺度。 - 近似正态性: - 单样本/两独立样本:总体分布(或均值的误差项)近似正态;样本量较大时对轻微偏离正态较稳健,但对重尾/强偏/离群值不稳健。 - 配对样本:配对差值的分布近似正态。 - 无严重离群值:t 检验对极端值敏感,应事先识别与处理。 - 正确的分组与设计:组别定义清晰、无交叉污染;配对/匹配关系正确建立。 二、按检验类型的特定假设 - 单样本 t 检验: - 观测值独立同分布。 - 总体(或误差)近似正态,或样本量足以使均值近似正态。 - 配对样本 t 检验: - 每对内的两个观测成对相关;不同配对之间独立。 - 配对“差值”独立且近似正态。 - 两独立样本 t 检验(Student’s t,合并方差): - 两组独立抽样、组内观测独立。 - 两组总体近似正态。 - 方差齐性:两组总体方差相等(σ1² = σ2²)。 - 两独立样本 Welch t 检验(不等方差): - 两组独立抽样、组内观测独立。 - 两组总体近似正态。 - 不要求方差相等(对方差不齐更稳健)。 三、实践备注(简要) - 诊断建议:QQ 图/正态性检验(如 Shapiro-Wilk,用于小样本)、方差齐性检验(Levene/Brown–Forsythe)、箱线图与标准化残差查离群。 - 违背假设时的对策: - 方差不齐:优先使用 Welch t。 - 非正态且样本小或存在重尾/离群:考虑变换(对数等)、稳健 t(如截尾均值检验)、非参数检验(配对:Wilcoxon 符号秩;独立:Mann–Whitney)、置换检验或自助法置信区间。 要点:独立性与设计正确性为首要;正态性针对均值的误差或差值分布;两独立样本的“是否要求方差齐性”取决于选择 Student’s 还是 Welch t。
Key assumptions for ordinary least squares (OLS) linear regression Core model assumptions (needed for unbiasedness/consistency) - Linearity in parameters and additive errors: The expected response is a linear combination of predictors; the error term adds to the mean structure (e.g., Y = Xβ + ε). - Correct specification (no omitted relevant variables, correct functional form): The model includes all predictors that drive the outcome and uses appropriate transformations; otherwise, estimates can be biased. - Random sampling and independence of observations: Data are drawn independently from the population. For time series or clustered data, independence is replaced by “no serial correlation” or independence within clusters conditional on X. - Exogeneity (zero conditional mean): E[ε | X] = 0. Predictors are not correlated with the error term. This is the key requirement for unbiased and consistent OLS estimates. - No perfect multicollinearity: Predictors are not exact linear combinations of each other; the design matrix has full column rank. Assumptions for efficiency and standard (non-robust) inference - Homoscedasticity: Var(ε | X) is constant. Violations (heteroscedasticity) do not bias OLS coefficients but invalidate conventional standard errors and reduce efficiency. - No autocorrelation of errors: Cov(εi, εj | X) = 0 for i ≠ j. Violations (e.g., in time series) affect inference and efficiency. - Normality of errors (optional, for exact small-sample tests): ε | X is normally distributed. Not required for unbiasedness; needed for exact t/F tests and small-sample confidence intervals. With large samples, inference relies on asymptotic normality and is less sensitive to non-normality. Data quality and identifiability assumptions (often implicit but essential) - Predictors measured without error (or measurement error is negligible): Classical OLS assumes X is measured accurately; errors-in-variables cause biased (typically attenuated) estimates. - Sufficient variation in predictors and absence of near-collinearity: Predictors must vary and not be highly collinear to yield stable, interpretable estimates. Context-specific additions (when applicable) - Time series: Weak/strict exogeneity, stationarity or stability of the process, and no serial correlation in errors conditional on X. - Panel/clustered data: Independence across clusters, appropriate handling of within-cluster correlation (e.g., clustered SE). Bottom line - For unbiased OLS estimates: linearity, correct specification, random sampling/independence, exogeneity, and no perfect multicollinearity. - For valid conventional inference: add homoscedasticity and no autocorrelation; normality is needed only for exact small-sample tests. Robust or cluster-robust methods can relax homoscedasticity and independence assumptions for inference.
卡方检验的关键假设与前提 通用 - 数据类型:基于分类数据的“频数”(计数),每个观测只能归入一个且仅一个类别;类别应互斥且穷尽。 - 抽样与独立性:样本来自随机抽样或随机分配;观测之间相互独立。不存在配对、重复测量或群集相关;若存在复杂抽样/群集,应使用设计校正(如 Rao–Scott 修正)或相应模型。 - 渐近近似有效性(期望频数要求):在原假设下,各单元格的期望频数应足够大。常用判据: - 传统规则:所有期望频数≥5; - 宽松规则:≤20%的单元格期望频数<5,且无期望频数<1。 若不满足,考虑合并类别、增大样本量、使用精确检验(如 Fisher)或蒙特卡罗方法。 - 固定分类方案:类别(行/列)在分析前预先定义,不应据数据事后调整;无结构性零(若有,需要专门处理/建模)。 - 计量一致性:使用原始计数而非比例/百分比;若只提供比例,需同时提供样本量以还原计数。 拟合优度检验(单维,检验样本是否来自给定分布) - 原假设的类别概率已明确给定;若从样本估计了 m 个分布参数,需相应调整自由度(df = k − 1 − m)。 - 样本来自同一总体,满足多项分布框架和独立性。 列联表检验(独立性/同质性) - 独立性检验:来自同一样本,按两个(或多个)分类变量进行交叉分类;样本内观测独立。 - 同质性检验:来自多个相互独立的样本/总体,比较其分类分布;各样本内独立,样本间也独立。 - 研究设计与边际:边际总数的确定应与所选检验类型一致(独立性 vs 同质性),但不作为分布近似的额外假设。 注意 - 对于2×2配对数据(非独立),不应用常规卡方检验,应使用 McNemar 检验。 - 当期望频数过小或存在稀疏表格,优先考虑 Fisher 精确检验、合并类别、或采用似然比卡方(G 检验)/蒙特卡罗方法;复杂抽样应进行设计效应调整。
在立项前快速列出A/B测试的统计前提与验证步骤;评审中用作标准清单,减少争议;复盘时定位失败原因并形成复用模板。
面对t检验、方差分析、回归等需求,一键生成假设与对应检查方法;不满足条件时获得替代建议,缩短分析与交付周期。
做活动或渠道效果评估时,生成对照前提与通过标准;把清单交给一线同事执行,确保数据采集与分组合规。
在问卷与品牌研究中,快速获得卡方、秩和等检验所需前提;用多语言版本向客户解释限制与可信度。
撰写方法与附录时,直接引用清单作为合规依据;按步骤保存检查证据,提高审稿透明度与通过率。
为临床或医疗研究列出分析前提、数据清洗与排除标准;用统一格式提交给伦理与统计审查,降低返工。
在模型评估或对比分析中,明确回归与时间序列的必要前提;完成残差与稳健性说明,提升报告说服力。
为客户交付实验设计或评估方案,快速生成标准化假设清单;以商务风格呈现,直接进入PPT与工作底稿。
为数据驱动团队提供一键生成“统计测试假设清单”的智能助手,快速明确每种统计方法的使用前提与限制,降低实验与分析风险,加速评审与决策,支持多语言输出与商务风格呈现。核心目标包括: - 在A/B测试、用户研究、指标监控、预测建模等场景,敏捷产出该测试必备的假设与适用条件 - 将隐性规则显性化,帮助团队在设计阶段就发现风险与边界,避免“结果被质疑”与重复返工 - 以专业、清晰、直接的商务文风呈现内容,便于嵌入方案评审、实验设计文档与合规材料 - 提供可复用的标准化清单,提升跨部门协作效率,保障结论可解释、可审核、可落地 - 通过输入“测试名称 + 输出语言”,即刻获取结构化、重点突出的假设列表,推动尝试与付费转化
将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。
把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。
在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。
免费获取高级提示词-优惠即将到期