以下为常见均值类 t 检验的关键假设。请根据具体设计选择相应版本并核查假设是否满足。

一、通用假设（适用于所有 t 检验）

随机性与独立性：样本来自适当的随机抽样/随机分配。观测值在适用单元间相互独立（配对设计除外，见下）。
测量尺度：响应变量为连续或近似连续的区间尺度。
近似正态性：
- 单样本/两独立样本：总体分布（或均值的误差项）近似正态；样本量较大时对轻微偏离正态较稳健，但对重尾/强偏/离群值不稳健。
- 配对样本：配对差值的分布近似正态。
无严重离群值：t 检验对极端值敏感，应事先识别与处理。
正确的分组与设计：组别定义清晰、无交叉污染；配对/匹配关系正确建立。

二、按检验类型的特定假设

单样本 t 检验：
- 观测值独立同分布。
- 总体（或误差）近似正态，或样本量足以使均值近似正态。
配对样本 t 检验：
- 每对内的两个观测成对相关；不同配对之间独立。
- 配对“差值”独立且近似正态。
两独立样本 t 检验（Student’s t，合并方差）：
- 两组独立抽样、组内观测独立。
- 两组总体近似正态。
- 方差齐性：两组总体方差相等（σ1² = σ2²）。
两独立样本 Welch t 检验（不等方差）：
- 两组独立抽样、组内观测独立。
- 两组总体近似正态。
- 不要求方差相等（对方差不齐更稳健）。

三、实践备注（简要）

诊断建议：QQ 图/正态性检验（如 Shapiro-Wilk，用于小样本）、方差齐性检验（Levene/Brown–Forsythe）、箱线图与标准化残差查离群。
违背假设时的对策：
- 方差不齐：优先使用 Welch t。
- 非正态且样本小或存在重尾/离群：考虑变换（对数等）、稳健 t（如截尾均值检验）、非参数检验（配对：Wilcoxon 符号秩；独立：Mann–Whitney）、置换检验或自助法置信区间。

要点：独立性与设计正确性为首要；正态性针对均值的误差或差值分布；两独立样本的“是否要求方差齐性”取决于选择 Student’s 还是 Welch t。

Key assumptions for ordinary least squares (OLS) linear regression

Core model assumptions (needed for unbiasedness/consistency)

Linearity in parameters and additive errors: The expected response is a linear combination of predictors; the error term adds to the mean structure (e.g., Y = Xβ + ε).
Correct specification (no omitted relevant variables, correct functional form): The model includes all predictors that drive the outcome and uses appropriate transformations; otherwise, estimates can be biased.
Random sampling and independence of observations: Data are drawn independently from the population. For time series or clustered data, independence is replaced by “no serial correlation” or independence within clusters conditional on X.
Exogeneity (zero conditional mean): E[ε | X] = 0. Predictors are not correlated with the error term. This is the key requirement for unbiased and consistent OLS estimates.
No perfect multicollinearity: Predictors are not exact linear combinations of each other; the design matrix has full column rank.

Assumptions for efficiency and standard (non-robust) inference

Homoscedasticity: Var(ε | X) is constant. Violations (heteroscedasticity) do not bias OLS coefficients but invalidate conventional standard errors and reduce efficiency.
No autocorrelation of errors: Cov(εi, εj | X) = 0 for i ≠ j. Violations (e.g., in time series) affect inference and efficiency.
Normality of errors (optional, for exact small-sample tests): ε | X is normally distributed. Not required for unbiasedness; needed for exact t/F tests and small-sample confidence intervals. With large samples, inference relies on asymptotic normality and is less sensitive to non-normality.

Data quality and identifiability assumptions (often implicit but essential)

Predictors measured without error (or measurement error is negligible): Classical OLS assumes X is measured accurately; errors-in-variables cause biased (typically attenuated) estimates.
Sufficient variation in predictors and absence of near-collinearity: Predictors must vary and not be highly collinear to yield stable, interpretable estimates.

Context-specific additions (when applicable)

Time series: Weak/strict exogeneity, stationarity or stability of the process, and no serial correlation in errors conditional on X.
Panel/clustered data: Independence across clusters, appropriate handling of within-cluster correlation (e.g., clustered SE).

Bottom line

For unbiased OLS estimates: linearity, correct specification, random sampling/independence, exogeneity, and no perfect multicollinearity.
For valid conventional inference: add homoscedasticity and no autocorrelation; normality is needed only for exact small-sample tests. Robust or cluster-robust methods can relax homoscedasticity and independence assumptions for inference.

卡方检验的关键假设与前提

通用

数据类型：基于分类数据的“频数”（计数），每个观测只能归入一个且仅一个类别；类别应互斥且穷尽。
抽样与独立性：样本来自随机抽样或随机分配；观测之间相互独立。不存在配对、重复测量或群集相关；若存在复杂抽样/群集，应使用设计校正（如 Rao–Scott 修正）或相应模型。
渐近近似有效性（期望频数要求）：在原假设下，各单元格的期望频数应足够大。常用判据：
- 传统规则：所有期望频数≥5；
- 宽松规则：≤20%的单元格期望频数<5，且无期望频数<1。若不满足，考虑合并类别、增大样本量、使用精确检验（如 Fisher）或蒙特卡罗方法。
固定分类方案：类别（行/列）在分析前预先定义，不应据数据事后调整；无结构性零（若有，需要专门处理/建模）。
计量一致性：使用原始计数而非比例/百分比；若只提供比例，需同时提供样本量以还原计数。

拟合优度检验（单维，检验样本是否来自给定分布）

原假设的类别概率已明确给定；若从样本估计了 m 个分布参数，需相应调整自由度（df = k − 1 − m）。
样本来自同一总体，满足多项分布框架和独立性。

列联表检验（独立性/同质性）

独立性检验：来自同一样本，按两个（或多个）分类变量进行交叉分类；样本内观测独立。
同质性检验：来自多个相互独立的样本/总体，比较其分类分布；各样本内独立，样本间也独立。
研究设计与边际：边际总数的确定应与所选检验类型一致（独立性 vs 同质性），但不作为分布近似的额外假设。

注意

对于2×2配对数据（非独立），不应用常规卡方检验，应使用 McNemar 检验。
当期望频数过小或存在稀疏表格，优先考虑 Fisher 精确检验、合并类别、或采用似然比卡方（G 检验）/蒙特卡罗方法；复杂抽样应进行设计效应调整。

解决的问题

为数据驱动团队提供一键生成“统计测试假设清单”的智能助手，快速明确每种统计方法的使用前提与限制，降低实验与分析风险，加速评审与决策，支持多语言输出与商务风格呈现。核心目标包括：

在A/B测试、用户研究、指标监控、预测建模等场景，敏捷产出该测试必备的假设与适用条件
将隐性规则显性化，帮助团队在设计阶段就发现风险与边界，避免“结果被质疑”与重复返工
以专业、清晰、直接的商务文风呈现内容，便于嵌入方案评审、实验设计文档与合规材料
提供可复用的标准化清单，提升跨部门协作效率，保障结论可解释、可审核、可落地
通过输入“测试名称 + 输出语言”，即刻获取结构化、重点突出的假设列表，推动尝试与付费转化

适用用户

增长产品经理

在立项前快速列出A/B测试的统计前提与验证步骤；评审中用作标准清单，减少争议；复盘时定位失败原因并形成复用模板。

数据分析师

面对t检验、方差分析、回归等需求，一键生成假设与对应检查方法；不满足条件时获得替代建议，缩短分析与交付周期。

运营经理

做活动或渠道效果评估时，生成对照前提与通过标准；把清单交给一线同事执行，确保数据采集与分组合规。

特征总结

• 一键生成指定统计检验的前置假设清单，结构清晰，直接用于评审与执行。

• 自动补充每条假设的验证方法与数据要求，减少沟通成本，避免遗漏关键检查。

• 结合业务场景给出风险提示与通过标准，帮助团队统一口径、加速决策通过。

• 支持多语言输出与术语本地化设置，便捷跨部门协作与对外沟通沉淀资料。

• 针对A/B测试、回归、方差分析等常见检验，一键调用即可获得专属假设列表。

• 输出以商务风为主，信息紧凑、重点突出，便于直接粘贴进方案、报告与评审材料。

• 对常见误区给出替代路径，如不满足条件的稳健方法与数据修正建议，降低结果偏差风险。

• 可保存为标准模板，适配不同项目，快速复用，建立团队级统计合规清单库。

• 提供示例描述与措辞建议，让非统计背景同事也能读懂并按步骤完成检查。

如何使用购买的提示词模板

1. 直接在外部 Chat 应用中使用

将模板生成的提示词复制粘贴到您常用的 Chat 应用（如 ChatGPT、Claude 等），即可直接对话使用，无需额外开发。适合个人快速体验和轻量使用场景。

2. 发布为 API 接口调用

把提示词模板转化为 API，您的程序可任意修改模板参数，通过接口直接调用，轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。

3. 在 MCP Client 中配置使用

在 MCP client 中配置对应的 server 地址，让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作，让提示词在不同 AI 工具间无缝衔接。

数据分析文生文 AI提示词

统计测试假设清单

幂简官方

392

Sep 25, 2025

生成统计测试所需假设的清单，内容专业清晰并具有业务实用性。

查看提示词内容

解决的问题