根据研究问题推荐合适的统计测试,提供精准分析建议。
推荐的统计测试 - 首选:Welch 双样本 t 检验(不等方差 t 检验,双侧) 适用场景与理由 - 目标:比较两独立组(实验组 vs 对照组)的平均成绩是否存在显著差异。 - 条件:样本独立,方差可能不齐,样本量可不相等。 - Welch t 检验对方差不齐与不等样本量具有稳健性;在组内分布近似正态或样本量适中(中心极限定理)时,检验均值差异的控制一类错误率表现优于传统等方差 t 检验。 假设与统计量 - 原假设 H0:μE = μC - 备择假设 H1:μE ≠ μC(双侧) - 统计量: t = (x̄E − x̄C) / sqrt(sE²/nE + sC²/nC) 自由度(Welch–Satterthwaite 近似): df = (sE²/nE + sC²/nC)² / [ (sE²/nE)²/(nE−1) + (sC²/nC)²/(nC−1) ] - 置信区间(例如 95%): (x̄E − x̄C) ± t_{df,1−α/2} × sqrt(sE²/nE + sC²/nC) 前置检查与数据处理建议 - 缺失值:剔除或适当插补,确保每个观测独立。 - 分布与异常值:用直方图/密度图/箱线图检查严重偏态与极端值。样本量很小且分布明显偏离正态、且存在重尾/离群时,考虑鲁棒/非参替代方案(见下)。 - 方差齐性:无需事先通过 Levene/Brown–Forsythe 检验来决定检验类型;在怀疑方差不齐时直接采用 Welch t 检验。 结果报告规范 - 报告 t 值、自由度、p 值,以及均值差的置信区间。 - 同时报告效应量: - 若方差差异不大:Hedges g(对 Cohen’s d 的小样本修正)。 - 若确认方差明显不齐且以对照组为基准:Glass Δ(以对照组标准差标准化)。 - 提供组内均值和标准差,便于解释实际差异大小。 非正态或异常值较多时的替代方案 - Mann–Whitney U(Wilcoxon 秩和检验):当数据为有序/不满足正态且样本量较小可用;其检验的是分布位置差异(在形状相同假设下可近似解释为中位数差),对方差不齐与形状差异敏感,解释不直接指向“均值差”。 - Brunner–Munzel 检验:当方差与形状均可能不同且不想依赖中位数差解释时,检验两组“随机优势概率”差异,较 MWU 对方差不齐更稳健。 - 鲁棒均值比较:Yuen 修剪均值 t 检验(如 20% 修剪)在重尾/离群场景下对“位置参数”更稳健。 实现要点(工具) - R:t.test(xE, xC, var.equal = FALSE, alternative = "two.sided") - Python(SciPy):scipy.stats.ttest_ind(xE, xC, equal_var=False) - 非参替代:scipy.stats.mannwhitneyu;scipy.stats.brunnermunzel 结论 - 在“独立样本、方差可能不齐、比较均值差异”的设定下,采用双侧 Welch t 检验是首选。若分布严重偏离正态且样本量很小或存在重尾/离群,则考虑 Brunner–Munzel 或 Yuen 修剪均值检验作为补充或敏感性分析。
Recommended test: Two-sample test for proportions (two-proportion z-test), with Fisher’s exact test as a fallback for small samples. Rationale: - Outcome is binary and groups A and B are independent. The hypothesis is H0: pA = pB vs H1: pA ≠ pB, where pA and pB are conversion probabilities. - The two-proportion z-test uses a pooled standard error under H0 and is appropriate when sample sizes are moderate to large. - If any expected cell count is small (commonly <5), Fisher’s exact test provides an exact p-value without reliance on large-sample approximations. Implementation details: - Let xA, nA be conversions and total exposures in A; xB, nB in B. - Sample proportions: p̂A = xA/nA, p̂B = xB/nB. - Null (pooled) proportion: p̂ = (xA + xB) / (nA + nB). - Test statistic: z = (p̂A − p̂B) / sqrt( p̂ (1 − p̂) (1/nA + 1/nB) ). - Two-sided p-value: 2 × (1 − Φ(|z|)), where Φ is the standard normal cdf. - Equivalent: Pearson chi-squared test of independence on a 2×2 table yields the same p-value asymptotically. Small-sample rule: - If any expected count = nA·p̂ or nB·p̂ (and complements) is <5, use Fisher’s exact test on the 2×2 table. Effect size and interval estimation: - Report effect size with a confidence interval, not only the p-value: - Difference in proportions: Δ = p̂A − p̂B with a CI (prefer Newcombe-Wilson CI for better coverage; Wald CI can be used if samples are large). - Relative risk: RR = p̂A / p̂B with a log-transformed CI. - Odds ratio (from 2×2 table) with a log-transformed CI. Assumptions and checks: - Independent observations within and between A and B. - Consistent outcome definition and comparable exposure windows. - For z-test/chi-squared: sufficiently large sample sizes to justify normal approximation. Extensions: - If you need to adjust for covariates (e.g., traffic source, device), fit a logistic regression with a group indicator and covariates; test the group coefficient.
推荐的统计检验与报告方案如下: 一、主要检验 - 首选:Pearson 卡方检验(2×2列联表) - 适用于比较两独立组(二分类结局)的并发症发生率是否不同。 - 与“两独立样本比例的z检验”在2×2情形下等价(z²=χ²,df=1)。 - 小样本/稀疏数据:Fisher确切检验 - 当任一期望频数 <5(或更保守地:有单元格期望频数<5,或样本量较小)时使用。 - 期望频数计算:E_ij = (行总计 × 列总计) / 总样本量。 二、前提与假设 - 独立样本:两组患者相互独立(RCT满足)。 - 分类正确且完整:二分类结局明确、无缺失或缺失可解释(建议按ITT原则处理)。 - 卡方检验适用条件:2×2表各期望频数通常≥5;若不满足,改用Fisher确切检验。 三、效应量与区间估计(建议与p值同步报告) - 风险差(RD,绝对差):p_new − p_std - 区间估计建议使用Newcombe(Wilson)法,较Wald更稳健。 - 相对风险(RR):p_new / p_std - 区间估计可用对数变换法(log(RR)的标准误),再反变换。 - 可选:优势比(OR),主要用于逻辑回归模型;若并发症不稀少,优先报告RR和RD更直观。 - 同时报告双侧95%置信区间与双侧检验的p值。 四、分析步骤(概述) - 构建2×2列联表:行(新药组、标准组)×列(有并发症、无并发症)。 - 计算每格观察频数与期望频数,判断检验选择(Pearson χ²或Fisher)。 - 执行主要检验,得到p值。 - 估计并报告RD、RR及其95%CI。 - 如有分层随机化(如中心、年龄层):可使用Cochran–Mantel–Haenszel检验与分层RR,以提高精度。 五、可选的模型扩展(如需协变量调整) - 逻辑回归:结局为并发症(是/否),自变量含治疗组与基线协变量。 - 报告调整后的OR及95%CI;若需近似RR,可用泊松回归带稳健方差或log-binomial模型(若收敛)。 六、结果呈现与可视化(建议) - 列联表 + 条形图(两组并发症率及其95%CI误差线)。 - 文字报告包括:检验类型、p值、RD(95%CI)、RR(95%CI),并说明分析集(ITT或PP)与缺失数据处理。 结论性建议 - 在样本量与期望频数满足条件时,使用Pearson卡方检验比较两组并发症发生率;若期望频数较小,使用Fisher确切检验。并同步报告风险差与相对风险的估计及95%置信区间,以提供效应的大小与临床意义。
快速选择合适统计检验、规范报告结构、避免审稿常见质疑,缩短投稿与答辩周期。
在A/B测试与转化分析中,一键匹配检验与样本前提检查,生成解读要点,提升发布决策效率。
为随机对照或队列数据选择恰当检验,提示前提验证与替代方案,支持方案设计与伦理材料撰写。
针对问卷与追踪研究,自动推荐卡方、秩和等检验,输出易懂结果与图表建议,增强客户呈现。
用于课堂演示检验选择逻辑,提供结构化示例与作业参考,提升学生对统计实操的理解。
通过清晰步骤与误区提醒,建立正确检验思维,快速上手并减少走弯路。
让你用一句研究问题,快速拿到“该用哪种统计检验、为何适用、如何准备与呈现结果”的完整分析方案。帮助产品、运营、研究、教育、医疗等岗位,以更少时间做出更可信的结论,统一团队方法标准,提升转化与决策效率。
将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。
把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。
在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。
免费获取高级提示词-优惠即将到期