统计测试推荐助手

0 浏览
0 试用
0 购买
Sep 25, 2025更新

根据研究问题推荐合适的统计测试,提供精准分析建议。

示例1

推荐的统计测试
- 首选:Welch 双样本 t 检验(不等方差 t 检验,双侧)

适用场景与理由
- 目标:比较两独立组(实验组 vs 对照组)的平均成绩是否存在显著差异。
- 条件:样本独立,方差可能不齐,样本量可不相等。
- Welch t 检验对方差不齐与不等样本量具有稳健性;在组内分布近似正态或样本量适中(中心极限定理)时,检验均值差异的控制一类错误率表现优于传统等方差 t 检验。

假设与统计量
- 原假设 H0:μE = μC
- 备择假设 H1:μE ≠ μC(双侧)
- 统计量:
  t = (x̄E − x̄C) / sqrt(sE²/nE + sC²/nC)
  自由度(Welch–Satterthwaite 近似):
  df = (sE²/nE + sC²/nC)² / [ (sE²/nE)²/(nE−1) + (sC²/nC)²/(nC−1) ]
- 置信区间(例如 95%):
  (x̄E − x̄C) ± t_{df,1−α/2} × sqrt(sE²/nE + sC²/nC)

前置检查与数据处理建议
- 缺失值:剔除或适当插补,确保每个观测独立。
- 分布与异常值:用直方图/密度图/箱线图检查严重偏态与极端值。样本量很小且分布明显偏离正态、且存在重尾/离群时,考虑鲁棒/非参替代方案(见下)。
- 方差齐性:无需事先通过 Levene/Brown–Forsythe 检验来决定检验类型;在怀疑方差不齐时直接采用 Welch t 检验。

结果报告规范
- 报告 t 值、自由度、p 值,以及均值差的置信区间。
- 同时报告效应量:
  - 若方差差异不大:Hedges g(对 Cohen’s d 的小样本修正)。
  - 若确认方差明显不齐且以对照组为基准:Glass Δ(以对照组标准差标准化)。
- 提供组内均值和标准差,便于解释实际差异大小。

非正态或异常值较多时的替代方案
- Mann–Whitney U(Wilcoxon 秩和检验):当数据为有序/不满足正态且样本量较小可用;其检验的是分布位置差异(在形状相同假设下可近似解释为中位数差),对方差不齐与形状差异敏感,解释不直接指向“均值差”。
- Brunner–Munzel 检验:当方差与形状均可能不同且不想依赖中位数差解释时,检验两组“随机优势概率”差异,较 MWU 对方差不齐更稳健。
- 鲁棒均值比较:Yuen 修剪均值 t 检验(如 20% 修剪)在重尾/离群场景下对“位置参数”更稳健。

实现要点(工具)
- R:t.test(xE, xC, var.equal = FALSE, alternative = "two.sided")
- Python(SciPy):scipy.stats.ttest_ind(xE, xC, equal_var=False)
- 非参替代:scipy.stats.mannwhitneyu;scipy.stats.brunnermunzel

结论
- 在“独立样本、方差可能不齐、比较均值差异”的设定下,采用双侧 Welch t 检验是首选。若分布严重偏离正态且样本量很小或存在重尾/离群,则考虑 Brunner–Munzel 或 Yuen 修剪均值检验作为补充或敏感性分析。

示例2

Recommended test: Two-sample test for proportions (two-proportion z-test), with Fisher’s exact test as a fallback for small samples.

Rationale:
- Outcome is binary and groups A and B are independent. The hypothesis is H0: pA = pB vs H1: pA ≠ pB, where pA and pB are conversion probabilities.
- The two-proportion z-test uses a pooled standard error under H0 and is appropriate when sample sizes are moderate to large.
- If any expected cell count is small (commonly <5), Fisher’s exact test provides an exact p-value without reliance on large-sample approximations.

Implementation details:
- Let xA, nA be conversions and total exposures in A; xB, nB in B.
- Sample proportions: p̂A = xA/nA, p̂B = xB/nB.
- Null (pooled) proportion: p̂ = (xA + xB) / (nA + nB).
- Test statistic: z = (p̂A − p̂B) / sqrt( p̂ (1 − p̂) (1/nA + 1/nB) ).
- Two-sided p-value: 2 × (1 − Φ(|z|)), where Φ is the standard normal cdf.
- Equivalent: Pearson chi-squared test of independence on a 2×2 table yields the same p-value asymptotically.

Small-sample rule:
- If any expected count = nA·p̂ or nB·p̂ (and complements) is <5, use Fisher’s exact test on the 2×2 table.

Effect size and interval estimation:
- Report effect size with a confidence interval, not only the p-value:
  - Difference in proportions: Δ = p̂A − p̂B with a CI (prefer Newcombe-Wilson CI for better coverage; Wald CI can be used if samples are large).
  - Relative risk: RR = p̂A / p̂B with a log-transformed CI.
  - Odds ratio (from 2×2 table) with a log-transformed CI.

Assumptions and checks:
- Independent observations within and between A and B.
- Consistent outcome definition and comparable exposure windows.
- For z-test/chi-squared: sufficiently large sample sizes to justify normal approximation.

Extensions:
- If you need to adjust for covariates (e.g., traffic source, device), fit a logistic regression with a group indicator and covariates; test the group coefficient.

示例3

推荐的统计检验与报告方案如下:

一、主要检验
- 首选:Pearson 卡方检验(2×2列联表)
  - 适用于比较两独立组(二分类结局)的并发症发生率是否不同。
  - 与“两独立样本比例的z检验”在2×2情形下等价(z²=χ²,df=1)。
- 小样本/稀疏数据:Fisher确切检验
  - 当任一期望频数 <5(或更保守地:有单元格期望频数<5,或样本量较小)时使用。
  - 期望频数计算:E_ij = (行总计 × 列总计) / 总样本量。

二、前提与假设
- 独立样本:两组患者相互独立(RCT满足)。
- 分类正确且完整:二分类结局明确、无缺失或缺失可解释(建议按ITT原则处理)。
- 卡方检验适用条件:2×2表各期望频数通常≥5;若不满足,改用Fisher确切检验。

三、效应量与区间估计(建议与p值同步报告)
- 风险差(RD,绝对差):p_new − p_std
  - 区间估计建议使用Newcombe(Wilson)法,较Wald更稳健。
- 相对风险(RR):p_new / p_std
  - 区间估计可用对数变换法(log(RR)的标准误),再反变换。
- 可选:优势比(OR),主要用于逻辑回归模型;若并发症不稀少,优先报告RR和RD更直观。
- 同时报告双侧95%置信区间与双侧检验的p值。

四、分析步骤(概述)
- 构建2×2列联表:行(新药组、标准组)×列(有并发症、无并发症)。
- 计算每格观察频数与期望频数,判断检验选择(Pearson χ²或Fisher)。
- 执行主要检验,得到p值。
- 估计并报告RD、RR及其95%CI。
- 如有分层随机化(如中心、年龄层):可使用Cochran–Mantel–Haenszel检验与分层RR,以提高精度。

五、可选的模型扩展(如需协变量调整)
- 逻辑回归:结局为并发症(是/否),自变量含治疗组与基线协变量。
  - 报告调整后的OR及95%CI;若需近似RR,可用泊松回归带稳健方差或log-binomial模型(若收敛)。

六、结果呈现与可视化(建议)
- 列联表 + 条形图(两组并发症率及其95%CI误差线)。
- 文字报告包括:检验类型、p值、RD(95%CI)、RR(95%CI),并说明分析集(ITT或PP)与缺失数据处理。

结论性建议
- 在样本量与期望频数满足条件时,使用Pearson卡方检验比较两组并发症发生率;若期望频数较小,使用Fisher确切检验。并同步报告风险差与相对风险的估计及95%置信区间,以提供效应的大小与临床意义。

适用用户

学术研究者(硕博/课题组)

快速选择合适统计检验、规范报告结构、避免审稿常见质疑,缩短投稿与答辩周期。

产品与运营分析师

在A/B测试与转化分析中,一键匹配检验与样本前提检查,生成解读要点,提升发布决策效率。

医疗与临床研究人员

为随机对照或队列数据选择恰当检验,提示前提验证与替代方案,支持方案设计与伦理材料撰写。

市场研究与咨询顾问

针对问卷与追踪研究,自动推荐卡方、秩和等检验,输出易懂结果与图表建议,增强客户呈现。

高校教师与助教

用于课堂演示检验选择逻辑,提供结构化示例与作业参考,提升学生对统计实操的理解。

数据分析初学者

通过清晰步骤与误区提醒,建立正确检验思维,快速上手并减少走弯路。

解决的问题

让你用一句研究问题,快速拿到“该用哪种统计检验、为何适用、如何准备与呈现结果”的完整分析方案。帮助产品、运营、研究、教育、医疗等岗位,以更少时间做出更可信的结论,统一团队方法标准,提升转化与决策效率。

特征总结

一键匹配统计检验,依据研究问题与变量结构,快速推荐适配方案并标注适用边界。
自动检查数据前提,提醒正态性、方差齐性与独立性,并给出简单验证与替代。
场景化分析建议,覆盖A/B实验、问卷与观察研究,提供解读要点与风险提示。
结构化输出步骤,生成检验流程、统计量报告模板与可视化建议,直接用于写作。
多语言专业表述,一键切换中文或英文,适合论文、邮件和跨团队沟通场景。
参数化定制偏好,可设单双尾、置信水平与效应方向,自动调整推荐与呈现。
误用防护提醒,识别多重比较与样本不平衡等问题,提供纠正策略与替代检验。
方案对比与决策,罗列可选检验的适用条件、优缺点与结果含义,助力快速取舍。
可视化指导,建议箱线图、QQ图等搭配展示,提升报告可读性与审稿通过率。
轻量化上手体验,按提示输入研究问题即可获得可执行步骤,迅速落地分析。

如何使用购买的提示词模板

1. 直接在外部 Chat 应用中使用

将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。

2. 发布为 API 接口调用

把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。

3. 在 MCP Client 中配置使用

在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。

¥10.00元
平台提供免费试用机制,
确保效果符合预期,再付费购买!

您购买后可以获得什么

获得完整提示词模板
- 共 242 tokens
- 2 个可调节参数
{ 研究问题 } { 输出语言 }
自动加入"我的提示词库"
- 获得提示词优化器支持
- 版本化管理支持
获得社区共享的应用案例
限时免费

不要错过!

免费获取高级提示词-优惠即将到期

17
:
23
小时
:
59
分钟
:
59