¥
立即购买

统计测试推荐

366 浏览
34 试用
9 购买
Nov 27, 2025更新

该提示词根据用户提供的研究问题、数据集描述、变量类型、研究设计与样本量,自动推荐最合适的统计检验(含参数/非参数、单样本/双样本/多组、相关/回归/生存分析等)。输出包括推荐检验、适用前提、需要的假设检验步骤、若前提不满足的替代方法与简单的实施说明,适用于学术研究、实验设计与数据分析决策支持。

以下为针对该A/B实验研究问题的推荐统计检验与分析路径(两比例比较与回归)、前提检查和可替代方案。

一、主要分析结论路径(优先顺序)

  1. 主要(未调整)检验:两独立样本比例Z检验(双侧),以意向性分析(ITT)评估B相对A的首购转化差异。
  • 原假设 H0: pB = pA;备择 H1: pB ≠ pA。
  • 报告:绝对提升(pB − pA)、相对提升(pB/pA − 1)、95%置信区间、p值。
  1. 协变量调整(提高精度并回答“控制后仍有优势”):多变量Logistic回归
  • 模型:logit[P(Y=1)] = β0 + β1·B + γ·渠道(哑变量组) + δ·设备(移动=1) [+ 可选:日固定效应]。
  • 关注参数:β1(B版主效应)。报告OR=exp(β1)及其95%CI,并给出平均边际效应(AME)或在渠道、设备分布上的预测概率差,作为“控制后的绝对提升”。
  • 备注:由于仅含名义协变量,不涉及logit线性假设;使用稳健标准误(HC2/HC3)以抵御轻微方差不齐。
  1. 无模型的协变量控制(灵敏度/备选主分析):分层Cochran–Mantel–Haenszel(CMH)检验
  • 按渠道×设备形成6个层,检验公共OR是否≠1,并给出Mantel–Haenszel合并OR与95%CI。
  • 若层间效应不齐,可用Breslow–Day检验检查同质性;不齐时汇报分层特异效应,或在Logistic中加入B×渠道/B×设备交互。

二、具体方法说明 A. 两比例Z检验(未调整)

  • 适用条件:各组事件数和非事件数均≥5(2000/组通常满足,除非转化率<0.5%)。
  • 统计量:基于原假设下的合并方差估计进行标准化差异检验。
  • 优点:随机对照下无偏;解释直接、透明。缺点:不利用协变量提升精度。

B. 协变量调整的Logistic回归

  • 自变量编码:页面版本B=1;渠道以“自然”为基准(或样本最多的类),付费与社媒为哑变量;设备移动=1、PC为基准。
  • 推断:Wald检验或似然比检验均可。建议报告预测概率层面的提升(AME),以便与两比例检验结果一致解读。
  • 可选项:
    • 加入“日”固定效应,控制7天内的日内/日际波动。
    • 探索异质性:事先限定检验B×设备、B×渠道交互(控制多重性)。若显著,分层报告B效应。

C. 分层CMH检验(渠道×设备)

  • 适用:希望在不依赖回归模型的前提下控制名义协变量。
  • 要求:层内无严重零单元问题;公共OR同质性假设较合理(否则转为分层或含交互的回归)。

三、前提检查与数据质量控制

  • 样本配比与随机化成功:
    • SRM检测:A/B样本量是否显著偏离1:1(卡方检验)。
    • 基线平衡:A/B在渠道和设备的分布是否平衡(卡方检验与标准化差异)。若不平衡,回归/CMH可缓解;仍需解释潜在原因。
  • 单位与独立性:
    • 单位为cookie层用户,确保每用户唯一计入且跨天版本一致;若存在重复访问,仅计首购一次。
    • 排除跨版本“串扰”和归因泄漏(SUTVA)。
  • 结局定义一致:
    • 首购转化窗口与时间戳一致;删去机器人/异常流量;缺失的渠道/设备明确定义为独立类别以避免选择性缺失偏倚。
  • 频数条件:
    • 若任一层(或组)事件数过小,避免正态近似,改用精确检验或合并层。

四、替代方案与边界情形

  • 低事件率或稀疏格子:
    • Fisher精确检验(两比例);分层可用精确CMH;或基于随机化的置换检验(整体或分层置换)。
  • 目标为相对风险:
    • 直接估计RR的log-binomial回归(若不收敛,可用Poisson回归带稳健方差近似RR)。
  • 绝对提升为主且便于解读:
    • 线性概率模型(LPM)+稳健标准误,协变量同上;报告B系数即“控制后的绝对提升”。
  • 罕见的分离问题:
    • Firth惩罚Logistic回归以稳定估计(大样本下通常不需)。

五、结果报告建议

  • 未调整与调整后结果同时报告:
    • 未调整:pB、pA、差值、相对提升、95%CI、p值。
    • 调整后:B的AME(绝对提升)及其95%CI;OR或RR(若用Poisson稳健)与95%CI、p值。
  • 若检验了交互:报告分层效应与同质性检验结果;控制多重比较。
  • 结论以ITT为准,并提供对日效应控制与CMH结果作为稳健性验证。

综合建议

  • 作为主分析:实施两比例Z检验(ITT),随后以包含渠道与设备的Logistic回归给出“控制后”的效应与推断。用CMH分层检验作为无模型的稳健性校验。这样可直接回答“B版是否显著提升首购转化,且在控制渠道与设备后仍保持优势”。

建议的主要统计方法与检验方案

  1. 主要假设与显著性水平
  • 研究目的:检验免疫联合方案相较标准化疗是否延长PFS(优效性)。
  • 原假设 H0:两组PFS风险比 HR = 1(或≥1);备择假设 H1:HR ≠ 1(或 < 1,若预先指定单侧)。
  • 显著性水平:建议总体两侧α=0.05;如肿瘤领域常用单侧2.5%,需在方案中预先规定并与期中分析联动控制整体I类错误。
  1. 主要统计检验(事件驱动)
  • 主要检验:分层Log-rank检验(stratified log-rank),按随机化分层因素进行分层合并检验统计量,用于控制分层不平衡并提高效能。
    • 分层因素:肿瘤分期(II/III/IV)与分中心。若分中心数量多且每中心样本很小,出于稳定性考虑可预先规定将中心合并为区域层或仅对分期分层,同时在模型中对中心做稳健调整(见下)。
  • 效果量与区间估计:分层Cox比例风险模型估计HR及95%置信区间,给出两组HR(免疫联合/标准)的点估计与区间。
    • Ties处理:使用Efron方法。
    • 显著性检验:基于Cox模型的Wald检验或似然比检验;与分层Log-rank检验一致时报告主要结论。
  1. 模型规格与协变量处理
  • 首选模型:分层Cox模型
    • 基本形式:对每个分层因子k设独立基线风险h0k(t),模型包含治疗组别作为主要自变量;分期作为分层因子不再作为协变量重复进入。
    • 分中心的处理:
      • 若中心数目有限且每层样本足够,可作为分层因子共同分层。
      • 若中心数量多且层数稀疏,建议:仅对分期分层;中心以共享脆弱性(gamma frailty)或集群稳健方差(cluster-robust SE,按中心聚类)进行方差稳健化,并在敏感性分析中对区域或合并中心分层。
  • 协变量:年龄(连续)与分期(有序)。
    • 主要分析:治疗效应基于分层(至少按分期)进行;年龄可不进入主要模型,以便估计与检验与分层Log-rank更一致。
    • 支持性分析:Cox模型中纳入年龄(连续,可用限制性立方样条以检验非线性),分期若未分层则作为有序协变量进入;报告调整后HR。
  1. 比例风险假设(PH)检验与处理
  • 检验步骤(针对治疗效应):
    • Grambsch–Therneau检验(基于Schoenfeld残差的全局与治疗项检验)。
    • 对数-对数生存曲线平行性检查;Cox时间交互项:treatment × f(log t)(如样条)检验时间变系数。
  • 若PH假设成立:
    • 主要结论基于分层Log-rank与分层Cox一致给出;HR解释为随时间恒定的相对风险。
  • 若PH显著违背,尤其免疫治疗常见的延迟效应:
    • 预先指定的处理与敏感性:
      • 时间分段Cox(例如0–6月与>6月)报告分段HR;
      • 加权Log-rank(Fleming–Harrington G(ρ,γ),如ρ=0, γ=1或2,强调后期差异)作为支持性;
      • RMST(限制平均生存时间)差异与比值,在预先指定的截断时间τ(例如24或36个月)下进行比较,可采用分层RMST或协变量调整的伪值回归;报告差异及95%CI与p值。
    • 在PH不满足时,仍可报告总体HR但需注明其平均化解释并以RMST/分段HR补充临床解释。
  1. 删失机制与处理
  • 删失定义:对未发生进展/死亡者按末次无进展随访时间右删失;行政性删失于数据截断日;事件指示:进展/死亡=1,仍在随访=0。
  • 假设:独立且非信息性删失(与潜在风险独立,给定已纳入的分层/协变量);该假设不可检验但需通过如下方式支持:
    • 比较两组失访率与随访时长(反向Kaplan–Meier估计中位随访时间);
    • 描述删失原因与时间分布;如发现组间系统性差异,进行IPCW(逆概率加权)敏感性分析。
  • 竞争风险:PFS将进展与死亡均视为事件,不构成竞争风险情形,使用标准生存分析即可。
  1. 期中分析与I类错误控制
  • 设计:一次期中分析,建议基于信息量驱动(例如累计主要事件达到计划信息量的约50%时)。
  • 错误率控制:采用Lan–DeMets α花费函数实现O’Brien–Fleming边界(保守早停),整体两侧α=0.05控制至期末。
    • 期中边界(示例,信息量约50%):两侧Z临界值约±2.96(具体由实际信息量计算);期末边界相应放宽。报告实际花费α与调整后的p值(或边界跨越情况)。
  • 统计量:分层Log-rank Z值为主要监测统计量;效应量和区间估计采用分层Cox模型,对应时间点可报告组间HR与CI。
  • 无效性(futility)规则:可设置非绑定型边界(如基于条件效能),仅用于运营决策,不影响I类错误。
  1. 描述性与主要输出
  • Kaplan–Meier曲线:按组分层绘制并在图注中注明分层检验;提供风险表。
  • 估计量:HR(分层Cox)、95%CI、分层Log-rank p值;中位PFS及其Brookmeyer–Crowley法CI(注意PH违背时中位数差异可失真)。
  • 随访:反向KM法估计中位随访时长与两组对比。
  • 事件信息:总事件数、各分层内事件分布、删失比例。
  1. 数据预处理与质量控制
  • 确保时间变量为非负,若存在同日事件与入组时间,按最小正增量(如0.01月)避免0时刻事件引起的计算问题。
  • 核对事件定义一致性与进展日期规则(如影像学评估窗口);确保分层因子(分期、中心)在数据库中完整且与随机化记录一致。
  • 意向性分析(ITT):所有随机化受试者按分配组纳入主要分析;如设安全性人群或符合方案人群,仅作支持性。
  1. 敏感性与附加分析
  • 协变量调整Cox:在主要分层基础上加入年龄(连续,必要时用样条)评估稳健性;若中心未分层,使用中心簇稳健方差或共享脆弱性模型评估中心异质性影响。
  • 预设延迟效应敏感性:Fleming–Harrington加权Log-rank与RMST。
  • 缺失协变量处理:若年龄等协变量有缺失,在敏感性分析中采用多重插补(与分层因子和治疗组别兼容),主要分析的分层Log-rank与分层Cox不受协变量缺失影响。

结论性推荐

  • 主要检验:分层Log-rank(按随机化分层因素),控制I类错误的组序贯边界用于期中与期末决策。
  • 主要效应估计:分层Cox比例风险模型的HR与95%CI(ties用Efron),以ITT人群进行。
  • PH假设评估:Schoenfeld残差/Grambsch–Therneau检验和时间交互;若违背,报告RMST与/或分段HR,并可辅以加权Log-rank作为支持性。
  • 删失机制:按末次无进展随访时间右删失,假设非信息性;如可疑,进行IPCW敏感性分析。
  • 分层因素处理:优先按分期与分中心分层;若中心层数过多导致不稳定,改为对分期分层并对中心作稳健或脆弱性调整,预先在SAP中明确。

推荐的统计检验与建模策略

主要结论

  • 首选:有序结局的重复测量模型。使用累积对数几率混合效应模型(Cumulative Link Mixed Model, CLMM)或等价的有序GEE来检验时间的线性下降趋势,并同时调整干预强度与性别。
  • 敏感性分析(不含协变量):Page’s L 趋势检验(单侧,检验基线 ≥ 2周 ≥ 4周的单调下降),以及Friedman检验作为非参数组内总体差异检验。

一、主要分析:CLMM(有序logit,个体随机截距)

  • 适配原因

    • 结局为0–10等级评分(有序离散),存在非正态与潜在离群值;有序模型无需正态性假设,对极端值不敏感。
    • 三次重复测量,CLMM可引入受试者随机截距处理组内相关。
    • 可同时纳入协变量(干预强度、性别),回答“在控制协变量后是否存在下降趋势”。
  • 模型设定(示意)

    • 令Yij ∈ {0,…,10}为第i名受试者在时间j的疼痛评分(j ∈ {0周, 2周, 4周})。
    • 累积logit模型: logit P(Yij ≤ k) = θk − [βtime·timej + βint·Intensityi + βsex·Sexi + ui], k = 0,…,9 其中ui为受试者随机截距,θk为阈值。time可按周数作为连续变量(0, 2, 4)。
    • 研究假设(趋势检验): H0: βtime = 0;H1: βtime < 0(时间每增加2周,疼痛向较低等级移动)。 可用Wald检验或似然比检验;报告双侧p值并给出方向,或按方案预先声明单侧检验。
  • 协变量处理

    • 干预强度(轻/中/重):作为有序变量。可先按1/2/3线性编码检验单调效应;如线性不合适,改为因子处理。
    • 性别(男/女):二分类名义变量。
    • 可加入时间×干预强度交互作为探索(若关切不同强度的趋势差异),并在主分析中以无交互为主。
  • 报告与解释

    • 主要效应:时间的比值比 ORtime(每增加2周,评分处于“较高疼痛”类别的累积优势比变化)。ORtime < 1 表示下降趋势。
    • 补充:各时间点评分分布的模型化预测概率、预测中位数或期望评分(基于PO模型的期望值)及其区间。
    • 全局时间效应(若将时间作因子)与线性对比:先检验全局,再报告线性对比的p值。
  • 假设与诊断

    • 比例优势(平行线)假设:用模拟残差或得分检验评估;若违反,可采用
      1. 有序GEE的部分比例优势模型(partial proportional odds)配稳健标准误;
      2. 或将时间作因子(放宽PO对时间的限制),仍以线性对比检验趋势。
    • 拟合与异常:检查随机效应分布与高影响个体;可用稳健(夹心)标准误或引导法作为稳健性增强。
  • 缺失与相关性

    • CLMM在“可忽略性缺失/MAR”下可用全部可用数据;GEE配稳健标准误对相关结构设定不敏感(建议交换型或不结构化)。

二、敏感性/验证分析(不依赖分布、无协变量)

  • Page’s L 趋势检验(单侧)

    • 适用:同一受试者在有序时间点上的秩,检验单调下降(基线 ≥ 2周 ≥ 4周,至少一个严格不等)。
    • 优点:对离群值不敏感,专门针对有序条件下的单调趋势,功效高于Friedman在存在单调备择时。
    • 报告:L统计量与单侧p值;可附加效应量(如标准化L或报告下降方向的达成比例)。
  • Friedman检验 + 配对Wilcoxon事后分析

    • Friedman检验:三时点总体差异的组内非参数检验。
    • 事后:成对Wilcoxon签名秩检验(基线vs2周、2周vs4周、基线vs4周),多重比较校正(Holm)。
    • 效应量:r或Cliff’s delta(配对)。

三、可视化与报告要点

  • 可视化:个体轨迹图(薄线)+各时间点中位数和IQR;或堆叠条形图展示0–10分布的右移→左移。
  • 主要结果:时间的OR(每2周)、95%CI、p for trend;协变量调整后的预测分布/中位数变化。
  • 辅助:Page’s L 单侧p值;Friedman及配对差异的中位数变化与效应量。

四、实现建议(简述)

  • CLMM:R的ordinal::clmm 或 brms/Stan贝叶斯有序混合模型;时间按0,2,4数值编码检验线性趋势;稳健SE可用引导。
  • 有序GEE:geepack + ordinalgee或multgee,使用累积logit与夹心稳健SE;可做部分比例优势。
  • 非参数:DescTools::PageTest 或 PMCMRplus 的实现;Friedman与配对Wilcoxon为基础函数或coin包。

结论

  • 在n=68、三次重复测量、非正态与潜在离群值、需调整协变量的前提下,优先采用“有序累积对数几率混合效应模型(或有序GEE)”对时间进行线性下降趋势检验,并纳入干预强度与性别。以Page’s L 单侧趋势检验作为不含协变量的敏感性分析,Friedman+Wilcoxon作为补充。这样既满足设计与数据性质,又对模型假设与稳健性有良好控制。

示例详情

解决的问题

让你用一句研究问题,快速拿到“该用哪种统计检验、为何适用、如何准备与呈现结果”的完整分析方案。帮助产品、运营、研究、教育、医疗等岗位,以更少时间做出更可信的结论,统一团队方法标准,提升转化与决策效率。

适用用户

学术研究者(硕博/课题组)

快速选择合适统计检验、规范报告结构、避免审稿常见质疑,缩短投稿与答辩周期。

产品与运营分析师

在A/B测试与转化分析中,一键匹配检验与样本前提检查,生成解读要点,提升发布决策效率。

医疗与临床研究人员

为随机对照或队列数据选择恰当检验,提示前提验证与替代方案,支持方案设计与伦理材料撰写。

特征总结

一键匹配统计检验,依据研究问题与变量结构,快速推荐适配方案并标注适用边界。
自动检查数据前提,提醒正态性、方差齐性与独立性,并给出简单验证与替代。
场景化分析建议,覆盖A/B实验、问卷与观察研究,提供解读要点与风险提示。
结构化输出步骤,生成检验流程、统计量报告模板与可视化建议,直接用于写作。
多语言专业表述,一键切换中文或英文,适合论文、邮件和跨团队沟通场景。
参数化定制偏好,可设单双尾、置信水平与效应方向,自动调整推荐与呈现。
误用防护提醒,识别多重比较与样本不平衡等问题,提供纠正策略与替代检验。
方案对比与决策,罗列可选检验的适用条件、优缺点与结果含义,助力快速取舍。
可视化指导,建议箱线图、QQ图等搭配展示,提升报告可读性与审稿通过率。
轻量化上手体验,按提示输入研究问题即可获得可执行步骤,迅速落地分析。

如何使用购买的提示词模板

1. 直接在外部 Chat 应用中使用

将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。

2. 发布为 API 接口调用

把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。

3. 在 MCP Client 中配置使用

在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。

AI 提示词价格
¥20.00元
先用后买,用好了再付款,超安全!

您购买后可以获得什么

获得完整提示词模板
- 共 277 tokens
- 5 个可调节参数
{ 研究问题 } { 主要变量名称 } { 每个变量的数据类型 } { 分组或实验条件 } { 样本量或观测数 }
获得社区贡献内容的使用权
- 精选社区优质案例,助您快速上手提示词
使用提示词兑换券,低至 ¥ 9.9
了解兑换券 →
限时半价

不要错过!

半价获取高级提示词-优惠即将到期

17
:
23
小时
:
59
分钟
:
59