场景化问题设计指南

0 浏览
0 试用
0 购买
Sep 28, 2025更新

根据特定主题或场景设计场景化问题,提供精准建议。

示例1

以下为基于初中科学“能量守恒”的情境化测评题与组卷提示。设计遵循基于证据的测评原则,确保任务—证据—论证一致性,注重对核心概念“能量既不会凭空产生也不会凭空消失,只会从一种形式转化为另一种形式或从一处转移到另一处”的有效测量(NGSS Lead States, 2013;NRC, 2012),并参照测量标准与评分一致性规范(AERA, APA, & NCME, 2014)。

一、评估目标与对齐
- 核心概念:PS3.B 能量守恒与能量转移;交叉概念:系统与系统模型;科学实践:构建论证并用证据支持。
- 绩效期望对齐(示例):MS-PS3-5(动能变化与能量转移的证据性论证),MS-PS3-3(设计装置以最小化或最大化能量转移)。
- 认知层级(Anderson & Krathwohl, 2001):理解(U)、应用(A)、分析/评价(An/E)。

二、情境材料(提供给学生)
在一次科学探究活动中,学生甲骑自行车从一段斜坡顶端匀速起步下滑。车轮上装有一个小型发电机(俗称“车灯发电机”)连接3 W车灯。已知:
- 骑行者与自行车的总质量 m = 70 kg
- 斜坡高度差 h = 10 m
- 近似取重力场强 g = 10 N/kg
- 下坡过程持续约 30 s,车灯全程点亮
- 在斜坡底端,学生甲短暂停车等待红灯,此过程靠闸把车完全刹停
- 监测显示下坡末端车速约 v = 8 m/s

三、试题设计(场景化综合题,满分20分)
题1(单选,U,2分)
为在本问题中正确应用能量守恒原理,请选择“系统”的恰当边界。
A. 仅自行车车架
B. 自行车和骑行者
C. 自行车、骑行者、斜坡、周围空气以及发电机-车灯电路
D. 仅发电机与车灯
正确答案:C

题2(计算,A,4分)
计算骑行者—自行车系统从坡顶到坡底引起的重力势能变化ΔEp,并给出数值。(取 g = 10 N/kg)
期望作答要点:ΔEp = mgh = 70×10×10 = 7000 J。

题3(计算与解释,A→An,4分)
已知坡底车速 v = 8 m/s,求此时系统的动能 Ek,并据此完成下列能量核算:
- 车灯在30 s内获得的电能 E电(车灯功率3 W)。
- 说明若不立即刹车,剩余能量主要以何种形式存在;若刹车至静止,这部分能量将转化为何种形式。
期望作答要点:
- Ek = 1/2 mv^2 = 0.5×70×(8^2) = 2240 J
- E电 = P·t = 3×30 = 90 J
- 不刹车:剩余为车辆的机械能(主要为动能);刹车:动能转化为制动器及车轮、路面等的内能(热),并有少量声能。

题4(判断+简答,U→An,4分)
判断对错并说明理由:
“在该过程中,部分能量因摩擦和空气阻力而消失了,所以总能量减少。”
期望作答要点:错误。能量未消失而是转移/转化为周围环境的内能(空气、轮胎、刹车片、路面升温等)及声能,系统—环境合并后能量守恒(NGSS Lead States, 2013;Driver et al., 1994)。

题5(数据归因与估算,An,4分)
基于题2与题3的结果,对从坡顶到完全刹停的全过程进行能量归因并进行数量级估算:将7000 J 的重力势能大致分配为“电能”“动能(若未刹停时的瞬时存储)”“最终作为热的能量”。给出比例或数值近似,并说明估算依据。
期望作答要点(示例估算路径):
- 电能约90 J(≈1.3%)
- 若考虑刹停:动能最终亦转化为热2240 J
- 剩余约7000−(90+2240)≈4670 J 转化为环境内能(空气阻力、滚动摩擦等)
- 合理表达比例与不确定性,并说明基于给定数据的估算逻辑。

题6(设计改进与权衡,E,2分)
提出一种可增加电能输出的改进方案,并说明不违反能量守恒的理由及对骑行体验可能产生的影响。
期望作答要点(示例):提高发电机磁场强度或采用更高功率负载可增加电能输出,但会增大机械阻力,使下坡速度降低或需更长时间,能量来自原有重力势能并更多地被电路汲取,符合能量守恒;需权衡照明需求与骑行阻力。

四、评分量规(要点式,供阅卷一致性参照)
- 题1:选C得2分;其他0分。
- 题2:过程与单位正确2分,数值正确2分(容许6900–7000 J的四舍五入范围)。
- 题3:Ek 数值正确2分;E电数值正确1分;能量去向表述符合守恒1分。
- 题4:判断错误1分;理由论证包含“转化为内能/热,系统—环境合并后守恒”2分;措辞明确1分。
- 题5:完成三类能量的数量级分配2分;电能比例或数值合理1分;对不确定性与依据的说明1分。
- 题6:改进方案可行1分;阐明阻力—输出权衡且不违背守恒1分。
评分说明:允许等效表述;单位错误每题扣1分至多;计算可采用 g=9.8 N/kg,给等值分。

五、干扰项与常见误解对照(用于命题与诊断)
- 系统边界狭隘化(仅“车”或“灯”):不利于正确核算能量流(NRC, 2012)。为此在题1设置A/B/D干扰项。
- “能量被消耗/消失”表述:混淆能量守恒与有用能(可用能/有序能)的损失,题4针对性纠正(Driver et al., 1994)。
- 将效率理解为“提高输出不改变阻力”:忽视能量来源与权衡关系,题6要求阐明代价。
- 将动能与电能重复计入或忽略刹车阶段能量转化:题3、题5通过阶段性核算加以澄清。

六、组卷与实施提示
- 蓝图覆盖与权重:U(题1、4)约30%;A(题2、3)约40%;An/E(题5、6)约30%。总分20分,建议合卷占能量单元测试的30%。
- 难度与区分度:题1、2中等偏易;题3、4中等;题5、6中等偏难。目标难度系数(p)约0.45–0.75;注意通过试测估计区分度(点二列相关≥0.25为宜)。
- 时间与工具:建议作答时间15–18分钟;允许简单计算器;统一常数取值说明(g=10 N/kg)。
- 证据中心化设计(ECD):主张—证据—任务一致性;题2–5提供定量与定性证据链,题6考查权衡性论证(AERA et al., 2014)。
- 公平性与可访问性:语言简洁避免文化偏见;为有需要学生提供单位与符号表;图示可选(非必需);注意不因交通工具经验差异而引入构念无关差异。
- 评分一致性:采用要点式量规与示例答案,共同培训阅卷员;进行双评与仲裁;抽取≥10%样本复核。
- 结果解释:提供学习反馈维度(系统边界、能量核算、能量去向表达、设计权衡);与教学对接,针对“能量消失”类误解提供矫正性教学。

七、标准答案要点汇总
- 题1:C
- 题2:7000 J
- 题3:Ek=2240 J;E电=90 J;不刹车:能量留在动能;刹车:动能→热(及声)
- 题4:错误;理由见上
- 题5:电≈90 J;刹停后热≈2240 J(来自动能)+≈4670 J(阻力等),总≈7000 J
- 题6:示例见上(提高磁场/再生阻力等并说明权衡)

参考文献(APA第7版)
- AERA, APA, & NCME. (2014). Standards for educational and psychological testing. American Educational Research Association.
- Anderson, L. W., & Krathwohl, D. R. (Eds.). (2001). A taxonomy for learning, teaching, and assessing: A revision of Bloom’s taxonomy of educational objectives. Longman.
- Driver, R., Squires, A., Rushworth, P., & Wood-Robinson, V. (1994). Making sense of secondary science: Research into children’s ideas. Routledge.
- NGSS Lead States. (2013). Next Generation Science Standards: For states, by states. Achieve, Inc.
- National Research Council. (2012). A framework for K–12 science education: Practices, crosscutting concepts, and core ideas. The National Academies Press. https://doi.org/10.17226/13165

说明:本情境化测评聚焦能量守恒的系统性核算、能量去向的正确表达,以及工程性权衡的初步理解,能有效诊断初中阶段的关键概念与常见误解,并为教学提供可操作的反馈依据。

示例2

一线销售岗位情境化行为面试题与绩效观察点设计

1. 设计原则与证据基础
- 采用高结构化的情境式与行为描述式面试,依据实证研究,较非结构化面试具有更高的预测效度和更好的公平性。元分析表明结构化面试与工作绩样本对未来工作绩效的修正后平均预测效度约为0.51与0.54(Schmidt & Hunter, 1998)。情境式面试通过标准化情境与评分规则提升测评质量(Latham et al., 1980),行为描述式面试基于“行为一致性原则”提升效度(Janz, 1982)。结构化控制可降低晕轮效应与评估误差(Campion et al., 1997)。行为锚定评分量表(BARS)可提升评分一致性与可解释性(Smith & Kendall, 1963)。
- 本题设置采用双证据路径:情境化口头作答与角色扮演微型工作样本,辅以行为锚定评分,以增强证据充分性与评分信度。

2. 场景描述(面向一线B2B区域销售,可按行业微调)
情境:月度目标完成率为68%,尚差关键订单。最大在谈客户A由采购主导,提出需15%额外折扣(超出公司可授权上限5%)。竞争对手近期以低价切入并承诺免费实施。公司库存对本季度热销配置紧张,仅能保障30台,客户意向量为50台。法务提醒近期合规检查趋严,价格审批与赠予政策需严格遵循。请在不违背公司政策的前提下推进成交,同时兼顾利润与长期关系。
限制条件:不能承诺超授权折扣或未审批的让利;需在48小时内给客户明确方案并推动决策节点;需与售后、供应链和财务协调资源。

3. 面试题干与探询(结构化提问顺序)
主问题(情境式):请详细说明您将如何在上述情境下推进成交。请按“目标—诊断—策略—执行—复盘”的逻辑展开,明确每一步的具体行动、与谁沟通、何时完成以及预计产出。
追问提纲(标准化探询):
- 利益相关方识别与优先级:谁影响决策?各自KPI与可能的反对点是什么?您将如何获得他们的支持?
- 需求验证与价值主张:您将如何验证客户真实的决策标准(价格、总拥有成本、风险、交付)?不依赖降价,您有哪些价值杠杆(如分期、配置替代、服务级别、实施排期、培训/成功保障)?
- 竞争与合规:如何正面应对竞品免费实施的承诺而不诋毁对手?如何确保价格与让利在授权与审批链内?
- 资源协调与供需:在库存紧张条件下如何拆分批次、替代配置或与供应链协同以满足关键场景需求?
- 计划与度量:48小时内的里程碑是什么?如何判定成交概率变化(具体领先指标)?若失败,复盘与风险对策为何?

4. 角色扮演补充(5–7分钟微型工作样本)
设置:评估者扮演客户采购与技术双人角色,给出三类异议(价格、实施风险、交付期)。候选人需现场进行需求澄清、价值呈现、异议处理与推进下一步。
标准化异议脚本要点:要求15%折扣;质疑实施成本与切换风险;强调交付窗口固定;对“批次供货+服务保障”持观望。

5. 评分维度与行为锚定(BARS,5点制;1=低到5=高)
维度1 需求洞察与利益相关方管理
- 5分:系统识别并验证决策链(如采购/技术/财务/使用部门),用客户语言复述并确认3项以上决策标准;区分显性与隐性需求并提出验证问题。
- 3分:能识别关键两类角色与主要标准但验证不充分。
- 1分:将议题简化为“价格/采购”单一维度,无验证。
维度2 价值呈现与异议处理
- 5分:提出至少两种非降价方案(如分期/配置替代/服务级别协议/成功里程碑付款),用量化TCO或风险降低证据对比竞品,运用探询与同理技巧将异议转化为条件化成交测试。
- 3分:能给出一种替代方案,部分量化价值,异议处理以解释为主。
- 1分:主要诉诸进一步降价或回避异议。
维度3 商务合规与价格治理
- 5分:清晰引用授权边界与审批路径,主动提出合规替代(如捆绑授权、回扣避免、书面条款),拒绝超授权承诺并提供可行路径。
- 3分:口头表示遵循政策但缺少具体路径与文件化。
- 1分:暗示或承诺超授权让利/非合规操作。
维度4 跨部门协同与供需解决
- 5分:提出可执行的供货拆分方案(如30台本季+20台下月并配临时替代配置),定义内部RACI并约定SLA与里程碑。
- 3分:能识别需协同的部门但行动方案不具体。
- 1分:忽视库存限制或将问题外推。
维度5 计划与数据运用
- 5分:设定48小时内可验证的里程碑(如技术评审预约、经济采购人会谈、法务条款草拟),在CRM/清单中量化成交概率变动与关键领先指标,并定义失单触发的备选路径。
- 3分:有里程碑但度量与复盘框架不清。
- 1分:泛化表述,无可验证计划。

总评分规则:各维度权重可设为2:3:2:2:1(偏重价值与异议处理)。建议双评委独立评分后合议,差异>1分的维度需基于行为证据复核。

6. 绩效观察点与证据采集要点
- 可观察行为清单
  - 澄清与复述:能用客户术语复述痛点并获得确认。
  - 定量化能力:以数据支持TCO、风险、产出影响(如停机成本、实施人天)。
  - 条件化成交测试:设置若满足X条件则推进Y动作的闭合式问题。
  - 合规表述:明确“在我授权范围内可提供……;超出部分需走审批,预计时长……我可今天发起”。
  - 推进下一步:在会话内锁定时间、参与人、目标与材料清单。
- 正向证据示例
  - “若我们将实施费用按里程碑分摊,并由我方提供上线成功指标保证,是否能在本周内安排技术与采购的联合评审?”
  - “基于您对交付窗口的约束,我们建议先行供货30台以覆盖关键门店,其余20台采用替代配置并在下月切换不产生二次实施成本。”
- 负向/红旗
  - 暗示绕过审批线下返利;贬损竞争对手;未能识别经济采购人;未定义具体下一步。
- 记录规范
  - 仅记录可见行为与原话,不做性格推断;采用情境—行为—结果笔记模板;标注时间戳和追问触发点以便复核。

7. 评分与决策阈值
- 合格基线:维度2与维度3不得低于3分;总加权分≥3.5方可进入下一轮。
- 信度控制:至少两名评估者,目标组内相关或ICC≥0.70;评分前进行锚点校准,评分后进行差异复核。
- 组合证据:与简短角色扮演表现取加权平均(建议面试:角色扮演=60:40),以提升效度(Schmidt & Hunter, 1998)。

8. 反偏差与公平性控制
- 统一提问、统一追问触发条件与时间控制;禁止随意扩展非工作相关话题(Campion et al., 1997)。
- 使用标准化评分表与锚点示例以降低晕轮、首因/近因及相似性偏差。
- 监测评分分布与不利影响指标,对异常评估者进行再培训。
- 题项与维度均与岗位关键KSAO直接对应,确保工作相关性以支持内容效度与推断合法性(Latham et al., 1980)。

9. 试点与校准建议
- 先在10–20名现岗员工中进行试测,检验区分度与评分者一致性;根据行为证据饱和度微调追问。
- 6个月后将总分与销售领先/滞后指标(如90天赢单率、毛利率偏差、审批违规率)进行效标关联,目标相关系数≥0.30,并据此优化权重与锚点描述。

参考文献(APA)
- Campion, M. A., Palmer, D. K., & Campion, J. E. (1997). A review of structure in the selection interview. Personnel Psychology, 50(3), 655–702. https://doi.org/10.1111/j.1744-6570.1997.tb00709.x
- Janz, T. (1982). Initial comparisons of patterned behavior description interviews versus unstructured interviews. Journal of Applied Psychology, 67(5), 577–580. https://doi.org/10.1037/0021-9010.67.5.577
- Latham, G. P., Saari, L. M., Pursell, E. D., & Campion, M. A. (1980). The situational interview. Journal of Applied Psychology, 65(4), 422–427. https://doi.org/10.1037/0021-9010.65.4.422
- Schmidt, F. L., & Hunter, J. E. (1998). The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 85 years of research findings. Psychological Bulletin, 124(2), 262–274. https://doi.org/10.1037/0033-2909.124.2.262
- Smith, P. C., & Kendall, L. M. (1963). Retranslation: A technique for evaluating the meaningfulness of rating scales. Journal of Applied Psychology, 47(2), 149–154. https://doi.org/10.1037/h0040936

示例3

目标与原则
- 目标:围绕移动应用“新功能”的任务可用性,设计一条情境化、无偏见的问卷题,用于收集用户在真实使用场景中的任务难易感知。该题应聚焦单一构念(任务难易度),避免引导性与双重问法,并与可用性核心维度(有效性与效率)相关(ISO 9241-11:2018)。
- 依据:采用任务后单题难易度量表(post-task single-item ease question)可有效捕捉任务难度知觉,并与客观指标(成功率、用时)相关,且负担低、信度与效度良好(Sauro & Dumas, 2009)。题干与选项措辞遵循问卷设计的认知过程模型与无偏见表述原则,减少同意性偏差、引导性形容词、模糊指代与社会期许影响(Tourangeau, Rips, & Rasinski, 2000; Dillman, Smyth, & Christian, 2014; Krosnick & Presser, 2010)。

场景化问卷题(优化措辞版)
- 使用场景描述(中立、目标导向):
  设想你正在应用内浏览一篇文章,准备在通勤途中继续阅读,但届时可能无法连接网络。请使用该应用的新功能,将当前文章保存为离线可阅读的内容。
- 题干(单一构念、避免引导):
  完成上述离线保存任务对你而言有多容易或困难?
- 回答量表(对称、行为中立、端点标注,含“不可适用”以降低测量误差):
  1 非常困难
  2 困难
  3 略困难
  4 既不困难也不容易
  5 略容易
  6 容易
  7 非常容易
  选项:不适用/未尝试

措辞与偏差控制说明(简要证据化论证)
- 单一构念与反双重问法:仅测量“任务难易度”,不混入满意度、理解度或效率等其他维度,避免双重问法导致的效度损失(Krosnick & Presser, 2010)。
- 情境具体而不引导:描述用户目标与客观约束(通勤与可能断网)而不赋予功能正负评价词(如“便捷、智能、复杂”),减少评价性引导(Dillman et al., 2014)。
- 避免同意性偏差:不采用“同意/不同意”格式,改用难易度判断,降低同意性反应倾向(acquiescence)(Krosnick & Presser, 2010)。
- 量表对称与端点锚定:7 点对称量表覆盖难—易连续体,并明确端点语义,提升反应一致性与可比性;该形式与任务后单题量表的实践证据一致(Sauro & Dumas, 2009)。
- 与可用性构念对齐:难易度反映任务有效性与效率的主观整合评估,符合 ISO 9241-11 对可用性的定义构成(ISO 9241-11:2018)。
- 附“不可适用/未尝试”:为不符合场景或未执行任务的受试者提供退出路径,降低无效或随机作答(Dillman et al., 2014)。

参考文献(APA 第7版)
- Dillman, D. A., Smyth, J. D., & Christian, L. M. (2014). Internet, Phone, Mail, and Mixed-Mode Surveys: The Tailored Design Method (4th ed.). Wiley.
- ISO. (2018). ISO 9241-11:2018 Ergonomics of human-system interaction—Usability: Definitions and concepts. International Organization for Standardization.
- Krosnick, J. A., & Presser, S. (2010). Question and Questionnaire Design. In P. V. Marsden & J. D. Wright (Eds.), Handbook of Survey Research (2nd ed., pp. 263–313). Emerald.
- Sauro, J., & Dumas, J. S. (2009). Comparison of three one-question, post-task usability questionnaires. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (pp. 1599–1608). ACM.
- Tourangeau, R., Rips, L. J., & Rasinski, K. (2000). The Psychology of Survey Response. Cambridge University Press.

适用用户

教师与教研人员

将课程目标转化为情境化测评题,匹配难度与题型,快速组卷与形成性评价,提升课堂反馈质量。

人力资源与培训负责人

围绕岗位场景设计行为面试题与绩效评估条目,给出观察点建议,统一标准,缩短评估准备时间。

市场与用户研究者

把研究主题转为无偏见的情境化问卷题,优化措辞与背景设定,提高回收率与结论可信度。

客服与运营管理者

为新人训练与质检复盘设计真实服务场景问题,明确评价线索,沉淀标准话术与处置策略。

销售与售前团队

构建行业化案例问答,评估需求理解与解决方案掌握度,统一赋能内容,支撑资格认证。

教育研究生与学术研究者

按学术风格生成场景化问题与说明,提供引用指引,辅助研究设计与伦理审查材料准备。

解决的问题

为教育评测、人力绩效、用户研究与客户体验等场景,提供一条可复用、可规模化的「场景化问题生成」提示词。通过明确专家视角、输入与输出、语言与风格约束,帮助用户把模糊主题/业务场景快速转化为精准、可落地的问题与专业建议,减少偏题与冗余,提升问题质量与命中率,缩短准备时间,推动调研、测评与培训项目更快达成目标与转化。

特征总结

一键生成贴合主题的场景化评估问题,直接用于测试、问卷或绩效讨论。
依据目标与受众自动建议题型与结构,减少试错,快速搭建测评框架。
自动优化表述与情境设定,确保问题具体可测,避免含糊与引导性措辞。
支持多语言输出与本地化语气,轻松覆盖跨国教学、全球招聘与国际调研。
提供基于证据的专业建议与引用指引,测评更有理据,便于对外说明与留档。
聚焦准确与相关,过滤冗余信息,帮助你快速落地可执行的评估方案。
按业务目标定制评分维度与观察点建议,对齐KPI与能力模型,便于评估。
支持按场景批量生成多版本问题,便于对比试用与难度分层管理。
输出结构清晰、逻辑严谨,可直接粘贴进试卷、问卷、培训脚本与规范。
坚持审慎与事实核验风格,降低偏差与误导,提升数据与结论的可信度。

如何使用购买的提示词模板

1. 直接在外部 Chat 应用中使用

将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。

2. 发布为 API 接口调用

把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。

3. 在 MCP Client 中配置使用

在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。

¥15.00元
平台提供免费试用机制,
确保效果符合预期,再付费购买!

您购买后可以获得什么

获得完整提示词模板
- 共 236 tokens
- 2 个可调节参数
{ 输入主题或场景 } { 输出语言 }
自动加入"我的提示词库"
- 获得提示词优化器支持
- 版本化管理支持
获得社区共享的应用案例
限时免费

不要错过!

免费获取高级提示词-优惠即将到期

17
:
23
小时
:
59
分钟
:
59