数据字典条目撰写

5 浏览
1 试用
0 购买
Sep 22, 2025更新

为指定数据列撰写数据字典条目,提供专业咨询建议。

示例1

数据字典条目:首购日期

- 字段中文名:首购日期
- 字段英文名:first_purchase_date
- 所属主题/域:客户(Customer)/ 客户生命周期
- 粒度:客户粒度(customer_id 唯一确定一条记录)
- 数据类型与格式:DATE(YYYY-MM-DD)
- 时区口径:以交易发生地业务时区为准(默认 UTC+08:00);跨地区业务需在计算前完成时区统一

业务定义
- 客户在本企业范围内首次完成“有效购买”的日期。有效购买指订单已成功支付且未被全额退款或取消。用于刻画客户生命周期起点,常用于新客判定、留存与分群分析。

默认计算口径
- 交易范围:商品/服务销售订单
- 成交时间:以支付成功时间 paid_at 为准;若无 paid_at 且以收货/完成作为成交依据的业态,可取完成时间 finished_at,但需在口径中保持一致
- 有效订单条件:
  - 订单状态属于已支付/已完成(不含取消、关闭)
  - 非全额退款(全额退款订单剔除;部分退款订单保留)
  - 订单金额 amount_payable > 0(剔除纯0元、全额优惠、纯积分兑换、仅使用代金券且应收为0的订单)
  - 订单类型不包含:充值、礼品卡购买、内部测试单、虚拟冲销单
- 身份合并:如存在账号合并/多渠道统一客户ID,以统一后的 customer_id 取最早有效 paid_at 日期
- 拆单/并单:若一次购买被拆分多个子单,以最早一个有效子单的 paid_at 计入
- 预售/订金场景:以尾款支付成功时间计入(订金支付不计为首购)
- 退款时序:若首购订单后被全额退款且无其他有效订单,则首购日期置空;若存在更早被退款的订单且之后有有效订单,则以后者的最早支付日为首购日期

来源与血缘(示例)
- 源表:dwd_order_header(或事实表 fact_sales_order)
- 关键字段:customer_id, order_id, order_type, order_status, paid_at, finished_at, amount_payable, amount_refunded, is_test
- 生成逻辑(概念性):
  1) 从订单事实中过滤有效订单(按上述口径)
  2) 以 customer_id 分组,取最小的 paid_at 的日期部分
  3) 写入客户主题表或客户快照表的 first_purchase_date

数据刷新
- 刷新频率:每日增量+周期性全量回溯(建议每周回溯近90天以处理迟到退款/状态更正)
- 生效延迟:考虑支付对账与退款回填延迟,T+1 至 T+2 稳妥

缺失与默认值
- 无有效订单的客户:首购日期为空(NULL)
- 禁止使用占位日期(如 1900-01-01)

数据质量校验
- 首购日期不应晚于当前日期
- 同一 customer_id 首购日期应唯一且不可变更,除非订单状态回溯导致口径重算
- 首购日期应大于等于客户首次识别日期(若小于且存在游客购买后注册,需确认ID合并逻辑)
- 核对规则:样本抽检首购订单应满足有效订单条件;全额退款回溯后样本应被移除

常见陷阱与处理
- 时区未统一导致跨日偏移:统一在 ETL 前转换至业务时区
- 将下单时间或发货时间误作成交时间:必须以 paid_at 为主口径
- 未剔除全额退款/测试单/0元单:严格按口径过滤
- 多渠道客户未合并:确保使用统一客户主数据(CDP/MDM)映射

应用场景
- 新客判定与首购 Cohort 分析
- RFM、CLV、留存与复购漏斗
- 精准营销与拉新投放归因起点

口径负责人与变更
- 口径负责人:数据治理/BI 负责人
- 版本与生效:v1.0(生效日期:填写发布日)
- 变更原则:任何口径调整需在数据字典与下游报表同步更新并进行影响评估

示例2

数据字典条目:订单金额

- 名称(中文/英文标识)
  - 订单金额 / order_amount

- 定义(业务口径)
  - 订单头粒度的“商品实付金额(含税)”,即消费者在支付成功时针对商品本身实际支付的金额:
    - 含:商品含税成交价合计
    - 扣除:商品行级与订单级的折扣、优惠券、满减等
    - 不含:运费、包装费、小费、保险、服务费等非商品金额
    - 不随退款变动(退款相关见“订单退款金额”)

- 计算逻辑(标准公式)
  - 行实付金额(含税)= 数量 × 含税成交单价 − 行级优惠
  - 订单金额 = Σ 行实付金额(含税) − 订单级优惠
  - 结果四舍五入到分(2 位小数)

- 粒度与主键
  - 粒度:订单头
  - 主键:order_id

- 适用状态与时间口径
  - 适用订单状态:支付成功(已支付)
  - 时间口径:以支付成功时间(pay_success_time)作为该金额的生效时间
  - 未支付或已关闭订单:该字段为空(NULL)

- 币种与单位
  - 单位:元
  - 币种:记录订单币种(currency_code)
  - 如涉及多币种,可同时维护基准币种金额(如 CNY),转换汇率基于支付成功时间取数,来源于企业标准汇率表

- 数据类型与取值范围
  - 数据类型:DECIMAL(18,2)
  - 取值范围:≥ 0.00
  - 允许极小的误差容忍(±0.01)用于明细汇总一致性校验

- 汇总与去重规则
  - 报表汇总使用 SUM(order_amount)
  - 跨明细表关联时,确保按订单去重(distinct order_id),避免订单头与订单行重复计数导致放大

- 与相近指标的区分
  - 订单原价金额:未扣减任何优惠的商品金额
  - 订单应付金额:商品金额(含税、折后)+ 运费等非商品金额
  - 支付金额:应付金额中由支付渠道实际扣款的总额(可能包含运费等)
  - 订单退款金额:支付后发生的退款累计金额
  - 订单净收入金额:支付金额 − 退款金额(具体以财务口径为准)

- 退款与取消处理
  - 本字段不随部分或全额退款变化
  - 全额退款订单在“订单金额”仍保留原实付额;分析净收入请使用“订单净收入金额”或结合退款字段

- 数据来源与血缘(示例,按企业实际系统替换)
  - 源系统:交易中心(OMS/TMS)
  - 明细表:src.order_items(成交单价、数量、行级优惠、税额)
  - 头表:src.orders(订单级优惠、订单状态、支付成功时间、币种)
  - 汇率表:dim.fx_rates(以支付成功时间取对应币种汇率)
  - 数仓分层:dwd_order_item → dwd_order_head → dws_order_summary

- 数据质量校验
  - 校验1:订单头金额 ≈ 明细行实付金额之和(误差 ≤ 0.01)
  - 校验2:订单金额 ≥ 0,currency_code 非空
  - 校验3:仅对支付成功订单产出金额;未支付订单为 NULL
  - 校验4:重复关联校验(order_id 唯一)

- 权限与合规
  - 本字段为交易敏感数据,涉及用户维度联表时需遵循最小权限原则与隐私合规要求

- 示例
  - 三个明细行(含税成交单价 × 数量 − 行级优惠):100×1−10=90;50×2−0=100;30×1−5=25,合计215
  - 订单级优惠:15
  - 订单金额 = 215 − 15 = 200.00 元(不含运费等)

- 版本与负责人
  - 版本:v1.0
  - 口径负责人:数据治理/商业智能负责人(待指派)
  - 口径变更:如需变更是否含税、是否包含运费、是否随退款调整,需走变更评审并全量回溯或维护新指标名

结论与使用建议
- 本字段用于衡量商品层面的“实付销售额”,适合作为销售额的统一口径用于营销、转化与商品分析。
- 涉及收入确认、财务对账或跨币种分析时,应配合基准币种转换与退款字段,避免误用导致口径偏差。

示例3

Data Dictionary Entry: New Customer Flag

- Business Term: New Customer Flag
- Technical Name: new_customer_flag
- Definition (Business): Identifies whether a transaction is the customer’s first successful purchase with the company. Value = 1 (true) if the order is the earliest qualifying paid order for the resolved customer; otherwise 0 (false).
- Purpose/Use: Distinguishes acquisition vs. repeat sales; supports funnel analysis, marketing ROI, CAC/LTV segmentation, and new-to-company revenue reporting.
- Data Type / Domain: Boolean (BIT); Allowed values: 1 or 0 (no nulls).
- Grain: Transaction/Order-level (one flag per order_id).
- Scope: Enterprise-wide across brands and channels after customer identity resolution. For brand-limited needs, use New-to-Brand Flag.
- Calculation Logic:
  1) Resolve customer identity to customer_id (post-identity graph).
  2) Define qualifying order: order_status in {‘Paid’, ‘Fulfilled’, ‘Completed’}; exclude canceled, voided, failed payments; exclude test/internal orders.
  3) For each customer_id, find min(qualified_paid_at) as first_paid_at.
  4) Set new_customer_flag = 1 when order_paid_at = first_paid_at for that customer_id; else 0.
- Inclusion/Exclusion Rules:
  - Include only monetary purchases (exclude $0 orders unless business policy states otherwise).
  - If an order is fully refunded after payment, the flag on that order remains 1 (represents first conversion); net revenue is handled separately.
  - Same-day/tie handling: If multiple qualified orders share the same paid timestamp for the same customer, flag the earliest by order_created_at or lowest order_id as 1; others as 0.
  - Guest checkouts must be linked to the resolved identity; otherwise treated as separate customers.
- Source Systems / Lineage:
  - Primary fact: fact_orders (fields: order_id, customer_id, paid_at, order_status, gross_amount, is_test, channel).
  - Dimensions/services: dim_customer (identity resolution), ref_order_status.
- Refresh / Latency:
  - Recomputed daily after ETL completes and identity resolution converges. Retroactive changes can occur when identities merge.
- Data Quality Checks:
  - Uniqueness: Exactly one order per customer_id with new_customer_flag = 1.
  - Completeness: No null values.
  - Reasonableness: New-order rate within expected historical bounds; alert on deviations.
- Ownership:
  - Data Product Owner: Sales Analytics
  - Data Steward: BI Data Governance
- Example:
  - Customer C001 qualified orders: 2025-08-01 (Order 123), 2025-08-10 (Order 456). Order 123 → new_customer_flag = 1; Order 456 → 0.
- Related Fields:
  - first_order_date (customer-level)
  - new_to_brand_flag (brand scope)
  - returning_customer_flag
  - acquisition_channel

Key points:
- This flag marks only the first qualifying paid order per resolved customer across the enterprise.
- It is sensitive to identity resolution; merges can retroactively change historical flags.
- Use brand-scoped “new_to_brand_flag” for brand-specific acquisition reporting.

适用用户

数据分析师

为每个新字段快速生成清晰口径、取值规则与应用示例,减少复盘争议。基于统一数据字典开展分析与解释,提升结论可复用性与可信度。

BI工程师/报表开发

依托标准化字段说明配置图表与计算逻辑,明确聚合方式与过滤条件,降低返工。上线前快速校验数据质量与异常处理,提高交付稳定性。

产品经理与运营

用通俗商务语言理解指标含义与边界,快速校准活动指标。在复盘与增长实验中,引用统一字典避免口径不一致,令团队对结果更易达成共识。

数据治理负责人

建立命名规范与口径对齐机制,将多语言数据字典集中归档。沉淀版本记录与变更影响说明,提升审计与合规效率,推动企业级数据一致性。

新人培训与知识管理负责人

为新人提供带案例的字段说明与常见误用提示,缩短学习曲线。将高频问题沉淀为字典条目,减少口头传承与重复解答。

咨询顾问/审计人员

在尽调或评估中快速获取字段背景、取值规则与风险提示,提升访谈效率。以标准化条目辅助出具报告,减少文档梳理与反复确认。

解决的问题

用一次可复用的“数据字典条目撰写”提示词,快速为任意数据列生成清晰、统一、可执行的定义说明与业务口径。它旨在:1) 让产品、BI、数据治理、运营团队在同一套标准下协作,避免“口径不一致”的争议;2) 将复杂的指标解释、计算逻辑与注意事项转化为简洁的商务写作条目,可直接纳入报表文档和知识库;3) 支持多语言输出与统一风格,满足跨区域团队沟通;4) 显著降低文档编写时间与沟通成本,提升报表可信度与审计友好度;5) 在需求评审、仪表盘上线、数据口径复盘、交接培训等高频场景中,帮助团队更快达成一致并推动落地。

特征总结

按列名一键生成标准化数据字典,清晰定义指标与口径,减少跨部门沟通成本与理解偏差。
自动提炼业务背景与使用场景,说明该字段在报表、分析与决策中的作用,帮助快速落地应用。
智能补充取值规则、数据类型、缺失处理与合法校验建议,提升数据质量与可用性。
支持多语言输出与商务写作风格,便于全球团队协作与对外材料统一表达。
提供命名规范与口径对齐建议,避免同名不同义或异名同义,保障企业数据一致性。
为指标归类维度或度量,并给出聚合方式与切片建议,加速建模配置与可视化落地。
生成字段应用示例与常见错误提示,指导新人上手并避免误用,缩短培训与交付周期。
可按参数快速定制输出结构与重点,满足不同部门审阅、合规与交付要求。
为字段变更提供版本记录与影响评估建议,降低报表维护风险并保障历史数据可追溯。
输出可直接纳入数据治理手册的条目,统一口径与责任人信息,提升审计效率与合规性。

如何使用购买的提示词模板

1. 直接在外部 Chat 应用中使用

将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。

2. 发布为 API 接口调用

把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。

3. 在 MCP Client 中配置使用

在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。

30 积分
平台提供免费试用机制,
确保效果符合预期,再付费购买!

您购买后可以获得什么

获得完整提示词模板
- 共 241 tokens
- 2 个可调节参数
{ 数据列名称 } { 输出语言 }
自动加入"我的提示词库"
- 获得提示词优化器支持
- 版本化管理支持
获得社区共享的应用案例
限时免费

不要错过!

免费获取高级提示词-优惠即将到期

17
:
23
小时
:
59
分钟
:
59
摄影
免费 原价:20 限时
试用