×
¥
查看详情
🔥 会员专享 文生文 数据处理

数据格式标准化

👁️ 143 次查看
📅 Nov 28, 2025
💡 核心价值: 本提示词专为商业数据运营场景设计,能够系统化处理各类数据格式标准化问题。通过智能识别数据特征、分析格式差异、制定转换规则、执行标准化操作和验证处理结果五个核心步骤,确保数据质量符合业务要求。支持多种数据源格式的统一处理,包括日期时间标准化、数值格式规范、文本内容清洗等常见数据预处理需求,帮助用户提升数据质量,为后续数据分析奠定坚实基础。

🎯 可自定义参数(4个)

CSV数据
用户提供完整CSV数据,包括字段及数据内容,用于标准化处理
数据用途
描述数据使用场景
数据质量要求
数据质量的具体要求
目标标准化格式
目标标准化格式要求

🎨 效果示例

数据标准化结果

标准化后数据(CSV格式)

order_id,order_date,amount_value,currency,is_paid,customer_name,discount_rate,note SO-001,2024-12-01,1200.50,USD,true,晨曦商铺,0.05,"首单; 重复记录" SO-002,2024-12-01,800.00,USD,true,云谷科技,0.08,返现

应用的标准化操作

.列名规范化:将列名统一为小写蛇形命名(snake_case):OrderID→order_id,OrderDate→order_date,Amount→amount_value,IsPaid→is_paid,CustomerName→customer_name,Discount→discount_rate,Note→note
.日期标准化:支持多格式解析(YYYY/MM/DD、DD-MM-YYYY、YYYY-MM-DD)并统一为ISO格式YYYY-MM-DD;假设“01-12-2024”为DD-MM-YYYY,即2024-12-01(与其余样本一致)
.货币解析与数值化:识别“$”“USD ”等货币标识,映射为ISO币种USD;去除货币符号与千分位,保留两位小数;新增currency列以保留币种信息,amount_value为数值
.数字标准化:移除千位分隔符“,”,保留小数点
.布尔值统一:Y/Yes标准化为true(不区分大小写)
.文本清洗:去除首尾空格,折叠多余空格;中文不做大小写转换;业务ID与ISO代码保持原大小写以符合行业规范
.折扣标准化:将百分比与小数混合输入统一为小数(0-1区间),保留至4位精度(本数据输出为0.05/0.08)
.去重处理:按业务主键order_id去重,保留首条记录;对非关键字段进行安全合并

  • 去重与合并:order_id=SO-001 第二条重复记录(原第3行)合并到首条:note由“首单”合并为“首单; 重复记录”
    .数据验证:
  • 日期均有效且在可解析范围
  • amount_value均为有效数值(1200.50、800.00)且currency=USD
  • discount_rate在[0,1]范围内(0.05、0.08)
  • is_paid字段均为布尔型(true)
    .空值处理:本批数据无空值,未做填补

处理摘要

指标 | 数值
总行数 | 3
处理行数 | 3
错误数量 | 0
处理时间 | 0.02s

处理状态

success - 数据标准化处理完成

标准化规则说明与合规提示

  • 日期列:统一转换为ISO格式YYYY-MM-DD;对“01-12-2024”采用DD-MM-YYYY解释,因其与其他样本日期一致(2024-12-01)。若后续存在歧义值,将按来源区域或提供的业务口径再确认。
  • 货币列:为避免信息丢失,金额与币种分列(amount_value为数值,currency为ISO代码),不做汇率换算。
  • 布尔列:统一为true/false。
  • 文本列:去除多余空格,保持业务ID与ISO代码大小写不变。
  • 折扣列:统一为小数(0-1),满足财务与建模口径。
  • 去重:以order_id为主键;如关键字段(日期、金额、支付状态、折扣、客户名)不一致将标记冲突而不自动删除。本次仅合并备注,不改动关键业务字段。

数据标准化结果

标准化后数据(CSV格式)

claim_id,apply_date,amount,tax_rate,currency,is_approved,department,description RB-1001,2024-11-30,1500.00,0.0500,CNY,true,市场部,差旅住宿 RB-1002,2024-11-30,-200.75,0.0000,CNY,false,财务部,退款冲减 RB-1003,2024-11-29,800.00,0.0700,EUR,true,研发部,外包采购

应用的标准化操作

.列名规范化:将 CamelCase 列名统一为小写下划线风格(claim_id, apply_date, amount, tax_rate, currency, is_approved, department, description)
.日期统一格式(ISO 8601):解析多种日期格式(YYYY/MM/DD、DD-MM-YYYY、YYYY-MM-DD),统一输出为 YYYY-MM-DD;示例:2024/11/30→2024-11-30,30-11-2024→2024-11-30
.金额标准化(千分位/地区小数/货币符号):移除千分位分隔符,识别欧式小数(, 为小数点),移除货币符号(€),将括号负数转换为负号,输出为数值并保留2位小数;示例:"1,500.00"→1500.00,"(200.75)"→-200.75,"€800,00"→800.00
.税率标准化(百分比→比例值):去除%并转换为[0,1]区间比例,统一保留4位小数;示例:5%→0.0500
.布尔值统一:将“是/否”“Yes/No”映射为true/false;示例:是→true,否→false,Yes→true
.文本空白清理:去除首尾空格并合并连续空格为单一空格;示例:" 市场部 "→"市场部","研发部 "→"研发部"
.货币代码校验:保留并校验ISO 4217 货币代码(CNY、EUR),保持大写
.数据类型验证:apply_date(日期)、amount(数值)、tax_rate(数值比例)、currency(字符串)、is_approved(布尔)、department/description(字符串)类型检查通过
.范围与规则校验:tax_rate ∈ [0,1] 校验通过;识别负数金额为有效业务值(如退款/冲减),不标记为错误

处理摘要

指标 | 数值
总行数 | 3
处理行数 | 3
错误数量 | 0
处理时间 | 约0.02s

处理状态

success - 数据标准化处理完成

标准化规则示例

  • 日期列:统一转换为ISO格式"YYYY-MM-DD"
  • 数字列:移除千位分隔符,保留小数点,转换为数值类型
  • 文本列:修剪多余空格(中文不转小写)
  • 货币列:移除货币符号,保留ISO 4217货币代码,金额以数值存储
  • 布尔值列:统一为true/false
  • 税率列:去除百分号并存为比例值(四位小数)
  • 默认规则:遵循行业最佳实践与数据治理规范(类型校验、范围校验、可追溯日志)

数据标准化结果

标准化后数据(CSV格式)

user_id,event_time,session_seconds,consent,utm_source,remarks u_001,2024-12-01 09:05:00,1200,true,email,首次激活 u_002,2024-12-01 09:06:00,1500,false,social,分享邀请

应用的标准化操作

  • 列名校验与保留:已符合snake_case与英文小写规范,未调整列名
  • 日期时间标准化(event_time):多格式解析并统一为"YYYY-MM-DD HH:MM:SS"
    • 解析格式支持:YYYY/MM/DD HH:mm、DD-MM-YYYY H:mm、YYYY-MM-DD HH:mm
    • 无时区信息,保持为本地无时区时间;缺省秒补全为":00"
    • 歧义日期“01-12-2024 9:06”按日优先(day-first)解析为2024-12-01 09:06,与同批数据一致
  • 数值标准化(session_seconds):去除科学计数法并转换为数值类型
    • "1.5e3" → 1500;统一为整数秒;校验非负且在合理范围内(未发现异常)
  • 布尔值标准化(consent):统一为true/false(不区分大小写)
    • 映射:["true","yes","1"]→true;["false","no","0"]→false
    • 本次转换:TRUE→true;Yes→true;0→false
  • 文本清洗(utm_source, remarks)
    • 去除首尾及多余空格(含常见Unicode空白)
    • ASCII字符统一小写;中文不变
    • 示例:" Email"→"email";"SOCIAL "→"social";" 首次激活 "→"首次激活"
  • 渠道归一(utm_source):映射至标准渠道名称集合
    • 映射:email→email;social→social(本次仅涉及这两类)
  • 去重(同一会话事件)
    • 去重键:user_id + event_time(到分钟) + session_seconds
    • 规则:保留首条出现记录;布尔字段冲突时优先true(不影响本次结果)
    • 结果:第3行(u_001, 2024-12-01 09:05, 1200)判定为第1行重复并删除(remarks为“重复”进一步佐证)
  • 空值处理:未发现空值,无填补操作
  • 异常值标注:未发现异常;未新增标注列

处理摘要

指标 | 数值 总行数 | 2 处理行数 | 3 错误数量 | 0 处理时间 | N/A

处理状态

success - 数据标准化处理完成

标准化规则示例

  • 日期列:统一转换为ISO样式"YYYY-MM-DD HH:MM:SS"(保留时间以避免信息丢失)
  • 数字列:移除千位/科学计数,转换为数值类型
  • 文本列:ASCII小写,修剪多余空格
  • 货币列:移除货币符号,转换为数值(本次未涉及)
  • 布尔值列:统一为true/false
  • 默认规则:遵循行业最佳实践与数据治理规范,确保可追溯与不丢失关键业务信息

示例详情

该提示词已被收录:
“商业数据运营者高效分析与输出提示词合集”
提升数据处理、分析到报告生成全流程效率
√ 立即可用 · 零学习成本
√ 参数化批量生成
√ 专业提示词工程师打磨

📖 如何使用

30秒出活:复制 → 粘贴 → 搞定
与其花几十分钟和AI聊天、试错,不如直接复制这些经过千人验证的模板,修改几个 {{变量}} 就能立刻获得专业级输出。省下来的时间,足够你轻松享受两杯咖啡!
加载中...
💬 不会填参数?让 AI 反过来问你
不确定变量该填什么?一键转为对话模式,AI 会像资深顾问一样逐步引导你,问几个问题就能自动生成完美匹配你需求的定制结果。零门槛,开口就行。
转为对话模式
🚀 告别复制粘贴,Chat 里直接调用
无需切换,输入 / 唤醒 8000+ 专家级提示词。 插件将全站提示词库深度集成于 Chat 输入框。基于当前对话语境,系统智能推荐最契合的 Prompt 并自动完成参数化,让海量资源触手可及,从此彻底告别"手动搬运"。
即将推出
🔌 接口一调,提示词自己会进化
手动跑一次还行,跑一百次呢?通过 API 接口动态注入变量,接入批量评价引擎,让程序自动迭代出更高质量的提示词方案。Prompt 会自己进化,你只管收结果。
发布 API
🤖 一键变成你的专属 Agent 应用
不想每次都配参数?把这条提示词直接发布成独立 Agent,内嵌图片生成、参数优化等工具,分享链接就能用。给团队或客户一个"开箱即用"的完整方案。
创建 Agent

✅ 特性总结

一键生成标准化方案总览,明确目标、数据特征与转换规则,让处理路径一目了然
自动识别多源数据格式差异与异常,给出修复建议与优先级,让清洗事半功倍
日期、数值、文本、编码等字段轻松统一标准,避免报表错漏与系统对接失败
可按目标系统要求定制转换规则,一键应用整批数据,减少重复人工操作
处理后自动进行质量验证与一致性检查,输出可审阅报告,保障业务可用性
内置异常处理机制,识别缺失、重复与混合格式问题,并提供安全修复方案
支持销售、客户、财务、产品等多场景标准化,直接提升分析与决策效率
保留业务含义与数值精度,合规标准化不改原意,数据可信可追溯,全程可审计
提供工具选择、自动化流程与监控建议,帮助快速落地并持续优化处理效果
从数据到报表形成闭环,减少手工清洗时间,把精力转向洞察与增长

🎯 解决的问题

打造一套“拿来即用”的数据标准化提示词,面向销售、财务、运营、产品与数据分析团队,帮助你在最短时间内把来源各异、格式不一的业务数据统一成可直接用于分析和报表的高质量数据。核心目标:1) 快速识别并统一日期、数值、文本、编码等常见字段,显著缩短出数周期;2) 按业务规则生成清晰的转换方案与校验清单,降低重复返工和人为错误;3) 在不改变业务含义与数值精度的前提下,实现可复用、可审阅、可追踪的标准化流程;4) 为后续分析、看板搭建、系统对接提供稳定的数据底座,促进从试用到付费的持续价值落地。

🕒 版本历史

当前版本
v2.1 2024-01-15
优化输出结构,增强情节连贯性
  • ✨ 新增章节节奏控制参数
  • 🔧 优化人物关系描述逻辑
  • 📝 改进主题深化引导语
  • 🎯 增强情节转折点设计
v2.0 2023-12-20
重构提示词架构,提升生成质量
  • 🚀 全新的提示词结构设计
  • 📊 增加输出格式化选项
  • 💡 优化角色塑造引导
v1.5 2023-11-10
修复已知问题,提升稳定性
  • 🐛 修复长文本处理bug
  • ⚡ 提升响应速度
v1.0 2023-10-01
首次发布
  • 🎉 初始版本上线
COMING SOON
版本历史追踪,即将启航
记录每一次提示词的进化与升级,敬请期待。

💬 用户评价

4.8
⭐⭐⭐⭐⭐
基于 28 条评价
5星
85%
4星
12%
3星
3%
👤
电商运营 - 张先生
⭐⭐⭐⭐⭐ 2025-01-15
双十一用这个提示词生成了20多张海报,效果非常好!点击率提升了35%,节省了大量设计时间。参数调整很灵活,能快速适配不同节日。
效果好 节省时间
👤
品牌设计师 - 李女士
⭐⭐⭐⭐⭐ 2025-01-10
作为设计师,这个提示词帮我快速生成创意方向,大大提升了工作效率。生成的海报氛围感很强,稍作调整就能直接使用。
创意好 专业
COMING SOON
用户评价与反馈系统,即将上线
倾听真实反馈,在这里留下您的使用心得,敬请期待。
加载中...
📋
提示词复制
在当前页面填写参数后直接复制: