企业级数据清洗助手

258 浏览
21 试用
5 购买
Oct 22, 2025更新

从海量数据中精准提取手机号,严格格式化输出并确保数据准确性和合规性。

基于题设要求和用户输入,以下是处理输入文本后返回的JSON结果:

{
  "extracted_numbers": ["13800138000", "15512345678"],
  "total_count": 2
}

流程说明:

  1. 输入文本:
    客户列表包括:13800138000,15512345678,请尽快整理。
    
  2. 解析规则:
    • 提取手机号:判断是否为有效的手机号码(中国CN地区号码标准为11位数字,以1开头,且第二位为3-9范围内的数字)。
    • 开启严格模式(true):严格依据规则提取符合国家格式的手机号码。
    • 国家代码为CN:仅提取符合中国手机号格式的号码。
    • 最大结果数量为2:限制输出结果的数量最多为2条。
  3. 应用正则表达式提取:
    \b1[3-9]\d{9}\b
    
    解释:
    • \b:匹配单词边界,确保号码两侧为分隔符。
    • 1[3-9]:首位为1,第二位为3-9。
    • \d{9}:后续为9位数字。
    • 匹配到的号码为:1380013800015512345678
  4. 结构化输出:
    • 限制返回的结果数量为2。
    • 组织JSON格式结果,其中包含提取的手机号数组及总数量。

如有进一步需求,可调整参数,重新处理数据。

根据用户的输入和要求,以下是基于规则和参数的处理结果:

用户提供的条件解析

  • 文本内容为:
    "推广客户名单:+19876543210, 请联系18500000001接洽。"
  • 指定国家代码:US(美国)。
  • 最大返回数量:1。
  • 严格模式:关闭(false,允许返回可能不完全符合标准的号码格式)。

处理逻辑

  1. 提取所有可能的手机号:
    使用正则表达式匹配文本中的手机号。支持国际格式(以+开头,包含国家代码)和本地格式(无+开头)。
    正则表达式示例:

    • 国际格式:\+\d{10,15}
    • 本地格式:\b\d{10}\b
  2. 筛选符合国家代码US的号码:
    美国手机号格式一般为国际前缀 +1 或 10位本地号码(不带前缀)。
    若开启严格模式,则验证格式是否完全符合标准(暂未启用严格匹配)。

  3. 限制返回结果数量:
    根据参数限制返回数量为1。

  4. 组织数据并输出JSON结果


匹配过程

  1. 从文本中匹配到的手机号码:

    • +19876543210 (符合国际前缀+1,美国号码)。
    • 18500000001 (无明确的国家代码,本地号码,可能为其他区域号码)。
  2. 筛选国家代码为US(+1)的号码,仅保留:

    • +19876543210
  3. 根据数量限制返回1条结果:

    • 最终返回号码:+19876543210

输出结果

以下为符合条件的JSON返回结果:

{
  "extracted_numbers": ["+19876543210"],
  "total_count": 1
}

根据用户的输入需求和规则,我将进行手机号提取并返回符合正确格式的结构化JSON结果。以下是基于输入文本的返回结果:


输入文本:

客户反馈:请服务团队联系18688888888,谢谢!

参数解析:

  • 国家代码:CN(中国)
  • 严格模式:True(仅提取符合标准格式的手机号)
  • 最大返回数量:5(最多返回5条记录)

处理逻辑:

  1. 正则定义
    • 中国手机号标准格式:以1开头,后接3/4/5/6/7/8/9的任意一位数字,再加9位数字(总共11位)。
    • 正则表达式:1[3-9]\d{9}
    • 严格模式开关为True,因此将仅提取符合此正则表达式的号码。
  2. 筛选逻辑
    • 文本中仅发现18688888888符合中国手机号的标准格式。
  3. 数量限制
    • 返回指定数量的手机号(最多5条)。
    • 实际提取结果数为1,未超过设定上限。

提取结果:

{
  "extracted_numbers": ["18688888888"],
  "total_count": 1
}

如果有更多内容需要处理,或需要调整规则(如更改国家代码或严格模式状态),欢迎随时补充说明!

示例详情

解决的问题

帮助企业用户快速实现从大规模数据中提取和清洗手机号码,支持数据的精准格式化输出,确保数据合规性和高效性,以满足后续分析、营销等核心业务需求。

适用用户

数据分析师

轻松从海量数据中提取有效手机号,生成结构化结果,为后续分析提供高质量输入。

市场营销人员

精准获取目标客户手机号,用于广告投放、精准营销和客户触达,大幅提升转化率。

客服团队

快速整理客户联系信息,用于高效跟进与服务,提升用户满意度和工作效率。

特征总结

精准提取手机号,支持从大量文本中快速找到符合规则的号码。
严格模式筛选,仅返回符合标准格式的手机号,确保数据合规性。
灵活支持国家代码筛选,可按区域需求提取特定号码数据。
一键生成结构化输出,以JSON格式返回,方便系统集成与分析。
自定义提取数量,根据设定灵活调整返回数据规模。
处理噪声数据,通过智能清洗隔离无效或多余信息。
适配大规模数据场景,高效处理复杂数据集,提升分析效率。
对规则适配性强,用户可根据需求调整筛选标准和展示方式。
无需技术基础,简单输入参数即可快速获取结果。

如何使用购买的提示词模板

1. 直接在外部 Chat 应用中使用

将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。

2. 发布为 API 接口调用

把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。

3. 在 MCP Client 中配置使用

在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。

AI 提示词价格
¥15.00元
先用后买,用好了再付款,超安全!

您购买后可以获得什么

获得完整提示词模板
- 共 748 tokens
- 4 个可调节参数
{ 手机号文本内容 } { 国家代码 } { 最大结果数量 } { 严格模式 }
获得社区贡献内容的使用权
- 精选社区优质案例,助您快速上手提示词
限时免费

不要错过!

免费获取高级提示词-优惠即将到期

17
:
23
小时
:
59
分钟
:
59