企业级数据清洗助手

58 浏览
4 试用
0 购买
Aug 5, 2025更新

从海量数据中精准提取手机号,严格格式化输出并确保数据准确性和合规性。

示例1

基于题设要求和用户输入,以下是处理输入文本后返回的JSON结果:

```json
{
  "extracted_numbers": ["13800138000", "15512345678"],
  "total_count": 2
}
```

### 流程说明:
1. 输入文本:
   ```
   客户列表包括:13800138000,15512345678,请尽快整理。
   ```
2. 解析规则:
   - 提取手机号:判断是否为有效的手机号码(中国CN地区号码标准为11位数字,以1开头,且第二位为3-9范围内的数字)。
   - 开启严格模式(true):严格依据规则提取符合国家格式的手机号码。
   - 国家代码为CN:仅提取符合中国手机号格式的号码。
   - 最大结果数量为2:限制输出结果的数量最多为2条。
3. 应用正则表达式提取:
   ```regex
   \b1[3-9]\d{9}\b
   ```
   解释:
   - `\b`:匹配单词边界,确保号码两侧为分隔符。
   - `1[3-9]`:首位为1,第二位为3-9。
   - `\d{9}`:后续为9位数字。
   - 匹配到的号码为:`13800138000` 和 `15512345678`。
4. 结构化输出:
   - 限制返回的结果数量为2。
   - 组织JSON格式结果,其中包含提取的手机号数组及总数量。

如有进一步需求,可调整参数,重新处理数据。

示例2

根据用户的输入和要求,以下是基于规则和参数的处理结果:

### 用户提供的条件解析  
- 文本内容为:  
  "推广客户名单:+19876543210, 请联系18500000001接洽。"  
- 指定国家代码:US(美国)。
- 最大返回数量:1。
- 严格模式:关闭(`false`,允许返回可能不完全符合标准的号码格式)。  

### 处理逻辑  
1. **提取所有可能的手机号:**  
   使用正则表达式匹配文本中的手机号。支持国际格式(以`+`开头,包含国家代码)和本地格式(无`+`开头)。  
   正则表达式示例:  
   - 国际格式:`\+\d{10,15}`  
   - 本地格式:`\b\d{10}\b`  
   
2. **筛选符合国家代码US的号码:**  
   美国手机号格式一般为国际前缀 +1 或 10位本地号码(不带前缀)。  
   若开启严格模式,则验证格式是否完全符合标准(暂未启用严格匹配)。  

3. **限制返回结果数量:**  
   根据参数限制返回数量为1。    

4. **组织数据并输出JSON结果**  

---

### 匹配过程  
1. 从文本中匹配到的手机号码:  
   - `+19876543210` (符合国际前缀`+1`,美国号码)。  
   - `18500000001` (无明确的国家代码,本地号码,可能为其他区域号码)。
   
2. 筛选国家代码为US(`+1`)的号码,仅保留:  
   - `+19876543210`。
   
3. 根据数量限制返回1条结果:  
   - 最终返回号码:`+19876543210`。

---

### 输出结果  
以下为符合条件的JSON返回结果:  
```json
{
  "extracted_numbers": ["+19876543210"],
  "total_count": 1
}
```

示例3

根据用户的输入需求和规则,我将进行手机号提取并返回符合正确格式的结构化JSON结果。以下是基于输入文本的返回结果:

---

### 输入文本:
`客户反馈:请服务团队联系18688888888,谢谢!`

### 参数解析:
- **国家代码**:CN(中国)
- **严格模式**:True(仅提取符合标准格式的手机号)
- **最大返回数量**:5(最多返回5条记录)

### 处理逻辑:
1. **正则定义**:
   - 中国手机号标准格式:以1开头,后接3/4/5/6/7/8/9的任意一位数字,再加9位数字(总共11位)。
   - 正则表达式:`1[3-9]\d{9}`。
   - 严格模式开关为True,因此将仅提取符合此正则表达式的号码。
2. **筛选逻辑**:
   - 文本中仅发现`18688888888`符合中国手机号的标准格式。
3. **数量限制**:
   - 返回指定数量的手机号(最多5条)。
   - 实际提取结果数为1,未超过设定上限。

### 提取结果:
```json
{
  "extracted_numbers": ["18688888888"],
  "total_count": 1
}
```

---

如果有更多内容需要处理,或需要调整规则(如更改国家代码或严格模式状态),欢迎随时补充说明!

适用用户

数据分析师

轻松从海量数据中提取有效手机号,生成结构化结果,为后续分析提供高质量输入。

市场营销人员

精准获取目标客户手机号,用于广告投放、精准营销和客户触达,大幅提升转化率。

客服团队

快速整理客户联系信息,用于高效跟进与服务,提升用户满意度和工作效率。

教育行业从业者

整理和提取学生或家长的联系方式,方便通知管理和活动信息发布。

研究人员

清洗大规模调查数据,精准提取研究对象联系方式,提高研究数据的准确性与完整性。

解决的问题

帮助企业用户快速实现从大规模数据中提取和清洗手机号码,支持数据的精准格式化输出,确保数据合规性和高效性,以满足后续分析、营销等核心业务需求。

特征总结

精准提取手机号,支持从大量文本中快速找到符合规则的号码。
严格模式筛选,仅返回符合标准格式的手机号,确保数据合规性。
灵活支持国家代码筛选,可按区域需求提取特定号码数据。
一键生成结构化输出,以JSON格式返回,方便系统集成与分析。
自定义提取数量,根据设定灵活调整返回数据规模。
处理噪声数据,通过智能清洗隔离无效或多余信息。
适配大规模数据场景,高效处理复杂数据集,提升分析效率。
对规则适配性强,用户可根据需求调整筛选标准和展示方式。
无需技术基础,简单输入参数即可快速获取结果。

如何使用购买的提示词模板

1. 直接在外部 Chat 应用中使用

将模板生成的提示词复制粘贴到您常用的 Chat 应用(如 ChatGPT、Claude 等),即可直接对话使用,无需额外开发。适合个人快速体验和轻量使用场景。

2. 发布为 API 接口调用

把提示词模板转化为 API,您的程序可任意修改模板参数,通过接口直接调用,轻松实现自动化与批量处理。适合开发者集成与业务系统嵌入。

3. 在 MCP Client 中配置使用

在 MCP client 中配置对应的 server 地址,让您的 AI 应用自动调用提示词模板。适合高级用户和团队协作,让提示词在不同 AI 工具间无缝衔接。

30 积分
平台提供免费试用机制,
确保效果符合预期,再付费购买!

您购买后可以获得什么

获得完整提示词模板
- 共 748 tokens
- 4 个可调节参数
{ 手机号文本内容 } { 国家代码 } { 最大结果数量 } { 严格模式 }
自动加入"我的提示词库"
- 获得提示词优化器支持
- 版本化管理支持
获得社区共享的应用案例
限时免费

不要错过!

免费获取高级提示词-优惠即将到期

17
:
23
小时
:
59
分钟
:
59
摄影
免费 原价:20 限时
试用