社区应用 最新帖子 精华区 社区服务 会员列表 统计排行
  • 407阅读
  • 3回复

[分享]杂乱无章的数据,如何提取需要的信息?巧用通配符帮助你

楼层直达
z3960 
级别: FLY版主
发帖
787358
飞翔币
211623
威望
215717
飞扬币
2621544
信誉值
8


[backcolor=transparent]
在某些系统导出的Excel数据中,往往会有很多杂乱的字符,如果在这些数据中单独使用Excel中的函数提取所需要的信息(如汉字、数字、英文),往往太费事,效率不高。但若用Excel联合Word,再加上通配符的辅助,在这些杂乱数据中提取所需信息,就非常容易了(图1)。
[backcolor=transparent]
1. 获取中文
首先,选定Excel工作表中存放杂乱数据列中的所有数据,将它们复制并粘贴到一个新建的空白Word文档中(图2)。
[backcolor=transparent]
选中Word文档中数据列,点击“替换”,在弹出窗口的查找内容处输入“[!一-﨩]”,“替换为”处什么也不输入,点击“更多”,在展开的面板中勾选“使用通配符”,点击“全部替换”。这样,数据列中非中文的字符就会被全部删除掉了,只剩中文。把替换后的数据剪切、粘贴到Excel工作表中就可以了(图3)。
[backcolor=transparent]
小提示:上述表达式中的“[!一-﨩]”是关键,“[一-﨩]”表示汉字通配符,表示GBK编码表中从“一”到“﨩”的所有汉字(﨩 拼音:dǎo)。而“[!一-﨩]”中的“!”是否定的意思,就是除了汉字全部替换成空格。
2. 获取数字
重新将杂乱数据从Excel工作表中复制粘贴到空白Word文档中,选中Word文档中数据列,点击“替换”,在弹出窗口的查找内容处输入“[!0-9]”,“替换为”处什么也不输入,点击“更多”,在展出面板中勾选“使用通配符”,点击“全部替换”。这样,数据列中非数字的字符就会被全部删除掉了,只剩下数字。把替换后的数据剪切、粘贴到Excel工作表中就可以了(图4)。
[backcolor=transparent]
小提示:“[!0-9]”的含义:由于数字通配符是“[0-9]”,同样“!”是否定的意思,因此“[!0-9]”就表示非数字

3. 获取英文
要获取英文字符,需要两步进行。在Word文档中查找替换时,先将“[0-9]”替换为什么也不输入;再将“[一-﨩]”替换为什么也不输入。这样,数据列中的数字和汉字就被全部删除掉了,只剩英文字符。把替换后的数据剪切、粘贴到Excel工作表中就可以了。
本帖最近评分记录: 1 条评分 飞扬币 +50
爱我中华 飞扬币 +50 2022-01-12 社区因为有您的参与更精彩!
 
我不喜欢说话却每天说最多的话,我不喜欢笑却总笑个不停,身边的每个人都说我的生活好快乐,于是我也就认为自己真的快乐。可是为什么我会在一大群朋友中突然地就沉默,为什么在人群中看到个相似的背影就难过,看见秋天树木疯狂地掉叶子我就忘记了说话,看见天色渐晚路上暖黄色的灯火就忘记了自己原来的方向。
级别: 茶馆馆主
发帖
618960
飞翔币
216789
威望
3961
飞扬币
3151316
信誉值
0

只看该作者 1 发表于: 2022-01-12
学习了
级别: 超级版主
发帖
884685
飞翔币
253183
威望
224883
飞扬币
2710647
信誉值
0

只看该作者 2 发表于: 2022-01-14
来看一下
级别: 超级版主
发帖
884685
飞翔币
253183
威望
224883
飞扬币
2710647
信誉值
0

只看该作者 3 发表于: 2022-01-14
不错,了解了