物联网软件开发公司 ①WPS新增的REGEXP函数,相配好用!利害保举
今天咱们来先容正则抒发式函数REGEXP。
这个函数相配好用。有了它,许多文本函数都不错无须了。
在先容它之前,咱们一王人来学习一下正则抒发式的基础学问。
图片
正则抒发式基础学问
正则抒发式便是用一些出奇的字符来抒发或追思字符串的轨则或特色。比如用\d或[0-9]暗示数字,那么\d{11}就暗示11位的整数。
操作符
含义
示例
.
极少点,暗示任何单个字符
[]
中括号暗示字符集,对单个字符给出取值鸿沟
[abc]暗示a或b或c,[a-z]暗示a-z单个字符(随便一位小写字母)
[0-9]暗示单个随便数字
[^]
非字符集。对单个字符给出排斥鸿沟
[^abc]暗示非a或非b或非c的单个字符
*
星号暗示前一个元素的0次能够无穷次的膨大
abc*暗示ab、abc、abcc、abcccc等等(匹配 ab)
+
前一个元素的1次能够无穷次的膨大
abc+暗示 abc、abccc、abcc、abccccc等(不匹配 ab)
?
前一个元素的0次能够1次膨大
abc?仅暗示 ab、abc。
不错把“4th|4”简化为“4(th)?”。咱们看到“?”作用的元素是通盘括号了
|
傍边抒发式中的随便一个。傍边抒发式不错是多字符。把稳与[ ]的永别
abc|def暗示abc、def
{m}
膨大前一个字符m次
ab{2}c暗示abbc
{m,n}
膨大前一个字符m至n次(含m和n次)
ab{1,2}c匹配abc、abbc
^
匹配字符串起首
^abc暗示abc在一个字符串的起首,即不匹配 aabc
$
匹配字符串扫尾
abc$暗示abc在一个字符串的扫尾,即不匹配abcd
()
分组标记里面只可使用|操作符
(abc)暗示abc ,(abc|def)暗示abc、def
\d
一位数字,等价于[0-9]
\w
构成单词的字符,等价于[A-Za-z0-9_]
暗示字符小写大写的a-z和数字0-9以及下划线_
底下咱们来看一下REGEXP函数的基本语法及愚弄案例
图片
REGEXP语法
=REGEXP ( 字符串,正则抒发式,匹配面目,替换本色 )
第三参数的匹配面目有三种:0索求、1判断、2替换
图片
索求字符串中的数字
决赛中国U20女排首发派出主攻李晨瑄、郭湘玲,副攻陈厚羽、单琳倩,接应王音迪,二传朱航霆和自由人孙婉鋆。
app图片
正则抒发式讲明:
[0-9]:匹配随便一个数字字符,从0到9。
.:匹配极少点字符。在正则抒发式中,点是一个出奇字符,暗示匹配除了换行符以外的随便单个字符。但在这里,由于它被放在了方括号内,它失去了出奇含义,只暗示匹配字面量的点字符。
-:匹配短横线字符。相似,在方括号内,短横线仅仅一个平方字符,不暗示鸿沟。
[0-9.-]:方括号暗示一个字符集,该围聚包含数字0到9、点字符和短横线字符。匹配时,它会尝试匹配这个围聚中的随便一个字符。
+:暗示匹配前边的字符集一次或屡次。因此,[0-9.-]+会匹配一个或多个贯穿的数字、点或短横线字符。
若是字符串中有多个数字,物联网软件开发公司在最外围套一个SUM函数,就能乞降
=SUM(--REGEXP(A5,"[0-9.-]+"))
图片
拆分中英混杂的字符串
图片
索求华文的公式:
=REGEXP(A1,"[一-龟]+")
[一-龟]代表汉字,详备讲明请阅读底下的著述
为什么不错用一-龟来指代常用汉字?
索求非华文的公式:
=REGEXP(A1,"[^一-龟]+")
正则抒发式讲明:
[]:这是一个字符集,用于匹配括号内列出的随便单个字符。
^:在字符集的起首,它暗示抵赖,即匹配不在字符集结的任何单个字符。
一-龟:这暗示从汉字“一”到汉字“龟”的字符鸿沟。把稳,这个鸿沟并不是按照字母举止来界说的,而是按照 Unicode 编码的举止。这意味着它将匹配从“一”到“龟”这个鸿沟内通盘的汉字。
+:暗示匹配前边的面目(在这里是字符集)一次或屡次。
图片
索求第一个汉字后的通盘本色
公式:
=REGEXP(A2,"[一-龟]+.*")
图片
正则抒发式讲明:
[一-龟]:这是一个字符集,暗示匹配从汉字“一”到汉字“龟”之间的随便单个汉字。把稳,这里的鸿沟并不是基于字典举止,而是基于这些汉字在 Unicode 编码中的举止。
+:暗示匹配前边的字符集(在这里是 [一-龟])一次或屡次。也便是说,这个正则抒发式会匹配一个或多个贯穿的汉字,这些汉字的鸿沟是从“一”到“龟”。
.*:这里的 .暗示匹配除了换行符以外的随便单个字符,而 *暗示匹配前边的字符(在这里是 .)零次或屡次。因此,.*会匹配随便数目的随便字符(包括零个字符)。
图片
索求第一个汉字前的本色
图片
公式
=REGEXP(A2,"^[^一-龟]+")
正则抒发多讲明:
^:这个标志暗示匹配字符串的初始位置。也便是说,通盘正则抒发式面目必须匹配字符串的肇始部分。
[]:这是一个字符集,用于匹配括号内列出的随便单个字符。
^:在字符集的起首,它暗示排斥、抵赖,即匹配不在字符集结的任何单个字符。把稳,这里的 ^是字符集内的第一个字符,因此它暗示抵赖,而不是匹配字符串的初始位置。
一-龟:这暗示从汉字“一”到汉字“龟”的字符鸿沟。把稳,这个鸿沟并不是按照字母举止来界说的,而是按照 Unicode 编码的举止。
+:暗示匹配前边的面目(在这里是字符集)一次或屡次。
图片
按指定字符拆分
图片
公式:
=REGEXP(A2,"([^,]+)")
按换行符拆分
图片
=REGEXP(A2,".+")
正则抒发式讲明
.:这个标志在正则抒发式中暗示匹配除了换行符以外的随便单个字符。
+:这个标志暗示匹配前边的字符(在这里是 .)一次或屡次。
还有其他更复杂的用法,咱们下篇著述再先容。
图片
图片
图片
本站仅提供存储作事,通盘本色均由用户发布,如发现存害或侵权本色,请点击举报。