#REGEXP_INSTR
REGEXP_INSTR为正则表达式函数,用于在源字符串expr按正则模式匹配目标字符串regexp,返回第occurrence次匹配到regexp的第subexpr个子字符串的return_opt(开始或结束)位置,返回值为BIGINT类型。若没有匹配到,函数返回0。
函数首先从expr的第position个字符开始进行匹配,匹配到第1次后,继续从该匹配项后的第1个字符进行匹配,依此类推直到expr的最后一个字符。
本函数与INSTR函数相似,但本函数的目标字符串regexp可以使用正则表达式。
expr
通用表达式,其值须为字符型或可转换为字符型的其他类型。
expr不能为转义字符。
expr不能为超过32000字节的XMLTYPE、LOB类型数据。
函数使用输入字符集定义的字符计算字符串(仅支持UTF-8)。
当expr的值为NULL时,函数返回NULL。
regexp
指定一个RegExp,长度不超过512字节。
regexp支持转义字符。
当regexp为NULL时,函数返回NULL。
position
指定开始进行匹配的偏移量,可省略,默认为1。position为与expr相同的通用表达式,须为数值型数据或可转换为NUMBER类型的其他类型数据。
position的值应为正整数(0或负数将报错,小数将直接截取整数部分),内部处理时统一转换为BIGINT类型。
当position超出expr值的长度时,不执行匹配,函数返回0。
当position为NULL时,函数返回NULL。
occurrence
指定返回regexp在expr中第occurrence次匹配到的位置,可省略,默认为1。occurrence为与expr相同的通用表达式,须为数值型数据或可转换为NUMBER类型的其他类型数据。
occurrence的值应为正整数(0或负数将报错,小数将直接截取整数部分),内部处理时统一转换为BIGINT类型。
当occurrence超出匹配次数时,不执行匹配,函数返回expr值。
当occurrence为NULL时,函数返回NULL。
return_opt
指定返回的匹配位置选项,其值只能为0或1,可省略,默认为0。
- 如果指定为0,将返回匹配项的第一个字符的位置。
- 如果指定为1,将返回匹配项后面的第一个字符的位置。
match_para
正则匹配参数,与REGEXP_COUNT中的含义相同。
subexpr
当匹配到regexp时,函数返回regexp的第subexpr个子表达式所匹配到的return_opt位置,可省略,默认为0,表示返回完整的regexp字符串的return_opt位置。
子表达式是指使用括号()
包围的表达式片段,括号允许嵌套,所有子表达式按其左括号在表达式中出现的顺序进行编号,子表达式编号从1开始(0则表示整个regexp表达式)。例如0123(((abc)(de)f)ghi)45(678)
包含5个子表达式,按顺序分别为“abcdefghi”、“abcdef”、“abc”、“de”和“678”。
subexpr的值只能为[0,9]区间的整数,值小于0将报错,值大于9将返回0,小数将直接截取整数部分。
当subexpr的值超过regexp中子表达式数量时,函数返回0。
示例
SELECT REGEXP_INSTR('1234567890', '(123)(4(56)(78))', 1, 1, 0, 'i', 2) "REGEXP_INSTR" FROM DUAL;
REGEXP_INSTR
---------------------
4
SELECT REGEXP_INSTR('1234567890', '(123)(4(56)(78))', 1, 1, 1, 'i', 2) "REGEXP_INSTR" FROM DUAL;
REGEXP_INSTR
---------------------
9
SELECT REGEXP_INSTR('1234567890', '[0-9]', 1, 5) "REGEXP_INSTR" FROM DUAL;
REGEXP_INSTR
---------------------
5