使用模式匹配步骤

Pattern Match步骤允许您定义一个字符序列,以便跨数据源进行搜索。当步骤找到与已定义模式匹配的内容时,它将从搜索查询中收集与结果相关的其他信息,以便在以后的步骤中使用。

模式匹配vs滤波器

Filter步骤允许您根据逻辑条件过滤数据。如果数据不满足基于过滤器的条件语句,工作流将不会继续。

Pattern Match步骤用于匹配数据的特定格式,然后将该格式定义为变量。该数据将根据正则表达式进行匹配。过滤器和模式匹配的另一个主要区别是,即使匹配不成功,工作流也将继续。

正则表达式

您搜索的模式被格式化为“正则表达式”或regex。

可接受的模式可以是你写的自定义正则表达式,或者是以下“匹配变量”类型中的模式:

  • IPv4
  • URL
  • 电子邮件

InsightConnect支持谷歌的RE2公司正则表达式语言。

正则表达式和字符串字面值之间有什么区别?

字符串或字符串字面值是通常按原样读取和处理的字符序列,没有格式化。例如,字符串“Hello, world!”将被解读为一个由13个字符组成的字符串,包括10个字母字符、两个标点字符和一个空格。

Regex功能要强大得多,它包含字符串。当然,您可以使用模式匹配步骤来搜索基本文本字符串,但是使用正则表达式,您可以搜索正则表达式语法设计的任意模式。

配置步骤

  1. 名字的步骤。我们建议使用您正在使用的模式的描述作为名称。
  2. 在“匹配输入”区域,点击+并选择要在其中搜索模式的数据源。
    • 您也可以粘贴一个原始文本块来搜索您想要的模式,但是您必须至少包含一个变量。
  3. 在“against”字段中输入您想要用于匹配输入数据的模式。
  4. 如果您想要不区分大小写的搜索或捕获所有匹配的结果,请选中相应的框。
  5. 点击继续为了节省。

格式匹配变量

match变量是与输入进行比较的模式。对于自定义正则表达式,使用以下表示法格式化'match variables':{{<变量名>:/正则表达式/}}或者通过替换,将这种表示法用于内置的match变量类型<建于类型>使用"ipv4", "domain", "email",或"url":{{<变量名>:<内置类型>}}