为了账号安全,请及时绑定邮箱和手机立即绑定

如何从 regexp.ReplaceAllFunc 访问捕获组?

如何从 regexp.ReplaceAllFunc 访问捕获组?

Go
汪汪一只猫 2021-09-10 21:33:52
如何从 ReplaceAllFunc() 内部访问捕获组?package mainimport (    "fmt"    "regexp")func main() {    body := []byte("Visit this page: [PageName]")    search := regexp.MustCompile("\\[([a-zA-Z]+)\\]")    body = search.ReplaceAllFunc(body, func(s []byte) []byte {        // How can I access the capture group here?    })    fmt.Println(string(body))}目标是替换[PageName]为<a href="/view/PageName">PageName</a>.这是编写 Web 应用程序Go 教程底部“其他任务”部分下的最后一个任务。
查看完整描述

3 回答

?
holdtom

TA贡献1805条经验 获得超10个赞

我同意在您的函数内部访问捕获组是理想的,我认为regexp.ReplaceAllFunc. 现在我想到的唯一关于如何使用该函数执行此操作的是:


package main


import (

    "fmt"

    "regexp"

)


func main() {

    body := []byte("Visit this page: [PageName] [OtherPageName]")

    search := regexp.MustCompile("\\[[a-zA-Z]+\\]")

    body = search.ReplaceAllFunc(body, func(s []byte) []byte {

        m := string(s[1 : len(s)-1])

        return []byte("<a href=\"/view/" + m + "\">" + m + "</a>")

    })

    fmt.Println(string(body))

}

编辑


还有另一种方式我知道如何做你想做的事。您需要知道的第一件事是您可以使用正则表达式(?:re)where reis 的语法指定非捕获组。这不是必需的,但会减少不感兴趣的匹配的数量。


接下来要知道的是regexp.FindAllSubmatcheIndex。它将返回切片的切片,其中每个内部切片代表给定正则表达式匹配的所有子匹配的范围。


有了这两件事,您就可以构建一些通用的解决方案:


package main


import (

    "fmt"

    "regexp"

)


func ReplaceAllSubmatchFunc(re *regexp.Regexp, b []byte, f func(s []byte) []byte) []byte {

    idxs := re.FindAllSubmatchIndex(b, -1)

    if len(idxs) == 0 {

        return b

    }

    l := len(idxs)

    ret := append([]byte{}, b[:idxs[0][0]]...)

    for i, pair := range idxs {

        // replace internal submatch with result of user supplied function

        ret = append(ret, f(b[pair[2]:pair[3]])...)

        if i+1 < l {

            ret = append(ret, b[pair[1]:idxs[i+1][0]]...)

        }

    }

    ret = append(ret, b[idxs[len(idxs)-1][1]:]...)

    return ret

}


func main() {

    body := []byte("Visit this page: [PageName] [OtherPageName][XYZ]     [XY]")

    search := regexp.MustCompile("(?:\\[)([a-zA-Z]+)(?:\\])")


    body = ReplaceAllSubmatchFunc(search, body, func(s []byte) []byte {

        m := string(s)

        return []byte("<a href=\"/view/" + m + "\">" + m + "</a>")

    })


    fmt.Println(string(body))

}


查看完整回答
反对 回复 2021-09-10
?
智慧大石

TA贡献1946条经验 获得超3个赞

如果你想得到 group in ReplaceAllFunc,你可以使用ReplaceAllStringget 子组。


package main


import (

    "fmt"

    "regexp"

)


func main() {

    body := []byte("Visit this page: [PageName]")

    search := regexp.MustCompile("\\[([a-zA-Z]+)\\]")


    body = search.ReplaceAllFunc(body, func(s []byte) []byte {

        // How can I access the capture group here?

        group := search.ReplaceAllString(string(s), `$1`)


        fmt.Println(group)


        // handle group as you wish

        newGroup := "<a href='/view/" + group + "'>" + group + "</a>"

        return []byte(newGroup)

    })


    fmt.Println(string(body))

}

当有很多组时,你可以通过这种方式获取每个组,然后处理每个组并返回所需的值。


查看完整回答
反对 回复 2021-09-10
?
慕森王

TA贡献1777条经验 获得超3个赞

您必须ReplaceAllFunc先在FindStringSubmatch同一个正则表达式的函数调用中再次调用。喜欢:


func (p parser) substituteEnvVars(data []byte) ([]byte, error) {

    var err error

    substituted := p.envVarPattern.ReplaceAllFunc(data, func(matched []byte) []byte {

        varName := p.envVarPattern.FindStringSubmatch(string(matched))[1]

        value := os.Getenv(varName)

        if len(value) == 0 {

            log.Printf("Fatal error substituting environment variable %s\n", varName)

        }


        return []byte(value)

    });

    return substituted, err

}


查看完整回答
反对 回复 2021-09-10
  • 3 回答
  • 0 关注
  • 204 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信