为了账号安全,请及时绑定邮箱和手机立即绑定

去解析无效的 XML

去解析无效的 XML

Go
素胚勾勒不出你 2021-11-22 16:11:13
有一个指向 XML 的链接:http : //www.guru.com/rss/jobs/ 当尝试使用 解析 XML 时encoding/xml,得到错误:第 1 行 XML 语法错误:无效的 XML 名称:t我知道,此 XML 已损坏,但是我如何忽略它并解析第一项?XML 的最后一项如下所示:<item>    <title>Online Ad Posting Data Entry Jobs</t    <?xml version="1.0" encoding="utf-8"?>    <rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">        <channel>            <title>Guru Jobs</title>            <link>http://www.guru.com</link>            <description>Guru Jobs</description>            <lastBuildDate>Sun, 15 Nov 2015 11:04:51 GMT</lastBuildDate>            <language>en-us</language>            <atom:link href='http://www.guru.com/rss/jobs/' rel="self" type="application/rss+xml" />        </channel>    </rss>    itle>    <link>http://www.guru.com/jobs/online-ad-posting-data-entry-jobs/1189496</link>    <guid>http://www.guru.com/jobs/online-ad-posting-data-entry-jobs/1189496</guid></item> 代码示例:type Rss2 struct {     ItemList []Item `xml:"channel>item"`}type Item struct {    Title       string      `xml:"title"`    Link        string      `xml:"link"`    Description string      `xml:"description"`    PubDate     string      `xml:"pubDate"`    GUID        string      `xml:"guid"`    }r := Rss2{}reader := bytes.NewReader(xmlRead)decoder := xml.NewDecoder(reader)decoder.CharsetReader = charset.NewReaderLabeldecoder.Strict = falseerr = decoder.Decode(&r)if err != nil { fmt.Printf(err.Error()) }
查看完整描述

2 回答

?
慕桂英546537

TA贡献1848条经验 获得超10个赞

XML 标签应该正确打开和关闭。从您发布的 XML 来看,似乎 XML 声明并非一开始。

<?xml version="1.0" encoding="utf-8"?>

这应该是一开始的。希望这可以帮助


查看完整回答
反对 回复 2021-11-22
?
翻翻过去那场雪

TA贡献2065条经验 获得超14个赞

有问题的 XML 似乎是错误的,


这是正确版本的 XML 文件和 Go 代码


XML文件:


<?xml version="1.0" encoding="utf-8"?>

<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

    <title>Guru Jobs</title>

    <link>http://www.guru.com</link>

    <description>Guru Jobs</description>

    <lastBuildDate>Sun, 15 Nov 2015 11:04:51 GMT</lastBuildDate>

    <language>en-us</language>

    <atom:link href='http://www.guru.com/rss/jobs/' rel="self" type="application/rss+xml" />

    <item>

        <title>Imaging for Bespoke Curtain Website</title>

        <link>http://www.guru.com/jobs/imaging-for-bespoke-curtain-website/1203083</link>

        <guid>http://www.guru.com/jobs/imaging-for-bespoke-curtain-website/1203083</guid>

        <description><![CDATA[<b>Description:</b> Hi,We are currently developing a made to measure curtain website and are looking for help in develo...<br><b>Category:</b> Web, Software & IT<br><b>Required skills:</b> ecommerce, imaging software, opencart, web development<br><b>Fixed Price budget:</b> $500-$1k<br><b>Job type:</b> Public<br><b>Freelancer Location:</b> Worldwide<br>]]>

        </description>

        <pubDate>Mon, 04 Jan 2016 12:14:09 GMT</pubDate>

    </item>

</channel>

</rss>

示例 Go 代码


package main


import (

    "io/ioutil"

    "encoding/xml"

    "fmt"

    )


type Rss2 struct {

    ItemList []Item `xml:"channel>item"`

}

type Item struct {

    Title       string      `xml:"title"`

    Link        string      `xml:"link"`

    Description string      `xml:"description"`

    PubDate     string      `xml:"pubDate"`

    GUID        string      `xml:"guid"`

}


func main() {

    r := Rss2{}

    xmlContent, _ := ioutil.ReadFile("example2.xml")

    if err := xml.Unmarshal(xmlContent, &r); err != nil {

        panic(err)

    }

    fmt.Println("RSS item :", r)

}

现在,您可以迭代并在 XML 中找到所需的数据。


查看完整回答
反对 回复 2021-11-22
  • 2 回答
  • 0 关注
  • 180 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信