首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用colly在属性中抓取属性

如何使用colly在属性中抓取属性
EN

Stack Overflow用户
提问于 2021-10-21 10:57:56
回答 1查看 151关注 0票数 1

我试着抓取一个产品的productId,但我做不到。请帮帮忙

html代码

代码语言:javascript
复制
<span class="info">
 <button data-product="{"merchantName":"xxx","price":"11","productName":"car window","categoryName":"windows","brandName":"aa assosiations","productId":"which I want to scrape"}">

当我尝试的时候

代码语言:javascript
复制
h.ChildAttr("span.info>button", "data-product")

结果为{"merchantName":"xxx","price":"11","productName":"car window","categoryName":"windows","brandName":"aa assosiations","productId":"which I want to scrape"}

当我尝试的时候

代码语言:javascript
复制
h.ChildAttr("span.info>button", "productId")

没有结果。如何使用colly获取此数据?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-10-21 12:25:47

属性值是一个原始值,在本例中,它是JSON格式的,因此需要解析JSON才能正确获取数据。

例如:

代码语言:javascript
复制
package main

import (
    "log"
    "encoding/json"
    "github.com/gocolly/colly"
)

func main() {
    c := colly.NewCollector()

    c.OnHTML(`body`, func(e *colly.HTMLElement) {
        text := e.ChildAttr("span.info>button", "data-product")

        var result map[string]interface{}
        err := json.Unmarshal([]byte(text), &result)
        if err != nil {
            log.Println(err)
            return
        }
        log.Println(result["productId"])
    })

    c.Visit("[some url]")
}

输出

代码语言:javascript
复制
2021/10/21 14:23:24 which I want to scrape
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69660694

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档