当前位置: 首页 > news >正文

宝安区住房和建设局官方网站盐城seo营销

宝安区住房和建设局官方网站,盐城seo营销,上海网站建设 推荐站霸网络,牧风的在wordpress【腾讯云 TDSQL-C Serverless产品体验】抓取processon热门模版的标题生成词云 serverless服务是腾讯云自研的新一代云原生关系型数据库TDSQ L-C的无服务器架构版,是全Serverless架构的云原生数据库 前言 体验了一下腾讯云刚出的TDSQL-C Serverless,使用…

【腾讯云 TDSQL-C Serverless产品体验】抓取processon热门模版的标题生成词云

serverless服务是腾讯云自研的新一代云原生关系型数据库TDSQ L-C的无服务器架构版,是全Serverless架构的云原生数据库

前言

体验了一下腾讯云刚出的TDSQL-C Serverless,使用它存储数据比较方便,能根据负载动态扩容,现在我们正好用来爬下数据分析一下。

数据源

processOn是比较常用的画图平台,它的模版也是比较丰富,但是基本上都要钱。。。
现在我们爬一下数据,看下这些推荐的模版标题的构成,即什么样的词汇比较容易被推荐,还有它的价格分布是怎样的
在这里插入图片描述

项目目录

config存储配置文件,dao负责链接数据库,logic下面就是具体的逻辑,包括爬虫、分析、词云分词。
在这里插入图片描述

爬虫

具体爬虫代码如下,这里才有异步存储,也正好测试下数据库的性能如何

import ("fmt""github.com/anaskhan96/soup""github.com/spf13/cast""strings""sync""td_test/logic/wordcloud"
)func Crawl(url string) error {res, err := soup.Get(url)if err != nil {return err}var wg sync.WaitGroupdoc := soup.HTMLParse(res)// 模版列表tempList := doc.FindAll("div", "class", "list-item-content")for _, item := range tempList {// 模版详情数据detail := item.Find("div", "class", "temp-item-detail")title := detail.Find("h2").Text()// view clone like数量var countList []intfor _, count := range detail.FindAll("span", "class", "count") {countList = append(countList, cast.ToInt(count.Text()))}// 获取价格owner := item.Find("div", "class", "temp-item-owner")priceStr := owner.Find("span", "class", "count").Text()var price float32if priceStr != "免费" {priceStr = strings.Trim(priceStr, "¥")price = cast.ToFloat32(priceStr)}// 异步存储go func() {wg.Add(1)defer wg.Done()saveToDB(title, countList, price)// 对标题进行分词并存储wordcloud.SplitTitleAndSave(title)}()}wg.Wait()return nil
}

分词

分词库用的是结巴分词,直接用它的精准模式即可

import ("github.com/yanyiwu/gojieba"
)var splitClient *gojieba.Jiebafunc init() {splitClient = gojieba.NewJieba()
}
func SplitTitleAndSave(title string) {words := splitClient.Cut(title, true)for i := range words {m := &TemplateTitleWordModel{Word: words[i]}m.Save()}return
}

分析词云和价格饼状图

词云和饼状图都是用的github.com/go-echarts/go-echarts,使用比较简单,词云需要把数据从数据库中提取出来塞进去就好了,词云代码:

func getTitleListFromDB() []opts.WordCloudData {var wordList []stringdao.GetDB().Raw("select word from template_title_words").Scan(&wordList)wordMap := make(map[string]int)for i := range wordList {wordMap[wordList[i]]++}ans := make([]opts.WordCloudData, 0)for k, v := range wordMap {ans = append(ans, opts.WordCloudData{Value: v, Name: cast.ToString(k)})}return ans
}
func createWordCloud(title string, data []opts.WordCloudData) {wc := charts.NewWordCloud()wc.SetGlobalOptions(charts.WithTitleOpts(opts.Title{Title: title}))wc.AddSeries(title, data).SetSeriesOptions(charts.WithWorldCloudChartOpts(opts.WordCloudChart{SizeRange: []float32{40, 80},Shape:     "cardioid",}),)f, _ := os.Create(fmt.Sprintf("wordcloud_%s.html", title))_ = wc.Render(f)
}

生成的词云如下
在这里插入图片描述
价格分布如下
在这里插入图片描述

小结

可以看到,标题中流程图词汇占比最高,价格中五块钱的模版占比最高,其次是3块钱的,再其次是免费的。
TDSQL-C Serverless使用体验上还不错,比较丝滑,感觉和远程数据库差不多,它动态扩缩容能力也能让我们少操点心

http://www.yidumall.com/news/33863.html

相关文章:

  • 网站开发的三层架构怎么建造自己的网站
  • 网站公司设计网络推广运营优化
  • 做资料分享网站有哪些谷歌地球
  • 网站制作换下面友情连接app代理推广平台
  • wordpress 问答 主题 knowhow免费seo排名网站
  • 云网站系统深圳正规seo
  • 做漫画的网站有哪些网上电商平台开发
  • 网站是做百度快照推广好最新网站发布
  • 网站的链接优化长治seo
  • 58同城租房做网站怎么弄白酒最有效的推广方式
  • 稿定设计在线制作友情链接seo
  • 网站推广方法有哪些网络营销和网上销售的区别
  • 官网做有下拉列表的网站的图片营销咨询服务
  • 外星人做的网站石家庄seo网络推广
  • 政府网站平台安全建设方案免费seo网站推荐一下
  • 榆林网站制作爱站网络挖掘词
  • 360免费wifi助手搜索引擎优化包括
  • 杭州有哪些做网站的公司网络营销理论基础有哪些
  • 大理网站建设推广公司运营模式
  • b2b群发网站网站优化是什么意思
  • 网站导航提交入口大全高端网站建设公司排行
  • 建立一个企业网站google中文搜索引擎
  • php带数据库的网站站长统计app下载免费
  • 如何给网站的关键词做排名seo的形式有哪些
  • 做电影解析网站品牌传播方案
  • 网站建设类公司可以拿哪些项目资金如何做网站seo排名优化
  • 3维网站制作技术windows11优化大师
  • 做网站要什么技术成都网站关键词推广优化
  • 我的网站设计联盟小程序制作费用一览表
  • 石河子网站建设公司重庆seo排