当前位置: 首页 > news >正文

问答类网站开发站长工具使用方法

问答类网站开发,站长工具使用方法,淘宝上网站建设靠谱吗,html项目答辩论文下载:https://openreview.net/pdf?idr1xMH1BtvB 另一篇分析文章:ELECTRA 详解 - 知乎 一、概述 对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。 不是对选择的token直接用mask替代,而是替换为…

论文下载:https://openreview.net/pdf?id=r1xMH1BtvB

另一篇分析文章:ELECTRA 详解 - 知乎

一、概述

对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。

不是对选择的token直接用mask替代,而是替换为一个生成器网络产生的token。

然后训练模型时并不是只被破坏的token,而是训练一个辨别模型来预测这些被破坏的输入的每一个token是否是被生成模型生成的样本替代的。因为将GANs应用于文本很困难,所以生成损坏token的生成器是以最大似然进行训练的。

小generator和大discriminator共同训练,但判别器的梯度不会传给生成器

fine-tuning 时丢弃generator,只使用discriminator

二、网络结构和训练

1、模型训练两个网络G和D。

        G:给定位置t,将该位置token替换为mask,输入到G,G输出一个概率,结合softmax层,来产生mask位置的xt,从而G产生损坏的输入。输出只在mask的token中计算分数,不是所有的token。

        D:给定位置t,D预测xt是否是真的。输出只在mask的token中预测是不是真的,不是所有的。

        对于给定一个随机位置序列,原始输入对应位置替换为[MASK] token,输入G,G学习恢复原始序列。D来分辨哪些token是被生成器产生的样本替换的。

文本损坏过程描述为:

2、损失函数为:

MLM损失的计算只计算m个,即m个被masked tokens

Disc损失 t的取值到 1..n,每个token都会更新参数

        在训练过程中,discriminator的loss不会反向传播到generator(因为generator的sampling的步骤导致),在pre-training之后,只使用discriminator进行fine-tuning.

http://www.yidumall.com/news/33128.html

相关文章:

  • wordpress建网站的优点百度推广外包哪家不错
  • 北京食药局网站年检怎么做2021百度热搜年度榜
  • 中国人民解放军国防大学衡阳seo服务
  • 莆田网站建设南城网站优化公司
  • 网站更改备案信息在哪寄生虫seo教程
  • 网上北京网站制作公司怎么在平台上做推广
  • wordpress 去掉图片链接下载优化大师
  • 美国生物等效性如果做的网站狼雨的seo教程
  • 投资网站模版下载成都网站建设公司
  • 策划推广公司seo关键词推广话术
  • 中国石油天然气第六建设公司网站seo公司哪家好用
  • 钓鱼网站盗号下载seo包年优化平台
  • 云南网站建设维修公司如何对seo进行优化
  • 推荐做ppt照片的网站品牌策划公司
  • 广州天河区是富人区吗班级优化大师电脑版
  • 做装修工程找什么网站接单seo主要是指优化
  • 做外贸 上国外网站软文写作
  • 云浮市做网站的公司网络推广员一个月多少钱
  • 网站服务器购买价格百度竞价排名名词解释
  • 用网站空间可以做有后台的网站吗广西网络优化seo
  • 网站正能量网站不用下载直接进入网站赚钱
  • 山东省建设科技协会网站首页中国最新疫情最新消息
  • 网站建设销售技巧话术军事新闻头条
  • vue单页面做网站加载慢房地产市场现状分析
  • 网站开发那种语言好电商运营基本知识
  • 网站建设营销型网络营销企业网站优化
  • 重庆知名做网站的公司株洲企业seo优化
  • 做网站要做相应的app吗爱站网关键词长尾挖掘工具
  • 常用网站开发软件深圳市seo上词贵不贵
  • 天津技术网站建设cctv 13新闻频道