当前位置: 首页 > news >正文

无锡网站制作8qq推广引流怎么做

无锡网站制作8,qq推广引流怎么做,安徽六安属于哪个市,安阳做网站哪里好LayerNormlization 在许多的语言模型如Bert里,虽然都是说做的LayerNormlization,但计算均值和方差只会沿着channel维度做,并不是沿着seq_L和channel维度一起做,参考:BERT用的LayerNorm可能不是你认为的那个Layer Norm  LayerNorm…

LayerNormlization

 在许多的语言模型如Bert里,虽然都是说做的LayerNormlization,但计算均值和方差只会沿着channel维度做,并不是沿着seq_L和channel维度一起做,参考:BERT用的LayerNorm可能不是你认为的那个Layer Norm
 LayerNormlization计算流程:

  1. init里初始化C_in大小的scale和shift向量
  2. 沿Channel维度计算均值和方差
  3. 归一化

代码

 LayerNorm(InstanceNorm)实现如下:

class LayerNormalization(nn.Module):def __init__(self,hidden_dim,eps=1e-6):super(LayerNormalization, self).__init__()self.eps=epsself.gamma=nn.Parameter(torch.ones(hidden_dim))self.beta=nn.Parameter(torch.zeros(hidden_dim))def forward(self,x):B,seq_L,C=x.shapemean=x.mean(dim=-1,keepdim=True)std=x.std(dim=-1,keepdim=True)out=(x-mean)/(std+self.eps)out=out*self.gamma+self.betareturn out
if __name__=="__main__":tensor_input=torch.rand(5,10,8)model=LayerNormalization(8)res=model(tensor_input)print(res)
http://www.yidumall.com/news/95211.html

相关文章:

  • 成都网站开发公司排名seo是什么意思新手怎么做seo
  • 怎样做代刷网站新乡网站优化公司价格
  • 贸易公司 网站 扶持福州排名seo公司
  • 网站做下载wordpress网络游戏推广员
  • wordpress说明书网站制作优化排名
  • 佛山企业网站建设咨询如何在百度上推广业务
  • diy在线定制网站系统一键搭建网站
  • 网站建设美化seo做的好的网站
  • 做外贸手机网站搜索引擎优化的英语简称
  • 美橙互联网站模板云南网站seo服务
  • 深圳航空官网机票预订百度seo原理
  • 网站后台对接表新闻内容摘抄
  • 南充网站建设公司新闻今天的最新新闻
  • 广州白云发布最新通告一键优化下载
  • 官网设计报价seo网站推广方案策划书
  • 建网站的费用包括哈尔滨优化推广公司
  • wordpress书谷歌sem和seo区别
  • 跨境进口网站怎么做广告投放网站平台
  • visual studio做的网站网站维护一年一般多少钱?
  • 网站标题有图片要怎么做网站上不去首页seo要怎么办
  • 蓝色政府网站模板上海seo优化培训机构
  • 日语网站建设网络游戏推广平台
  • 眉山建行网站百度网址大全官方网站
  • 网站运营前期中期后期企业网站制作与维护
  • 如何用macbook做网站小说榜单首页百度搜索风云榜
  • 教做幼儿菜谱菜的网站百度浏览器网址链接
  • 阿里云可以做几个网站百度快速排名优化服务
  • 魔方网站建设网络营销的内容有哪些方面
  • wordpress 全站ssl官网整站优化
  • 网站建设wordpress国家卫健委每日疫情报告