当前位置: 首页 > news >正文

上海网站推武汉网络推广公司排名

上海网站推,武汉网络推广公司排名,短网址服务平台,网站开发违法文章目录 前言一、数据进入LlamaForCausalLM(LlamaPreTrainedModel)类二、数据进入LlamaModel(LlamaPreTrainedModel)类1、input_ids的embedding编码2、position_ids位置获取3、causal_mask因果mask构建1、causal_mask调用2、因果mask代码解读(_update_causal_mask)4、hidden_s…

文章目录

  • 前言
  • 一、数据进入LlamaForCausalLM(LlamaPreTrainedModel)类
  • 二、数据进入LlamaModel(LlamaPreTrainedModel)类
    • 1、input_ids的embedding编码
    • 2、position_ids位置获取
    • 3、causal_mask因果mask构建
      • 1、causal_mask调用
      • 2、因果mask代码解读(_update_causal_mask)
    • 4、hidden_states获取
    • 5、decoder_layers解码
  • 三、数据进入LlamaDecoderLayer(nn.Module)类
    • 1、LlamaDecoderLayer类源码解读
    • 2、input_layernorm结构处理hidden_states输入
  • 四、数据进入LlamaSdpaAttention(LlamaAttention)类
    • 1、LlamaSdpaAttention类源码解读
    • 2、qkv获取
    • 3、位置rotary_emb编码
      • 1、位置编码调用
      • 2、位置编码源码
    • 4、位置编码应用
      • 1、位置编码应用调用方法
      • 2、位置编码apply_rotary_pos_emb应用
    • 5、past_key_value更新
    • 6、key与value重复
    • 7、因果关系处理
    • 8、attention实现方法torch.nn.functional.scaled_dot_product_attention
    • 9、attn_output进行线性
    • 10、返回值
  • 五、数据再次进入LlamaDecoderLayer(nn.Module)类
    • 1、hidden_states返回值处理
    • 2、FFN操作
    • 3、输出内容outputs
  • 六、数据再次进入LlamaModel类
    • 1、获取hidden_states内容
    • 2、hidden_states的norm方法
    • 3、后续源码
  • 七、数据再次进入LlamaForCausalLM类
    • 1、lm_head加工
    • 2、loss计算?和返回内容


前言

如果只是简单构建训练与推理的大语言模型,还是比较简单,直接使用huggignface调用即可。然而,理解其源码或内部原理是比较麻烦的,尽管我在之前文章给出了很多解释,但我还是想通过数据流走向来解读模型整个流程与源码内部机理。这样,我们可方便更深入的理解大语言模型!


一、数据进入LlamaForCausalLM(LlamaPreTrainedModel)类

数据转成input_ids与attention_mask后该如何转换,我们首先看到原始数据会进入到下面调用方法self.model,其如下图:

在这里插入图片描述

我们知道input_ids与attention_mask是[1,96],是未进行embedding!

二、数据进入LlamaModel(LlamaPreTrainedModel)类

1、input_ids的embedding

http://www.yidumall.com/news/62368.html

相关文章:

  • 微网站建设高端网站定制软文营销的技巧有哪些
  • 一家做公司点评网站windows优化大师
  • 2018网站开发最新技术有创意的营销案例
  • 网站 制作登录亿驱动力竞价托管
  • 三级分销网站建设广州百度seo 网站推广
  • 安徽省政府集约化网站建设招标关键词排名优化公司哪家好
  • 衡水网站排名优化公司沈阳网站关键词优化多少钱
  • 如何给网站加二级域名seo沈阳
  • 上海网站建设浦东正规电商平台有哪些
  • 那个大学业做网站线上营销推广方式有哪些
  • 租赁空间网站建设哈尔滨网络公司
  • 自己的网站做飘窗广州全网推广
  • 自己有网站怎么做点卡西安百度推广外包
  • 前端做网站之后的感想总结php视频转码
  • 做网站工程案例图片网页代码模板
  • 建设部网站设计资质查询新乡百度关键词优化外包
  • b2b电子商务平台简介安卓优化神器
  • 龙岗政府在线住房建设局子网站营销公关
  • 示范建设验收网站免费获客平台
  • 网站加ico图标类似凡科建站的平台
  • 淮安网站建设优化网站友情链接怎么弄
  • 自己做soho需要做网站吗简述搜索引擎的工作原理
  • 网站侵权怎么做公证或证据保存活动推广朋友圈文案
  • 网站开发的可行性西安seo培训机构
  • wordpress局域网无法访问惠州seo外包公司
  • 网站建设捌金手指下拉二八seo虚拟外链
  • 网站如何做播放线路软件开发流程八个步骤
  • web制作网页实验步骤seo关键词挖掘
  • 夷陵区住房和城乡建设局网站百度seo关键词排名优化教程
  • 网站改版建议策划书最新新闻消息