当前位置: 首页 > news >正文

汽车网站设计论文长春网站制作系统

汽车网站设计论文,长春网站制作系统,中国纪检监察报电子版,门户 diy WordPressBGE的技术亮点: 高效预训练和大规模文本微调;在两个大规模语料集上采用了RetroMAE预训练算法,进一步增强了模型的语义表征能力;通过负采样和难负样例挖掘,增强了语义向量的判别力;借鉴Instruction Tuning的…

BGE的技术亮点:

  • 高效预训练和大规模文本微调;
  • 在两个大规模语料集上采用了RetroMAE预训练算法,进一步增强了模型的语义表征能力;
  • 通过负采样和难负样例挖掘,增强了语义向量的判别力;
  • 借鉴Instruction Tuning的策略,增强了在多任务场景下的通用能力。

数据集的构成:
在这里插入图片描述

RetroMAE预训练

主要思想是:encoder用小一点的mask rate得到sentence embedding,然后decoder用大一点的mask rate结合encoder得到的sentence embedding进行重构

在这里插入图片描述
此外,为了使得每个token使用的context信息不同,RetroMAE还使用了增强解码的方法

在这里插入图片描述

  • 解码的时候每一行都带,上下文信息和位置信息
    在这里插入图片描述
    在这里插入图片描述

微调

  • 主要通过对比学习和Instruction Tuning的思想

对比学习是一种训练模型的方法,通过比较正例和反例来学习数据的表示。

  • 输入数据的格式:模型接受三元组格式的数据作为输入,包括一个查询(query),一个正例(positive),和一个反例(negative)。

  • in-batch negatives 策略:除了上述三元组中的反例外,他们还采用了“in-batch negatives”策略,意思是在同一个批次的数据中,使用其他数据作为额外的反例。

  • cross-device negatives sharing method:这是一种在不同的GPU之间共享反例的方法,目的是大大增加反例的数量。

  • 训练硬件和参数:使用了48个A100(40G)的GPU进行训练。批次大小为32,768,因此每个查询在批次中有65,535个反例。使用了AdamW优化器,学习率为1e-5。对比损失的温度为0.01。

  • 在训练中为检索任务的查询添加了instruction。 对于英语,指令是Represent this sentence for searching relevant passages: ; 对于中文,指令是为这个句子生成表示以用于检索相关文章:. 在评测中,针对段落检索任务的任务需要在查询中添加指令,但不需要为段落文档添加指令。

http://www.yidumall.com/news/13906.html

相关文章:

  • 常州个人网站建设今日新闻热点大事件
  • 内部网站建设seo推广主要做什么
  • 网站建设的原则有哪些方面百度手机助手应用商店
  • 柳市建设网站关键词优化武汉
  • 怎么做自己的网站免费广州seo网站排名
  • 漯河做网站zrgu国外搜索引擎入口
  • 近期10大新闻事件山东网站seo
  • 聊城网站建设优化百度搜索引擎网址格式
  • 一站式织梦网站模板百度推广外推联系方式
  • websocket 网站开发郑州seo培训班
  • 重庆网站建设报价郑州网络推广服务
  • 公司的网站怎么做推广方案国内快速建站
  • 黑马程序员前端培训费用淘宝关键词排名优化技巧
  • 怎么做网站后缀识别符号才不会变最近新闻摘抄50字
  • 服装html网站模板下载上海seo关键词优化
  • 猎头公司靠谱吗seo工作职位
  • 为什么做网站都用php最近的新闻热点
  • 德阳网站建设手机百度如何发布作品
  • 网站换ip对优化有影响吗深圳优化怎么做搜索
  • 福田商城网站建设长沙seo男团
  • 网站建设公司固定ip大数据培训机构排名前十
  • 杨凌做网站广告营销公司
  • 昆山做网站的公司有哪些无线网络优化
  • 龙岗在线网站建设海淀区seo全面优化
  • 做ppt做好的网站开发网站需要多少钱
  • 不用iis建立网站网络营销师主要做什么
  • 网站设计师网站公司怎么推广网络营销
  • 北京大型网站建设百度下载免费官方安装
  • 互联网服务网站建设目的网站建设找哪家公司好
  • 电子网站商业策划书google本地搜索