当前位置: 首页 > news >正文

重庆互联网网站建设鹤壁网站seo

重庆互联网网站建设,鹤壁网站seo,中粮我买网是哪个公司做的网站,合肥企业做网站诸神缄默不语-个人CSDN博文目录 最近更新时间:2023.4.26 最早更新时间:2023.4.25 文本摘要主题的数据集见我之前写的另一篇博文:文本摘要数据集的整理、总结及介绍(持续更新ing…) 智能司法主题的数据集我准备等项目…

诸神缄默不语-个人CSDN博文目录

最近更新时间:2023.4.26
最早更新时间:2023.4.25

文本摘要主题的数据集见我之前写的另一篇博文:文本摘要数据集的整理、总结及介绍(持续更新ing…)
智能司法主题的数据集我准备等项目结束后发布。
其他NLP数据集见下:

文章目录

  • 1. 语料库
    • 1.1 中文
  • 2. QA数据集
    • 2.1 英文
  • 3. 对话系统
    • 3.1 open-domain
      • 3.1.1 中文
  • 4. 多模态
    • 4.1 图文匹配
  • 5. 复述
  • 6. 自然语言推理NLI
    • 6.1 集锦
    • 6.2 英文
  • 5. 其他集成性项目 / benchmark
    • 5.1 中文
    • 5.2 中文多模态
    • 5.3 英文

1. 语料库

1.1 中文

  1. CLUEbenchmark/CLUECorpus2020: Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料
  2. FudanNLPLAB/CBook-150K: 中文图书语料MD5链接
  3. Index of /zhwiki/latest/
  4. PCL-Platform.Intelligence/Chinese_WPLC: 中文长上下文词语预测(Chinese WPLC)数据集 - Chinese_WPLC - OpenI - 启智AI开源社区提供普惠算力!
  5. 诗歌和音韵:THUNLP-AIPoet/Datasets: Poetry-related datasets developed by THUAIPoet (Jiuge) group.

2. QA数据集

2.1 英文

  1. QQP First Quora Dataset Release: Question Pairs - Data @ Quora - Quora

3. 对话系统

3.1 open-domain

3.1.1 中文

  1. https://huggingface.co/datasets/fnlp/moss-002-sft-data
  2. https://github.com/OpenLMLab/MOSS/tree/main/SFT_data/conversations/conversation_with_plugins
  3. https://github.com/OpenLMLab/MOSS/tree/main/SFT_data/conversations/conversation_without_plugins
  4. thu-coai/CDial-GPT: A Large-scale Chinese Short-Text Conversation Dataset and Chinese pre-training dialog models

4. 多模态

4.1 图文匹配

  1. Flickr 30k From image descriptions to visual denotations: New similarity metrics for semantic inference over event descriptions

5. 复述

  1. ParaNMT-50M: Pushing the Limits of Paraphrastic Sentence Embeddings with Millions of Machine Translations
    1. Para-nmt-50m https://drive.google.com/file/d/1rbF3daJjCsa1-fu2GANeJd2FBXos1ugD/view?usp=sharing
    2. Para-nmt-5m-processed https://drive.google.com/file/d/19NQ87gEFYu3zOIp_VNYQZgmnwRuSIyJd/view?usp=sharing

6. 自然语言推理NLI

6.1 集锦

  1. 赛尔笔记 | 自然语言推理数据集简述 - 知乎
  2. GLUE部分基准数据集介绍:RTE、MRPC、SST-2、QNLI、MNLI、QQP_真·skysys的博客-CSDN博客

6.2 英文

  1. SNLI https://nlp.stanford.edu/projects/snli/

5. 其他集成性项目 / benchmark

5.1 中文

  1. CLUEbenchmark/CLUE: 中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard
  2. 中文医疗信息处理评测基准CBLUE
  3. 千言(LUGE)| 全面的中文开源数据集合
  4. funNLP
  5. brightmart/nlp_chinese_corpus: 大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP

5.2 中文多模态

  1. MUGE(Multimodal Understanding and Generation Evaluation)

5.3 英文

  1. SemEval
http://www.yidumall.com/news/83693.html

相关文章:

  • 网站应该设计成什么样专业seo整站优化
  • 西安未央区网站建设如何优化seo
  • 做网站有哪些语言腾讯疫情实时数据
  • 南宁本地网站有哪些seo提高网站排名
  • 做汽车行业必须注册际零件网站宁波seo优化排名
  • 收费小说网站怎么做优化大师下载电脑版
  • 门户网站开发的意义关键词seo排名怎么选
  • 网页规划书怎么写搜索引擎优化的概念是什么
  • 品古典家具网站模板指数基金有哪些
  • 江苏弘仁建设有限公司网站seo技术培训教程
  • 微信h5在哪个网站做小程序开发流程详细
  • 微网站开发合同排名nba
  • 龙华营销型网站建设手机建站平台
  • 建一个英文网站需要多少钱域名注册需要什么条件
  • 正规营销型网站定制软文发布平台排名
  • 学校网站模板html营销策划公司排名
  • 不动产认证是哪个公司做的网站如何自己创建网站
  • 有没有什么网站做泰国的东西网络营销的成功案例有哪些
  • 重庆企业网站设计维护互联网营销师教材
  • 日照住房和城乡建设局网站网络推广团队
  • 微网站建设教程视频教程兰州百度推广的公司
  • 买完阿里云域名如何做网站seo系统培训课程
  • wordpress摄影主题广州seo优化排名推广
  • 手机版商城网站都有哪 些功能百度联系电话多少
  • 网站建设项目实施方案青岛百度seo代理
  • 鄂州网站设计制作福州seo优化
  • 网站优化日志seo排名点击报价
  • 宅男做网站广告推广投放平台
  • 做网站要icp备案吗免费做网站推广的软件
  • 南京触屏网站开发深圳企业seo