Loading...
AI 大模型平台AI 大模型平台AI大语言模型

TigerBot

以世界级的基础大模型,贡献于中国式的创新。

标签:
TigerBot是一个多语言多任务的大规模语言模型(LLM)。根据OpenAIInstructGPT论文在公开NLP数据集上的自动评测,TigerBot-7B达到OpenAI同样大小模型的综合表现的96%,并且这只是我们的MVP,在此我们将如下探索成果开源:

  • 模型:TigerBot-7B,TigerBot-7B-base,TigerBot-180B(researchversion),
  • 代码:基本训练和推理代码,包括双卡推理180B模型的量化和推理代码,
  • 数据:预训练100G,从2TB过滤后的数据中经过去噪去重清洗而得;监督微调1G或100万条数据,按比例涵盖用户指令常见的10大类120小类任务,
  • API:chat,plugin,finetune,让用户能在半小时内无代码的训练和使用专属于自己的大模型和数据,
  • 领域数据:涵盖金融,法律,百科,广邀大模型应用开发者,一起打造中国的世界级的应用。
  • 我们在BLOOM基础上,在模型架构和算法上做了如下优化:

  • 指令完成监督微调的创新算法以获得更好的可学习型(learnability),
  • 运用ensemble和probabilisticmodeling的方法实现更可控的事实性(factuality)和创造性(generativeness),
  • 在并行训练上,我们突破了deep-speed等主流框架中若干内存和通信问题,使得在千卡环境下数月无间断,
  • 对中文语言的更不规则的分布,从tokenizer到训练算法上做了更适合的算法优化。
    • 数据统计

      数据评估

      TigerBot浏览人数已经达到12,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:TigerBot的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找TigerBot的站长进行洽谈提供。如该站的IP、PV、跳出率等!

      关于TigerBot特别声明

      本站一为导航采集站演示提供的TigerBot都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由一为导航采集站演示实际控制,在2024 年 7 月 8 日 下午5:07收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,一为导航采集站演示不承担任何责任。

      相关导航

      暂无评论

      暂无评论...