1. 概述

大模型成为热门关键词

广泛的应用和研究,相关论文指数级增长

ChatGPT发布后两个月月活迅速破亿,成为最快破亿的应用

大模型成为发展通用人工智能的重要途径

专用模型:针对特定模型,一个模型解决一个问题 通用大模型:一个模型应对多种任务、多种模态 GPT-4 从语言拓展到图像

书生·浦语大模型开源历程

轻量级:InternLM-7B:社区低成本可用最佳模型规模 中量级:InternLM-20B:商业场景可开发定制高精度、较小模型规模

书生·浦语大模型系列

轻量级:InternLM-7B InternLM-20B InternLM-123B
社区低成本可用最佳模型规模 商业场景可开发定制高精度,较小模型规模 通用大模型能力全面覆盖,千亿模型规模

从模型到应用

根据对于模型的需求选择操作顺序

根据对于模型的需求选择操作顺序

2. 书生·浦语全链条开源开放体系

Untitled

数据

书生·万卷 1.0

文本数据:50亿个文档,数据量超1TB

图像-文本数据集:超2200万个文件,数据量超140GB

视频数据:超1000个文件,数据量超900GB