广泛的应用和研究,相关论文指数级增长
ChatGPT发布后两个月月活迅速破亿,成为最快破亿的应用
专用模型:针对特定模型,一个模型解决一个问题 通用大模型:一个模型应对多种任务、多种模态 GPT-4 从语言拓展到图像
轻量级:InternLM-7B:社区低成本可用最佳模型规模 中量级:InternLM-20B:商业场景可开发定制高精度、较小模型规模
轻量级:InternLM-7B | InternLM-20B | InternLM-123B |
---|---|---|
社区低成本可用最佳模型规模 | 商业场景可开发定制高精度,较小模型规模 | 通用大模型能力全面覆盖,千亿模型规模 |
根据对于模型的需求选择操作顺序
文本数据:50亿个文档,数据量超1TB
图像-文本数据集:超2200万个文件,数据量超140GB
视频数据:超1000个文件,数据量超900GB