GPU和CPU如何混合训练大模型训练的GPU联手CPU显存优化分析方法

admigg

2024-11-15 01:18:12发布
关注私信

531 508 289

如果使用fluid.CUDAPlace指定了全局的运行设备，飞桨将会自动把支持GPU计算的OP分配在GPU上执行，然而当模型参数量过大并且显存有限时，很可能会遇到显存超出的情况。如下面的示例代码，embedding层的参数size包含两个元素，第一个元素为vocab_size(词表大小)，第二个为emb_size（embedding层维度）。实际场景中，词表可能会非常大。示例代码中，词表大小被设置为10,000,000，该层创建的权重矩阵的大小为(10000000, 150)，仅这一层就需要占用5.59G的显存。如果再加上其他的网络层，在这种大词表场景下，很有可能会显存超出。

版权声明 1、本网站名称：朵贝贝家具网
2、本站永久网址：http://www.dbbjjxs.com
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报

#AI #盘古 #Copilot #人工智能 #训练 #孟子 #清言 #模型 #开源大模型 #AIGC应用 #Sora #AIGC #LaMDA #混元 #Bard #日日新 #通义千问 #紫东太初 #多模态 #言犀 #文心一言 #GPT #OpenAI #悟道 #ChatGPT #4 #Agent #大模型 #云雀

GPU和CPU如何混合训练 大模型训练的GPU联手CPU显存优化分析方法

GPU和CPU如何混合训练大模型训练的GPU联手CPU显存优化分析方法