汽车长翅膀 GPU 是如何加速深度学习模型的训练和推理过程的

汽车长翅膀 GPU 是如何加速深度学习模型的训练和推理过程的

编者按,深度学习的飞速发展离不开硬件技术的突破,而GPU的崛起无疑是其中最大的推力之一,但你是否曾好奇过,为何一行简单的&amp,ldquo,.to,&amp,#039,cuda&amp,#039,&amp,......
admigg 11-14
920 284 425
H100 10k 怎样在 上训练模型 GPU #AIGC创新先锋者征文大赛# 个

H100 10k 怎样在 上训练模型 GPU #AIGC创新先锋者征文大赛# 个

​​,本文正在参与AI.x社区AIGC创新先锋者征文大赛,​​​​https,www.aigc2223.html​​编者按,怎样在10,000个H100GPU上训练大模型,如何充分利用每一块GPU的算力,如何在这个复杂的GPU网络中高效传递......
admigg 11-14
274 255 692
化 5 Query 腐朽 优化技术应对千奇百怪的 RAG 种 神奇 为

化 5 Query 腐朽 优化技术应对千奇百怪的 RAG 种 神奇 为

编者按,您是否曾经遇到这样的情况,明明构建了一个功能强大的RAG系统,但用户却频繁抱怨&amp,ldquo,找不到想要的信息&amp,rdquo,或&amp,ldquo,返回的结果不够准确&amp,rdquo......
admigg 11-14
619 596 746
LLM集中爆发的一周 卷疯了! Open

LLM集中爆发的一周 卷疯了! Open

开源大模型领域热闹非凡的一周,各种开源,PaperAgent进行了概括,端侧、Code、RAG、Agent、Reflection,反思纠正,、MoE,你关注的都在这里了,ReflectionLlama3.170B开源ReflectionLl......
admigg 11-14
994 384 711
训练的万卡集群 LLM 阿里 HPN 针对大规模

训练的万卡集群 LLM 阿里 HPN 针对大规模

一、背景之前的文章中我们具体介绍了万卡GPU集群中的网络拓扑以及在万卡GPU集群中进行大规模LLM训练面对的挑战和解决方案;也进一步介绍了阿里云的集合通信调度框架C4和C4底层的阿里云新一代智算集群网络架构HPN7.0,不过上述HPN7.0......
admigg 11-14
637 189 656
如何使用HippoRAG增强LLM的记忆

如何使用HippoRAG增强LLM的记忆

译者李睿审校重楼大型语言模型,LLM,已经证明是一种非常宝贵的思考工具,经过大量文本、代码和其他媒体数据集的训练,它们能够创作出接近人类水平的文章、翻译语言、生成图像,还能以信息丰富的方式回答人们提出的问题,甚至可以编写不同类型的创意内容,......
admigg 11-14
413 429 586
HippoRAG如何从大脑获取线索以改进LLM检索

HippoRAG如何从大脑获取线索以改进LLM检索

译者李睿审校重楼知识存储和检索正在成为大型语言模型,LLM,应用的重要组成部分,虽然检索增强生成,RAG,在该领域取得了巨大进步,但一些局限性仍然没有克服,俄亥俄州立大学和斯坦福大学的研究团队推出了HippoRAG,这是一种创新性的检索框架......
admigg 11-14
258 564 899
如何改进RAG模型的性能

如何改进RAG模型的性能

本文中将重点介绍如何优化RAG系统,使其尽可能高效,我们从多个角度介绍RAG系统,深入了解其用途以及如何优化,介绍检索增强生成,RAG,模型通常被称为RAG系统,在AI行业得到极大的关注,这种模型背后的概念很简单,我们允许模型根据需要从单独......
admigg 11-14
270 398 232
Mixture

Mixture

嘿,大家好!这里是一个专注于AI智能体的频道!首先,让我们来聊聊LLM,这些模型通过在海量数据集上预训练,已经展现出了惊人的能力,无论是理解还是生成自然语言,它们都能做得很好,但问题来了,这些模型的规模和训练成本都很高,这让它们在实际应用中......
admigg 11-14
625 333 728
XAI有什么用 探索LLM时代利用可解释性的10种策略

XAI有什么用 探索LLM时代利用可解释性的10种策略

你是否也好奇,在大模型时代,可解释性人工智能技术,XAI,有怎样的使用价值,近日,来自佐治亚大学、新泽西理工学院、弗吉尼亚大学、维克森林大学、和腾讯AILab的研究者联合发布了解释性技术在大语言模型,LLM,上的可用性综述,提出了,Usab......
admigg 11-14
681 315 793