直接扩展到无限长 谷歌Infini

直接扩展到无限长 谷歌Infini

谷歌又放大招了,发布下一代Transformer模型InfiniTransformer,InfiniTransformer引入了一种有效的方法,可以将基于Transformer的大型语言模型,LLM,扩展到无限长输入,而不增加内存和计算需求......
admigg 11-14
309 675 735
准确评估大模型长上下文能力 港中文提出CLongEval中文基准测试集

准确评估大模型长上下文能力 港中文提出CLongEval中文基准测试集

论文题目,ClongEval,AChineseBenchmarkforEvaluatingLongContextLargeLanguageModels论文地址,​​https,arxiv.orgabs2403.03514​​代码地址,​​h......
admigg 11-14
760 340 280
LLM超长上下文查询

LLM超长上下文查询

在大型语言模型,LLM,的应用中,有几个场景需要以结构化的方式呈现数据,其中信息提取和查询分析是两个典型的例子,我们最近通过更新的文档和一个专门的代码仓库强调了信息提取的重要性,对于查询分析,我们同样更新了相关文档,在这些场景中,数据字段可......
admigg 11-14
418 670 616
2 2万亿token碾压Llama 革命新架构掀翻Transformer!无限上下文处理

2 2万亿token碾压Llama 革命新架构掀翻Transformer!无限上下文处理

继Mamba之后,又一敢于挑战Transformer的架构诞生了!来自Meta、南加州大学,USC,、CMU和UCSD的研究人员提出了全新的神经网络架构&amp,mdash,&amp,mdash,Megalodon,巨齿鲨,......
admigg 11-14
653 281 767
百万上下文RAG Agent还能这么玩

百万上下文RAG Agent还能这么玩

​QwenAgent的设计思路虽然与LangChain相似,但其发布几个的Agent示例却很有意思,今天本文将深入探讨如何使用QwenAgent将上下文记忆扩展到百万量级,让Agent的智能得到更广泛的应用,暴力关键字检索优于向量方案在处理......
admigg 11-14
635 496 782
AI发布SuperNova Arcee 超级新星降临

AI发布SuperNova Arcee 超级新星降临

01引言在人工智能,AI,的世界里,大型语言模型已经成为解决复杂任务、提升决策过程的重要工具,但这些模型的扩展也带来了高计算成本、低可访问性和环境影响等挑战,ArceeAI直面这些挑战,推出了SuperNovaMedius&amp,......
admigg 11-14
171 163 835
大型语言模型在医学领域的应用 探究Med

大型语言模型在医学领域的应用 探究Med

01、概述在医学领域,信息的精确性、可靠性和安全性至关重要,随着人工智能,AI,技术的发展,大型语言模型,LLM,如GPT3和BERT为医学领域带来了新的机遇,这些模型在语言处理方面的能力,使其在医学应用中显示出巨大潜力,包括知识检索、临床......
admigg 11-14
898 298 730
Zyphra发布Zamba2

Zyphra发布Zamba2

01引言在如今竞争激烈的人工智能,AI,领域,性能和效率始终是技术发展的焦点,10月15日,Zyphra公司推出了全新的Zamba27B小型语言模型,LLM,,以其强大的计算能力和卓越的效率引起了广泛关注,Zamba27B在7B参数范围内突......
admigg 11-14
698 221 491
开源 OLMo AMD 1B 完全开源的 语言模型系列 AMD

开源 OLMo AMD 1B 完全开源的 语言模型系列 AMD

01、概述在人工智能和机器学习领域,我们正经历着一场技术革命,随着技术的飞速发展,对于强大、灵活且易于获取的解决方案的需求也在不断增长,开发者、研究人员和技术爱好者在利用尖端技术时,常常受限于封闭生态系统的束缚,许多现有的语言模型,包括一些......
admigg 11-14
901 352 343
Agents在日常工作的五个实际用例! AI

Agents在日常工作的五个实际用例! AI

在当今快节奏的工作环境中,人工智能,AI,正以前所未有的速度改变着我们的工作方式,AI助手作为新一代通用人工智能,GenAI,的代表,正在引领一场智能革命,它们不仅具备强大的思考和推理能力,还能自动化处理日常任务,从而提高工作效率,随着Au......
admigg 11-14
692 245 393