有效上下文 提升20倍!DeepMind发布ReadAgent框架

有效上下文 提升20倍!DeepMind发布ReadAgent框架

基于Transformer的大语言模型,LLM,具有很强的语言理解能力,但LLM一次能够读取的文本量仍然受到极大限制,除了上下文窗口较小外,LLM的性能会随着输入内容长度的增加而下降,即便输入内容未超过模型的上下文窗口长度限制也是如此,相比......
admigg 11-15
636 357 873
Anthropic 升级版 3.5 Sonnet 模型 像人一样操控电脑 Claude

Anthropic 升级版 3.5 Sonnet 模型 像人一样操控电脑 Claude

在人工智能的创新之路上,Anthropic公司再次成为焦点,其推出的升级版Claude3.5Sonnet模型引发了广泛关注与热议,一个核心问题摆在我们面前,它真的能够像人一样操控电脑吗,一、模型发展与新特性亮相Claude3.5Sonnet......
admigg 11-15
759 560 502
OCR 创新引领光学字符识别新境界 探索 Zerox

OCR 创新引领光学字符识别新境界 探索 Zerox

在数字化信息飞速发展的当今时代,光学字符识别,OCR,技术成为了连接纸质与数字世界的重要桥梁,它能够将各种文档中的文字快速准确地转换为可编辑的电子文本,极大地提高了工作效率和信息利用价值,在众多OCR工具中,ZeroxOCR以其独特的特性和......
admigg 11-15
531 554 578
GLM 人工智能新高度

GLM 人工智能新高度

在当今人工智能飞速发展的时代,各种先进的大模型不断涌现,为我们的生活和工作带来了前所未有的变革,今天,让我们一同走进智谱AI推出的GLM4Plus大模型,深入了解它的独特魅力和强大功能,一、GLM4Plus简介智谱GLM团队重磅发布了新一代......
admigg 11-15
748 506 744
Madry OpenAI Preparedness团队首席Aleksander 机器学习模型的内部计算如何将输入转化为预测

Madry OpenAI Preparedness团队首席Aleksander 机器学习模型的内部计算如何将输入转化为预测

考虑一个标准的ResNet50模型,该模型经过训练用于图像分类任务,我们是否能够理解这个模型中的卷积滤波器如何将输入图像转换为其预测的标签,或者,GPT3中的注意力头如何contribute到下一个标记的预测,理解这些模型组件&am......
admigg 11-15
918 602 537
揭秘MemoRAG AI记忆模块如何提升生成质量

揭秘MemoRAG AI记忆模块如何提升生成质量

RAG技术已经成为当下提升大语言模型,LLMs,生成质量的重要手段,然而,传统的RAG方法在处理模糊信息需求或非结构化知识时存在显著局限性,近期,一项名为,MEMORAG,MOVINGTOWARDSNEXTGENRAGVIAMEMORYIN......
admigg 11-15
165 407 641
刚刚 OpenAI发布sCM提升50倍效率 扩散模型重大技术突破!

刚刚 OpenAI发布sCM提升50倍效率 扩散模型重大技术突破!

1、sCM新扩散模型在今日凌晨,OpenAI推出了创新的扩散模型方法sCM,这一方法仅需两步骤即可生成高质量的图片和3D模型,实现了高达50倍的时钟速度提升,特别是在处理高分辨率任务时表现尤为出色,举例来说,利用sCM训练的一个拥有15亿参......
admigg 11-15
550 142 798
清华大学提出1

清华大学提出1

在深度神经网络的训练过程中,全量化训练,FullyQuantizedTraining,FQT,通过将激活值、权重和梯度量化到较低的精度,显著加速了训练过程,随着对训练数值精度的不断压缩,一个自然而然的问题浮现出来,全量化训练的极限是什么,即......
admigg 11-15
157 118 724
Sam GPT Altman

Sam GPT Altman

5月16日,OpenAI首席执行官SamAltman接受了,硅谷著名风险投资公司红点,Redpoint,的董事兼总经理LoganBartlett专访,本周二,OpenAI重磅发布了可跨文本、视频、音频推理的多模态大模型GPT4o,其多元化的......
admigg 11-15
115 264 586
再战Transformer!原作者带队的Mamba 2来了 新架构训练效率大幅提升

再战Transformer!原作者带队的Mamba 2来了 新架构训练效率大幅提升

自2017年被提出以来,Transformer已经成为AI大模型的主流架构,一直稳居语言建模方面C位,但随着模型规模的扩展和需要处理的序列不断变长,Transformer的局限性也逐渐凸显,一个很明显的缺陷是,Transformer模型中自......
admigg 11-15
971 514 693