LLM集中爆发的一周 卷疯了! Open
开源大模型领域热闹非凡的一周,各种开源,PaperAgent进行了概括,端侧、Code、RAG、Agent、Reflection,反思纠正,、MoE,你关注的都在这里了,ReflectionLlama3.170B开源ReflectionLl......
阿里史上最大规模开源发布 超GPT
今天凌晨,阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5Coder和数学的Qwen2.5Math,这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用......
一文彻底搞懂大模型
HuggingFaceTransformers是一个开源的预训练模型库,旨在将NLP领域的最新进展向更广泛的机器学习社区开放,该库包含了经过精心设计的最先进的Transformer架构,并提供了易于使用的API,使得研究人员和开发者能够轻松......
Google开源大模型新成员CodeGemma 继Transformer后新架构Griffin诞生 RecurrentGemma
2024年2月,Google推出了Gemma,一系列轻量级、先进的开源大模型,这些模型是使用创建Gemini模型时所使用的相同研究和技术构建的,近日,Google宣布了Gemma家族的首批新增成员,为机器学习开发者扩展了创新责任的可能性,C......
AlphaFold 统一生物语言大模型阿里云先开了! 3不开源
把169861个生物物种数据装进大模型,大模型竟get到了生物中心法则的奥秘&,mdash,&,mdash,不仅能识别DNA、RNA与相应蛋白质之间的内在联系,在基因分类、蛋白质相互作用预测、热稳定性预测等7种不......
3.1 Llama 教你白嫖使用最强开源大模型 405B
LLama3.1有多种规模模型,从4050亿参数的超大版到70B、8B的轻量级版,想试用70B和8B,可以直接在Groq平台上体验,由于需求旺盛,405B模型不常开放,本文教你如何免费使用405B,不用下载安装,1在MetaAI上体验Lla......
7B超越百亿级 北大开源aiXcoder
当下,大语言模型集成至编程领域、完成代码生成与补全任务成为重要趋势,业界已经出现了一批引人瞩目的代码大模型,比如OpenAI的CodeX、谷歌DeepMind的AlphaCode、HuggingFace的StarCoder,帮助程序员更迅捷......
你值得拥有!!! Qwen2.5系列模型开源
Ta来了,Ta来了,Ta带着7个Size的开源模型迎面走来了,是的,期待已久的Qwen2.5开源了,共有7个尺寸规模,包括,0.5B、1.5B、3B、7B、14B、32B和72B,分别有Base模型和Instruct模型,本次全是Dense......
意料之外的效果 意料之中的尺寸 GLM4模型开源
写在前面今天智谱开了GLM49B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM49B,、Chat版本模型,GLM49BChat和GLM49BChat1M,和多模态模型,GLM4V9BChat,其中,模型为多语言模型除......
Meta发布1B和3B端侧模型 11B和90B多模态模型 Llama3.2开源
早上起来发现,MetaAI又开源模型,文本模型开源了端侧小模型1B和3B模型,也是首次开源了多模态大模型11B和90B两个版本;同时还开源了一个LlamaStack项目,Blog,https,ai.meta.comblogllama32co......