但等来了Qwen2 没有等来Qwen2.5

admigg

2024-11-14 23:37:34发布
关注私信

470 111 265

Qwen2又出新作Math大模型，你值得拥有。

我没有等来Qwen2.5，但等来了Qwen2-Math ，在数学推理能力上大幅度提高，先来一张图阵阵场子，72B模型超过GPT4-o、Claude-3.5-Sonnet和Gemini-1.5-Pro。

Blog:：
 本次开源共涉及3个尺寸2个版本，分别为Qwen2-Math-1.5B、Qwen2-Math-1.5B-Instruct、Qwen2-Math-7B、Qwen2-Math-7B-Instruct、Qwen2-Math-72B和Qwen2-Math-72B-Instruct。


 模型训练初始化采用Qwen2-1.5B、Qwen2-7B和Qwen2-72B，训练语料涉及高质量的数学网络文本、书籍、代码、考试题目以及由
 
  Qwen2模型合成的数学预训练数据
 
 。


 指令微调阶段是先用Qwen2-Math-72B训练了一个数学专用的奖励模型，然后利用该奖励模型和指示模型回答问题是否正确这两个指标一起拒绝采用构建SFT数据集，并利用GRPO进一步对齐模型效果。


 注意：模型在预训练和指令微调阶段为了防止数据泄露，均进行数据去污染除了，移除测试集中
 
  13-gram重复
 
 且
 
  最长公共子序列比例大于0.6
 
 的训练样本。


 模型在GSM8K、MATH、Aqua、SAT Math、OlympiadBench、College Math、AIME24、AMC23多个等数据集上均取得了很好的效果。



 相较于原版Qwen2有很大的提升


 HF快速使用：

from transformers import AutoModelForCausalLM, AutoTokenizermodel_name = "Qwen/Qwen2-Math-1.5B-Instruct"device = "cuda"model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto")tokenizer = AutoTokenizer.from_pretrained(model_name)prompt = "Find the value of $x$ that satisfies the equation $4x+5 = 6x+7$."messages = [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": prompt}]text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True)model_inputs = tokenizer([text], return_tensors="pt").to(device)generated_ids = model.generate(**model_inputs,max_new_tokens=512)generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]print(response)

 最后说一下，官方表示目前的模型仅为英文模型，后续会推出中英双语模型。


 本文转载自，作者：

版权声明 1、本网站名称：朵贝贝家具网
2、本站永久网址：http://www.dbbjjxs.com
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报

#Copilot #Agent #Bard #清言 #AI #GPT #文心一言 #4 #言犀 #人工智能 #Qwen2 #紫东太初 #混元 #盘古 #OpenAI #日日新 #Sora #通义千问 #大模型 #云雀 #模型 #开源大模型 #悟道 #孟子 #Qwen2.5 #ChatGPT #多模态 #AIGC #LaMDA #AIGC应用