OpenAI的o1是万金油吗 !研究发现 专家为思维链 泼冷水 这三种任务不适合让AI 想太多 o1准确率直降36.3%!

OpenAI的o1是万金油吗 !研究发现 专家为思维链 泼冷水 这三种任务不适合让AI 想太多 o1准确率直降36.3%!

尤其在GPT,4o中,CoT对MNLI和SNLI,数据集名,的性能提高了40%以上,然而,在直给答案的Prompt引导下表现最好的模型——Gemini,1.5,Pro中,研究却看到了CoT造成的性能下降。...
admigg 11-14
961 357 641