百度360必应搜狗淘宝本站头条

superbench

    清华大模型报告:文心一言中文理解、数学等多项能力全球第一

    最近,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,在人类对齐能力评测中,文心一言4.0表现位居国内第一,其中在中文推理、中文语言等评测...

    清华大学告诉你中文AI谁最强

    AI大模型方兴未艾,国内互联网巨头纷纷下场推出自己的AI大模型,那么谁家大模型最强?笔者从去年开始使用ChatGPT以及微软edge浏览器自带的bingAI,深感国外大模型对中文的支持以及本地化做的仍然不足,所以十分关注国内厂家的AI产品。很荣幸的是我很早拿到了讯飞星火和百度文心一言的内测资格,实...

    我们用GLM-4-Plus搞了个“阅读智能体”,工作效率提升了300%

    文|Alter每隔一段时间,大模型行业都会传出新的消息。先是在9月中旬,OpenAI在没有预告的情况下发布了o1模型的预览版;不到半个月后,国内的智谱发布了若干更新模型,其中就包括新的基座大模型GLM-4-Plus,也是智谱当前最强大的模型。国外围绕o1模型的讨论和场景探索还在继续,也让我们对GL...

    文心一言多项指标“遥遥领先” 清华权威报道公布

    最近,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小,名副其...

    清华大学发布3月份大模型评测报告,文心一言4.0表现亮眼

    日前,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个在海内外具有代表性的模型,结果显示:文心一言4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小。在人...

    清华大模型报告最新评测出炉!国产大模型仍旧很给力

    潮新闻客户端记者张云山由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0中文理解、数学等多项能力全球领跑。评测显...