9月2日至6日,2023年中国国际服务贸易交易会在北京举行。 作业邦受邀参加展会,并正式发布了自主研发的Galaxy机型。 此次服贸会上,银河模型在智能解题、知识问答、中英文写作、AI学习伴侣等方面的出色表现,吸引了大量现场观众互动体验。
同时,作业邦公布了Galaxy模型在两个权威大型语言模型评测基准C-Eval和CMMLU上的成绩。 数据显示,作业邦银河大模型表现极为出色,在C-Eval中以平均分73.7分排名第一; 同时,它在CMMLU Five-shot和Zero-shot评估中以平均分分别为74.03分和73.85分排名第一。 ,成为首个平均分同时位列上述两项权威榜单第一的主流教育模式。
Galaxy Big Model是作业邦自主研发的大型语言模型。 深度融合了作业邦多年的AI算法沉淀和教育数据积累。 它是为教育领域量身定制的涵盖多学科、多学习阶段、多场景的教育模式。 大模型。 不仅具有高度的多学科知识答疑能力,还可以辅助不同学术层次的学生进行创意写作。 还可以实现自主提问、陪伴辅导等,帮助学生个性化学习和成长。
作业邦银河大模型的综合实力在权威评测榜单中得到了验证。 C-Eval作为全球最具影响力的汉语评估集之一,是由清华大学、上海交通大学和爱丁堡大学联合构建的汉语语言模型综合考试评估集。 它包含 13,948 道选择题,涵盖 52 个不同科目和四个难度级别。 根据C-Eval排名的最新数据,作业帮银河模型以平均分73.7分排名第一。
在MBZUAI、上海交通大学、微软亚洲研究院联合推出的CMMLU排行榜中,作业邦银河大模型表现同样出色,分别以74.03分和73.85分在五镜头和零镜头测试中排名第一。
据了解,CMMLU共涵盖67个专题,涉及自然科学、社会科学、工程、人文和常识。 在CMMLU榜单中的出色表现,再次印证了作业邦银河模型在知识储备和语言理解方面的杰出实力。
作业帮银河大模型不仅中文表现出色,英文也表现出色。 MMLU是由加州大学伯克利分校、哥伦比亚大学、芝加哥大学等大学联合打造的全球大规模多任务语言理解评测基准。 它综合了科学、工程、数学、人文、社会科学等领域的57个学科的评价。 其中,作业帮银河大模的平均分高达71.88分,体现了其在英语领域的专业能力和解决问题的能力。
作业帮表示,作业帮银河大模型很快将应用于作业帮APP等学习工具、智能硬件、智能图书、教育数字化等业务场景。 同时,将持续优化银河大机型的性能和多模态能力,加速其在行业的发展。 更多教育场景的落地实践。