讯飞联手华为攻克全国产算力下推理模型训练难关
讯飞联手华为攻克全国产算力下推理模型训练难关 1月15日,科大讯飞发布了我国“全国产”算力平台第一个深度推理大模型——讯飞星火X1。据公开测试,该模型中文数学能力表现突出,目前已应用于教育、医疗等场景。 在大模型研发领域,讯飞星火坚持走全国产化路线。据科大讯飞研究院副院长殷兵介绍,尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的、具备深度思考和推理能力的大模型——讯飞星火X1。 发布会上,科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题、美国数学邀请赛(AIME)赛题以及高中奥赛题的表现。讯飞星火X1对解题思路和步骤进行了详细拆解,准确给出了这些题目的答案。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。 “讯飞星火X1充分展现深度推理模型的三大典型特征:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。”殷兵介绍说。 目前,讯飞星火X1率先在教育等真实场景中实现了应用落地。去年“1024开发者节”,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手,目前正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。在已部署的上述试点区域,星火X1广获好评,老师们反馈称讯飞X1在一题多解、教学知识关联、拓展学生高阶思维等方面表现出色。 在医疗领域,讯飞星火X1的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。发布会上,科大讯飞宣布将在2025年上半年正式发布基于讯飞星火X1的医疗大模型升级版,确保其深层次诊断推理效果和质控能力的领先水平。 此次发布会上,讯飞星火4.0 Turbo底座能力实现了全新升级,七大核心能力全面提升,全面对标OpenAI 最新版的GPT-4o。此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。 在备受关注的数学能力上,此次基于讯飞星火X1的高质量合成数据,讯飞星火4.0 Turbo的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好地帮助用户。此外,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒。