讯飞星火4.0 Turbo正式发布，大模型规模化落地加速到来！-中国吉林网

　　国产大模型“竞速赛”，又有新消息。

　　10月24日，第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上，科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单，并发布讯飞星火4.0 Turbo：七大核心能力全面超过GPT-4 Turbo，数学和代码能力超越GPT-4o，国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此同时，国产超大规模智算平台“飞星二号”正式启动。

　　众所周知，随着人工智能技术的迅猛发展,AI大模型已经成为全球科技竞争的焦点、未来产业的关键赛道以及经济发展的新动力。

　　放眼国内外，丰富的应用场景为大模型迭代提供试验载体，生成式人工智能遍地开花，“大模型之争”也愈演愈烈。

　　那么问题来了，正式发布的讯飞星火4.0 Turbo有何过人之处？

　　来看一组细节：

科大讯飞1.png

　　发布会上，科大讯飞首发10项基于讯飞星火底座能力的硬核产品与创新应用：定义多模AIUI标准，发布超拟人数字人；发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型；发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等；发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种 AI 翻译透明屏。

　　此外，在数学能力、代码能力上超过了GPT-4o。由艾伦人工智能研究所、OpenAI等国内外权威单位发布，涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中，讯飞星火4.0-Turbo在其中9项测试集中实现超越，效率相对提升50%。

　　现场，刘庆峰特别提到“硬碰硬”的数学能力和代码能力。

　　据悉，根据实用数学任务构建测试集CAppliedMath-1.0，讯飞星火4.0 Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平，已完成超长思维链、树搜索和自我反思评价等算法验证，预计今年底可实现类“o1”的高难度数学能力显著提升。

　　根据代码生成HumanEval测试集上的效果对比，讯飞星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o的差距微弱，在C++能力上超过GPT-4o。在真实应用场景，基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集，讯飞星火4.0 Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。同时推出星火代码7B版本，满足代码生成、代码补全等极速响应型任务，效果业界最优。

　　值得注意的是，发布会上，科大讯飞重新定义万物智联时代的多模AIUI交互标准，在原有的远场高噪、全双工、多语种多方言能力上，升级了多模态能力，新增了超拟人和个性化能力。

　　超拟人数字人首次亮相，多模态的交互从超拟人的语音变成超拟人的数字人，实现语音、视频、图文的全部联动的多模态交互……

　　此外，在语音识别领域，科大讯飞的远场高噪场景语音识别领先优势进一步扩大。

　　在多语言能力上，首次实现全国地级市方言全覆盖，含全国288个地市、202种方言，讯飞输入法14.0即将支持202种方言免切换自由说。

科大讯飞2.png

　　AI如何赋能企业，在发布会上亦能找到答案。

　　截至2024年10月，科大讯飞已与各头部企业共建20多个行业大模型，覆盖300+应用场景，所覆盖行业和场景数都是第一。据悉，为了帮助各行各业更好地落地大模型，科大讯飞构建了从“建算力、理数据、训模型，到落场景、保安全、精运营”的全套解决方案。

　　“科大讯飞有领先的工具链，可大幅提升‘理数据、训模型’的效率；有覆盖300+行业场景的实际应用案例，已形成相互借鉴和复用的规模化效应；还有全国产化的算力平台。”刘庆峰说。

　　中国吉林网吉刻APP

　　记者栾喜良

　　供图：科大讯飞

初审：郭龙复审：孙晓云终审：张彦梅吉网新闻热线：0431-82902222

讯飞星火4.0 Turbo正式发布，大模型规模化落地加速到来！

评论