讯飞星火4.0 Turbo正式发布,大模型规模化落地加速到来! 吉网原创-第一新闻 郭龙 3893859
讯飞星火4.0 Turbo正式发布,大模型规模化落地加速到来! 吉网原创-第一新闻 郭龙 3893859
您当前的位置 :首页 > 第一新闻 > 吉网原创

讯飞星火4.0 Turbo正式发布,大模型规模化落地加速到来!

2024-10-24 20:18      来源: 中国吉林网

  国产大模型“竞速赛”,又有新消息。

  10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此同时,国产超大规模智算平台“飞星二号”正式启动。

  众所周知,随着人工智能技术的迅猛发展,AI大模型已经成为全球科技竞争的焦点、未来产业的关键赛道以及经济发展的新动力。

  放眼国内外,丰富的应用场景为大模型迭代提供试验载体,生成式人工智能遍地开花,“大模型之争”也愈演愈烈。

  那么问题来了,正式发布的讯飞星火4.0 Turbo有何过人之处?

  来看一组细节:

科大讯飞1.png

  发布会上,科大讯飞首发10项基于讯飞星火底座能力的硬核产品与创新应用:定义多模AIUI标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种 AI 翻译透明屏。

  此外,在数学能力、代码能力上超过了GPT-4o。由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集中实现超越,效率相对提升50%。

  现场,刘庆峰特别提到“硬碰硬”的数学能力和代码能力。

  据悉,根据实用数学任务构建测试集CAppliedMath-1.0,讯飞星火4.0 Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类“o1”的高难度数学能力显著提升。

  根据代码生成HumanEval测试集上的效果对比,讯飞星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o的差距微弱,在C++能力上超过GPT-4o。在真实应用场景,基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集,讯飞星火4.0 Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。同时推出星火代码7B版本,满足代码生成、代码补全等极速响应型任务,效果业界最优。

  值得注意的是,发布会上,科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。

  超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互……

  此外,在语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。

  在多语言能力上,首次实现全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说。

科大讯飞2.png

  AI如何赋能企业,在发布会上亦能找到答案。

  截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景,所覆盖行业和场景数都是第一。据悉,为了帮助各行各业更好地落地大模型,科大讯飞构建了从“建算力、理数据、训模型,到落场景、保安全、精运营”的全套解决方案。

  “科大讯飞有领先的工具链,可大幅提升‘理数据、训模型’的效率;有覆盖300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应;还有全国产化的算力平台。”刘庆峰说。

  中国吉林网 吉刻APP

  记者 栾喜良

  供图:科大讯飞

初审: 郭龙   复审: 孙晓云   终审: 张彦梅 吉网新闻热线:0431-82902222