告别“胡说八道”!讯飞星火 X1升级,幻觉治理领先业界主流模型
7月25日,科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级。星火X1取得显著突破,无论是对自身生成内容真实性的把控(事实性幻觉治理),还是在参考外部资料时对原文的忠实程度(忠实性幻觉治理),都有显著改善,大大提升了大模型在行业应用中的可靠性。
整体来看,新版本综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上,已能对标OpenAI o3等国际一流大模型最新版本效果;多语言能力更是扩展至130余种。与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。
讯飞星火X1此次全面跃升,背后是一系列原创性技术突破的集成。面对大模型容易“胡说八道”的通病,科大讯飞提出基于多路径采样验证及事实性约束强化学习的幻觉治理技术,在大模型思考过程及回复生成阶段,实现客观问题与标准答案的深度强对齐,大幅减少了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题更加可靠。
多语言能力一直是讯飞的强项,此次升级将这一优势进一步放大。目前,星火X1已支持130+语种的交互问答、数学解题、文本生成、翻译等任务,为全球用户提供了真正意义上的“第二选择”。强大的多语言能力也让讯飞的同传会议服务、SaaS产品,以及翻译机、录音笔等智能设备的翻译效果和用户体验都迈上了新台阶。
不只是在多语言领域,在教育、医疗等细分行业上,升级版星火X1均有落地。如升级版星火X1,作业批改、个性化推荐、答疑辅学、科普问答及口语学习等多项能力显著提升,进一步扩大了科大讯飞在教育领域的领先优势。
借助星火X1的升级赋能,讯飞医疗各项核心能力实现全面跃升。在全科辅助诊断、体检报告解读、健康咨询、导医导诊等通用医疗任务上,星火医疗大模型持续保持业界大幅领先。其中,在医生辅助诊疗方面,星火应用范围不断扩大,已覆盖从基层全科到三甲专科、从门诊到住院的完整诊疗链条。目前在四川大学华西医院、北京安贞医院、中国科学技术大学附属第一医院等多家知名医院开展试点,核心效果表现保持行业领先水平。
1、胖东来要卖自营奶粉了??!!网友:高低要生个孩子支持下,胖东来自营品牌
2、截至7月26日20时,全国10条河流发生超警以上洪水,兔子一个月大可以洗澡吗
3、48分钟速胜!老将张帅夺赛季双打首冠,搭档登顶世界第一创纪录,张帅单打最好成绩