讯飞设计理念是A+i,“A”即“Artificial”,同时字母“A”趋于钻石的特征,是科大讯飞传统421克拉价值观的具象呈现,而“i”作为“讯飞”的首字母,同时又是“intelligence”的缩影。
在Chat-GPT时代下,人工智能技术对文化创作有着很大的影响。而这次演讲,我也将分享讯飞最前沿的技术,AIGC带来的影响以及讯飞的技术发展:讯飞2030超脑计划,讯飞听见会记/会写影响文字内容创作,虚拟人影响视频内容生产等。
IXDC采访到科大讯飞副总裁王玮女士,就目前AI行业的发展趋势和科大讯飞在其中的角色、科大讯飞在人工智能领域的竞争优势、在过去几年里科大讯飞重要的技术创新和突破等问题进行详细的解答。
请介绍目前AI行业的发展趋势和科大讯飞在其中的角色
首先非常高兴今天能有这样的一个交流,我本人不是从事设计专业,作为一个外行来参加今天这个会,我是想因为现在是一个无卡的时代,很多是需要跨界的融合和交流。科大讯飞是一家人工智能公司,1999年成立,是几位在中科大的学生创业,在2008年的时候在a股进行上市。我刚刚看了一下,今天的市值是1,500亿,他现在已经变成了一个全球亚太的这样的一个人工智能公司,从语音合成到语音识别到机器翻译到自然语言理解,甚至今年最火的大模型。讯飞是一家技术驱动型的公司,既然今年比较火,那就说说大模型。大模型从去年open ai发布以来,就给大家是带来技术上的一种颠覆,那么国内现在也是进入一个百模大战。今年的5月6号科大讯飞正式发布了星火大模型,我们也是从原来人工智能开放平台上面这样的400多种的能力,还有应用的开发者中间我们把所有的内容进行了汇聚。现在在文本生成、自然语言理解、逻辑推理、数学推理甚至还有多模态等七项任务中,萃取出了一些应用,在5月6号发布了之后,6月5号又进行了一个进阶,马上8月15号的时候又会发布新的一个大模型的一些应用。大模型来了以后给我们不管是从设计也好、应用也好,都会带来各种各样的一些变化,就比如说我现在带的团队,叫讯飞听见大家都看到语音转成文字,现在大模型来了之后,我们把它再增加上这种语意的理解,文本的顺滑还有一些规整。比如说我们今天采访的声音,然后它可以形成文字就可以一键的进行成稿,把我那种繁文缛节、乱七八糟的话萃取出来。另外的话可以生成会议纪要、工作待办,甚至还可以写文案,比如说这个小红书风格,比如说一些新闻播报风格等等。它就相当于给每个人尤其是文字工作者,增加了一个助手。你看了它之后在它的基础上再进行修改,就极大的提高了工作的效率。
请分享您是如何看到科大讯飞在人工智能领域的竞争优势的
首先因为我们还是秉持了自己的一些源头创新,讯飞现在第一个在开放的平台上,我们大概已经有400多种人工智能的技术,在源头创新中我们已经大概有四五十项,在国内国际上面都获得了一些国际性比赛的冠军。另外的话讯飞现在也是国家认知重点实验室,还有一些人工智能的实验室,其实现在已经是在核心的源头技术上面,讯飞应该是国家队。那么应该讲说技术是一个使能技术,技术也是供给侧,它必须要有自己的核心技术之后,才能够推动一些产品的变革,应用的变革,甚至一些人们生活方式的变革。
请介绍科大讯飞在人工智能领域的创新能力?在过去的几年里,科大讯飞有哪些重要的技术创新和突破
如果我们今天回到技术上来讲的话,其实在讯飞的这个里程碑上面是有几个阶段性里程碑的。首先我们是讲感知智能,大概在2015年左右,我们的语音识别突破到了一些应用的门槛,我们在2015年12月21号在国家会议中心发布了连续语音转写,就是全球首台的语音转文字,叫讯飞听见智能会议系统,这个是迈上一个境界,然后是到2017左右有个认知,我们把这个所有的医生的医师资格考试的资料进行了学习,学习了以后讯飞就去参加执业医师资格的考试,而且还获得了执业医师资格,这个就是开始面向认知。后续包括像现在一些大模型的从感知到认知,到自然语言理解等等一系列的这样的源头创新。但是光有技术还是不够的,我们要说用正确的方法做有用的研究,技术最后还是要走向应用、走向落地,赋能到大家的日常的工作生活学习中,我们就把这些的一些技术找到了一些场景,比如现在讯飞在面向教育、面向医疗、面向消费者,面向生活的方方面面,因为我们说人工智能就像水和电一样的,它可以给你改变很多。现在比如说教育里有没有,我们在整个K12的这种教育里面,提出了个性化学习,因为它里面用一些知识图谱,用这样的一些改进。包括现在讯飞的学习机不用孩子们频繁的刷题,你只要看一下你自己哪里的知识点掌握的有问题,你就重点的去做那个题目,更个性化的这种教学。比如说我们像现在的一些医疗,我们做一些辅助的这种智医助理,做一些这种慢病管理,也是极大的提升了社区医疗,甚至一些医院的辅助诊疗上都有了很大帮助。还是再说一下消费者,因为这个可能跟设计跟行业相关,本身我自己也是在消费者这个业务集群里面,那么我们这几年做了很多的一些软硬件一体化的设备,比如说我们的翻译机、办公板、录音笔,甚至我们的一些智能的麦克风,它通过软硬件这种结合的方式。就拿我们的录音笔来讲,他原来只是把声音录下来,现在不仅录下来了以后,还能够后续给你快速的语音转成文字,一小时的语音大概5分钟就可以给你出材,出了材之后极大提高采访和编辑的工作的效率,现在在搭载了大模型了之后还可以给你把文本各方面来进行整理。比如说我们的办公本,现在在消费类电子上的排名是第一,它是用墨水屏,你可以在上面进行很流畅的书写,书写完了以后还能够把内容进行记录、分享、存储,甚至还可以进行阅读。讲到这时候应该就到设计,讯飞专门有一个这样的硬件的设计的团队,包括一些工业造型,它最后还是要设计的比较美。我们其实也有一个叫AI人工智能 那在i的上面,我们又把它萃取出来一个跑道员,然后边上讯飞的价值观,我们有个叫421克拉,就是要成就员工理想、创造客户价值。另外还有创新和坚守,下面还有简单真诚、担当奋进等,就是一个421克拉像钻石一样,我们就把钻石的元素和这个人工智能的元素,把它进行融合后,可以看到讯飞现在的一些硬件的造型。第一个它是比较高科技,它选的颜色材质各方面都是比较黑科技,另外的话它这个触感各方面都显得比较高级一点,大概是有这样的一个元素理念,再往下讲因为我不是设计专业的就不能班门弄斧。
针对目前市场上存在的一些争议,如语音合成技术的“假人”问题,您如何看待这些问题?科大讯飞将如何应对这些挑战
我觉得你这问题挺好,因为我刚才说用假人,其实我觉得用虚拟数字人或者是用数字孪生这个表达的会更好。其实讯飞最早起家是做语音合成起家的,但是你看像现在,比如说10086甚至一些打电话的订餐电话或者什么,他都已经使用语音合成技术,包括我们现在的一些导航都是可以给你提高效率。那么再向前走的时候,就开始有多模态,我们就把这个人脸还有包括它一些口唇,这里面有2D的3D的虚拟数字人就起来了。现在正在开大运会,这次我们大运会里面有一个虚拟志愿者叫小福,他现在正在大运村里面工作,他有一个大屏,然后虚拟志愿者在上面,如果说有的一些运动员或者是这个国外的友人过来后,跟那个大屏进行互动,你要到哪怎么样或者是什么。大概在前天还上了央视的焦点访谈,就是它可以用一种更加科技的手段来去,给你带来一个全新的感受,你可以跟人机交互,因为人工智能还是让机器像人一样,能听、会说、能理解、会思考,再加上这种多模态的数字孪生,它会变成一种很好的形式和载体。比如说它可以是变成像虚拟的志愿者,它可以变成虚拟的前台,甚至我们都把它装在这个手机里面,你可以跟它进行一个虚拟的口语训练,这样的一些陪伴。另外的话其实现在有些在直播场景中它也是一种虚拟的孪生,它可以是你的一个助手,然后进入到你生活的方方面面,可以让我们人能够腾出时间来去做更多,更有创意的、更有温度的 或者是其他更需要人的这种去做的这样工作,其实还是解放生产力。
0人打赏
机构简介
2001年加入科大讯飞,现任科大讯飞消费者事业群副总裁、安徽听见科技有限公司总经理。王玮自2001年起,在语音合成、语音识别、语音评测、语音翻译等相关核心技术研发和产业发方面做出了重大的贡献,并多次推动和参与国家部委、省市等多个重点项目的建设。
带领团队在语音转写核心技术基础上推出听见转写网站、听见智能会议系统、智能文稿唱词系统等系列产品,目前讯飞听见系列产品已在政府、企业、教学、司法、媒体等各行各业中取得了良好的应用成效。
这里拥有全球领先的用户体验创新知识。全网独家,更权威,更全面。
每一年,来自全球领先企业的专家、CEO们都给我们分享最成功的案例、方法与前瞻观点。帮助数以万计的从业者们解决产品、设计、运营、技术、管理等5大内容类别的困惑与瓶颈。在这里,你可以观看500+国际体验设计大会高清权威视频课程。
IXDC带你建立全球视野与能力,解决专业困惑与职场瓶颈,足不出户汲取让你成长的海量知识。联系在线客服:18826260168