小富机器人:超越与梦想

近日,鼎富科技董事长杨凯程先生受邀参加了2016中国呼叫中心与企业通信大会,发表了《小富机器人:超越与梦想》的主题演讲,分享了鼎富科技在智能机器人领域取得的进展。以下是演讲PPT及部分演讲内容摘录:


小富是有着超越之处和梦想的机器人,希望能在明年CTI会议上亲自和大家交流。


现在可以说机器人是无所不在,并且炙手可热。AlphaGo与李世石的人机大战胜利之后,微软机器人、贤二法师先后都成了“网红”。但作为专业人士,我们必须考虑什么样的机器人才是我们工作和生活中需要的机器人?


答案就是需要我们的机器人做到机器无感。就是要和人沟通,要正确的理解,听得懂我们在说什么,同时也要给我们一个正确的答案,这是未来我们需要的机器人,也是我们在人工智能挑战的领域——认知计算的革命。


认知计算的革命已经成为了业界焦点,众多巨头纷纷推出了自己在这个领域的的商业计划:2016年3月1号,IBM推出一个新的概念叫认知商业,拳头产品是Watson;3月30号微软发布了微软认知服务和微软机器人的框架;百度把搜索业务分离出成立了一个搜索公司,要专注于认知技术。


这些说明了认知是很重要的,它是解决机器人必须攻克、绕不过去的一个方向;同时也说明认知计算的难度较大,与企业量级没有必然联系。而鼎富科技在认知计算领域积累多年,拥有先发优势和丰富的平台经验。


认知计算没有突破机器人会怎样呢?现实中,我们在网上跟某家银行的机器人聊天,往往是这个样子:我们先问它“微信公众号可办理哪些信用卡业务”,它很聪明,可以给我们正确答案;但当我们换了一个问法,“微信公众号都可以办理哪种业务?”结果它就不知道说什么了。同一个问题,换种问法,机器人就无法理解。


我们还可以问它“最后还款日(银行业中有到期还款日的概念)未还款怎么办?”它正确的回答了。我们再换一个方法来问,比如说“还款晚了一周有什么影响?”实际上是同一个问题,但机器就理解不了了。然后我们问“逾期还款不会怎么样吧?”它说依旧没理解我们的意思。认知技术的最大挑战在于自然语言的语义处理技术的突破,而中文的歧义性是一个绕不过去的问题。


机器人的后台如同中式餐馆的后厨都是十分辛苦的,需要有大量的人工把大家想知道的答案、知识先翻成Q&A,再把Q&A根据一个语言的模板填进去,不停地填,填完以后机器人表达的效果还是达不到理想的状态。因为我们很难用模板统一我们聊天的多样性。而在认知计算没有突破时,机器人跟我们聊天做到机器无感是如此的艰难。


我们最可能突破的领域是深度学习。可是深度学习首先需要大量样本,就是要跟它交谈,不断有知识跟它交谈,交谈还要学会新知识;其次还得好好教,一不小心不认真教,教一些不好的东西很快就学会了,这就是所谓善良的数据。就像小孩,你找的老师不好就学坏了。当你训练它的语料、样本数据不一样,训练出这个孩子长得一定不一样。


目前深度学习在这些领域是最有可能突破的:互联网上最多、最容易获得大量样本数据的领域,或者这些样本数据不在互联网上,但是在机构内部很容易获得,而且特别易于积累的领域,就能取得深度学习的成功,并且是我们对机器人答案的专业性要求不会太高的领域。在这个领域里,典型的例子是度秘,度秘提供了一些东西,可以提供一些生活、美食等方面的。这也是现在聊天、聊生活、聊日常的机器人比较多,而聊专业机器人比较少的原因。


在专业领域,深度学习会遇到各种困难。首先行业的专业领域缺乏样本大数据的支持,没有那么多的样本可供机器人学习。另一方面,专业领域不接受模糊的答案,应答要求专业、准确。第三个方面的挑战是中文的歧义性。


这三个问题导致目前专业机器人行业面临两个较大的挑战:第一个就是知识学习的自动化,能不能做的让机器自动把知识学进去,省下大量的人力成本;第二就是应答的准确性,在一种比较开放的情况下聊天,机器人的回答要很专业,要把握住含义。


鼎富科技通过大量基础性的研究工作,克服了这些困难和挑战,在中文语义方面实现了突破,开发出了智慧语义认知技术。这是鼎富科技成功开发小富机器人的主要原因。


一方面鼎富科技为了紧跟认知计算的变革,另一方面行业客户希望我们能给他们提供更好服务,鼎富科技开发出了另一个专利产品——DINFO-OEC的分析挖掘平台,这个平台运用了智慧语义认知技术,客户在应用时只需要描述自己的业务,就可以分析出描述内容在170种情感计算后的表达的情感是什么。目前DINFO-OEC分析挖掘平台已在金融、保险、证券、互联网等行业有较好的应用,是成熟、业界领先的技术。


运用智慧语义认知技术,鼎富科技自主研发的新一代知识库产品:DINFO-UBKM统一业务知识库系统。新一代知识库实现了知识的自动入库,不需要人加工知识,而是把各种形式的文档直接给系统,系统会自动地加工。另外支持自主学习、非结构化数据分析加工、基于业务的知识图谱的构建,以及智能搜索技术——碎片化搜索。比如呼叫中心发现了一个问题,但是这个问题的知识分散在了很多段落里,碎片化知识的搜索能从各个段落直接搜出来,而不是像现在绝大多数的知识库搜出一篇一篇的文章让用户阅读。


使用DINFO-UBKM统一业务知识库系统,你只要搜索一句话,会通过启发式搜索导引到段落最终的那一句。DINFO-UBKM让我们的小富机器人未来应对时不需要人工加工。


鼎富DINFO-UBKM统一业务知识库系统解决了知识加工的业务导向难题。专业领域的业务具有三大特点:所有行业的业务相对稳定、业务规则相对有限、业务表达相对规范。业务规则的表达是比较容易实现,而知识表达有多样性,知识无穷性,表达很灵活,同一个业务支持有很多种说法。因此我们就需要知识加工领域更多考虑业务建模,而不是直接对知识本身进行业务处理,这样就可以保证一次建模实现知识的自动加工。


另外,DINFO-UBKM系统目前至少可以支持27个国家语言的自动加工,客户不需要用英文建立业务模型,只要用简体中文做好业务建模即可,系统可以自动转化为多国语言。


鼎富科技能够实现小富机器人的另一个条件是拥有鼎富客服大数据分析挖掘系统。该系统服务时,呼叫中心打电话进去,客户的坐席会把用户说的话原封不动机器录入,录入了之后根据知识库自动转到5级、4级500个业务分类,准确率可以达到95%,而且响应是在毫秒。


鼎富客服大数据分析挖掘系统支持简体中文建模,同时可以支持简体、繁体、英文上线。每个工单打电话说话的内容和它做的分类完全没有关键字录音关系,但我们的小富理解它的含义,所以面向业务时十分方便,而且该系统基本上没有太多的回复。


另外,机器人在聊天沟通之后必须要大数据深度挖掘沟通内容。还能进行深度分析,不光分析投诉,还可以发现潜客,甚至支持市场的营销活动,呼叫中心有反应时,小富会随时做一个响应。顺丰、工商银行总行在2014年就上线了鼎富客服大数据分析挖掘系统,实现了全部呼叫中心的工单分析挖掘。


对某家商业银行的信用卡业务对比测试表明,小富机器人对于问题理解和答案相关性有显著优势。


此次测试信用卡小富学了不到800个知识,该行有1500个专业知识,我们同时使用1800个问卷对该行现有机器人和小富机器人进行测试,测试结果表明小富机器人百分之百回答了问题,现在的机器人只能实现60%-70%的准确率。这些差别是问题对于答案准确性的提升。


而同样一个逾期的不同表述,小富机器人除了可以告诉你什么情况下会判定逾期。对于还款逾期的后果?晚还款会有什么影响?还款晚了一周怎么办?逾期有没有程度轻重之分?不同信用卡等判定逾期规则一样吗?等等问题,小富机器人都有准确的回答。这是小富机器人在专业领域使用机器人带来的显著变化。


小富机器人还具有知识学习的自动化的优势。例如在信用卡业务,客户建立好业务规则的模型后,只要给小富一个相关银行的业务文档,不需要帮小富翻成Q&A,小富就会自动把这个章节分解成Q&A,同时会自动告诉客户属于的业务类别是收单、客户用卡,对应的业务还是还款的问题。它还可以给客户相关的一些标签、知识项。所有这些东西都是机器自动学习,它的后台完全实现了自动化。


目前小富机器人是TOB,未来小富会变成个性化咨询的机器人。届时,小富将具备以下能力:一是从互联网上和机器人之间将知识源源不断学习的开放学习能力;二是个性化特征的学习能力,小富机器人可在回答客户问题之后,把查到文章后面关心的知识点自动学习回来,它会把文章背后的含义帮客户做上标记,同时对多次关注文章进行内容聚合,给客户打上个性化标签。


此外小富还将具有动态个性化知识库构建能力和基于较强的基于认知计算的个性化沟通能力。例如,小富可以将怀孕相关的知识自动加工给客户建立一个知识库,出现了新款奶粉可以及时告知和推荐给用户,实现机器人的个性化的沟通,真正像人的大脑一样工作。鼎富科技有信心为小富机器人提供强大的技术支撑。


鼎富科技希望能在未来给大家带来一款全新的小富机器人,它将成为专业领域最优秀的人工智能解决方案之一,将会是大家工作和生活的好伙伴!让大家的生活更美好!