“会说话的机器人纷纷上岗 怎么让它们好好聊天仍是个技术活”
人类的对话极其繁多复杂,其中各句基于对应的语境和语境。 因此,对话服务需要通过深入理解语言和语境来更有效地学习。
“我想买手机,你有什么推荐的吗? “三星真不错。 我以前一直用三星。 “魅族是国产手机的十大企业品牌之一。 可以吗? 用一下就知道了。 “小米也不错啊”“小米比大米更有营养。 ’这些有时看起来很严肃,有时无厘头的对话和我们日常的微信群聊看起来不像,但其实在这个群聊的都是机器人。
让机器人聚在一起好好说话是一项技术工作,不仅要将多主体强化学习的做法应用到自然的对话场景中,还需要优化社会交流机器人在不同语境下的对话策略。 前几天在天津高新技术产业开发区举办的第三届社会交往机器人论坛和第一届机器人对话比赛研讨会上,许多社会交往机器人在同期对话的比赛现场达到了很高的水平。
这个机器人聊天有点“尴尬”。
据悉,在这次比赛中,试图将多智能体机器对话的技术应用于自然对话场景。 比赛选择特定主题的启动句,打乱启动顺序,经过一次或多次,生成符合主题的流畅对话,最终采用自动评价和人工评价相结合的方法,根据主题相关性、语言流动性、语境相关性进行评分。
“刚才还在认真说话的机器人们,可能因为某个机器人的话突然一变,整个话题被带入了不好意思的故事场景中。 就像那个推荐的手机话题一样,明明在说手机,但是机器人说了小米,所以整个话题就变成了美食和养生”大会组委会、哈尔滨工业大学副教授张伟男看到,通过这次比赛,机器人们的聊天能力有所增强,但是, 一致性弱,在同一组说话,机器人总是前后矛盾。 主题漂移是我们常说的脱轨,大部分小组都谈到了最后。 质量不稳定、恢复质量差的机器人会严重影响群聊的质量,机器人无法很好地筛选对话历史来做出恢复决策。
三种主要技术各有优缺点
虽然让机器人说话看起来很简单,但是它支撑着人工智能的交互式实现技术——人机对话技术的迅速发展。 获得首届机器人群谈话大赛第一名的团队funnlp指导老师、天津大学副教授张鹏在研究中介绍说,大数据和深度学习共同推动了自然语言理解技术的快速发展。 目前,实现人机对话有三个主要技术,各有优缺点。
在基于规则的人机交互系统中,机器人必须按照预先定义的一点规则回答系统,如关键字、if-else条件等。 这项技术最大的缺点是需要手工制定规则,定义的规则太多了,在规则的设计上需要很大的努力。
根据检索到的人机交互系统,从预先定义的候选池中直接选择最佳答案,但无法应对自然语言的多变性、多义性、语境结构、连贯性等,输入消息的意义差异较小时,机器人无法正确识别,而是进行了新的
“目前,基于生成模型的人机对话系统是研究热点。 ”。 张鹏表示,与搜索型对话机器人不同,由于比较灵活,可以生成新的回答。 但是,在这样的系统中,有时会产生语法错误,或者产生无意义的回复。
目前,很难达到人类对话的水平
在我们的日常生活中,各种类型的人类对话随处可见。 这是微软小冰块般的聊天对话。我推荐诸如用餐预约会对话系统等任务驱动的多次对话汽车语音系统之类的对话式对话呼叫机器人般的对话。 其中闲谈、答疑、基于任务的对话是指系统在客户输入副本后做出响应,推荐系统主动为客户提供服务和新闻。 但是,由于各项技术还不成熟,这个对话机器人还没有达到人类对话的水平,表现得不灵活,有时也会产生一点笑声。
针对此次比赛机器人在群聊回答中出现的一点问题,张鹏解释说这是三个原因。 首先对话机器人在群聊的对话记录、回复的情感一致性、与其他机器人的互动三个方面都存在一定的问题。 所以,在群聊的过程中出现了机器人主动回复、矛盾回复等现象。
其次,训练机器人聊天需要大量的数据,但该比赛的数字产品和美食主题等特定行业的对话数据相当有限。 另外,收集这些行业的中文闲谈型对话数据和建立对话系统需要十分劳力。
第三,现有的基于神经网络的对话系统主要依赖于大量结构化的外部知识库新闻和对话数据,系统通过训练“模仿”和“学习”人类的话语,这也导致了恢复语句的单一问题。 因此,对话服务需要通过深入理解语言和语境来更有效地学习。
像人类一样聊天必须深入了解语境
张鹏说:“深度学习技术得到了充分利用,技术水平得到了提高,但以现在的技术来看,很难让机器人像人类一样聊天。”其中各句基于对应的语境和语境,朋友们在聊天中对方说话前,下一句是什么
要达到与人类对话相当的水平,目前可以研究几种方法。 一般来说,通过构建巨大、高度多、复杂的ai模型,就像现在的基于transformer结构的bert模型和gpt模型一样,其参数量达到了数亿个水平。 但是,模型越大,顾客从输入新闻到对话系统反应的延迟就越长,实质上,这样的模型仍然需要依赖大量的数据,与人类的思维和学习方法不一致。
二是元 学习技术,需要机器人学习学习的能力,可以根据过去的经验迅速学习。 这样的模型模拟了人类的思维和学习方法,本质上接近于人类之间的相互对话。 但是,我们需要结合具体任务,提出基于物元 教学的处理方案,这确实需要更深入的研究。
三是强化学习技术,强化学习系统由主体、状态、奖项、动作、环境五部分组成。 目前的研究工作是将强化学习应用于任务型对话系统的战略学习,强化学习可以应对基于规则战略的泛化能力下降、人工成本高等问题,同时不需要大量的训练语料,以很小的目标提高任务型对话的质量,是深度学习的一大弊端 当然,强化学习会对当前的交互环境产生一定的影响等,带来了许多课题,这些都需要我们不断探索和深入研究。 (陈曦)
免责声明:凤凰报业网凤凰分类目录网致力于打造中国专业的网站分类目录平台,本篇文章是在网络上转载的,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本站将予以删除。