闭锁和栅栏的区分

发布时间：2021-02-21 15:22:06 所属栏目：评论来源：互联网

导读：这种处理方式有望推进图像识别领域。然而直到2012年左右，随着AlexNet(一种设计用于支持图像识别的八层卷积神经网络)的发展，研究人员才发现如何扩大这个过程以识别成千上万种不同类型的物体。诸如AlexNet之类的深度学习技术的优点在于，该模型可以自动学习

这种处理方式有望推进图像识别领域。然而直到2012年左右，随着AlexNet(一种设计用于支持图像识别的八层卷积神经网络)的发展，研究人员才发现如何扩大这个过程以识别成千上万种不同类型的物体。

诸如AlexNet之类的深度学习技术的优点在于，该模型可以自动学习以不需要人类以编程方式指定每个步骤的方式来执行各种图像识别任务。研究人员指出了如何将神经网络应用于不同类型的问题，该功能也促进了深度学习在其他类型的应用程序中的使用。

如今，图像识别用于识别货架上的产品、图片或视频中的人物，生产流水线上的缺陷以及自动驾驶汽车在街道上遇到的物体。随着冠状病毒疫情的出现，很多企业正在开发应用程序以监视社交距离的规则。

对于企业领导者来说，一个关键的见解是，通常有可能通过在应用程序中使用多种类型的图像识别来创造更多的价值。例如，智能文档处理和文档智能结合了一组人工智能技术，其中包括自然语言处理和机器学习，以捕获难以识别的格式中的数据并将其分类。与光学字符识别(OCR)结合使用，智能文档处理可以分析文档的视觉布局，以确定哪个部分代表产品、发票金额或销售条款，并将该信息提供给其他业务应用程序。

值得注意的是，企业中大多数图像识别应用程序都是高度场景相关的。供应商和研究人员经常宣传新的图像识别改进，例如在识别肿瘤方面击败了医学专家的软件。但是在实践中，仅当图像以正确的角度捕获时，人工智能才可以使用一组特定的设备来处理这些放射线图像，而人类则善于分析从许多不同角度捕获的各种图像。

研究人员还发现，在这些图像识别应用程序的一些实现中也潜藏着偏见。为了减少偏见，专家建议对这些应用程序进行数据训练，这些数据代表将要处理的特定类型的图像。

2.语音识别

需要多种算法将语音转换为文本并准备进行数字处理。尽管语音识别系统变得越来越好，但是即使是当今比较好的语音识别系统也仍然容易出错，因此在安全关键型应用(例如医疗数据捕获)中需要进行一些验证。

贝尔实验室的研究人员于1952年开发了首个用于识别单个数字的语音识别系统。到1962年，IBM公司推出了Shoebox机器，该机器可以理解16个单词。到1980年代中期，研究人员开始使用统计技术(例如隐马尔可夫模型)来开发可以理解2万个单词的应用程序，但其单词之间会有停顿。第一款消费者听写产品Dragon Dictate于1990年发布，可以根据语音自动键入文字。然后，AT&T公司推出了一种语音识别应用程序，该程序无需人工即可路由呼叫。这些早期的系统或者具有适合特定环境的小型词汇表，需要由单个声音进行大量训练。

研究人员从2010年开始发现了将深度神经网络应用于语音识别的方法。这一增长的主要推动力之一是需要找到更好的方法来代表不同类型智能音箱的声音特征。这要求探索出更好的方法，将原始音频数据转换为人类习惯于收听的独特声音(称为音素)(例如，“汽车”一词中的“c”)。

研究人员还将基本的语音识别结果与更好的场景结合起来，以区分同音异义词(bear/bare)。云计算服务现在提供了各种核心的语音转文本服务，开发人员随后将其融入各种企业工作流程中。

基本的语音识别功能通过云计算服务(如微软Cortana、谷歌Now和苹果Siri)嵌入到现代智能手机和电脑中。亚马逊公司利用语音识别技术推出了一种新的方式，通过Alexa语音服务在智能手机之外连接互联网。这些服务通常在云平台中完成繁重的工作。最近，谷歌公司通过开发更有效的算法来提高标准，这些算法可以在其Pixel手机上本地运行语音识别应用程序。

语音识别技术在企业中的使用正在增加。一些供应商还开始开发用于自动记录电话会议和现场会议的应用程序，以达到合规目的或更好地记录决策过程。自动化语音识别还可以帮助监视呼叫中心的活动，以确保工作人员遵循正确的程序，从而使管理人员不必听到每个呼叫。语音识别应用程序也正用于为国际旅行者自动进行语言翻译。这项人工智能技术的其他商业应用包括家庭自动化、视频游戏交互以及将视频编入索引的自动隐藏式字幕。

3.聊天机器人

对话式人工智能技术允许应用程序以自然的方式与人类交互。第一个聊天机器人Eliza于1964～1966年在MIT人工智能实验室开发。最早的聊天机器人在词汇量和可以允许的交互类型方面受到限制。这些应用程序使用决策树，该决策树根据查询或用户对问题的答案沿各种路径进行操作。在20世纪80年代到90年代，这些技术扩展到了自动电话应用程序，在其中，通过使用IVR技术的拨号音响应或简单词汇来控制交互。

最近，由于用于解释和响应文本查询的更好的自然语言处理技术，以及与其他服务的更好集成，使得企业能够更容易地自动设置能够响应常见问题的聊天机器人，聊天机器人的应用程序激增，接受命令或自定义对给定用户的响应。最近聊天机器人可应用程序的一个关键见解是开发用于表示用户意图和适当响应的应用程序编程框架。

面向外部的聊天机器人可以帮助实现客户交互的许多方面的自动化。它们还允许企业以一种更具吸引力的方式跨各种社交媒体渠道(例如Facebook)进行推广。

企业的应用程序开发和部署方面已经看到了使用聊天机器人技术的爆炸式增长，该技术将聊天机器人与可自动配置应用程序和基础设施并生成报告的操作工具结合在一起。聊天机器人集成使团队可以记录其流程，从而更轻松地应对重复出现的问题，或者确定过去特定流程的执行方式。

（编辑：周口站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!