什么是深度学习.docx
《什么是深度学习.docx》由会员分享,可在线阅读,更多相关《什么是深度学习.docx(5页珍藏版)》请在冰豆网上搜索。
什么是深度学习?
2019-09-04 逸香阁居...
深度学习是机器学习的一个子集,机器学习是人工智能的一个分支,用于配置计算机通过经验执行任务。
这是一次深度探索。
由于丰富的数据和增强的计算能力,深度学习是一种先进的人工智能技术,在过去几年中变得越来越流行。
它是我们每天使用的许多应用程序背后的主要技术,包括在线语言翻译和社交媒体中的自动面部标记。
这项技术在医疗保健方面也很有用:
今年早些时候,麻省理工学院(MIT)的计算机科学家利用深度学习创建了一种新的计算机程序来检测乳腺癌。
经典模型需要工程师手动定义用于检测癌症的规则和逻辑,但对于这个新模型,科学家们给出了深度学习算法,从60,000名患者中进行了90,000次全分辨率乳房X线照片扫描,并让它找到患者扫描之间的常见模式最终患有乳腺癌的人和没有患乳腺癌的人。
它能够提前五年预测乳腺癌,与之前的风险预测模型相比有了相当大的改进。
机器学习究竟是什么?
深度学习是机器学习的一个子集,机器学习是人工智能的一个分支,用于配置计算机通过经验执行任务。
与经典的基于规则的AI系统相反,机器学习算法通过处理带注释的示例(称为“训练”)来发展其行为。
例如,要创建欺诈检测程序,您需要使用一系列银行交易及其最终结果(合法或欺诈)来训练机器学习算法。
机器学习模型检查示例并开发合法和欺诈交易之间共同特征的统计表示。
之后,当您向算法提供新银行交易的数据时,它会根据从培训示例中收集的模式将其归类为合法或欺诈。
根据经验,您提供的数据质量越高,机器学习算法在执行任务时就越准确。
机器学习在解决规则定义不明确且无法编码为不同命令的问题时特别有用。
不同类型的算法在不同任务中表现出色。
深度学习和神经网络
虽然经典的机器学习算法解决了基于规则的程序所遇到的许多问题,但它们在处理图像,视频,声音文件和非结构化文本等软数据方面很差。
例如,根据AI研究人员和数据科学家JeremyHoward的说法,使用经典的机器学习方法创建乳腺癌预测模型需要数十名领域专家,计算机程序员和数学家的努力。
研究人员必须进行大量的特征工程,这是一个艰巨的过程,可以对计算机进行编程,以便在X射线和MRI扫描中找到已知的模式。
之后,工程师在提取的功能之上使用机器学习。
创建这样的AI模型需要数年时间。
深度学习算法使用深度神经网络解决了同样的问题,深度神经网络是一种受人类大脑启发的软件架构(尽管神经网络与生物神经元不同)。
神经网络是变量层上的层,它们根据它们所训练的数据的属性进行调整,并且能够执行诸如分类图像和将语音转换为文本等任务。
神经网络尤其擅长在非结构化数据中独立查找常见模式。
例如,当您在不同对象的图像上训练深度神经网络时,它会找到从这些图像中提取特征的方法。
神经网络的每一层都检测特定的特征,如边缘,角落,面部,眼球等。
通过使用神经网络,深度学习算法消除了对特征工程的需求。
对于麻省理工学院的乳腺癌预测模型,由于深入学习,该项目需要的计算机科学家和领域专家的努力要少得多,而且开发时间也更短。
此外,该模型能够在人体分析师遗漏的乳房X线照片扫描中找到特征和模式。
自20世纪50年代以来,神经网络已经存在(至少在概念上)。
但直到最近,人工智能社区在很大程度上驳回了他们,因为他们需要大量的数据和计算能力。
在过去几年中,存储,数据和计算资源的可用性和可承受性已经将神经网络推向了人工智能创新的最前沿。
深度学习用于什么?
有几个领域深度学习帮助计算机解决以前无法解决的问题。
计算机视觉:
计算机视觉是使用软件来理解图像和视频内容的科学。
这是深度学习取得很大进展的领域之一。
除了乳腺癌,深度学习图像处理算法可以检测其他类型的癌症,并帮助诊断其他疾病。
但深度学习也是你每天使用的许多应用程序中的根深蒂固。
Apple的FaceID使用深度学习,GooglePhotos也使用深度学习来搜索各种功能,例如搜索对象和场景以及校正图像。
Facebook使用深度学习自动标记您上传的照片中的人物。
深度学习还可以帮助社交媒体公司自动识别和阻止可疑内容,例如暴力和裸露。
最后,深度学习在使自驾车能够理解周围环境方面发挥着非常重要的作用。
语音和语音识别:
当您向AmazonEcho智能扬声器或Google智能助理发出命令时,深度学习算法会将您的语音转换为文本命令。
一些在线应用程序使用深度学习来转录音频和视频文件。
谷歌最近发布了一款设备上实时Gboard语音转录智能手机应用程序,该应用程序使用深度学习键入。
自然语言处理(NLP)和生成(NLG):
自然语言处理,提取非结构化文本含义的科学,一直是经典软件的历史痛点。
用计算机规则定义书面语言的所有不同细微差别和隐藏含义几乎是不可能的。
但是在大型文本上训练的神经网络可以准确地执行许多NLP任务。
当公司转向深度学习时,谷歌的翻译服务突然提升了业绩。
智能扬声器使用深度学习NLP来理解命令的各种细微差别,例如您可以询问天气或方向的不同方式。
深度学习在生成有意义的文本方面也非常有效,也称为自然语言生成。
Gmail的智能回复和智能撰写使用深度学习来显示对您的电子邮件的相关回复和完成句子的建议。
OpenAI今年早些时候开发的文本生成模型创建了长篇连贯文本。
深度学习的局限
尽管它有很多好处,但深度学习也有一些缺点。
数据依赖性:
通常,深度学习算法需要大量的训练数据才能准确地执行任务。
不幸的是,对于许多问题,没有足够的质量培训数据来创建深度学习模型。
可解释性:
神经网络以极其复杂的方式发展他们的行为 - 甚至他们的创造者也很难理解他们的行为。
缺乏可解释性使得解决错误和修复深度学习算法中的错误非常困难。
算法偏差:
深度学习算法与他们训练的数据一样好。
问题是训练数据通常包含隐藏或明显的偏差,算法会继承这些偏差。
例如,主要针对白人的照片训练的面部识别算法将对非白人执行不太准确。
缺乏概括性:
深度学习算法擅长执行重点任务,但在推广知识方面表现不佳。
与人类不同,受过星际争霸训练的深度学习模型将无法玩类似的游戏:
比如,魔兽争霸。
此外,深度学习在处理偏离其训练示例的数据方面也很差,也被称为“边缘情况”。
在自动驾驶汽车等情况下,这可能会变得很危险,因为错误会导致致命的后果。
深度学习的未来?
今年早些时候,深度学习的先驱者被授予图灵奖,这是计算机科学的诺贝尔奖。
但深度学习和神经网络的工作远未结束。
正在努力改进深度学习。
一些有趣的工作包括可以解释或开放解释的深度学习模型,可以用较少的训练数据开发行为的神经网络,以及可以在不依赖大型云计算资源的情况下执行任务的深度学习算法的边缘AI模型。
虽然深度学习是目前最先进的人工智能技术,但它并不是人工智能行业的最终目的地。
深度学习和神经网络的发展可能会给我们提供全新的架构。