《深度学习框架应用开发》习题.docx

上传人:zf 文档编号:30798729 上传时间:2023-10-12 格式:DOCX 页数:24 大小:55.57KB
下载 相关 举报
《深度学习框架应用开发》习题.docx_第1页
第1页 / 共24页
《深度学习框架应用开发》习题.docx_第2页
第2页 / 共24页
《深度学习框架应用开发》习题.docx_第3页
第3页 / 共24页
《深度学习框架应用开发》习题.docx_第4页
第4页 / 共24页
《深度学习框架应用开发》习题.docx_第5页
第5页 / 共24页
点击查看更多>>
下载资源
资源描述

《深度学习框架应用开发》习题.docx

《《深度学习框架应用开发》习题.docx》由会员分享,可在线阅读,更多相关《《深度学习框架应用开发》习题.docx(24页珍藏版)》请在冰豆网上搜索。

《深度学习框架应用开发》习题.docx

一、选择题

1、AI的英文缩写是()

A.Automatic Intelligence 

B.Artifical Intelligence

C.Automatice Information

D.Artifical Information

正确答案:

B

2、1.被誉为“人工智能之父”的科学家是( )。

A.明斯基

B. 图灵

C. 麦卡锡

D. 冯.诺依曼

正确答案:

C

3、最早的聊天机器人之一、最早通过图灵测试的程序()

A.Dendral

B.ELIZA

C.Xcon

D.Deepblue

正确答案:

C

4、哪些学科是人工智能的基础()

A.地理学

B.数学

C.经济学

D.计算机科学

正确答案:

B、D

5、第一例专家系统是在()领域发挥作用的

A.化学

B.生物

C.数学

D.物理

正确答案:

A

6、循环神经网络的应用非常广泛,以下哪一项不用循环神经网络的应用()

A.语音识别

B.看图说话

C.视频预测

D.垃圾分类

正确答案:

D

7、下面不属于人工智能研究基本内容的是( )

A. 机器感知   B. 机器学习    C. 自动化   D. 机器思维

正确答案:

C

8、下列哪个不是人工智能的研究领域(D)

A.机器证明B.模式识别

C.人工生命D.编译原理

9、1997年5月,著名的“人机大战”,最终计算机以3.5比2.5的总比分将世界国际象棋棋王卡斯帕罗夫击败,这台计算机被称为()

A.深蓝B.IBM C.深思D.蓝天

正确答案:

A

10、人工智能的含义最早由一位科学家于1950年提出,并且同时提出一个机器智能的测试模型,请问这个科学家是

A、明斯基   

B、扎德 

C、图灵  

D、冯.诺依曼

正确答案:

C

11、列哪个不是人工智能的研究领域(D)   

  A. 机器证明      B. 模式识别      C. 人工生命D. 编译原理

正确答案:

D

12、人工智能是一门(D)

A.数学和生理学B.心理学和生理学 C.语言学D.综合性的交叉学科和边缘学科

正确答案:

D

二、填空题

1、反向传播(Backpropagation)算法有效解决了非线性分类和学习的问题。

2、GeoffreyHinton发明的算法引起了神经网络的第二次浪潮。

3、梯度消失问题直接阻碍了人工智能的进一步发展,也导致人工智能进入第二次低谷期。

4、罗森布拉特第一次将MCP模型用于机器学习分类,感知器算法被证明能够收敛,理论与实践效果引起第一次神经网络的浪潮。

5、AlexNet模型是一种深度学习模型

6、Facebook基于深度学习技术的DeepFace项目,在人脸识别方面的准确率已经能达到97%以上

7、卷积神经网络是近年来广泛应用于模式识别、图像处理等领域的一种高效识别算法。

8、在传统目标检测算法框架中,一般分为三个阶段:

候选区域生成、特征提取、分类器分类。

9、计算机视觉是赋予机器的感知能力。

10、自然语言处理技术则是赋予机器认知的能力。

11、自然语言技术主要包括了语义理解技术和语言生成技术。

12、使用自然语言处理技术去解决某一问题的基本过程包括获取语料、语料预处理、特征工程、任务建模过程。

13、语料是语料库的基本单元。

14、自然语言处理技术中处理的数据不再是图像而是一句话,即序列数据。

15、循环神经网络解决自然语言处理中存在的问题。

三、简答题

1、语料库的建立就是为了解决什么问题。

2、安装深度学习的开发环境,拓展学习Jupyter Notebook的使用

第二章Tensorflow基本概念、用法、搭建线性回归模型

一、填空题

1、Tensorflow使用__图__来表示计算任务。

2、在TensorFlow2.0中,开发者可以通过tf.constant方法来创建不同数据类型的张量

  3、维度是用来描述一个张量非常重要的属性,用于描述张量维数的数量,也称为阶。

4、一个向量称为一阶张量,一个矩阵或者一个二维数组称为二阶张量。

  5、Tensorflow使用___、___可以为任意的操作赋值或者从其中获取数据

6、TensorFlow 的主要数据类型有____、____、____、____。

7、TensorFlow1.x版本中采用的是静态图机制,TensorFlow2.0则采用了动态图机制

8、使用TensorFlow之前,要先导入TensorFlow框架。

导入代码:

import tensorflow as tf

9、形状是用于描述张量内部的组织关系,张量的形状决定了每个轴上有多少索引可以使用。

10、类型转换函数,其函数原型是:

tf.cast(x, dtype, name=None)

11、计算机视觉方面,经常需要将一个张量从一个形状转换为另外一个形状,以满足某种计算需求。

TensorFlow2.0提供形状转换函数reshape。

12、在TensorFlow2.0中通过tf.Variable()方法创建一个变量。

13、模型训练前,模型的参数一般都是通过随机初始化给定,TensorFlow2.0提供了随机初始化组件tf.random。

14、TensorFlow2.0提供的tf.math组件包含了深度学习常用到的数学运算方法。

15、实际开发过程中,当完成数据收集后都需要对原始数据进行数据预处理的操作。

16、采用机器学习或者深度学习技术进行模型训练,一个关键的技术就是损失函数的定义,其往往决定最后模型的效果。

17、训练一个机器学习或者深度学习模型的本质,其实就是求解一个函数的系数。

工智能领域把求解方法称为优化器。

18、模型训练本质就是一个不断迭代的过程,可以为为如下几个常见步骤:

计算预测值、计算损失值、计算损失函数中的梯度、更新梯度的值、打印每一轮的损失值。

19、在开发的过程中,一旦完成了模型训练,就需要对模型的效果进行验证。

二、选择题

1.TensorFlow中的基本数据类型不包含(D)

A.数值型

B.字符串型

C.布尔型

D.字符型

2.对于以下两个张量,如何实现这两个张量的合并而不产生新的维度(A)

import tensorflow as tf

a = tf.random.normal([4, 35, 8])

b = tf.random.normal([6, 35, 8])

# 合并张量

#Todo

A.tf.concat([a, b], axis=0)

B.tf.stack([a, b], axis=0)

3.以下对张量进行等长切割的操作正确的是(A)

import tensorflow as tf

x = tf.random.normal([10,35,8])

A.result = tf.split(x,axis=0,num_or_size_splits=10)

B.result = tf.split(x,axis=0,num_or_size_splits=[4,2,2,2])

4.如何计算∞ −范数(D)

import numpy as np

import tensorflow as tf

x = tf.ones([2,2])

A.tf.norm(x,ord=0)

B.tf.norm(x,ord=1) 

C.tf.norm(x,ord=2) 

D.tf.norm(x,ord=np.inf)

5.如何求解张量在某个维度上的均值(C)

import tensorflow as tf

x = tf.random.normal([4,10])

A.tf.reduce_max(x,axis=1)

B.tf.reduce_min(x,axis=1)

C.tf.reduce_mean(x,axis=1)

D.tf.reduce_sum(x,axis=1)

6.如何比较两个张量是否相等(B)

A.tf.math.not_equal(a, b)

B.tf.equal(a, b)

C.tf.math.greater(a, b)

D.tf.math.less(a, b)

7.以下张量b填充后等到的数组形状为(A)

a = tf.constant([1,2,3,4,5,6])

b = tf.constant([7,8,1,6])

b = tf.pad(b, [[0,2]])

A.[7,8,1,6,0,0]

B.[7,8,1,6,1,1]

C.[7,8,1,6,2,2]

D.[0,0,7,8,1,6]

8.对于下列张量复制后得到的张量shape值为(B)

x = tf.random.normal([4,32,32,3])

tf.tile(x,[2,3,3,1])

A.(6,35,35,4)

B.(8,96,96,3)

C.(8,96,96,4)

D.(8,96,96,1)

9、张量arr1=[[1,4,5],[5,1,4]],arr2=array[[1,3,5],[3,5,2]]

tf.mod(arr1,arr2)的结果是:

(C)

A.array([[2,7,10],[8,6,6]])

B.array([[1,1,1],[1,0,2]])

C.array([[[0,1,2],[0,0,2]],[[0,1,2],[0,0,2]]])

D.array([[1.,1.33333333,1.],[1.66666667,0.2,2.]])

10、两个矩阵,a=[[0,1,2],[3,4,5]],b=[[0,1],[2,3],[4,5]],tf.matmul(a,b)的结果是(A)

A.[[10,13],[28,40]]

B.[[28,40],[10,13]]

C.[[15,18],[23,37]]

D.[[10,13],[25,43]]

三、综合题

搭建线性回归模型

从本章所讲内容之中我们可以知道线性回归模型大致的函数可以表示为ℎ0x=θ0x+θ1。

我们可以将模型稍作改变实现另外的一种功能。

在日常生活当中,我们都知道房价和房子的面积大致成正比,所以我们也可以利用matplotlib画图工具包(拓展内容),将线性回归的模型直观的在图上表示出来。

假定一组房屋的价格与面积的数据为[2104, 460], [1416, 232], [1534, 315], [1200,280],[852,178]。

任务要求:

利用这一组数据,通过调整θ0,θ1的值,观察线性回归模型的绘图情况以及对应的“损失”为多少。

一、选择题

1.最早的神经元数学模型是()

A.BP模型

B.感知器模型

C.CNN模型

D.M-P模型

答案:

D

解释:

最早的形式化神经元数学模型是M-P模型,由美国心理学家McCulloch和数理逻辑学家Pitts合作于1943年提出

2.生物神经元包括树突和轴突,其中树突相当于(),轴突相当于()

A.输入端处理端

B.输出端处理端

C.输入端输出端

D.输出端输入端

答案:

A

3.下列哪个函数不可以做激活函数?

A.y=tanh(x)

B.y=sin(x)

C.y=2x

D.y=sigmiod(x)

答案:

C

解释激活函数的作用:

引入非线性值,并且映射-1~1,所以y=2x不符合作为激活函数的要求

4.tanh激活函数通常比隐藏层单元的sigmoid激活函数效果更好,因为其输出的平均值更接近于零,因此它将数据集中在下一层是更好的选择,请问正确吗?

A.True

B.False

答案:

A

5.下面哪个选项不是神经网络训练过程中过拟合的防止方法?

A.提前终止

B.增加学习率

C.L2正则化

D.dropou

答案:

B

6.卷积神经网络的正向传播过程是指从输入层到输出层的信息传播过程,该过程包括的操作有()

A.卷积操作

B.池化操作

C.Relu操作

D.全连接分类

答案:

D

7.以下哪些结构属于BP神经网络

A.输入层

B.隐含层

C.输出层

D.卷积层

答案:

D

8.前馈神经网络通过误差后向传播(BP算法)进行参数学习,这是一种()机器学习手段

A.监督学习

B.半监督学习

C.无监督学习

D.无监督学习和监督学习的结合

答案:

A

9.下面对前馈神经网络描述不正确的是()

A.层与层之间通过“全连接”进行连接,即两个相邻层之间神经元完全成对连接

B.各个神经元接受前一级神经元的输入,并输出到下一级

C.同一层内神经元之间存在全连接

D.同一层内的神经元相互不连接

答案:

C

10.下面对前馈神经网络这种深度学习方法描述不正确的是()

A.实现了非线性映射

B.是一种端到端学习的方法

C.隐藏层数目大小对学习性能影响不大

D.是一种监督学习的方法

答案:

C

二、填空题

1、进行深度学习应用开发的第一步也是至关重要的一步就是数据处理。

2、TensorFlow2提供了函数tf.keras.utils.get_file用于下载数据集。

3、在实际开发过程中,开发人员都需要对数据进行分析。

通过分析,选取合适的数据以及相对应的数据预处理方法是项目开发成功的关键。

4、借助seaborn工具(安装命令:

pipinstallseaborn)可以对数据进行数据可视化。

5、散点矩阵图可以用于粗略揭示数据中,不同列之间的相关性。

6、数据送入模型进行训练之前,一步很重要的步骤就是清洗无效数据。

7、开发者想获取指定某连续几行的数据,如第30行到49行,可以通过切片的方式获取。

8、pandas提供无效数据统计函数isnan。

9、处理无效数据的方法有很多种,比如填充Nan数据、直接删除对应的数据。

10、在机器学习领域,某种值的递增本身就有特殊的意义,建议采用序号唯一编码技术。

11、把每一项数据视为一个长度为N的数组,数据类型有多少种,数组长度就为多少。

数组中每一个元素取值只有0、1两种形式,并且每一个数组中只有一项是1。

这种编码技术是独热(ont-hot)编码。

12、自然语言处理中的向量化先确定一个N项的数组,每个数组元素值通常都是用浮点数据,能代表更多的分类。

13、数据处理的最后一步就是数据集拆分,部分数据集用于评估模型性能。

14、通常在机器学习中将数据拆分为三份:

训练集(TrainingDataset)、验证集(ValidationDataset)、测试集(TestDataset)。

15、数据集拆分有二种常见的方法:

留出法和K-折交叉验证法

16、人工神经元(ArtificialNeuron),是构成神经网络的基本单元,其主要是模拟生物神经元的结构和特性,接收一组输入信号并产生。

17、现代人工神经元模型由连接、求和节点和激活函数组成。

18、激活函数对人工神经网络有非常重要的意义,能够提升网络的非线性能力、环节模型训练期间梯度消失的问题、加速网络收敛等。

19、Sigmoid函数可以使输出平滑而连续地限制在0-1,在0的附近表现为近视线性函数,而远离0的区域表现出非线性,输入越小,越接近于0;输入越大,越接近于1。

20、Tanh函数继承自sigmoid函数,改进了sigmoid变化过于平缓的问题,它将输入平滑地限制在~1-1的范围内。

21、现代深度学习技术,模型训练一般采用梯度下降法来更新参数。

22、损失函数用于描述网络模型的预测值和真实值之间的差距大小,是衡量神经网络学习质量的关键。

23、模型评估是深度学习应用开发非常重要的一个环节,直接影响该模型是否可以用于实际生产环境。

24、为了更好的刻画训练过程,可以通过可视化训练过程来帮助开发者更好的掌握模型训练的过程。

25、为了解决过拟合现象,一般采用正则化技术。

三、综合题

加利福尼亚州人口普查,收录了20640条样本。

数据包含的属性有longitude,latitude,housing_median_age,total_rooms,total_bedrooms,population,households(家庭人数),median_income,median_house_value,ocean_proximity。

本题要求使用加利福尼亚的房价数据,用第三方库Sklearn获取房价数据进行预测模型的搭建。

数据引入:

fromsklearn.datasetsimportfetch_california_housing

house=fetch_california_housing()

任务要求:

1.下载数据集,并打印出前10行数据。

2.分析数据,读取数据获取数据维度

3.数据拆分、归一化处理

4.搭建模型,设置优化模型,损失函数、回调函数进行训练

5.测试测试集,获取结果测试

一选择题

1、关于MNIST,下列说法错误的是(C)。

A.是著名的手写体数字识别数据集

B.有训练集和测试集两部分

C.训练集类似人学习中使用的各种考试试卷 

D.测试集大约包含10000个样本和标签

2、以下选项中,机器学习算法真正用来“学习”的数据是(B)

A.验证集

B.训练集

C.测试集

D.超参数集

3、对于神经网络的说法,下面正确的是:

()

A增加神经网络层数,可能会增加测试数据集的分类错误率

B减少神经网络层数,总是能减小测试数据集的分类错误率

C增加神经网络层数,总是能减小训练数据集的分类错误率

4预测分析中将原始数据分为训练数据集和测试数据集等,其中训练数据集的作用在于(C)。

A、用于对模型的效果进行无偏的评估

B、用于比较不同模型的预测准确度

C、用于构造预测模型

D、用于选择模型

5、什么样的数据不适合用深度学习()

A、数据集太小

B、数据集太大

C、数据集没有局部相关性

D、数据集局部相关性极强

6、学习没有标签的数据集的机器学习方法是?

()

A、监督学习

B、无监督学习

C、半监督学习

D、强化学习

7、可以通过(C)数据处理手段实现去除图像冗余部分。

A.图像归一化

B.均值

C.白化

D.图像灰度化

8、图像归一化的主要作用是(A)。

A.将图像按照一定的标准形式进行标准化处理,使图像能具有抵抗几何变换的能力

B.去除图像噪声部分

C.改正图像采集系统的系统误差和仪器位置的随机误差

D.矩阵维数下降,运算速度大幅度提高,并且梯度信息仍然保留

9、在tensorflow开发环境下,可以使用(A)方法来完成图像灰度化的操作。

A.tensorflow.image.rgb_to_grayscale()

B.tf.image.rgb_to_hsv()

C.tf.image.rgb_to_yiq()

D.tf.image.rgb_to_yuv()

10、One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。

它主要是用来解决类别型数据的离散值问题的。

假定对篮球,足球,乒乓球,羽毛球进行独热编码,其中篮球的编码结果为(A)。

A.[1000]

B.[0100]

C.[0010]

D.[0001]

11、LabelEncoder编码对不连续的数字或者文本进行编号,将其转换成连续的数值型变量。

假定对["paris","paris","tokyo","amsterdam"]进行labelencoder编码,那么得到的结果应该是(A)。

A.[1120]

B.[0012]

C.[1120]

D.[2201]

12、全连接神经网络简称是(C)。

A.CNN

B.RNN

C.DNN

D.RCNN

13、全连接神经网络一般由(B)几部分组成。

A.输入层,池化层,输出层

B.输入层,隐藏层,输出层

C.输入层,输出层

D.输入层,卷积层,输出层

二填空题

1、MNIST是一个非常著名的手写数字数据集,由纽约大学教授YannLeCun负责构建。

2、TensorFlow2也提供了自动下载MNIST数据集函数keras.datasets.mnist.load_data。

3、数字图像本质就是一个二维数组。

4、TensorFlow2中的MNIST数据存储是以npz格式存储,因此是无法再电脑用图片编辑器软件打开的。

5、在MNIST数据集中返回训练集的形状为(60000,28,28)的三维数组。

6、全连接神经网络对单个数据要求输入数据为向量,而不是二维数组。

因此,需要将的二维数组转换为一维数组。

7、TensorFlow2中保存的MNIST原始数据的数据类型是uint8,但是在后续的处理中肯定是会涉及到浮点数操作,因此需要将这些数据转换为浮点数。

8、MNIST的标签编码方式是序列化唯一。

9、MNIST数据集中图片的像素值是0-255范围内的,但是不同的图片的像素分布差别很大。

小像素值很容易在忽略的过程中被忽略掉,这对模型最终的性能影响是非常大的。

为了解决此类问题,可以通过对像素值的缩放来缓解。

常见的一种方法就是图像归一化,即将所有像素的值缩放到0-1范围内。

10、手写数字识别是一个3层的全连接神经网络模型。

11、分类任务的评估标准一般采用准确率来进行评估。

12、启动训练,程序会自动在脚本所在的目录下创建一个checkpoint文件夹,所有的权重模型都保存在该文件夹下。

13、通过加载指定权重实现在模型训练程序完全停止后进行模型测试,或者在测试中间保存的某一个模型的性能。

三、综合题

Cifar-10数据集一个十分接近普适物体的彩色图像数据集,它一共包含10个类别的RGB彩色图片:

飞机(airplane)、汽车(automobile)、鸟类(bird)、猫(cat)、鹿(deer)、狗(dog)、蛙类(frog)、马(horse)、船(ship)和卡车(truck)。

其中每个图片的尺寸为32×32,每个类别有6000个图像,数据集中一共有50000张训练图片和10000张测试图片。

在本章我们需要做的就是构建DNN网络模型,在cifar-10数据集上训练,得到一个比较好的识别cifar-10数据集的模型。

任务要求:

任务1 cifar-10数据集

任务2 搭建并训练cifar-10识别模型

任务3 cifar-10识别模型性能验证

一、选择题

1、卷积神经网络的简称(C)。

A.KNN

B.DNN

C.CNN

D.FNN

2、卷积层的主要作用是(A)。

A.提取输入的不同特征

B.实现线性到非线性的转换

C.提取输入的主要特征

D.降低网络开销,减少参数量

3、在典型的卷积神经网络中,(C)层是明显

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 哲学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1