正确答案: D 当爬虫创建好了之后,可以使用"scrapy()"命令运行爬虫。 A.startupB.starwarC.drawlD.crawl 正确答案: D 参数headers=(),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的。 A.HEADERB.HEADERSC.HEADD.BODY 正确答案: B 以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A.curl B.tar-zxvf C.mkdirD.cp 正确答案: A MongoDB中获取名字为db的库的语句为()A.client.db B.client('db') C.client['db'] D.client{'db'} 正确答案: AC 以下哪些方法属于Python写CSV文件的方法()A.writeheaders B.writeheader C.writerrowsD.writerow 正确答案: ACD 下载器中间件的作用有哪些? A.更换代理IP B.更换Cookies C.更换User-AgentD.自动重试 正确答案: ABCD 如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成() A.非法侵入计算机系统罪 B.非法获取计算机信息系统数据罪C.非法获取计算机数据罪 D.非法获取系统罪正确答案: AB Python中()容器有推导式 A.列表B.元组C.字典D.集合 正确答案: ACD 通用网络爬虫通常采用串行工作方式 T.对 F.错 正确答案: B 需要登录的网站一般通过GET请求就可以实现登录。 T.对 F.错 正确答案: B 代理中间件的可用代理列表一定要写在settings.py里面 T.对 F.错 正确答案: B requests中get请求方法的使用为requests.get('网址',data=data)T.对 F.错 正确答案: B 所有的异步加载都会向后台发送请求 T.对 F.错 正确答案: B 在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server 文件启动redis服务 src/redis-serverT.对 F.错 正确答案: B 爬虫文件无法从Pycharm运行和调试,只能通过命令行的方式运行。 T.对 F.错 正确答案: B 爬虫中间件的激活需要另外写一个文件来进行 T.对 F.错 正确答案: B 已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行 T.对 F.错 正确答案: B Linux环境中,Virtualenv创建的虚拟Python环境中,执行pip命令安装第三方库就不需要使用sudo命令了。 T.对 F.错 正确答案: A 在Scrapy的依赖库文件中,pywin32和Twisted的底层是基于##开发的。 正确答案: C语言 爬虫中间件scrapy.spidermiddlewares.urllength.UrlLengthMiddleware的顺序号是## 正确答案: IAA 在Windows下运行Redis命令为##redis.windows.conf 正确答案: redis-server.exe MongoDB如果需要从外网访问数据库,那么需要修改安装MongoDB时用到的配置文件## 正确答案: mongod.conf lxml库中etree模块的etree.tostring()方法是做什么用的 正确答案: 把Selector对象转换为bytes型的源代码数据 请描述爬虫中的深度优先搜索过程 正确答案: 在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索单独的一条链。 深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。 当不再有其他超链可选择时,说明搜索已经结束。
展开阅读全文
相关搜索
|