某大学大数据与舆情科研平台功能分析0930V15.docx

上传人:b****8 文档编号:11180097 上传时间:2023-02-25 格式:DOCX 页数:15 大小:23.66KB
下载 相关 举报
某大学大数据与舆情科研平台功能分析0930V15.docx_第1页
第1页 / 共15页
某大学大数据与舆情科研平台功能分析0930V15.docx_第2页
第2页 / 共15页
某大学大数据与舆情科研平台功能分析0930V15.docx_第3页
第3页 / 共15页
某大学大数据与舆情科研平台功能分析0930V15.docx_第4页
第4页 / 共15页
某大学大数据与舆情科研平台功能分析0930V15.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

某大学大数据与舆情科研平台功能分析0930V15.docx

《某大学大数据与舆情科研平台功能分析0930V15.docx》由会员分享,可在线阅读,更多相关《某大学大数据与舆情科研平台功能分析0930V15.docx(15页珍藏版)》请在冰豆网上搜索。

某大学大数据与舆情科研平台功能分析0930V15.docx

某大学大数据与舆情科研平台功能分析0930V15

 

某大学大数据与舆情科研平台

 

相关服务与功能分析

目录

1建设目标3

1.1全方位数据实时自动化采集3

1.2自动定位网络热点3

1.3舆情信息智能分析3

1.4简报快速生成3

2性能需求3

2.1可用性3

2.2可靠性4

2.2.1平均故障率4

2.2.2故障可恢复性4

2.2.3可维护性4

2.3可扩展性4

2.4并发处理能力4

3功能模块需求5

3.1首页个性化定制5

3.2信息综合搜索5

3.3重点关注订阅6

3.4热点智能推荐7

3.5微博全面监测7

3.6重要信息及时推送7

3.7舆情报告自动生成8

4设备详细技术参数要求描述8

4.1互联网大数据与舆情监测分析系统要求:

8

4.2采集/快照/报告服务器技术规格及配置要求:

10

4.3交换机技术规格及配置要求:

11

4.4机柜技术规格及配置要求:

12

4.5专业图形显示系统要求:

12

4.6数据可视化系统开发平台要求:

12

4.7电子文档存储阅览器要求:

13

4.8远程数据调试终端要求:

13

4.9数据存储阵列要求:

14

5采购内容及预算14

5.1总预算14

5.2采购内容14

1建设目标

1.1全方位数据实时自动化采集

实现对新闻、贴吧、论坛、博客、微博、微信、移动新闻客户端等各种媒体的实时化和自动化监测,确保监测信息的时效性、准确性、全面性。

1.2自动定位网络热点

监测系统自动对各种大型网站进行热点信息监测分析,掌握当下互联网热点舆情信息和大数据。

1.3舆情信息智能分析

实现对关注事件的智能分析,包括统计和语义上的双维度分析。

1.4简报快速生成

支持快速创建各类简报,提供多种模板选择,生成的报告可以DOC导出并进行编辑。

2性能需求

2.1可用性

系统需采用简洁、友好的人机交互界面,使系统操作人员能够方便、快捷地使用系统进行互联网信息监测分析等处理;同时提供丰富、便捷的辅助功能,提高处理效率。

2.2可靠性

系统运行安全可靠,保证7X24小时运转正常。

信息传输要防止截获、篡改。

系统的故障率、可恢复性和可维护性有较高要求,相应的技术指标要求如下:

2.2.1平均故障率

故障发生频率低于1次/月,且无不可恢复性故障发生。

2.2.2故障可恢复性

采用备份机制,提供方便的系统备份恢复工具,当故障发生时,能保障在24小时内恢复系统环境。

2.2.3可维护性

提供方便的系统管理工具、数据和系统备份/恢复工具,供系统管理员方便地进行系统设置和管理,以及定期备份,便于在发生故障时恢复系统。

2.3可扩展性

1)高效管理服务器的数量、性能;

2)快速提高存储容量,加快响应速度;

3)保证功能模块的独立性,可根据用户需求自由增删模块;

4)系统能根据用户需求及时进行升级改造;

2.4并发处理能力

系统性能随着客户端数量、数据库服务器性能、管理信息种类和数量的变化而变化。

进行典型文本类型数据管理和总信息内容不超过10k(5千个汉字)情况下的性能指标要求。

1)数据入库操作:

≤1秒。

2)数据修改入库时间:

≤1秒。

3)数据检索时间:

国内外重点网站检索模式进行关键字检索的返回结果时间≤1秒。

4)在线用户数:

能满足至少100个用户同时访问需求。

3功能模块需求

3.1首页个性化定制

系统需支持首页定制化功能,操作人员可根据自己的需求对首页展示内容进行控制管理,具体包括:

1、可将系统最新入库的数据与舆情信息分类展示,包括网站动态、微博微信动态、论坛博客动态及新闻客户端动态版块等。

2、可实时展示“重点关注订阅”模块中订阅内容的当天入库信息量。

3、可实时展示“重点关注订阅”模块中订阅内容的相关统计分析图表。

4、可通过拖拽展示内容版块的方式重新调整版块位置,并可对展示内容进行删除、添加等操作。

5、可对上述展示内容中的图表一键加入报告素材、放大、保存及编辑数据等操作。

3.2信息综合搜索

系统需支持对信息的综合搜索功能,至少包括模糊搜索、高级搜索、元搜索及以文找文等功能,并以列表的形式展示搜索结果。

1、模糊搜索:

可支持类似XX搜索的方式,利用关键词/关键词组直接进行信息搜索,并支持简单的语法逻辑运算。

2、高级搜索:

可支持通过设置关键词,并限定关键词位置(标题、正文)、发布时间、信息类型、作者、网站名称及频道名称等来进一步搜索目标信息。

3、元搜索:

可支持调用第三方搜索引擎的方式来搜索目标信息,支持的搜索引擎至少包括:

XX、搜狗、有道、必应、中国搜索等。

4、以文找文:

可支持根据一段文本内容对文本出处进行相似度搜索,并可通过进一步限定时间段和信息类型来更精确的查找文本出处。

5、搜索结果展示:

对于搜索结果,系统需支持同页面展示信息列表与相应的统计分析结果,至少包括报道趋势分析、媒体类型分布、媒体发布排行及情感分析等,并可对搜索结果进行筛选浏览(按信息类型、时间、是否消重等)。

同时,系统还需支持对信息列表中的每一条信息进行加入素材、加入处置、导出、推送等功能。

此外,系统还需支持对搜索内容一键添加至“重点关注订阅”模块的功能。

3.3重点关注订阅

系统需支持对重点关注人物、事件、行业等方向的信息订阅分析功能,可通过配置关键词/关键词组(支持关键词逻辑运算)的方式,对用户关注内容进行有效监测分析。

1、关注订阅配置:

支持个人订阅与公共订阅两种订阅方式,并可对订阅内容进行分组管理,支持对配置规则进行增加、删除、修改等操作。

2、订阅信息浏览:

订阅信息以列表的形式按时间先后顺序进行展示,并支持对订阅信息一键加入素材、推送、导出、加入处置、生成报告及二次搜索等功能。

3、订阅信息统计分析:

订阅信息统计分析维度至少包括网络声量、传播效果及演化分析这三类;需支持和订阅信息列表同页面展示。

(1)网络声量:

网络声量应包含报道趋势、信息类型、媒体发布排行及情感分析等。

(2)传播效果:

传播效果应包括参与互动媒体分布、网民观点、热词分布、热门微博及衍生词推荐等。

(3)演化分析:

演化分析应包括演化分析图、引发议题及当日话题等。

4、消重处理:

可对订阅的重点关注信息进行消重处理,可选择展示不重复的关注信息。

3.4热点智能推荐

系统需支持热点智能推荐功能,至少包括地域热点、网站热点及微博热点这三大类,并可按当日相关文档数及总计相关文档数、热度值等方式进行排序。

1、地域热点:

系统支持通过配置地域词自动聚类推送地域热点信息。

2、网站热点:

系统支持对采集的网站进行分类管理,并可对指定网站群内发布的热点信息进行聚类推送。

3、微博热点:

系统支持对重点关注博主发布内容的热点聚类功能,可及时推送关注微博群体中的热点信息。

3.5微博全面监测

系统需支持对新浪微博的全面监测分析功能,并可从微博群体、微博个体及单条微博这三个维度进行多维度的监测分析。

1、微博群体监测分析:

系统需支持利用微博主账号搜索的方式查找目标微博主,并可对博主进行分组管理,包括微博群的增加、删除、修改等。

系统需支持对微博群的热议词汇、发博规律、社群结构、活跃博主及最新博文情况进行分析展示。

2、微博个体监测分析:

系统需支持对单位微博主的有效监测分析,包括展示博主一个月内提及的其他博主情况、提及博主的认证情况、提及次数以及博主自身的发博规律、热议词汇等。

3、单条微博分析:

系统需支持对单条微博传播情况的统计分析,包括该微博的传播轨迹图、传播次数、传播层级、关键传播节点以及影响人数等。

3.6重要信息及时推送

系统支持重要信息推送功能,可在同一机构下向不同的用户推送操作人员指定的信息,并可对推送信息进行一键加入素材等。

重要信息推送模块应分为推送列表与接收列表,以列表的形式展示用户自身推送的信息以及接收到的信息,并可根据关键词、推送人/推送对象、推送时间、信息类型等进行搜索。

3.7舆情报告自动生成

系统需支持行业报告自动生成功能,操作人员可对上述功能模块中的图表及信息一键加入到报告素材库,并可根据报告模板一键生成多种类型的报告。

1、报告素材库管理:

系统需支持对报告素材的分类管理,包括素材库的添加、删除、修改等操作,并可对素材库中的内容进行添加、修改、删除、清空、移动、复制、导出、搜索等操作。

2、报告库管理:

系统需支持对报告的分类管理,包括报告库的添加、删除、修改等操作,并可对生成的报告进行在线浏览、在线编辑、下载、删除等操作。

4设备详细技术参数要求描述

4.1互联网大数据与舆情监测分析系统要求:

1.大数据采集系统

采用分布式采集架构,实现对新闻、论坛、贴吧、博客、微博、微信、移动客户端等全媒体类型网站和内容的实时监控和自动采集,满足对海量互联网信息资源的快速获取需求;未来视频数据采集预留接口。

2.大数据存储检索系统

采用分布式存储框架,利用列存储技术,满足对海量结构化/非结构化数据的高效存储,并基于中文信息处理技术,利用字词混合索引、倒排索引以及分段索引等多种检索技术,实现对海量数据的快速检索;

3.智能分析系统

采用分布式集群架构,以中文信息处理和自然语言理解技术为基础,融合最新的中文信息处理、人工智能、机器学习及文本挖掘的先进技术和最新研究成果,采用不同的智能分析策略,利用各种模型与算法,有效地克服了传统信息分析在海量数据环境下面临的困境,实现高效、智能的大数据分析;

4.舆情监测分析

系统采用“本地部署+数据推送”的方式为用户提供互联网舆情监测分析;

5.数据推送服务

提供数据推送服务,参投人需具备自有的数据中心,所监测的网站、论坛不少于20万个频道、移动新闻APP不少于200家4000个频道、新浪微博支持对千万级博主的监测等;

6.系统能够分析采集网页中的标题、作者、来源、时间、发布链接、关键词等数据信息;

7.支持首页定制化功能,操作人员可根据自己的需求对首页展示内容进行控制管理;

8.★支持多种检索方式,包括模糊搜索、高级搜索、元搜索(支持XX、搜狗、有道、必应、中国搜索等搜索引擎)及以文找文等;支持对未来基于图片/视频内容的检索与识别(以关键词搜图、以图搜图、以图搜视频、以视频片段搜视频等功能)

9.★支持对搜索结果的量化分析,包括增量分析、信息扩散分析、相关媒体报道、情感分析等;

10.★支持按信源(新闻、论坛、博客、微博、微信公众账号等)、时间、是否消重、回帖、网站分组等指标进行二次筛选;

11.★支持事件的订阅分析,以一组具有逻辑语义关系的关键词租配置的方式,对关注内容进行有效的监测;

12.★提供个人订阅与公共订阅的方式,支持对规则的修改、删除与添加;

13.★支持从网络声量、传播效果和演化分析三个维度对舆情事件进行智能分析,网络声量包括报道总趋势分析和情感分析等;传播效果包括参与互动概览、网民观点抽取、衍生词推荐等;演化分析包括由关注事件所演化的内容、引发的议题等;

14.支持舆情预警功能,预警方式至少包括邮件及手机短信的形式;

15.★支持热点聚焦,维度包括地域热点、网站聚焦和博主聚焦,按近一天、近一周、近一月进行展示,支持按热度值、文档相关数、当日文档相关数进行排序;

16.系统需支持对新浪微博的全面监测分析功能,并可从微博群体、微博个体及单条微博这三个维度进行多维度的监测分析;

17.微博群体分析展示微博群热议词汇、发布规律、社群结构和活跃博主等;

18.微博个体分析展示博主一个月内提及的其他博主情况、提及博主的认证情况、提及次数以及博主自身的发博规律、热议词汇等;

19.系统支持重要信息的推送功能,对接收/推送信息可根据关键词、推送人、推送时间、信息类型等进行搜索;

20.系统支持对素材内容的一键添加及分组,提供简报、日报、周报、月报、专报等多种模板自动生成报告,支持在线编辑及word形式下载至本地功能;

21.系统管理需提供对网站分组、热点配置、日志管理、运行监控、处置配置、机构管理、用户管理、权限管理和指定采集等;

4.2采集/快照/报告服务器技术规格及配置要求:

1.高度2U机架式

2.CPU1颗英特尔至强E5-2620v42.1GHz,20M缓存,8.0GT/sQPI,Turbo,HT,8C

3.内存≥16GBRDIMM,2400MT/s,双列,x8带宽,内存插槽支持≥24个,最大可扩展不少于768G;

4.硬盘≥2块600GBSAS热插拔硬盘,最大可扩展不低于8个硬盘3.5寸或者16个硬盘2.5寸;

5.RAID卡RAID卡,支持RAID0/1/5/6/10/50/60,带后备电池保护,支持双RAID卡功能

6.网卡≥4个Intel千兆网口

7.PCI-E≥6个PCI-E3.0

8.GPU≥2个GPU支持

9.快速同步支持通过手机应用快速同步服务器信息,了解服务器配置和状态

10.软件支持SanDiskDAS缓存,永久软件许可和3年软件维护

11.光驱DVDRW-ROM

12.虚拟化支持双SD冗余虚拟化卡,可安装虚拟化软件提高整体性能。

13.可用性

ECC内存、热插拔硬件、热插拔冗余散热系统、热插拔冗余电源、内置双SD模块、单设备数据校正(SDDC)、备用列、免工具拆装机箱,支持主动式系统管理警报、带生命周期控制器的iDRAC8

14.管理

配置独立远程管理卡(支持远程监控图形界面,可实现与操作系统无关的远程对服务器的完全控制,包括远程的开关机、重启、更新Firmware,虚拟KVM,虚拟软驱,虚拟光驱等操作);

主板集成驱动程序SD卡,可以将驱动程序等存放于存储空间,安装WindowsOS不需要导航盘和驱动盘,方便系统安装和管理;

带管理软件,使用统一的管理界面,支持IPv6。

允许用户独立于操作系统状态之外(免代理安装方式)远程访问、监控、维修、修复和升级服务器。

前面板上配备有液晶屏,可显示默认或定制信息,包括IP地址、服务器名称、支持服务编号等。

如果系统发生故障,该液晶屏上将显示关于故障的具体信息

15.电源最多可2个高效热插拔冗余电源

16.风扇配置热插拨冗余风扇

17.上架配件配置标准服务器上架导轨

18.售后服务提供原厂商3年7x24x4现场和备件服务;3年硬盘不返还服务,提供专用800报修电话;

4.3交换机技术规格及配置要求:

1.类型全千兆交换机,每端口均为千兆

2.应用层数二层

3.传输速率10/100/1000Mbps

4.端口数量48个10/100/1000Base-TX,4个100/1000Base-XSFP

5.背板带宽256Gbps

6.MAC地址表16K

7.端口结构非模块化

8.包转发率78Mpps

9.网络标准IEEE802.3,IEEE802.3u,IEEE802

10.交换方式存储-转发

11.支持堆叠可堆叠

4.4机柜技术规格及配置要求:

1高度33U,宽600mm×深950mm×高1645mm(允许偏离±5%)

4.5专业图形显示系统要求:

1.面板类型IPS

2.面板尺寸32寸;4K;99.5%AdobeRGB广色域;原生10bit色彩;

3.最佳分辨率3840*2160

4.响应时间5ms

5.亮度350cd/m2

6.对比度1000:

1

7.可视角度178°(H)/178°(V)

8.其它功能内置音箱,HDCP功能,LED背光

9.重量12.5kg

10.接口HDMI(v2.0)x4,MiniDisplayPort1.2,DisplayPort1.2

耳机插孔:

3.5mmMini-Jack;USB接口:

3.0x5

4.6数据可视化系统开发平台要求:

1.处理器3.0GHz八核,IntelXeonE5处理器(TurboBoost,最高可达3.9GHz),配备25MB三级缓存

2.内存32GB1866MHzDDR3ECC内存

3.硬盘512GBPCIE固态硬盘

4.显卡双AMDFireProD700图形处理器,各配备6GBGDDR5显存

5.音频接口光纤数字/模拟音频输出组合(迷你插孔),支持配耳麦的3.5毫米耳机插孔HDMI端口支持多通道音频输出,内置扬声器

6.网络802.11acWi-Fi无线网络连接3;与IEEE802.11a/b/g/n兼容,蓝牙4.0无线技术

7.外扩接口USB3.0*4,Thunderbolt2*6,1000MB以太网*2,HDMIHD*1

8.键盘鼠标带数字小键盘MagicKeyboard,MagicMouse2

9.配套说明DaVinciResolve14、Fusion8Studio、AutopanoVideoPro、LogicProX、FinalCutProX、Compressor、Motion、MochaPRO软件

4.7电子文档存储阅览器要求:

1.屏幕尺寸10.5英寸

2.分辨率2224x1668分辨率,264ppi

3.屏幕描述LED背光Multi-Touch显示屏

4.存储空间512GROM

5.主芯片64位架构的A10XFusion芯片嵌入式M10协处理器

6.网络无线网络(802.11a/b/g/n/ac);双频(2.4GHz和5GHz);支持HT80的MIMO技术。

蓝牙4.2技术

7.颜色深空灰色

4.8远程数据调试终端要求:

1.显示大小Retina显示屏15.4英寸(对角线)LED背光显示屏(采用IPS技术);初始分辨率2880x1800(220ppi),支持数百万色彩

2.处理器2.9GHz四核IntelCorei7处理器(TurboBoost最高可达3.9GHz),配备8MB共享三级缓存

3.采集指标720pFaceTimeHD摄像头

4.存储设备512GB主板集成PCIe固态硬盘

5.图形处理器RadeonPro560图形处理器,配备4GBGDDR5显存和显卡自动切换

6.外设扩展

四个Thunderbolt3(USB-C)端口

Thunderbolt(速率最高可达40Gbps)

USB3.1第二代(速率最高可达10Gbps)

7.网络802.11acWi-Fi无线网络;兼容IEEE802.11a/b/g/n,蓝牙4.2无线技术

8.其它MagicTrackpad2,MXAnywhere2S

9.配套说明DaVinciResolve14、Fusion8Studio、AutopanoVideoPro、LogicProX、FinalCutProX、Compressor、Motion、MochaPRO软件

4.9数据存储阵列要求:

1.容量可容纳4块硬盘RAID阵列箱,本次配置12TB,可扩展升级

2.配件带原厂Thunderbolt3(USB-C)至Thunderbolt2转换线

3.接口类型

支持Thunderbolt3接口允许的最大传输量

双Thunderbolt3端口支援菊链串接

热插拔磁盘槽

4.阵列级别可携式硬件RAID保护,RAID等级0、1、5、6、10

 

5采购内容及预算

5.1总预算

人民币69万元

5.2采购内容

1互联网大数据与舆情监测分析系统1套

2采集/快照/报告服务器1台

3交换机1台

4机柜1台

5专业图形显示系统2台

6数据可视化系统开发平台1台

7电子文档存储阅览器1台

8远程数据调试终端1台

9数据存储阵列1台

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 经济学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1