技术平台建设方案doc.docx

上传人:b****5 文档编号:7426250 上传时间:2023-01-23 格式:DOCX 页数:75 大小:3.99MB
下载 相关 举报
技术平台建设方案doc.docx_第1页
第1页 / 共75页
技术平台建设方案doc.docx_第2页
第2页 / 共75页
技术平台建设方案doc.docx_第3页
第3页 / 共75页
技术平台建设方案doc.docx_第4页
第4页 / 共75页
技术平台建设方案doc.docx_第5页
第5页 / 共75页
点击查看更多>>
下载资源
资源描述

技术平台建设方案doc.docx

《技术平台建设方案doc.docx》由会员分享,可在线阅读,更多相关《技术平台建设方案doc.docx(75页珍藏版)》请在冰豆网上搜索。

技术平台建设方案doc.docx

技术平台建设方案doc

技术平台建设方案

一.1项目概述

本项目为“中国对外政务信息服务平台”中的软件子项.

中国日报作为国家对外传播和资讯服务的窗口,近两年来在中国对外政务信息服务平台建设上取得了一定成果。

为进一步贯彻落实大数据产业发展的国家战略,创新大数据产业发展的新模态新应用,推动“互联网+政务”服务的发展,在原有政务信息平台即政务数据库和影响力分析平台(以下简称政务大数据平台)已有成果基础上,启动政务服务机器人项目建设,以进一步整合政务大数据资源,服务于“一带一路”和招商引资等系列“走出去”和“引进来”业务需求,使得国外企业和公众用户更方便快捷了解我国的政策和法规。

通过政务服务机器人的全渠道、多语种的服务方式,为国内外企业和公众提供智能、高效、便捷、透明的信息获取途径。

一.2项目内容

政务服务机器人项目基于已有基于政务大数据平台的资源和成果,设计交互服务场景,通过引入人工智能技术,主动感知用户需求,基于语音、图像和文本的智能识别,以及智能语义分析技术实现多种政务服务交互方式,进一步提高政府信息化服务工作效率,加快推进对外政务服务体系建设。

政务服务机器人项目本期建设内容包括:

政务服务场景设计、数据资源整合和补充、政务服务知识库建设、政务服务智能分析引擎建设、政务服务应用开发和集成、智能问答模型构建及训练等。

1。

政务大数据平台层

基于已有政务大数据平台,打通政务大数据平台应用接口,提取已有政策法规库、政务产品群、政务应用服务和政务知识图谱相关建设成果,实现服务数据联动,以及基础应用汇聚。

2。

政务智能分析引擎层

通过引入国际领先的语音识别、图像文字识别和智能语义分析等技术,实现多模态的用户交互方式。

开放多种形态的智能分析,在端、端嵌入政务服务机器人用户交互接口,实现语音问答对话、图形图像及文字智能识别,自然语言语义解析和推理等功能,并将识别结果推送至政务服务矩阵层.

3.政务服务矩阵层

基于政务智能分析引擎分析结果,实现政务服务矩阵多层联动,根据用户需求,提供政务百科、政务指南、办事攻略、地理位置引导、应用服务唤起(调用已有政务服务平台中的政务服务)和服务可视化引导等功能,为用户打造专属的、响应及时的政务服务。

一.3需求理解

一.3.1项目背景理解

党的十八大以来,针对世界经济缓慢复苏的新形势新局面,我国积极建设开放型经济新体制,不断推进高水平对外开放。

一方面不断完善法治化、国际化、便利化的营商环境,在改革开放30多年的基础上继续做好“引进来”的工作,另一方面针对我国产业发展的阶段性特点和企业发展的内在需求,创造性地提出“一带一路”倡议,积极推动“一带一路”建设,同时推进国际产能合作。

这些工作的持续推进绘就了我国开放发展的全新格局。

中国日报是中国走向世界、世界了解中国的重要窗口,是国内外高端人士首选的中国英文媒体,拥有报纸、网站、移动客户端、微博、微信、电子报等十余种媒介平台,全媒体用户总数累计超过9000万。

与此同时,中国日报致力于打造中国政务英文网络平台,助力政府信息化建设,承建了部分中央和地方政府机构的英文网站和客户端平台。

截至目前,中国日报网已累计为我国数百家政府、机构、国有大中型企业建设了专业化的英文网站,其中包括全国各地30多个地方政府的专业化、国际化英文网站,成为各级政府、企业信息权威发布,为海外受众提供定制化资讯服务。

依托中国日报社内容资源、用户资源和外部合作资源,中国日报社近两年来在对外政务信息服务方面取得了一定的成果,在建设政务大数据平台和对外政务信息服务平台的过程中,实现了基础平台的建设和大量政务数据的积累。

在面对改革开放“走出去"和“引进来”两个大局,中国日报社有条件也有责任做好中国对外政府服务,在云计算、大数据、人工智能等新技术的支撑下,进一步整合政务大数据资源,为国内外企业和公众提供更加智能、高效、便捷、透明的对外政务信息服务。

一.3.2业务需求理解

一.3.2.1业务目标理解

中国日报社政务机器人项目的核心业务目标,是以智能机器人的智能化问答服务为手段面向国内外企业和公众提供政务信息服务,服务于“一带一路”和招商引资等系列“走出去"和“引进来”业务需求.业务目标可拆分如下:

一.3.2.1.1对外政务信息服务智能化的业务目标

在人工智能不断成熟的技术环境下,借助自然语言处理、图像处理、语音处理等技术,以中国日报社政务大数据平台积累的资源和成果为基础,构建政务服务知识库和智能问答模型,以智能问答机器人的产品形态实现对外政务信息服务的智能化。

自然语言问答、语音问答、图像识别等智能化的线上咨询服务,让终端用户可以通过与问答机器人的自然语言交互、语音交互获得所需政务信息;通过智能内容推荐、服务推荐、线路推荐,向问答中和问答结束后的用户推荐相关知识和业务;通过智能化的服务指南,让用户体验友好的线上办事引导。

智能化服务的业务目标,是尽可能地以机器人服务替代人工服务,在准确理解用户意图的前提下,提供用户所需的业务服务及扩展服务。

一.3.2.1.2对外政务信息服务场景化的业务目标

面向中国日报政务信息服务的不同服务对象,包含政务服务工作人员和国内外企业和公众用户,以用户在综合政务百科、政务指南、办事攻略、地理位置引导等各类业务中的真实需求为向导,构建场景化、可视化的智能问答服务,提升用户服务的友好体验。

场景化服务的业务目标是让用户在线上平台也能更加顺畅地索取服务,因此应该充分调研用户真实需求,构想用户在提出咨询业务时的目标、条件、空间、时间等要素,在场景化视角上提升用户服务体验。

一.3.2.1.3对外政务信息服务多渠道化的业务目标

中国日报社的信息服务渠道覆盖端、端、微信、微博及国外主流社交平台等,因此本次中国日报社政务机器人项目以覆盖多渠道为目标,接入上述平台从而服务于不同渠道的国内外大量用户。

一.3.2.2对外政务服务业务现状

国内外企业、公众作为对外政务信息服务咨询的主要用户群体,在进行政务咨询时,经常出现无法获取有效政务信息.

第一,没有一个统一的途径让用户查找外国涉外的政务服务,各政府部门在信息化建设时,往往各自独立建站,导致用户不清楚要去哪个政府机构进行咨询。

第二,目前人工咨询往往是获得咨询答案的最稳妥途径,但往往由于咨询人数过多,咨询电话经常打不通、占线、无人应答等,使得服务无法及时到位。

第三,政务服务的线上服务可以缓解一部分人工咨询的压力,但是线上服务以信息查询、检索微住,绝大部分的政府网站仅提供多级菜单导航和关键词检索两种方式,用户需要从大篇幅的网页上进行人工筛查,服务效果不理想。

一.3.2.3用户业务需求

一.3.2.3.1“引进来”的国外企业的业务需求

过去的5年,我国在完善法治化、国际化、便利化的营商环境方面取得了突出成绩。

外商产业投资限制措施和各类审批事项大幅减少,企业成本降幅显著,知识产权保护明显改善。

随着改革新政的出台、新的自贸试验区的建成,我国加快了“引进来”的步伐。

外国政府、海外企业、海外投资机构、驻华外国机构和个人,在面对中国的投资市场、国家和各地政策、法律法规、行业标准以及国内大经济开发区及产业园区等不同层面问题时,都有从信息了解到业务办理等各方面的业务需求。

一.3.2.3.2“走出去"的国内企业的业务需求

国内企业“走出去”,需要面向不同的行政管理部门办理各种手续,需要面对国外社会、市场环境、商务规则、政策法规,尽可能多地了解各种信息,进行由针对性的投资、商贸和交流活动,需要强有力的信息支持、业务服务和咨询决策服务。

“走出去"企业需要相关服务以突破语言、人力、信息资源等方面的瓶颈,在业务拓展的不同时期高效获取目标国家的各方面信息。

一.3.2.3.3“引进来”的外国公众的业务需求

中国拥有丰富的旅游资源,近些年来随着基础设施的完善和国际间的跨境旅游合作的逐渐频繁,尤其是“一带一路”战略对思路沿线省区市旅游发展带来的促进作用,个人和团体的入境旅游越来越多。

除此以外,赴中国留学也是一项重要业务,目前中国成为亚洲最大留学目的国,生源层次显著提升。

对于在中国的旅游、留学和生活的公众而言,面对与个人息息相关的政务办事服务、交通出行等事务,有着不同程度的服务需求,并且,服务的便捷性、智能性、友好性是个人对政务信息服务的更深层次需求。

一.3.2.3.4“走出去"的国内公民的业务需求

对于出境从事旅游、留学、工作、投资等各种类型活动的国内公民而言,除对目的国的相关咨询信息的需求,更为重要的是在出国人员人身安全方面,包括保险、安全培训、国际救援、国际安保、安全咨询等相关的信息和服务的需求。

一.3.2.3.5政务服务工作人员的业务需求

政务服务工作人员是中国日报社政务机器人的重要服务对象.处理外事服务的政府工作人员面对现场咨询和电话咨询的人员,需要快捷、准确地回答咨询人员的问题,包括办理事项、所需材料、需要时间、办理地点等内容,并且根据用户办事情况和条件的不同,能够快速准确地进行告知.这需要政务服务工作人员拥有足够强大的知识体系,因此对于政务信息的智能问答、智能检索的应用场景能够辅助外事政务服务人员有效地提升服务能力。

一.3.3功能需求理解

一.3.3.1对技术平台的整体理解

中国日报社政务机器人项目技术平台的建设,自底向下主要包含政务大数据平台层、政务智能分析引擎层、政务服务矩阵层的建设。

政务大数据平台层:

利用政务大数据平台整合来自内外部不同渠道的政务资源数据,并借助政务知识体系的相关内容构建形成不少于30个类别的政务服务知识库和知识图谱,将政务资源数据知识化处理形成知识库内的知识条目,以此作为政务机器人智能问答的支撑数据。

政务知识分析引擎层:

提供支撑政务智能分析引擎所需的调用能力,利用拓尔思自有的技术实力和成熟产品,提供智能语音识别、语音交互、图像识别、文本识别、人脸识别等能力和模型。

政务服务矩阵层:

基于政务智能分析引擎的分析结果,实现政务服务矩阵多层联动,根据用户需求,提供政务百科、政务指南、办事攻略、地理位置引导、应用服务唤起和服务可视化引导等功能,为用户打造专属的、响应及时的政务服务.此外,在政务机器人的管理后台,面向管理人员提供系统级的配置管理功能和业务知识库管理的维护两类管理功能。

一.3.3.2对政务大数据平台层的理解

中国日报社政务机器人项目的政务大数据平台层设计到数据资源的整合、补充,以及政务服务知识库的建设。

对于数据资源的整合补充,基础资源数据来自于以下几个方面:

Ø与政务大数据平台对接,接入平台已有的政务信息数据

Ø接入其他外部合作的政务数据资源

Ø接入拓尔思自有的数据资源

为实现政务服务智能问答相关的应用场景,需要对以上各类资源数据进行进一步整合,对接入的政务信息数据需进行标签分类,为政务知识库提供基础数据,以形成基础政务信息、政策法规、政务百科、行业信息等等多类别的政务基础知识库.通过服务接口的接入,可快速调用政务法规库的推荐、查询类服务,以及政务应用服务中对招商引资类政务服务、“一带一路"类政务服务、政策法规类服务、旅游类政务服务、文化传播类政务服务、经济贸易类政务服务等等。

对其他外部合作的政务数据资源,通过对来源数据的调研、接入标准的设计,以合适的方式实现数据或服务接入。

对于拓尔思自有的数据资源,根据数据应用的场景和需求,提供数据中心推送和数据查询调用两种方式。

一.3.3.3对智能分析引擎建设的理解

提供支撑政务智能分析引擎所需的调用能力,包括但不限于智能语音识别、语音交互、图像识别、文本识别、人脸识别等能力和模型,并对各模型进行训练,以支持政务智能机器人应用的各场景和功能。

1、智能语音识别引擎

提供智能语音识别引擎,能够支持准确的语音识别服务,满足个性化输入的需求,可以利用语音识别服务来取代传统的键盘输入或者自动对语音数据进行分析、质检、索引等进一步操作.

2、政务语音交互引擎

提供政务语音交互引擎,包含语音问答、语音查询等方式的互动,支持语音朗读回答内容。

3、图像分析引擎

提供图像分析引擎,对用户发送的图像进行比对分析,定位图片出处,并向用户推送相关新闻信息。

4、语义分析引擎

提供文本分析引擎,对用户输入的文本信息以及语音转化的文本信息进行智能分析,准确识别文本内容,理解用户意图以便提供精准答案.

一.3.3.4对前端矩阵化政务服务的理解

中国日报社政务机器人项目面向前端用户提供矩阵和的政务服务,包括政务百科、政务指南、办事公立、地理位置引导、应用服务唤起和可视化引导等服务。

这些服务矩阵以知识化的政务资源数据为基础,以政务智能分析引擎为支撑,提供多种产品服务形态,例如:

智能问答、智能检索、服务推荐、个性化服务等。

1、政务百科服务

对用户的问答内容进行意图理解,从政务百科知识库中关联匹配相应的答案,将问题结果的关联数据推送给用户。

实现多维度,深层次的问答交互,需提供多轮互动问答,提高问题理解和答案推送的准确性。

2、政务指南服务

在问答过程中根据用户意图的理解为用户提供预设的服务导航,用户按照导航引导的点击进行服务选择;或向政务机器人直接发送政务服务请求,机器人回应指南内容。

3、办事攻略服务

需向用户提供完整的政务服务事项解决方案,按照办事流程向用户推送系列的政务服务和相关讯息.

4、地理位置引导

对于用户关于位置信息的咨询需求为用户推送地图数据,并能获取用户位置为其规划出现路线。

5、应用服务唤起

需实现对政务服务的智能唤起操作。

支持通过可视化引导功能唤醒应用服务和通过语音、文本信息的提问唤醒应用服务。

6、服务可视化引导

需向用户提供政务流程图、政务路线图、政务目录导航等多种可视化的形式呈现给用户,使用户能够直观了解政务服务的分布,更快捷地找到所需政务服务.

一.3.3.5对可配置可维护的系统后台的理解

中国日报社政务机器人的系统后台硬实现相应的系统管理功能,包括政务服务配置管理、分析引擎配置管理、服务总线管理、系统安全管理、调用日志管理、用户管理、异常警告管理和权限管理。

1、政务服务配置管理

政务服务配置管理需包括:

Ø政务应用在服务导航体系内的位置调整。

Ø热门服务推荐的调整.

Ø记录政务服务的调用数据,定期进行统计。

2、分析引擎配置管理

支持分析引擎的配置管理,包括:

Ø智能语音问答模型管理,如配置开关维护、主要参数调整等。

Ø用户语义分析模型管理,如配置开关维护、主要参数调整等。

Ø分析模型相关的操作和统计,如调用次数统计、命中次数统计等。

3、服务总线管理

Ø对服务总线上相关接口调用、数据交换进行记录、统计.

Ø实现数据交换节点对接的管理,可以执行开启/关闭操作。

4、接入渠道管理

对接入的不同渠道进行统一管理.

5、系统安全管理

对系统的安全进行统一管理,包括但不限于监测病毒、内存占用率等情况。

6、调用日志管理

实现对政务机器人调用政务大数据平台的数据和服务的调用日志进行管理,建立日志库,支持可视化信息内容核对和错误排查等.

7、用户及权限管理

构建用户数据库,对政务机器人的用户进行统一管理。

可对用户的基本信息、密码、权限等进行修改,同时可以执行新建/删除/冻结用户等操作.

8、异常警告管理

对系统运行过程中出现的异常警告信息进行记录和存储,定期进行统计.

一.3.4非功能需求分析

非功能性需求是项目建设需求中的一个重要组成部分,它影响了系统的架构设计,需要项目架构设计、技术开发人员重点关注。

本次项目中对非功能需求的分析涵盖系统性能需求、技术实现要求、安全需求、可用性要求、兼容性要求等几个方面。

一.3.4.1性能要求分析

项目需满足如下性能指标:

1、稳定性

提供24小时不间断的政务信息咨询服务,即任何时候向政务信息咨询服务发起请求时,服务都应给予回复,不应存在服务没有响应的情况。

2、准确率

智能问答模型经训练后,答案的准确率不低于95%,验证方法可采用抽样分析或用户反馈数据统计的方法.

3、兼容性

支持多渠道集成部署,包括微信、微博、客户端、国外主流社交平台等,即政务信息咨询服务可集成部署至以上渠道,实现对服务的调用。

4、服务接口

可提供包括基于语音识别、图像和文本的智能识别、智能语义分析等多种政务服务交互方式;可提供多语种服务,至少包括中文、英语等。

一.3.4.2技术实现要求分析

技术实现要求包括系统数据要求、开发部署环境要求和技术开发要求。

1、系统数据要求

本项目涉及的系统存储和处理的数据类型范围包括:

结构化数据、非结构化数据、半结构化数据等。

数据的计算、存储等要求,必须符合客户端、网站数据质量、数据标准,数据安全的要求。

对数据的存储和计算需采用符合数据类型特征的数据库,对于结构化数据一般需采用关系型数据库;对非结构化数据和半结构化数据,一般采用非关系型数据库.此外,考虑到项目大数据特性和未来弹性扩展的可能性,建议采用支持分布式部署的数据库。

数据库选型应符合项目在数据存储、应用和服务各个层面上对数据质量、数据标注、数据安全的要求.

2、开发部署环境要求

本项目开发部署应满足以下基本要求:

端应支持当前主流操作系统,可在、和主流操作系统上部署;

系统后台功能应使用架构,支持多种常用浏览器,如、、、360等浏览器。

3、技术开发要求

(1)需采用三层结构技术

系统需采用三层结构技术,系统技术框架可分三个层面:

人机交互界面层、中间层和数据库层.

(2)需采用平台化和组件化的设计思路

系统需采用平台化的设计,需采用成熟的平台产品支撑,实现支撑平台与应用分离;需采用组件化、模块化技术,确保平台在内核稳定的同时具有可灵活扩展性。

(3)兼容性要求

应对招标方的政务大数据平台、对外政务信息服务平台进行技术梳理,设计方案并实现各平台的应用互联互通,以确保各项业务的无缝顺畅衔和连续性。

(4)技术架构设计要求

为了保证平台功能和规模能够持续扩展,控制系统的复杂度,要求在设计上采用微服务架构来有效拆分应用和服务,实现敏捷开发、灵活部署、横向扩展和故障隔离.

一.3.4.3安全需求分析

1、信息安全设计需求

设计需从网络、系统、数据、应用等方面进行整体、全面的防护。

2、网络安全设计需求

设计合理的网络安全方案,确保各系统互联互通时的安全.

3、系统安全设计需求

系统安全需重点解决操作系统、数据库和服务器等系统级安全问题,抵抗黑客攻击,主要措施应包括但不限于:

安全操作系统、安全数据库、黑客入侵检测、系统漏洞扫描及病毒防护系统等。

4、数据安全设计需求

保证敏感数据在使用、传输过程中的强壮性、保密性、完整性和不可抵赖性。

5、应用系统的安全设计需求

对不同的应用采取相应的安全措施,包括但不限于用户身份认证、权限管理、日志和安全审计等,以降低安全风险。

一.3.4.4可用性要求分析

1、灵活性

支持中英文界面切换。

2、可维护性

系统在出现错误及故障时应有详细的日志记录相关信息以便进行排错。

3、健壮性

要求7*24小时不间断运行,可用性达到99%以上,能够具备一定的非常规峰值的数据处理能力,能够支撑增长的数据处理压力。

系统不发生不可挽回的数据丢失故障,业务数据要求数据备份.

一.3.4.5兼容性要求分析

1、应用兼容性支持

需支持多渠道集成部署(微信、微博、客户端、国外主流社交平台等)。

2、需提供移动端集成标准

需提供、集成标准。

3、支撑

需提供及两种移动架包。

一.4总体功能架构

基于拓尔思对招标文件的分析理解,我们对做技术平台的建设进行了整体功能架构设计,设计按照数据层、中间层、用户界面交互层分层设计,如下图所示:

一.4.1界面交互层

用户界面交互层是指面向不同类型的用户提供的可视化的交互界面,主要包括政务机器人的终端使用用户和对政务机器人进行后台管理、系统配置的相关管理人员。

(1)面向政务机器人的终端使用用户以政务服务矩阵的产品矩阵形态向用户提供服务,包含政务百科、政务指南、办事攻略、地理位置引导、应用服务唤起和服务可视化引导等,为用户打造专属的、响应及时的政务服务。

每一类服务从用户需求出发,提供智能问答、智能检索、智能推荐、服务推送、服务导航、流程引导等多种类型的功能,满足用户在应用场景中的真实需求。

(2)面向管理人员,提供政务机器人的系统管理功能,实现政务服务配置管理、分析引擎配置管理、服务总线管理、系统安全管理、调用日志管理、用户管理、异常警告管理和权限管理。

(3)面向业务管理人员,系统按照终端服务所需的所有知识构建相应知识库,由知识库的管理人员对其进行维护,包括但不限于问题管理、智能学习、未知问题学习、知识管理、知识查询等。

一.4.2中间层

中间层主要涉及系统的应用支撑、技术支撑、服务及数据的支撑,分为政务服务知识库支撑层、政务服务智能引擎支撑层和政务大数据平台层.

1、政务知识库支撑层

政务知识库支撑层是政务服务知识库的构建层,利用数据处理和文本分析的技术,对接入数据进行元数据处理、知识库分类,形成政务主题词库、词条库、语料库,构建政务领域知识图谱,从不同层面构建应用于政务信息服务的知识体系,形成的知识库和知识条目存储在数据层,对机器人的智能问答提供知识支撑。

2、政务服务智能分析引擎支撑层

政务服务智能分析引擎层提供支撑政务智能分析引擎所需的调用能力,包括但不限于智能语音识别、语音交互、图像识别、文本识别、人脸识别等能力和模型,并对各模型进行训练,以支持政务智能机器人应用的各场景和功能。

3、政务大数据平台层

政务大数据平台层实现内外部服务和数据接入,接入渠道包括政务大数据平台接入、外部合作资源服务接入、拓尔思数据中心的数据接入。

与政务大数据平台对接包括政策产品群、政务法规库及政务应用服务等相关服务接入;外部合作资源服务接入,是指与中国日报社自有的及拓尔思可提供的合作渠道的对接,为系统提供一定的补充;拓尔思数据中心的数据接入,是指与我公司数据中心自有的相关政务数据资源、媒体资讯数据及语料分析数据等的对接.

政务大数据平台层在实现各类数据和服务的接入,覆盖政策产品类、政务法规类、招商引资类、“一带一路”类、旅游类、文化传播类、经济贸易类等数据和服务,形成政务知识库支撑中的政务知识库和知识图谱,用以向用户提供知识问答和外部服务。

一.4.3数据层

数据层对系统不同层面的建设所需的各类数据进行存储,包括不少于30类的知识库相关数据,用于各类智能分析的训练数据、特征数据、模型数据等,以及系统业务相关的管理数据。

一.5技术实现路线

一.5.1系统数据类型

一.5.1.1数据类型分析

本项目涉及的系统存储和处理的数据类型范围包括:

结构化数据、非结构化数据、半结构化数据。

结构化数据是指行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,例如系统中知识条目、词典、标签、用户数据、日志数据等等。

结构化数据一般用关系型数据库进行存储和管理,如、、等。

非结构化数据是指不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、图像和音频/视频信息等等。

系统中的一些语料数据、资源数据等属于非结构化数据。

对于图像、音视频、文件等非结构化数据一般直接整体进行存储,而且一般存储为二进制的数据格式;对于文本数据,可以用非结构化数据库如全文检索数据库等进行存储,常作全文检索使用。

半结构化数据就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,文档就属于半结构化数据。

它一般是自描述的,数据的结构和内容混在一起,没有明显的区分.半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要.常见的半结构数据有、、等.

一.5.1.2数据存储规划

一.5.1.2

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1