结构化标准模型-标准馆演讲PPT文档格式.pptx
《结构化标准模型-标准馆演讲PPT文档格式.pptx》由会员分享,可在线阅读,更多相关《结构化标准模型-标准馆演讲PPT文档格式.pptx(27页珍藏版)》请在冰豆网上搜索。
但,全文内容在关系数据库中往往是存储在一个备注字段。
检索结果默认的指向是这个备注字段。
当检索一个日期字段时,会命中很多记录。
但匹配该字段的时间是什么语义?
如发布日期?
实施日期?
作废日期?
结果集不能说清楚,只能是自己甄别。
当对碎片化的需求,不仅仅是检索,有排序、统计需要时,全文搜索就无能为力。
问题由来由来模型构建模型构建模型模型应用用未来展望未来展望1PART默认是对特定的字段检索,检索具有明确的执向性默认的检索指向全文内容字段。
检索的指向性差,结果就会有歧义碎片化的数据存储在关系数据库或非关系数据库,检索直接指向特定的字段或列项,检索指向语义明确通过语义结构构建的数据模型展示数据项的内在联系,拓展检索线索关系数据库检索特点全文检索的特点碎片化、结构化知识图谱问题由来由来模型构建模型构建模型模型应用用未来展望未来展望2PART标准结构化包含2部分内容:
全文结构化、技术要求(技术指标)结构化标准结构化模型描述问题由来由来模型构建模型构建模型模型应用用未来展望未来展望1PART标准是什么?
无论是产品、方法、安全、卫生、环保等类型的标准,其技术要求无外乎回答2个问题:
what、howWhat(什么):
要求是什么How(怎么做):
要求怎么做标准是一种技术要求问题由来由来模型构建模型构建模型模型应用用未来展望未来展望标准是什么?
标准是什么?
问题由来由来模型构建模型构建模型模型应用用未来展望未来展望对象标准对象属性特征属性要求技术要求标准对象事物(产品、人、组织、环境)抽象观念(术语、编码、模型)属性自然属性社会属性技术要求共性要求个性要求2PART全文结构化(形式结构化)按照标准内容的层次结构及内容要素描述标准全文结构化。
这种按其形式特征描述的结构化模型,也成为形式结构化模型全文结构化按标准的章节最小单位进行存储,全文结构化库分为:
全文库、图片库、表格库、术语库、公式库。
问题由来由来模型构建模型构建模型模型应用用未来展望未来展望2PARTl对标准的技术要求,定性、定量指标进行分析,抽象出一般共性要素指标结构化(语义结构化)l选择不同类型标准,归纳、总结技术要求的数据项l对抽象描述的模型,进行数据标引、抽取验证方案名理化指标环境质量标准机械产品噪声家用电器噪声产品性能指标放射性物质人年摄入限值项名标准号标准号标准号标准号标准号标准号表名中文标准名称中文标准名称中文标准名称中文标准名称中文标准名称产品名称章节编号章节编号章节编号章节编号章节编号产品类别、型号指标组别指标组别指标组别指标组别指标组别产品等级计量单位计量单位计量单位计量单位计量单位产品材料、组件指标注指标注指标注指标注指标注指标组别备注产品名称表号放射物质指标名称环境质量主体产品名称产品类型表名元素符号指标值适用范围产品类型名称参数表注人群指标最大值环境质量等级产品类型值参数别名限量指标最小值取值时间声功率噪声限值噪声限值表号指标值误差污染物名称声压级噪声限值单位表名测试环境或条件关系表号噪声位置表注指标计量单位污染物限值表名表号试验方法表号表注表名缺陷类型表名表注指标注表注表号表名章节号问题由来由来模型构建模型构建模型模型应用用未来展望未来展望2PARTlIDEF0是以结构化分析和设计技术为基础所发展出来的一种系统菜单达的工具。
IDEF0业务描述l是美国空军在70年代末80年代初ICAM(IntegratedComputerAidedManufacturing)工程在结构化分析和设计方法基础上发展的一套系统分析和设计方法。
是比较经典的系统分析理论与方法。
方案名理化指标环境质量标准机械产品噪声家用电器噪声产品性能指标放射性物质人年摄入限值项名标准号标准号标准号标准号标准号标准号表名中文标准名称中文标准名称中文标准名称中文标准名称中文标准名称产品名称章节编号章节编号章节编号章节编号章节编号产品类别、型号指标组别指标组别指标组别指标组别指标组别产品等级计量单位计量单位计量单位计量单位计量单位产品材料、组件指标注指标注指标注指标注指标注指标组别备注产品名称表号放射物质指标名称环境质量主体产品名称产品类型表名元素符号指标值适用范围产品类型名称参数表注人群指标最大值环境质量等级产品类型值参数别名限量指标最小值取值时间声功率噪声限值噪声限值表号指标值误差污染物名称声压级噪声限值单位表名测试环境或条件关系表号噪声位置表注指标计量单位污染物限值表名表号试验方法表号表注表名缺陷类型表名表注指标注表注表号表名章节号问题由来由来模型构建模型构建模型模型应用用未来展望未来展望输入输出控制机制2PART基于UML对指标结构化模型描述对E-R进行抽象化,按UML思想构建描述模型用E-R图描述标准文献实体关系标准关系(影响因素)对象自然/社会属性对象对象技术特征属性(技术指标)标准文献标准对象实体指标对象实体1对象属性质量属性指标名称指标值指标关系指标值计量单位试验方法相关因素指标对象实体.标准文献实体标准号标准名称.理化指标数据结构指标元数据标准号标准号表名表名产品名称指标对象产品类别、型号指标对象属性产品等级指标对象属性产品材料、组件指标对象指标组别指标组别ID指标名称指标名称指标值指标值指标最大值指标值指标最小值指标值指标值误差指标值测试环境或条件指标对象影响因素指标计量单位计量单位试验方法试验方法缺陷类型指标对象属性指标注指标注表号表注表名表名章节号章节号问题由来由来模型构建模型构建模型模型应用用未来展望未来展望3PART模型应用问题由来由来模型构建模型构建模型模型应用用未来展望未来展望3PART标准结构化模型应用.标准结构化元数据描述结构化标准的数据标准结构化数据抽取用于对标准的内容结构化数据的存储结构化标准编写基于标准结构化元数据进行结构化标准编写问题由来由来模型构建模型构建模型模型应用用未来展望未来展望3PART例1-标准结构化编写应用标准结构化元数据,构建结构化标准的数据结构。
构建全文库、图表公式、术语数据结构;
构建指标库数据结构;
将标准编写涉及的标准碎片化,应用于标准编写,作为:
提示、校验规则、示例等。
问题由来由来模型构建模型构建模型模型应用用未来展望未来展望3PART例1-标准结构化编写假设:
所有企业标准按结构化标准进行编写。
推导:
企业标准指标排名、企业标准指标对比都会自动完成。
假设的前提是指标系列名称已经进行了对齐(规范化)问题由来由来模型构建模型构建模型模型应用用未来展望未来展望3PART例2-企业标准编写评价将标准编写涉及标准碎片化,归纳总结分成若干类别的编写要求。
据要求,形成评价项目、权重;
根据评价项目、权重、计算方法、评价过程形成“企业标准编写质量评价指南”标准。
问题由来由来模型构建模型构建模型模型应用用未来展望未来展望4PART全文库应用、术语库应用、图表公式库应用、指标库库应用未来展望问题由来由来模型构建模型构建模型模型应用用未来展望未来展望3PART问题由来由来模型构建模型构建模型模型应用用未来展望未来展望文本挖掘关联、相似性聚类自动分类数字化结构化知识化智能化自动化2PART作为分词的语料库防止术语编写的歧义性,提高术语的统一、协调性输入法、校对中以词为单进行输入、校对。
提高输入速度、校对精准度文本挖掘文本挖掘-分分词输入法、校入法、校对语料料库标准准编写写-语料料案例-术语库应用主要应在文本挖掘、知识检索问题由来由来模型构建模型构建模型模型应用用未来展望未来展望4PART指标库应用问题由来由来模型构建模型构建模型模型应用用未来展望未来展望指标体系编写参考手册专题库比对排名4PART全文结构化后的章节条内容包含语义,具体语义是什么?
难以体现,不易被检索到;
指标库的实现方式上是基于模版的应用,当模版增多,选择模版成为问题;
数据提起速度成为问题;
指标库构建完成后,名称对齐(统一)成为问题。
仍存在的问题解决章节条语义问题解决指标抽取方式问题解决名称对齐统一问题问题由来由来模型构建模型构建模型模型应用用未来展望未来展望谢谢聆听施建0311-83081183247514QQ.COM