信息管理学基础 教案.docx
《信息管理学基础 教案.docx》由会员分享,可在线阅读,更多相关《信息管理学基础 教案.docx(17页珍藏版)》请在冰豆网上搜索。
信息管理学基础教案
信息管理学
第1章
1.2信息的定义
问题:
1.不被主体(人)所感知的内容是信息吗?
本体论层次的信息。
定义:
事物存在的方式和运动状态的表现形式。
“事物”泛指存在于人类社会、思维活动和自然界中一切可能的对象。
“存在方式”指事物的内部结构和外部联系。
“运动”泛指一切意义上的变化,包括机械的、物理的、化学的、生物的、思维的和社会的运动。
“运动状态”则是指事物在时间和空间上变化所展示的特征、态势和规律。
2.离开主体的信息价值大吗?
信息定义二:
(认识论层次)信息是主体所感知或表述的事物存在的方式和运动状态
3.主体是有思考能力和目的性的,因此,同样的信息对不同主体所产生的效应是否相同呢?
信息的使用价值相对于该信息持有者的不同而不同
1.3数据、信息、知识及相关概念
数据+背景=信息
信息是数据载荷的内容,对于同一信息,其数据表现形式可以多种多样。
知识是信息接收者通过对信息的提炼和推理而获得的正确结论,是人通过信息对自然界、人类社会以及思维方式与运动规律的认识与掌握,是人的大脑通过思维重新组合的、系统化的信息集合。
同样,我们可以表达为如下公式:
信息+经验=知识
知识与信息的关系
知识告诉我们:
“这组数据意味着什么。
”
但实际上知识却同货物绝不相同,它并不像西红柿土豆之类的东西,只要主顾付了钱,就可以从店伙手里拿到,用袋子装走,回家炒着吃煮着吃。
知识是人类心灵经过了学习而获得的东西,其中含了无数的甘苦。
学者不但要知道学习获得的结果,而且更重要的是要知道得到这样结果的过程。
------季羡林
一个例子:
乘飞机
假如我现在要马上从佐治亚州的亚特兰大飞到上海,在旅行社网站上查看时间表信息。
1.网站上有一张航班图,标注着现有空座航班的出发时间。
我通过阅读和解释页面上的内容,有效地收集必要的原始数据。
2.我知道班机会在伦敦停留。
一小时后出发的航班是英国航空公司的,中途在伦敦的希思罗机场停留。
之后两小时出发的是德耳塔公司的航班,中途停留伦敦的Gatwick机场。
比较现在与出发时间,我得到了必要的信息。
3.我曾搭乘过从新德里起飞途径伦敦的航班,知道所有从北美飞往亚洲大陆的航班必须在Gatwick机场转机,而且从希思罗机场到Gatwick机场有一个小时汽车的路程。
早出发的航班不会比晚出发的早到。
我以这个经验为基础做出了判断,决定乘晚一点的航班,这样就有足够的时间收拾东西。
思考:
数据、信息、知识的区别?
区别该例中,哪些为知识,哪些为信息?
哪些为数据?
如何理解信息是一种资源?
--------”资源一般指天然财富的来源“
信息就是资源的口号给人一种误导
信息的资源意义在于信息的使用者
例1两名鞋厂营销人员同一地区考察的案例
例2农夫山泉的天然水与纯净水案例
信息的资源意义不在于信息本身,也不在于你是否掌握这一信息,而在于你对信息的思考,即对信息的管理。
案例——日本人巧妙搜集信息
第二次世界大战后,日本经济高速发展,一个重要原因就是重视信息的采集、开发、利用。
日本的信息传递、查询非常迅速。
5~10分钟搜集到世界各地金融市场的行情;3~5分钟查询并调用日本国内1万多重点公司、企业经营数据;5分钟模拟出国际国内经济因素变化可能给宏观经济带来的变动图和曲线;5~10分钟可查询或调用政府的法律、法令和国会记录。
这种现代化的信息处理技术,大大提高了行政效率。
日本人善于从平淡的信息报道中分离出重要的信息内容。
例如,日本人在二十世纪六十年代,根据中国的媒体公开报道,分析判断出大庆油田开发的重要信息,从而与中国谈成了产品设计买卖。
日本人对大庆油田早有耳闻,但始终得不到准确信息。
1964年4月《人民日报》写到“大庆精神大庆人”,于是判断“中国确有大庆油田”。
1966年7月《中国画报》封面有一张照片,铁人王进喜身穿大棉袄、头顶鹅毛大雪,猜测到“大庆油田在冬季零下30度的东北地区”。
1966年10月,日本人又从《人民中国》找到了王进喜的先进事迹,从事迹介绍分析得知“最早钻井地点是在北安东北部的马家窑”。
日本人又从伪满州地图上查到“马家窑是黑龙江省海伦县东面的一个小村”。
这就找到了大庆油田的准确地理位置。
为了弄清楚大庆炼油厂的加工能力,日本情报机构从1966年的一期《中国画报》上找到了一张炼油厂反应塔照片,从反应塔上的扶手栏杆(一般为一米多)与塔的相对比例推知塔直径约5米,从而计算出大庆炼油厂年加工原油能力约为100万吨,而在1966年大庆已有820口井出油,年产360万吨,估计到1971年大庆年产量可增至1200万吨。
通过对大庆油田位置、规模和加工能力的情报分析后,日本决策机构推断:
“中国在近几年中必然会感到炼油设备不足,买日本的轻油裂解设备是完全可能的,所要买的设备规模和数量要满足每天炼油一万吨需要。
”于是就按他们估计的大庆油田要求进行产品设计。
最后等待中国人去购买。
思考问题:
(1)日本人采集信息对我们有什么启示?
信息管理的概念
信息管理(狭义)就是对信息本身的管理,即采用各种技术方法和手段(如分类、主题、代码、计算机处理等等)对信息进行组织、控制、存贮、检索和规划等,并将其引向预定目标;
信息管理(广义)不单单是对信息的管理,而是对涉及信息活动的各种要素(信息、人、机器、机构等)进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。
信息资源管理的局限性:
①仅关注显在知识的管理而忽略隐性知识的管理,大大限制了管理范围和信息管理效能的发挥②仅关注人类智力劳动的最终成果而忽略学习与创新过程,不能实现全方位的信息管理。
③仅关注将信息提供给利用者而对利用者需求信息重视不够,限制了信息效用价值的实现。
④仅关注信息在组织内部的免费流动而忽视信息的增值问题,影响了组织对信息的评价。
信息管理与管理信息系统的区别?
信息管理包括信息的搜集、存储、传递、交流、控制,信息政策、法规的制定等等。
英国学者马丁认为,MIS是一种为明确限定的某一管理层次提供特定信息的“管理工具。
与信息管理活动相比,其范围更窄。
信息系统的三种重要资源是信息、信息技术和人。
这三种资源中你认为哪一个最重要?
为什么?
最不重要的是什么?
为什么?
人最重要。
在数据转化为信息时,是人赋予了其内容、意义和价值,也正是这些人能够从信息中获得价值。
在信息生命周期的中期——存储、归纳和传播上,信息技术是有帮助的。
但对于信息的创造或使用,其帮助并不大。
信息与信息技术谁最重要呢?
设想有一个有着水管情结的世界。
在这个奇异的世界里,所有的话题都是关于下水管道,管道设备大王的相片出现在各种出版物的封面上。
他们是世界上最富有的人。
许多公司发费了几百万、几十亿,甚至几万亿的金钱去连接所有的管道设施,以确保管道能通达至每一个办公桌、每一个家庭办公室,甚至每一辆汽车上。
但他们忽略了什么?
水!
它是清洁的水吗?
这种水恰好是消费者想饮用的水吗?
第2章信息交流
主要内容:
1.信息交流的基本概念
2.信息交流传播的一般模式
3.信息传递的基本规律(重点)
4.信息交流的实现与障碍(重点
定义:
信息交流是不同时间或不同空间上的认知主体(人或由人组成的机构、组织)之间相互交换信息的过程。
认知主体可以处在同一时间和同一空间,也可以处在不同时间或不同空间。
2.3信息传递的基本规律:
守恒与扩散
2.3.1信息守恒
信息守恒:
信息一经生成,只能被掩蔽,但不会被消灭。
同样,信息被接收后只能被遗忘,但不会消失。
信息守恒的三个角度:
S信息守恒意味着任何信息生产者,只要信息自他的大脑中输到外部世界,这些信息就是永恒存在的。
R信息守恒描述的是信息接受者在接收信息时所特有的“0”或“1”的特征。
信息要么被接收,要么被选择过滤。
“信息栈”传递信息守恒,即T(Transfer)信息守恒保证信息输出与信息输入的信息守恒,保证在对信息进行种种加工、处理过程中,不篡改或损害信息的内容。
2.3.2信息扩散原理
1.信息扩散的多向对称性
信息扩散的多向对称性是指信息在传递或扩散过程中,如果信息源S所处的外围介质(包括自然介质、社会介质)是同质均匀分布的话,则S的信息传递就成一种各向对称结构。
多向对称的形式:
①传递速度对称;②传递内容对称;③传递空间(或距离)对称;④传递的信息强度对称。
(实际情况中,这一条件是否容易满足呢?
当这一条件不成立时,信息扩散遵循什么规则呢?
)
多向对称性法则的条件及其引申原则
多向对称性原则的适用条件是同质均匀分布的外部介质,当这一条件不成立时,也就导出了一些新的信息扩散规律。
这就是多向对称的引申原则,具体包括:
①信息传递的拓扑原则(信息栈拓扑图):
拓扑原则是指信息从S传递至R时,如果是均匀介质环境,则S—R是最直接、最快速的传递。
但若是非均匀介质条件下,S—R信息流就要出现拓扑变换,即在传递过程中会出现种种“信息栈”来传递信息,因为信息介质的每一次改变都要经过一次转换,都要经过“信息栈”予以变换。
②多路传递法则:
多路传递法则,又称多通道原则,它是指在S至R的信息传递过程中,除了S与R的直接沟通之外,还可以通过其他的通道,经过或不经过信息栈而将信息传递给接受者R。
多路传递法则的理论基础:
a.信息是可以分享的;b.信息是可以分栈传递的。
2.信息传递的密度递减法则
从空间方面来说,设S为信息源,并设其在t时刻以声音向外传递信息。
信息是以各向对称形式发送的,呈圆周对称形状。
如果以他声音的压强为信息特征,显然,压强大,则信息被感受的可能性就大,当压强减至一定程度时,信息就无法被接受者感知。
从时间上来说,也存在信息递减,即S所发生的信息,时间越久,衰减越严重。
除了物理空间的信息密度递减外,在精神空间中亦是如此。
在时间轴上,知识也存在一种积淀过程。
现代所获知的信息中,10年后可能有1/3是被剔除的,20年后可能就有一半是过时的。
思考:
如何看待信息递减律与T守恒律?
第3章信息分布
主要内容:
1.信息产生与分布中的马太效应
2.信息生产者分布规律(难点)
3.信息离散分布规律(难点)
4.信息对时间的分布规律(难点)
3.1信息产生与分布中的马太效应
1.马太效应
描述了优势与劣势的积累过程:
一经存在有优势,这种优势局面就会不断加强,反之若处于劣势,则这种不利条件也会继续加剧。
2、马太效应的表现和作用形式
核心趋势
–高产作者群体的形成
–期刊信息密度增大
–高频词汇的确立
集中取向
–一篇论文多次被引
–一个网站被众多用户点击
3、马太效应的负面影响
信息分布的富集现象
–突出重点、摒弃平均,为信息源的选择、获取、评价和利用提供依据,降低信息管理成本,提高信息利用效益。
核心信息源
–忽略分布在其他信息源中有价值的信息。
–马太效应青睐名人、拒绝新人的习惯势力限制了新思想、新知识和新信息的产生及传播
3.2信息生产者分布规律
3.2.1洛特卡定律
洛特卡定律
f(yx)=C/x2(C=60.79%)
f(yx):
表示写x篇论文的作者出现的频率
yx表示写x篇论文的作者数目
f(yx)=yx/∑yx
提问:
假设《万方数据库》中,撰写信息管理学文章的作者有1000人,根据洛特卡定律,这1000人中,发表3篇信息管理学文章的作者数量大约是多少?
f(yx)=C/x2=yx/∑yx
2.普赖斯定律
在某一特定领域中,全部论文的半数由该领域中全部作者的平方根的那些人(核心或高产作者)撰写的。
M=0.749(max)1/2式子表明,高产作者中一位最低产的作者发表的论文数量,等于最高产作者所发表论文数的平方根的0.749倍。
提问:
假设2000-2004年,《中国期刊网数据库》中发表信息管理学文章的总人数为10000人,其中最高产作者人数为25人,每人发表文章16篇,根据普赖撕定律,求出高产作者区的人数,以及高产区作者中发表文章的最少篇数。
3.3信息离散分布规律
信息的离散分布是信息的重要属性,表现为信息的内容单元以不同方式从不同角度分布于各种载体中。
信息的离散分布具有复杂的机理,本质上是由信息的生产和利用决定的。
1.布拉德福分散定律
如果将科学期刊按期刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的“核心”部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1:
a:
a2的关系(a>1)。
将所有期刊分成三个区,使每区论文数大致相等,则期刊数服从布拉德福定律即1:
5:
52即:
若第1分区期刊数为9,则第2分区的期刊总数大约为…..?
第三分区呢?
2.齐夫定律
如果将一篇较长文章(约5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号(出现频次最高的为1级,其次为2级……这样一直到D级),如果用f表示词在文章中出现的频次,用r表示词的等级,则有:
fr=c(c为常数)
(出现频率最高的为1级)
齐夫词频分布曲线
如果建立f与r的直角坐标系,用纵坐标表示词的等级序号,横坐标表示出现频次,就得到一条双曲线。
如果等级r与频次f都取对数,则双曲线变成一条直线。
与之等价的数学表达式为:
lgr+lgf=lgc
3.4信息对时间的分布规律
3.4.1指数增长律
1.普赖斯曲线
如果我们以文献量为纵轴,以历史年代为横轴,把各不同年代的文献量在坐标图上逐点描绘出来,然后以一光滑曲线连接各点,则可十分近似地表征文献随时间增长的规律。
这就是著名的普赖斯曲线。
普赖斯曲线
F(t)=aebt………………………(3-23)
式中:
a是统计的初始时刻(t=0)的文献量;
e=2.718;
b表示持续增长率。
人们还常常用文献量翻一倍的时间来衡量文献的增长速度,即
t′=ln2/b………………………(3-24)
式中:
t′为文献量翻倍时间,b为持续增长率。
文献翻倍的时间:
tˊ=ln2/b
2aebt’=aeb*0
tˊ=ln2/b
设某一初始时刻,文献量a=10000,增长率b=10%求10年后文献量和文献翻一番的时间。
则10年后文献量F(10)=10000*e0.1(10)=27183
文献翻一番的时间是tˊ=ln2/b=0.693/0.1=6.93(年)
实际的统计发现,不同时期、不同级别、不同质量、不同学科领域的文献信息增长态势是不一样的。
勒希尔考察了不同质量级别的文献增长状况,发现它们的增长速度差别很大。
勒希尔认为,文献的数量与其质量有关。
他定义λ(0≤λ≤1)为文献的质量级别,则不同级别上的文献量为[F(t)]λ。
他给λ的具体值如下:
–λ=1:
至少是一般文献(实际代表所有文献)
–λ=3/4:
至少是有意义的文献
–λ=1/2:
至少是重要的文献
–λ=1/4:
至少是非常重要的文献
–λ=0:
第一流的文献
对于第一流的文献(即λ=0),文献数量为lnF(t)。
(1)λ文献翻番时间为tˊ=tˊ/λ(λ≠0)
(2)当λ=0时,F0(t)=lnaebt=lna+bt
思考:
文献总量为10000,b=0.1翻一番的时间是tˊ=ln2/b=0.693/0.1=6.93(年)现求λ=3/4,1/2,1/4,0的翻番时间。
文献半衰期:
表示某学科领域中尚在利用的全部文献的一半是在多长时间内发表的。
例如:
物理学文献的半衰期是4.6,两个含义:
Ø现在仍在利用的物理学文献的50%,其出版年轮不超过4.6年。
Ø物理学文献一半失效的时间也是4.6年。
文献信息老化曲线
第5章信息组织
5.1信息组织的基本原理
1.信息组织的概念和内容
信息组织,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行描述和揭示,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。
期刊论文:
文献的题目、著者、著者的工作单位、文献的出处(刊名、年卷期、起止页码)、语种、参考文献及图表的数量、刊号
图书:
书名、著者(或编者、译者)、出版项(出版社、地点、时间)、稽核项(价格、页数、参考文献)、书号
信息的外表特征是指信息的名称、来源、加工者、类型及表现形式等内容
怎么组织内容特征
(1)
是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其成为有序化集合的过程。
分析:
内容特征是隐含的,需要分析方能显现。
选择:
并不是所有的内容特征都需要反映出来以供检索,所以根据使用目的加以选择
标引:
分析信息资源的内容属性(特征)及相关的外表属性,并用特定的语言表达分析出的属性或特征,从而赋予其检索标识的过程。
处理:
按照一定的规则组织成检索工具,并给予适当的说明。
二、为什么需要信息组织
1、从环境来看
信息资源数量急剧增加,大量无序信息将有用的信息湮没其间,使得人们比过去更难获取有用信息。
2、从信息组织的目的来看
信息组织的目的是将无序的信息变成有序的集合。
这一目的的实现手段是组织各种类型的信息资源检索工具,这也正是信息组织的任务。
思考:
信息组织与信息检索的关系
5.2信息的描述与揭示
1.元数据(metadata)
关于数据的数据,关于信息的信息,或描述数据的数据。
它是专门用来描述数据的特征和属性,也是描述和组织信息资源、发现信息资源的语言和工具。
数据仓库
数据仓库是决策支持体系结构的基础
W·H·Inmon(数据仓库之父)认为数据仓库具有以下四个特征:
Ø面向主题的:
就面向主题而言,这里指机构的“名词”(如客户、后勤、财务、营销和销售)。
Ø集成的:
数据仓库提供了企业主要涉及的一些主题域的集成视图。
Ø非易失的:
数据仓库的数据不能被用户直接更新,只能被访问。
Ø随时间变化的:
即使数据会随着时间变化,数据仓库仍然保留其历史视图。
数据集市
数据集市通常被设计用来满足特定的、性质相同的业务用户群(如市场、财务、人力资源等)的需求。
第6章信息检索
信息检索概念(续)
•信息检索是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。
信息组织和信息检索是一对互逆过程。
检索是信息组织的反变换过程。
信息组织的目的是将零散的信息组成一个有序的体系,检索的目的则是迅速从这个体系中搜寻所需的信息。
(五)信息检索特性
信息检索的相关性
相关性表明用户是否认为一文献与一提问吻合。
信息检索的不确定性
在标引和检索词的选用中都存在不确定性,二种不确定性作用于检索系统,使得信息检索具有不确定性。
(1)标引的不确定性
指不同标引员在给同一篇信息对象进行标引时会选用不同的标引词,即标引词选用的不一致性。
(2)检索词选用的不确定性
指候选检索词集不只一个,而是多个,检索过程具有试探性:
系统依次选用词集进行检索,直到检出或在失败中放弃查找。
信息检索特性(续)
信息检索的逻辑性
信息检索作为信息管理的核心,具有非常强的逻辑性。
(1)检索语言方面,检索词表作为检索语言的典据性文本,其自身编排具有很强的逻辑性。
(2)检索策略是指处理信息检索提问的逻辑与查找步骤的科学安排。
正确的检索策略优化了检索过程,有助于取得最佳的检索效果,获得具有高相关度的文献。
检索效果评价(续)
◆查全率R(Recallratio)
FR=检出的相关文献量/检索系统中相关文献总量*100%
◆查准率P(Precisionratio)
FP=检出的相关文献量/检出的文献总量*100%
理想的检出结果是查全率与查准率都趋近于1。
但在实际检索中,查全率与查准率之间存在互逆相关性。
如果追求过高的查全率,就可能降低查准率。
思考:
影响检索效果的主要原因?
讨论:
1.信息检索技巧能否获取利润?
2.如何理解信息爆炸与信息匮乏之间的矛盾?
第7章信息服务
1.多业务数据来源公司
万事达卡国际公司不愿让他们的数据闲置,它与对称资源公司合作。
对称资源公司是一家在佛罗里达的市场研究公司。
万事达卡公司与对称资源公司的合资公司叫多业务数据来源公司。
对称资源公司的员工与万事达卡公司数据库的专家们紧密合作,把这一超大型的数据库经营得井井有条,富有效率。
通过应用电子商务智能外网——“商人顾问”(Merchant
Advisor),多业务数据来源公司把数据按流通渠道、地区、全国范围提供给商号,并对它们的客户行为深入分析,同时让商号在了解自我表现的同时,知道如何与对手竞争。
数据可以回答以下问题:
★怎么样的消费者主导销售额?
★他们阅读什么杂志,我们可以在什么杂志上作广告?
★他们看什么样的电视节目?
★客户还买其他什么产品?
在哪儿买的?
★什么样的消费者不是从我这儿,而是从竞争对手那里购买?
多业务数据来源公司的董事长和CEO比尔·恩格尔说,商人顾问系统的与众不同之处是严格使用可靠的数据。
万事达卡国际公司的系统自动匿名跟踪持卡人通过信用卡完成的所有交易行为。
由于现在建立在交易基础上的数据更为精确,商家可以改进自己的营销方式,专门对准特定的群体。
思考:
为什么多业务数据来源公司能成功?
2.茨租赁公司
赫茨租赁公司,地处巴黎,每年大约营收1亿美元,出租17500辆车给1400余家公司。
现在他们也收集有关车辆运行表现得数据,打包整理后卖给汽车生产商。
赫茨租赁公司现在拥有一个数据库,除有含有其他信息,还专门记录了租给客户车辆的维修保养数据。
因为大部分车辆都是常年出租的,所以公司收集的数据实际上反映了不同车辆及其组件的优劣情况。
比如,赫茨租赁公司注意到某一型号的车辆,在行使达到20000英里时,容易出现水泵方面的问题。
因为人们总是对租来的车没有对自己的车那样爱惜,赫茨租赁公司有充分理由认为,在这种“高强度测试”条件下汽车暴露出来的问题对汽车制造商来说很有价值。
在20000英里水泵出问题,对生产商来说,可能意味着水泵系统由问题。
这类能够迅速发现的隐情价值无限,特别是召回制度下,可能导致生产商耗资巨大。
在这个过程中,赫茨租赁公司得到制造商的好感,从而带来其他的业务和租赁机会。
总结(续):
信息服务实际上是传播信息、交流信息、实现信息增值的一项活动。
思考:
1.信息服务在信息管理中的位置是什么呢?
信息服务:
是信息管理活动的出发点和归宿。
思考:
1.你认为实现信息服务所应采取的行动?
2.你认为成为一个信息经纪人应具备的素质?