SaTScan软件说明书.docx

资源描述

SaTScan软件说明书.docx

《SaTScan软件说明书.docx》由会员分享，可在线阅读，更多相关《SaTScan软件说明书.docx（97页珍藏版）》请在冰豆网上搜索。

SaTScan软件说明书.docx

SaTScan软件说明书

SaTScan软件

目的

SaTScan是一个自由软件，分析了空间，时间和空间的数据使用的空间，时间，或时空扫描统计。

它是专为以下任何相关用途：

执行地理疾病监测，检测空间或时空疾病集群，看看他们是否有统计学意义。

测试是否是随机分布在空间，时间，或在空间和时间。

评估的统计意义的疾病集束警报器。

进行前瞻性实时或定期监测疾病的早期发现疾病暴发。

该软件还可以用于类似的问题在其他领域诸如考古学，天文学，犯罪学，生态学，经济学，工程学，遗传，地理，地质，历史，或生态。

数据类型和方法

SaTScan可用于离散和连续扫描数据。

离散扫描统计数据的地理位置在观察是随机和固定的用户。

这些地点可能是实际位置的意见，如房屋，学校或蚁巢，或者它可能是一个中央位置代表一个较大的地区，如地理或人口加权形心邮政区，县或省。

连续扫描的统计，该地点的意见是随机的和可能发生的任何地方在一个预定义的研究领域由用户定义，如矩形。

离散扫描统计，SaTScan使用离散泊松模型，其中一些事件在一个位置是泊松分布，根据已知的潜在风险人口；伯努利模型，与0/1事件数据，如案件和控制；时空置换模式，只使用情况的数据；多项式模型的分类数据；一个序模型，分类数据；指数模型的生存时间数据或不删失变量；正常模式为其他类型的连续数据；或空间变化的时间趋势模型，寻找地理区域异常高或低temportal趋势。

一个共同特点，所有这些离散扫描统计，地理位置在数据可以看出是随机和固定的用户。

对于离散扫描统计，数据可以是聚集在普查道，邮编，县或其他地理水平，或可能有独特的坐标为每个观察。

SaTScan调整的基本均匀的背景人口。

它也可以适应任何数量的绝对变量由用户提供，以及时间的趋势，称为时空集群和数据丢失。

它可以扫描多个数据集的同时寻找集群发生在一个或更多的人。

连续扫描统计，SaTScan采用连续泊松模型。

开发商和投资者

该软件是由™SaTScan·库尔多夫，与信息管理服务有限公司的财政支持，SaTScan已收到下列机构：

国家癌症研究所，司的癌症预防，生物科[1.0，2，2.1]

国家癌症研究所，司的癌症控制和人口科学，统计研究和应用分公司[3（部分），新（部分），8（部分），v9.0（部分）]

艾尔弗雷德·史隆基金会通过拨款，为纽约医学专科学院（法扎德mostashari，皮）[3（部分），3.1，4，5，5.1]

疾病预防和控制中心，通过协会的美国医学院校合作协议奖多项mm-0870 [大师，6.1（部分）]。

全国儿童健康与发展，通过给予#ro1hd048852[7，8，9（部分）]

国家癌症研究所，司的癌症流行病学和遗传学[v9.0（部分）]

国立综合医学科学研究所，通过建模传染病剂的研究补助金#u01gm076672[v9.0（部分）]

他们的经济支持是极大的赞赏。

内容SaTScan是发展商的责任和不一定反映官方意见的资助

相关主题：

统计方法

SaTScan书目

相关主题：

统计方法

SaTScan书目

下载和安装

检查SaTScan软件更新，到SaTScan网址：

http:

//www.satscan.org

安装一个更新版本，选择SaTScan下载链接。

下载后SaTScan安装可执行文件到你的电脑，点击它的图标和安装软件后，一步一步的指示。

相关主题：

新版本

测试运行

在使用自己的数据，我们建议在一个样本数据集提供的软件。

使用这些得到主意如何运行SaTScan。

执行测试：

1。

应用程序图标上点击SaTScan。

2。

点击“打开保存的会话。

3。

选择一个参数文件，例如“纳米带”（宝。

泊松模型，时空和空间变化的时间趋势：

脑肿瘤的发病率在新墨西哥

案例档案：

nm.cas

格式：

<<例>=1县><一><><>年龄组性别

人口：

nm.pop

格式：

<><><县年人口><><>年龄组性别

nm.geo坐标文件：

格式：

<><>

研究期间：

1973至1991年

聚集：

32县

精密案件倍：

年

直角坐标：

#1变量，年龄组：

1=0-4年，2=5-9年，…18=85+年

#2变量，性别：

男1，女2=

人口：

1973，1982，1991年

数据来源：

新墨西哥季节能效比肿瘤登记处

这是一个浓缩版的更完整的数据集的人口为每年1973至1991，和种族的三分之一个变量。

完整的数据集可以发现在：

www.satscan.org/datasets/

伯努利模型，纯粹的空间：

儿童白血病和淋巴瘤的发病率在亨伯赛德

案例档案：

nhumberside.cas

格式：

<例>><#位置编号

控制文件：

nhumberside.ctl

格式：

<位置标识><#控制>

nhumberside.geo坐标文件：

格式：

<><><定位标识xy>

研究期间：

1974-1986

控制：

随机选择从出生登记

聚集：

191邮政编码（最多只有一个单一的个体）

精度的情况和控制时间：

无

直角坐标：

变量：

没有

数据来源：

雷卡特莱特和弗里达亚力山大博士。

报告由J.库兹克和爱德华兹，英国皇家统计学会，73-104乙：

52，1990

这和其他数据集可以被发现：

www.satscan组织/数据/。

时空置换模式：

医院的急诊室住院因发烧在纽约市医院

案例档案：

nycfever.cas

格式：

<邮编><#例=1><日期>

nycfever.geo坐标文件：

格式：

<><><拉链纬度经度

研究期间：

2001年11月1日2001年11月24日–

聚集：

邮编地区

例：

天倍精度

坐标：

纬度/经度

变量：

没有

数据来源：

纽约市卫生局

这和其他数据集可以被发现：

www.satscan.org/datasets/

序模型，纯粹的空间

正规教育水平在马里兰

案例档案：

marylandeducation.cas

格式：

<位置标识><><>类##个人

marylandeducation.geo坐标文件：

格式：

<><><定位标识纬度经度

研究期间：

2000

聚集：

24各县、县级

精度的情况：

无

坐标：

纬度/经度

变量：

没有

类别：

1=<9年的学校，2=9+年而不是高中，3=4=高中或同等学历，本科或以上学历

数据来源：

美国人口普查局：

教育信息来自于长期普查2000表格，填写的1/6户。

这和其他数据集可以被发现：

www.satscan.org/datasets/

注意：

只有人25岁及以上被列入数据。

对于每一个县，人口普查提供信息的人的百分不同层次的正规教育。

一些个人的报告不同的教育水平在每一个县估计这一比例倍的总人口年龄25+六分反映1/6采样率的长期普查表。

指数模型，时空：

人为的生存数据

案例档案：

survivalfake.cas

格式：

<位置标识><><#个人诊断时间><生存时间检查

survivalfake.geo坐标文件：

格式：

<><><定位标识xy>

研究期间：

2000-2005

聚集：

5个地点

精度的诊断：

一年的时间

精密的生存/审查时间：

一天

直角坐标：

变量：

没有

数据来源：

人为制造的数据。

相关主题：

测试运行，输入数据。

正常模式，纯粹的空间：

人为制造的连续数据

案例档案：

normalfake.cas

格式：

<位置标识><><>#个人体重增加

normalfake.geo坐标文件：

格式：

<><><定位标识xy>

研究期间：

2006

聚集：

26个地点

直角坐标：

变量：

没有

数据来源：

人为制造的数据

伯努利模型

与伯努利模型，有案件和非案件所代表的0/1变。

这些变量可能代表人或无病，或人与不同类型的疾病，如早期和晚期乳腺癌。

它们可能反映和控制的情况下一个大的人口，或他们可能构成人口作为一个整体。

无论什么情况可能是，这些变量将被命名为例，控制整个用户指南，和他们的总人口将被命名为。

伯努利的数据可以分析与纯粹的时间，纯粹的空间或时空扫描统计。

例如：

为伯努利模型，案件可能是新生儿的出生缺陷，而控制所有新生儿无出生缺陷。

伯努利模型需要的信息的位置，设置和控制的情况下，提供SaTScan使用情况，控制和协调文件。

不同的地点可能被指定为每一个案件和控制，或可能是数据汇总为国家，省，县，区，人口普查传单，邮政编码区，学校，家庭，等等，与多个案件和控制每个数据的位置。

做一个时间或时空分析，它必须有一个时间为每一个案件和控制以及。

相关主题：

案件档案

控制文件

坐标文件

似然比检验

分析表

概率模型的比较

方法的论文

翻译结果重试

抱歉，系统响应超时，请稍后再试

支持中英、中日在线互译

支持网页翻译，在输入框输入网页地址即可

提供一键清空、复制功能、支持双语对照查看，使您体验更加流畅

离散泊松模型

与离散泊松模型，案件的数量在每个位置是泊松分布。

零假设下，当有任何变量，预期的案件数量在各地区的人口比例大小，或在该地区的人。

泊松数据可以分析与纯粹的时间，纯粹的空间，时空扫描和空间变化的时间趋势统计。

例如：

为离散泊松模型，案件可能是中风的发生，而人口是结合一些人来住，计算“1”，有人居住在该地区的整个时间段，和“1/2”垂死的人或移动在中间的一段时间。

离散泊松模型需要情况和人口数为一组数据的位置，如县，教区，人口普查传单，或邮政编码地区，以及地理坐标为每个这些地点。

这些需要提供SaTScan使用情况，人口和坐标文件。

人口数据不需要指定持续时间，但只在一个或多个具体的普查时间。

倍之间，SaTScan做线性插值的基础上的人口在普查时立即出发，后立即。

时代前的第一次人口普查时，人口规模是相当于人口规模在普查时间，和时间后，最近一次人口普查时，相当于做。

获得人口大小为特定地点和时间内，人口规模，上述定义，是综合性的时间期限问题。

相关主题：

分析表

案件档案

连续泊松模型

坐标文件

似然比检验

人口档案

概率模型的比较

方法的论文

时空置换模式

时空置换模型只需要数据的情况下，信息的空间位置和时间为每一个案件，没有信息需要控制或背景的人口处于危险。

观察到的一些案件中的一组比本来预计如果空间和时间地点，所有病例均相互独立，因此没有时空互动。

这是，有一组在一个地理区域，在某一特定时间内，该地区有较高比例的情况下，在这段时间比其他地区。

这意味着，如果，在一个特定的一周，所有的地理区域有两倍的案件数量比正常，并没有对这些地区构成一个群。

另一方面，如果在这一周，一个地理区域的两倍数量的情况下比较正常，而其他地区正常数量的情况下，会有一组在第一区。

时空置换模型自动调整为纯粹的空间和纯粹颞集群。

因此，不存在纯粹的时间或空间版本的这一模式。

例如：

在时空置换模型，案件可能是每天发生的救护车派遣中风患者。

重要的是要认识到，时空置换群可能是由于要么增加疾病的风险，或对不同地理种群分布在不同的时间，例如，在一些地区的人口增长速度比其他。

这通常不是一个问题，如果总时间不超过一年。

然而，建议用户非常小心，当使用这种方法的数据跨越几年。

如果背景人口的增加或下降速度比在另一些地区，有风险的人口变化的偏见，这可能产生偏见的P-值在研究期间长于几年。

例如，如果一个新的大型社区的发展，会增加情况下，仅仅是因为人口的增加，并且只使用数据的情况下，时空置换模型不能区分增加由于当地人口的增加与增加的疾病的风险。

如同所有的时空互动方法，这主要是关注在研究期间长于几年（曼特尔，癌症研究，27:

209-2201967；库尔多夫和hjalmars，生物识别技术，9:

621-6301999，P10）。

如果人口的增加（或减少）是相同的整个研究区域，这是好的，并不会导致偏见的结果。

分享到

翻译结果重试

抱歉，系统响应超时，请稍后再试

支持中英、中日在线互译

支持网页翻译，在输入框输入网页地址即可

提供一键清空、复制功能、支持双语对照查看，使您体验更加流畅

多项式模型

用多项式模型，每个观察是一个案例，每个案例属于几个类别之一。

多项式的扫描统计评估是否有任何集群的分布情况是不同的从其他地区的研究。

例如，可能有更高比例的案件类型1和2和较低的比例例3型，比例的情况下，4型是相同的群集外的。

如果只有2大类，序的模式是相同的伯努利模型，其中一个范畴的案件和其他类别的控制。

案件中的多项式模型可能是一个样本，从更大的人口也可能构成一套完整的意见。

多项数据可以分析与纯粹的时间，纯粹的空间或时空扫描统计。

例如：

为多项式模型，数据可以由每个人患有脑膜炎，与五个不同的类别，代表五个不同的无性系物的疾病。

多项式的扫描统计将同时寻找高或低集群的任何的克隆物，或一组照片，调整整体的地理分布的疾病。

多重比较中所固有的许多种类占计算的P-值。

多项式模型需要的信息的位置，分别在每个类别。

一个独特的位置可能被指定为每一个案件，或可能是数据汇总为国家，省，县，区，人口普查传单，邮政编码区，学校，家庭，等等，与多个案件在同一地点。

做一个时间或时空分析，它必须有一个时间为每一个案件等。

用多项式模型，这是没有必要指定一个搜索为高或低的集群，由于没有层次的类别，但在输出显示什么类型更突出的集群内。

该命令或索引的类别并不影响分析中的聚类发现，但它可能影响随机用来计算p-值。

OrdinalModel

Withtheordinalmodel,eachobservationisacase,andeachcasebelongstooneofseveralordinalcategories.Ifthereareonlytwocategories,theordinalmodelisidenticaltotheBernoullimodel,whereonecategoryrepresentsthecasesandtheothercategoryrepresentthecontrolsintheBernoullimodel.Thecasesintheordinalmodelmaybeasamplefromalargerpopulationortheymayconstituteacompletesetofobservations.Ordinaldatacanbeanalyzedwiththepurelytemporal,thepurelyspatialorthespace-timescanstatistics.

Example:

Fortheordinalmodel,thedatamayconsistofeveryonediagnosedwithbreastcancerduringaten-yearperiod,withthreedifferentcategoriesrepresentingearly,mediumandlatestagecanceratthetimeofdiagnosis.

Theordinalmodelrequiresinformationaboutthelocationofeachcaseineachcategory.Separatelocationsmaybespecifiedforeachcase,orthedatamaybeaggregatedforstates,provinces,counties,parishes,censustracts,postalcodeareas,schooldistricts,households,etc,withmultiplecasesinthesameordifferentcategoriesateachdatalocation.Todoatemporalorspace-timeanalysis,itisnecessarytohaveatimeforeachcaseaswell.

Withtheordinalmodelitispossibletosearchforhighclusters,withanexcessofcasesinthehigh-valuedcategories,forlowclusterswithanexcessofcasesinthelow-valuedcategories,orsimultaneouslyforbothtypesofclusters.Reversingtheorderofthecategorieshasthesameeffectaschangingtheanalysisfromhightolowandviceversa.

序模型

与序模型，每个观察是一个案例，每个案例属于一个序数类。

如果只有2大类，序的模式是相同的伯努利模型，其中一个范畴的案件和其他类别的控制的伯努利模型。

案件的序模型可能是一个样本，从更大的人口也可能构成一套完整的意见。

序数数据可以分析与纯粹的时间，纯粹的空间或时空扫描统计。

例如：

为序模型，数据可以由每个人诊断出患有乳腺癌，在10年期间，有三个不同类别的代表早期，中期和晚期癌症的诊断时间。

序模型需要的信息的位置，分别在每个类别。

不同的地点可能被指定为每一个案件，或可能是数据汇总为国家，省，县，区，人口普查传单，邮政编码区，学校，家庭，等等，多例相同或不同的类别，每个数据的位置。

做一个时间或时空分析，它必须有一个时间为每一个案件等。

与序模型，有可能寻求高集群，一个多余的情况下在高价值，低集群与多余的情况下在低价值的类别，或同时有两种类型的集群。

扭转秩序的类别有相同效果的分析从高到低，反之亦然。

ExponentialModel

Theexponentialmodelisdesignedforsurvivaltimedata,althoughitcouldbeusedforothercontinuoustypedataaswell.Eachobservationisacase,andeachcasehasonecontinuousvariableattributeaswellasa0/1censoringdesignation.Forsurvivaldata,thecontinuousvariableisthetimebetweendiagnosisanddeathordependingontheapplication,betweentwoothertypesofevents.Ifsomeofthedataiscensored,duetolossoffollow-up,thecontinuousvariableistheninsteadthetimebetweendiagnosisandtimeofcensoring.The0/1censoringvariableisusedtodistinguishbetweencensoredandnon-censoredobservations.

Example:

Fortheexponentialmodel,thedatamayconsistofeveryonediagnosedwithprostatecancerduringaten-yearperiod,withinformationabouteitherthelengthoftimefromdiagnosisuntildeathorfromdiagnosisuntilatimeofcensoringafterwhichsurvivalisunknown.

Whenusingthetemporalorspace-timeexponentialmodelforsurvivaltimes,itisimportanttorealizethattherearetwoverydifferenttimevariablesinvolved.Thefirstisthetimethecasewasdiagnosed,andthatisthetimethatthetemporalandspace-timescanningwindowisscanningover.Thesecondisthesurvivaltime,thatis,timebetweendiagnosisanddeathorforcensoreddatathetimebetweendiagnosisandcensoring.Thisisanattributeofeachcase,andthereis noscanningdoneoverthisvariable.Rather,weareinterestedinwhetherthescanningwindowincludesexceptionallymanycaseswithasmallorlargevalueofthisattribute.

Itisimportanttonote,thatwhiletheexponentialmodelusesalikelihoodfunctionbasedontheexponentialdistribution,thetruesurvivaltimedistributionmustnotbeexponentialandthestatisticalinference（p-value）isvalidforothersurvivaltimedistributionsaswell.Thereasonforthisisthattherandomizationisnotdonebygeneratingobservationsfromtheexponentialdistribution,butrather,bypermutingthespace-timelocationsandthesurvivaltime/censoringattributesoftheobservations.

指数模型

该模型的目的是为生存时间数据，虽然也可以用其他连续型数据以及。

每个观察是一个案例，每个案例都有一个连续变量的属性，以及0/1审查指定。

生存数据，连续变量是时间之间的诊断和死亡或根据应

展开阅读全文