uci数据集大致情况翻译资料.docx

上传人:b****6 文档编号:5919393 上传时间:2023-01-02 格式:DOCX 页数:25 大小:42.99KB
下载 相关 举报
uci数据集大致情况翻译资料.docx_第1页
第1页 / 共25页
uci数据集大致情况翻译资料.docx_第2页
第2页 / 共25页
uci数据集大致情况翻译资料.docx_第3页
第3页 / 共25页
uci数据集大致情况翻译资料.docx_第4页
第4页 / 共25页
uci数据集大致情况翻译资料.docx_第5页
第5页 / 共25页
点击查看更多>>
下载资源
资源描述

uci数据集大致情况翻译资料.docx

《uci数据集大致情况翻译资料.docx》由会员分享,可在线阅读,更多相关《uci数据集大致情况翻译资料.docx(25页珍藏版)》请在冰豆网上搜索。

uci数据集大致情况翻译资料.docx

uci数据集大致情况翻译资料

来源:

http:

//archive.ics.uci.edu/ml/datasets.html?

format=&task=&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=list

206DataSets

TableView  ListView

1.Abalone:

Predicttheageofabalonefromphysicalmeasurements

鲍鱼DataSet:

根据物理度量,预测鲍鱼的年龄。

2.AbscisicAcidSignalingNetwork:

Theobjectiveistodeterminethesetofbooleanrulesthatdescribetheinteractionsofthenodeswithinthisplantsignalingnetwork.Thedatasetincludes300separatebooleanpseudodynamicsimulationsusinganasynchronousupdatescheme.

目标是测定布尔值的度量集合,以描述植物的信号网路节点。

该数据集包括了300个独立的布尔值形式的虚拟动态模拟值,使用了异步更新的架构。

3.AcuteInflammations:

Thedatawascreatedbyamedicalexpertasadatasettotesttheexpertsystem,whichwillperformthepresumptivediagnosisoftwodiseasesoftheurinarysystem.

急性炎症DataSet:

数据来源于一位医学专家的数据集,用以检测专家系统,可以推断出泌尿系统的两种疾病的诊断结果。

4.Adult:

Predictwhetherincomeexceeds$50K/yrbasedoncensusdata.Alsoknownas"CensusIncome"dataset.

成人DataSet:

根据户口普查资料,预测收入是否能超过50000美元/年。

通常也被称为“收入普查”数据集。

5.Annealing:

Steelannealingdata

退火DataSet:

训练退火数据。

6.AnonymousMicrosoftWebData:

Logofanonymoususersof;predictareasofthewebsiteauservisitedbasedondataonotherareastheuservisited.

匿名微软网络数据:

微软网站的匿名用户记录;通过其他的用户访问区域数据,预测用户在web站点的访问区域。

7.Arcene:

ARCENE'staskistodistinguishcancerversusnormalpatternsfrommass-spectrometricdata.Thisisatwo-classclassificationproblemwithcontinuousinputvariables.Thisdatasetisoneof5datasetsoftheNIPS2003featureselectionchallenge.

ArceneDataSet:

该数据集的任务是根据大量的观测数据,从正常的模式中辨别出癌症。

这是一个根据不断输入的变量的二级分类问题。

该数据集是从NIPS2003特征选择挑战比赛中的5个数据集之一。

8.Arrhythmia:

Distinguishbetweenthepresenceandabsenceofcardiacarrhythmiaandclassifyitinoneofthe16groups.

心率失常DataSet:

分辨是否出现心率失常,并将结果分类进16个组之一。

9.ArtificialCharacters:

DatasetartificiallygeneratedbyusingfirstordertheorywhichdescribesstructureoftencapitallettersofEnglishalphabet

人为性状DataSet:

通过使用第一次序理论(该理论可以描述出英语字母表的十个开头字母的结构),自动生成的数据集。

10.Audiology(Original):

NominalaudiologydatasetfromBaylor

原始AudiologyDataSet:

来自Baylor的标称型的audiology数据集。

11.Audiology(Standardized):

Standardizedversionoftheoriginalaudiologydatabase

标准AudiologyDataSet:

原始Audiology数据集的标准化版本。

12.AustralianSignLanguagesigns:

ThisdataconsistsofsampleofAuslan(AustralianSignLanguage)signs.Examplesof95signswerecollectedfromfivesignerswithatotalof6650signsamples.

澳大利亚标记语言标记DataSet:

这些数据包括了澳大利亚标记语言标记的样本。

95个实例,均来自五个标识器,其中有6650个标记样本。

13.AustralianSignLanguagesigns(HighQuality):

ThisdataconsistsofsampleofAuslan(AustralianSignLanguage)signs.27examplesofeachof95Auslansignswerecapturedfromanativesignerusinghigh-qualitypositiontrackers

澳大利亚标记语言标记DataSet高品质版:

该数据集包含了Auslan标记的样本。

有27个实例,它们来自95个标记,这27个实例是使用高质量位置追踪器的当地标识器捕捉出来的。

14.AutoMPG:

RevisedfromCMUStatLiblibrary,dataconcernscity-cyclefuelconsumption

自动MPGDataSet:

来自CMUStatLib实验室的精品,是与城市循环能源消耗相关的数据集。

15.Automobile:

From1985Ward'sAutomotiveYearbook

汽车DataSet:

来自1985的沃德自动化年鉴。

16.AutoUniv:

AutoUnivisanadvanceddatageneratorforclassificationstasks.Theaimistoreflectthenuancesandheterogeneityofrealdata.Datacanbegeneratedin.csv,ARFForC4.5formats.

AutoUniv是一个高级数据生成器,可以用来处理分类任务。

目标是反映现实数据的微妙与不同之处。

数据可以在.csv中生成,采用ARFF或者C4.5的格式。

17.BachChorales:

Time-seriesdatabasedonchorales;challengeistolearngenerativegrammar;datainLisp

基于Chorales的时间序列数据集;可以用来挑战生成性的语法;数据放在Lisp中。

18.Badges:

Badgeslabeledwitha"+"or"-"asafunctionofaperson'sname

徽章DataSet:

标记了“+”或“-”的符号的标记,可以作为一个人姓名的函数表达式。

19.BagofWords:

Thisdatasetcontainsfivetextcollectionsintheformofbags-of-words.

词语包DataSet:

该数据集包含了5个文本集合,每个文本集合以词语包的形式展现。

20.BalanceScale:

Balancescaleweight&distancedatabase

天平DataSet:

天平的重量和距离数据库。

21.Balloons:

Datapreviouslyusedincognitivepsychologyexperiment;4datasetsrepresentdifferentconditionsofanexperiment

气球DataSet:

曾经用在认知心理学实验中的数据;4个数据集代表了一个实验中的不同条件。

22.BloodTransfusionServiceCenter:

DatatakenfromtheBloodTransfusionServiceCenterinHsin-ChuCityinTaiwan--thisisaclassificationproblem.

输血服务中心DataSet:

来自台湾的Hsin-CHu市的输血服务中心的数据——用以解决分类问题。

23.BreastCancer:

BreastCancerData(RestrictedAccess)

乳腺癌DataSet:

乳腺癌数据(访问限制)。

24.BreastCancerWisconsin(Diagnostic):

DiagnosticWisconsinBreastCancerDatabase

乳腺癌威斯康星洲(诊断数据)DataSet:

威斯康星的乳腺癌诊断数据。

25.BreastCancerWisconsin(Original):

OriginalWisconsinBreastCancerDatabase

乳腺癌威斯康星洲(原始数据):

原始的威斯康星州乳腺癌数据库。

26.BreastCancerWisconsin(Prognostic):

PrognosticWisconsinBreastCancerDatabase

乳腺癌威斯康星洲(Prognostic版):

威斯康星州乳腺癌数据库。

27.BreastTissue:

Datasetwithelectricalimpedancemeasurementsoffreshlyexcisedtissuesamplesfromthebreast.

乳腺组织DataSet:

乳腺的新鲜切除组织样本的电阻度量数据集。

28.CalIt2BuildingPeopleCounts:

ThisdatacomesfromthemaindooroftheCalIt2buildingatUCI.

Calt2建筑的人数:

该数据集来自UCI的Calts建筑的主要大门。

29.CarEvaluation:

Derivedfromsimplehierarchicaldecisionmodel,thisdatabasemaybeusefulfortestingconstructiveinductionandstructurediscoverymethods.

汽车评估DataSet:

来源于简单层次决策模型,该数据集可用于测试建设性的回归,和发现结构性方法。

30.Cardiotocography:

Thedatasetconsistsofmeasurementsoffetalheartrate(FHR)anduterinecontraction(UC)featuresoncardiotocogramsclassifiedbyexpertobstetricians.

胎儿心率DataSet:

该数据集包括胎儿心率(FHR),和基于产科专家医生分类的cardiotocograms 子宫收缩(UC)特征。

31.CensusIncome:

Predictwhetherincomeexceeds$50K/yrbasedoncensusdata.Alsoknownas"Adult"dataset.

收入普查DataSet:

基于普查数据,预测收入是否超过50000美元/年。

也被称为“成人”数据集。

32.Census-Income(KDD):

Thisdatasetcontainsweightedcensusdataextractedfromthe1994and1995currentpopulationsurveysconductedbytheU.S.CensusBureau.

收入普查(KDD)DataSet:

这个数据集包含了从1994-1995年的U.S普查局的《当前人口调查》中提取出来的普查数据。

33.ChallengerUSASpaceShuttleO-Ring:

Task:

predictthenumberofO-ringsthatexperiencethermaldistressonaflightat31degreesFgivendataontheprevious23shuttleflights

挑战者号USA航天飞机O形圈DataSet:

任务:

基于前23次飞行数据,预测在一次31度热压F的状况中的飞行任务的O形圈的数目。

34.CharacterTrajectories:

Multiple,labelledsamplesofpentiptrajectoriesrecordedwhilstwritingindividualcharacters.Allsamplesarefromthesamewriter,forthepurposesofprimitiveextraction.Onlycharacterswithasinglepen-downsegmentwereconsidered.

字符轨迹DataSet:

同时写出单个字幕的笔尖轨道的多个标记样本记录。

为了保证初始的提取数据,所有的样本都来自于同一个书写人员。

仅仅考虑了单一落笔段的字符。

35.Chess(DomainTheories):

6differentdomaintheoriesforgeneratinglegalmovesofchess

国际象棋(域理论)DataSet:

产生国际象棋的规定路数的6个不同的域理论。

36.Chess(King-Rookvs.King):

ChessEndgameDatabaseforWhiteKingandRookagainstBlackKing(KRK).

国际象棋(王RookVS王)DataSet:

白国王与黑国王的象棋残局数据库。

37.Chess(King-Rookvs.King-Knight):

KnightPinChessEnd-GameDatabaseCreator

国际象棋(王Rook对战骑士):

骑士

38.Chess(King-Rookvs.King-Pawn):

King+RookversusKing+Pawnona7(usuallyabbreviatedKRKPA7).

国王Rook与国王Pawn的a7(通常简写为KAEPA7)。

39.Cloud:

LittleDocumentation

小文档。

40.CMUFaceImages:

Thisdataconsistsof640blackandwhitefaceimagesofpeopletakenwithvaryingpose(straight,left,right,up),expression(neutral,happy,sad,angry),eyes(wearingsunglassesornot),andsize

CMU人脸图像DataSet:

该数据集包含了640张黑白人脸图像,并且有直、左、右、上四个角度,中性、高兴、悲伤、生气四个表情,有的戴着太阳镜,有的没有,并且大小也不一。

41.Coil1999CompetitionData:

Thisdatasetisfromthe1999ComputationalIntelligenceandLearning(COIL)competition.Thedatacontainsmeasurementsofriverchemicalconcentrationsandalgaedensities.

Coil1999竞赛数据:

该数据集来自1999年的计算机智能学习竞赛(简写为Coil)。

该数据集包含了河流的化学浓度度量和藻类的密度度量。

42.CommunitiesandCrime:

CommunitieswithintheUnitedStates.Thedatacombinessocio-economicdatafromthe1990USCensus,lawenforcementdatafromthe1990USLEMASsurvey,andcrimedatafromthe1995FBIUCR.

社区与犯罪DataSet:

美国的社区。

该数据集包含了来自1990美国普查的社会经济数据、来自1990美国LEMAS调查的法律实施数据,还有来自1995年FBIUCR的犯罪数据。

43.CommunitiesandCrimeUnnormalized:

CommunitiesintheUS.Datacombinessocio-economicdatafromthe'90Census,lawenforcementdatafromthe1990LawEnforcementManagementandAdminStatssurvey,andcrimedatafromthe1995FBIUCR

社区和非标准化犯罪DataSet:

美国的社区。

数据包含了来自90年代普查的社会经济数据、来自1990年法律实施管理调查的法律实施数据,还有来自1995年FBIUCR的犯罪数据。

44.ComputerHardware:

RelativeCPUPerformanceData,describedintermsofitscycletime,memorysize,etc.

计算机硬件:

相关CPU运行数据,采用它的时间周期、内存大小来描述。

45.ConcreteCompressiveStrength:

Concreteisthemostimportantmaterialincivilengineering.Theconcretecompressivestrengthisahighlynonlinearfunctionofageandingredients.

混凝土抗压强度DataSet:

混凝土是土木工程中最重要的材料。

抗压强度是混凝土年龄与组成非线性特征。

46.ConcreteSlumpTest:

Concreteisahighlycomplexmaterial.Theslumpflowofconcreteisnotonlydeterminedbythewatercontent,butthatisalsoinfluencedbyotherconcreteingredients.

混凝土塌方度试验:

混凝土是一种非常复杂的材料。

它的塌落度流量不仅取决于含水量,也受其他具体成分的影响。

47.CongressionalVotingRecords:

1984UnitedStatedCongressionalVotingRecords;ClassifyasRepublicanorDemocrat

国会投票记录DataSet:

1984年美国国会投票记录;按照共和党与民主党分类。

48.Connect-4:

Containsconnect-4positions

连接4:

包含了连接4的位置。

49.ConnectionistBench(NettalkCorpus):

Thefile"nettalk.data"containsalistof20,008Englishwords,alongwithaphonetictranscriptionforeachword.Thetaskistotrainanetworktoproducetheproperphonemes

连接工作台(Nettalk资料库):

文件“nettalk.data”包含了一个有20008个英语单词的列表,还有一个每个单词的phonetic副本。

任务是训练一个网络,用来产生适当的phonemes。

50.ConnectionistBench(Sonar,Minesvs.Rocks):

Thetaskistotrainanetworktodiscriminatebetweensonarsignalsbouncedoffametalcylinderandthosebouncedoffaroughlycylindricalrock.

连接工作台(声纳、矿产和岩石):

目标是训练一个网络,用来区别在金属圆柱体的反弹声纳信号,和在基本为圆柱体的岩石上的反弹信号。

51.ConnectionistBench(VowelRecognition-DeterdingData):

SpeakerindependentrecognitionoftheelevensteadystatevowelsofBritishEnglishusingaspecifiedtrainingsetoflpcderivedlogarearatios.

连接工作台(元音识别—Detering数据):

使用一个来源于一个比率的指定训练集的11个英式英语的稳定元音字母的独立识别扬声器。

52.Contracepti

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿教育 > 育儿理论经验

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1