还剩4页未读,继续阅读
文本内容:
Gdeltl.O eventEVENTAND DATEATTRIBUTES这一部分的字段记录了捕捉事件的全局唯一标识符号码,事件发生的日期和日期的不同版本格式,这有助于信息被记录在可能有特定的日期格式要求的不同的分析程序中所包含的字段有数据类型为整数型,它是一条记录的唯一标识符,通常它是递增标识的AGIobalEventID记录事件发生的日期,格式为B DayYYYYMMDD记录事件发生的年月,格式为C MonthYearYYYYMM记录事件发生的年份,格式为DYear YYYY记录事件发生的日期,格式为其中为到该日期为止在当前年份E FractionDateYYYY.FFFF,FFFF所占的百分比,通过公式()进行近似计算MONTH*30+DAY/365々ACTOR TRIBUTES这一部分字段描述了事件的两个参与者的码、名称和特征属性在复杂事件或仅有一个CAMEO参与者的事件中另一个参与者的属性值可能为空,在系统无法识别参与者时参与者属性也gdelt可能为空每个参与者的各项属性在缺省的情况下也会为空值所包含的字段有:参与者的码包含一组编码属性指示参与者的地理、阶级、民FActorlCode1CAMEO CAMEO族和宗教信仰和他的角色信息(政治精英、军官、反对派等)每个属性均为个字母的缩写,3以任何可能的顺序排列组成码CAMEOGActorlName参与者1的名称对于政治领袖或组织,这将是领导人的正式名称(如乔治・W•布什、联合国);地理比赛将是该国或首都/主要城市名称参与者国家信息的码(字母缩写),它可能为中的HActorlCountryCode1CAMEO3ActorlCode码,也可能为空它标识了受到该事件影响的地理区域CAMEO如果参与者是一个已知的组织/非政府组织/反叛组织(如联合国、I ActorlKnownGroupCode1世界银行、基地组织等),该字段将包含其码CAMEO如果系统能识别出参与者的民族信息并且该民族具有码,该字J10ActorlEthnicCode1CAMEO段将包含其码注意该新增字段仍处于实验阶段CAMEO如果系统能识别出参与者的宗教信息并且该宗教具有码,该字K ActorlReligionlCode1CAMEO段将包含其码注意该新增字段仍处于实验阶段CAMEO如果参与者包含多重宗教信息,该字段将包含其二级代码一些宗L12ActorlReligion2Code1教将自动使用两个代码,如将调用作为第一个代码,作为第二Catholic ChristianityCatholicism个此处的三位代码将指代参与者的类型或角色信息这可能是M13ActorlTypelCode CAMEO1一个特定的角色,如警察、政府、军队、政治反对派,反对派等,或是如教育、精英、媒体、难民这样的广泛的角色类型,或是有组织的团体,例如民间运动特殊的代码如“温和的”和“激进的”可能指一组的操作策略如果参与者具有多重角色,此处将包含其码N14ActorlType2Code1CAMEO如果参与者具有多重角色,此处将包含其码015ActorlType3Code1CAMEO参与者将重复以上所有属性2P16Actor2CodeQ17Actor2NameR18Actor2CountryCodeS19Actor2KnownGroupCodeT20Actor2EthnicCodeU21Actor2ReligionlCodeV22Actor2Religion2CodeW23Actor2TypelCodeX24Actor2Type2CodeY25Actor2Type3CodeEVENT ACTIONATTRIBUTES这部分字段将包含事件行为(即参与者对参与者所做的事)的各类属性,并将提供几种机12制来评估事件的重要性和其造成的短期影响此字段标识了该事件在事件流中是否处于根节点位置Z26IsRootEvent此字段通过码描述了事件参与者对参与者的行为AA27EventCode CAMEO12这里是一个三级分类法标识的码对于第三级的事件,此处包含AB28EventBaseCode CAMEO其二级事件的叶节点例如编码()此处即“0251”Appeal foreasing ofadministrative sanctions,为()对于二级事件和一级事件,此处即为其“025”“Appeal toyield”EventCodeo与上面类似,此处标识了事件的根节点如(AC29EventRootCode“0251”“Appeal foreasing ofadministrativesanctionsv,此处即为“02”(Appeal”)这个字段指定事件类型主要分类,所有事件将被划分为以下四个分类之一AD30QuadClass1二口头合作,二物质合作,二口头冲突,二物质冲突234每个事件将被分配一个在至卜之间的数值,用以衡量理论上该事件对国AE31GoldsteinScale10家产生的潜在影响注意这个分数的判定是基于事件类型而非事件的细节,因此一个人参10与的暴乱与一个人参与的暴乱都将获得同样的分数1000该属性值为数据库内所有文章提及该事件的次数这可以用作评估事件的AF32NumMentions重要性的方法:讨论该事件越多,越有可能是重要的如果新闻文章发表之后这个事件引发了讨论,该字段数值会进行更新(例如,一个事件在几周后的可能引发一个舆论热潮,会有无数的新闻文章发表提到原始新闻;在新的发展背景下,某一事件在一周年时可能会有进一步的报道)该属性值为所有提及该事件的数据源数值同上一个属性一样,这也可以AG33NumSources用作评估事件的重要性的方法该属性值也会在上文相同的情况下进行更新该属性值为所有提及该事件的文章数同上一个属性一样,这也可以用作AH34NumArticles评估事件的重要性的方法该属性值也会在上文相同的情况下进行更新该属性值为所有文章提及该事件时“语气”的平均值分数范围从(极其消Al35AvgTone-100极的)到(极积极的)共同的价值观分数范围在-和之间,表示中立这可以用作+10010+100过滤事件的“上下文”的方法,从而衡量一个事件的重要性和其影响例如,轻微负面语气的暴乱事件很可能是一个小事件,而如果是极其负面的语气,这表明可能是一个更严重的事件而具有积极分数的暴乱事件则可能表明上下文中正在描述一个积极的事(如每天攻击的数量已经大大减少了)EVENT GEOGRAPHY这一部分属性值描述了事件参与者与事件的地理位置信息,包含如下字段该字段取值如下:AJ36ActorlGeo_Type1=COUNTRY matchwas atthe countrylevel,2=USSTATEmatch was to a US state,3=USCITY matchwas to a UScity orlandmark,4=WORLDCITY matchwasto acity orlandmark outside the US,5=WORLDSTATE matchwas to an AdministrativeDivision1outside the US-roughly equivalentto a US state家”注意同一地点可能具有不同拼写或名称,所以该属性无法用来确定唯一的地理信息利用下面的属性可确定两个不同名字的位置指的是同一个地方Feature©此处为位国家编码和位行政区划编AL38ActorlGeo_ADMlCode2FIPS10-42FIPS10-41ADM1码,标识了参与者的行政区划地理信息1对于国际地区,这是分配给每个全球位置的数字全球行政单位层AM39ActorlGeo_ADM2Code:行政区划代码,而对于美国地区,这是州名称的两个字符的缩写例如德克萨斯GAUL2ADM2州的,后跟位数的县代码遵循中使用的标准注意在没有“TX”3GNIS INCITS31200x ADM2信息可用,某些级别匹配以及所有国家级匹配的情况下,此字段可能为空白/空注意ADM1此字段可能仍然包含级匹配的值,具体取决于它们在中的编码方式ADM1GNS参与者所处地理位置的纬度AN40ActorlGeo_Lat1参与者所处地理位置的经度AO41ActorlGeo_Long1参与者地理位置的或标识,详细信息请参考AP42ActorlGeo_FeaturelD.1GNS GNISLeetaru2012该字段取值如下:AQ43Actor2Geo_Type1=COUNTRY matchwas atthe countrylevel,2=USSTATEmatch was to aUS state,3=USCITY matchwas to aUScity orlandmark,4=WORLDCITY matchwasto acity orlandmark outside the US,5=WORLDSTATE matchwas toan AdministrativeDivision1outsidetheUS-roughly equivalenttoaUS state此处为参与者的完整地理名称,格式为“城市/地标,州,国家:注AR44Actor2Geo_Fullname1意同一地点可能具有不同拼写或名称,所以该属性无法用来确定唯一的地理信息利用下面的属性可确定两个不同名字的位置指的是同一个地方Feature©此处为位国家编码和位行政区划AS45Actor2Geo_ADMlCode2FIPS10-42FIPS10-41ADM1编码,标识了参与者的行政区划地理信息2对于国际地区,这是分配给每个全球位置的数字全球行政单位层AT46Actor2Geo_ADM2Code:行政区划代码,而对于美国地区,这是州名称的两个字符的缩写例如德克萨斯GAUL2ADM2州的,后跟位数的县代码遵循中使用的标准注意在没有“TX”3GNIS INCITS31200x ADM2信息可用,某些级别匹配以及所有国家级匹配的情况下,此字段可能为空白/空注意ADM1此字段可能仍然包含级匹配的值,具体取决于它们在中的编码方式ADM1GNS参与者所处地理位置的纬度AU47Actor2Geo_Lat2参与者所处地理位置的经度AV48Actor2Geo_Long2Leetaru2012该字段取值如下二AX50ActionGeo_Type1COUNTRY matchwas atthe countrylevel,2=USSTATEmatch wastoaUS state,3=USCITY matchwastoaUScity orlandmark,4=WORLDCITY matchwasto acity orlandmark outsidetheUS,5=WORLDSTATE matchwastoan AdministrativeDivision1outsidetheUS-roughly equivalenttoaUS state此处为的完整地理名称,格式为“城市/地标,州,国家”注AY51ActionGeo_Fullname Action意同一地点可能具有不同拼写或名称,所以该属性无法用来确定唯一的地理信息利用下面的属性可确定两个不同名字的位置指的是同一个地方FeaturelD此处为位国家编码和位行政区划AZ52ActionGeo_CountryCode2FIPS10-42FIPS10-41ADM1编码,标识了的行政区划地理信息Action对于国际地区,这是分配给每个全球位置的数字全球行政单位层BA53ActionGeo_ADMlCode行政区划代码,而对于美国地区,这是州名称的两个字符的缩写例如德克萨斯GAUL2ADM2州的,后跟位数的县代码遵循中使用的标准注意在没有“TX”3GNIS INCITS31200x ADM2信息可用,某些级别匹配以及所有国家级匹配的情况下,此字段可能为空白/空注意ADM1此字段可能仍然包含级匹配的值,具体取决于它们在中的编码方式ADM1GNSBB54ActionGeo_LatBC55ActionGeo_LongBD56ActionGeo_FeaturelDDATA MANAGEMENTFIELDS最后一组字段提供数据管理信息记录的事件记录年月日之前的事件在这部分中只具201341有属性DATEADDED因为今天发布的新闻报道可以报道过去的事件,这将导致此字段和其他事件BE57DATEADDED日期字段不一致此字段记录的是该条数据被添加入数据库的日期,而第一部分的日期信息记录的是事件发生的时间这个字段只存在年月日以后的文件中通常记录事件的新闻文章的BF58SOURCEURL201341列表如果事件是从监测服务的文章中获得的,这个字段将包含如URL BBC“BBC Monitoring果一个事件在多篇文章中被提及,只提供一个urlGdelt
2.0event的事件表中有个字段,其中个字段与中完全相同,新增的个字段为在GDELT
2.06158GDELT3中参与者、参与者和事件都增加了一个属性EVENT GEOGRAPHY12Geo_ADM2Code对于国际地区,这是分配给每个全球位置的数字全球行政单位层()行Geo_ADM2Code GAUL政区戈()代码,而对于美国地区,这是州名称的两个字符的缩写(例如德克萨斯州U2ADM2的),后跟位数的县代码(遵循中使用的州标准)“TX”3GNIS INQTS31Ox与相同的个属性,其属性描述也是相同的,不同的是在中,GDELT
1.058GDELT
2.0EVENT ACTION中的四个属性值由对每天的统计ATTRIBUTES NumMentionsNumSources NumArticlesAvgTone变为对每分钟的统计以及中的属性由之前只精确15DATA MANAGEMENTFIELDS DATEADDED到天到现在改为精确到每分钟15。
个人认证
优秀文档
获得点赞 0