当前位置: 首页 > news >正文

wordpress 网站白屏舟山建设技术学校网站

wordpress 网站白屏,舟山建设技术学校网站,wordpress静态插件,网站开发工程师学什么区别本文转载自公众号#xff1a;爱思美谱。 指导老师 | 傅洛伊 王新兵核心技术成员 | 刘佳琪导读在前面几期的内容中#xff0c;小编已经为大家介绍了知识图谱的产生历史和基本概念。相信大家已经对知识图谱强大的信息结构化能力有所了解。但是#xff0c;目前的大部分知识… 本文转载自公众号爱思美谱。           指导老师 | 傅洛伊  王新兵核心技术成员 | 刘佳琪导读在前面几期的内容中小编已经为大家介绍了知识图谱的产生历史和基本概念。相信大家已经对知识图谱强大的信息结构化能力有所了解。但是目前的大部分知识图谱均有一个特点——仅刻画了静态知识信息。在现实世界中知识往往是带有时间标签的且会随时间发生显著变化。例如乔布斯于2010年发布IPhone4。这一条内容如果在传统知识图谱中进行表征会被表示为一个三元组乔布斯发布IPhone4其中主语实体subjectentity为“乔布斯”宾语实体objectentity为“IPhone4”关系relation为“发布”。细心的读者想必已经发现了这条内容的一个关键信息——时间即2010年没有被整合进知识图谱。这就造成了信息的遗漏和损失会对后续的知识提取和挖掘产生负面影响。另外从时间维度上考虑知识我们会发现很多不同时间段之间的知识存在着“因果联系”或者至少存在一定的相关性。举个例子这里有两个事件分别为“Bob于2017年到访美国”和“Bob于2018年到访加拿大”这两个事件之间是否存在某种联系呢答案是很有可能我们可以猜测Bob可能在2017年前往美国后与北美地区的一些商家建立了合作关系才会在2018年前往北美的另外一个国家——加拿大。从上面两个例子我们可以总结出知识往往是带有时间标签的 时间靠前的知识可能会对时间靠后的知识产生影响因此一个更完善的知识图谱需要充分体现时间的作用能够在刻画实体对象的关系时既“瞻前”又“顾后”这样才能更深入地了解事件发展的来龙去脉图1是一个演进知识图谱的示意。目前学术界对于演进知识图谱的研究尚处于起步阶段仅有少数几篇工作对这个新概念进行了研究和探讨。接下来我们以发表于2019 IEEE INFOCOM 会议上的文章“Evolving Bipartite Graph”为基础为大家介绍“演进知识图谱”这个概念。下面的内容会以研究思想为主不涉及太多数学实现细节感兴趣的读者可以自行查阅论文来获得更加详细的实现信息。原文详细信息Jiaqi Liu, Qin Zhang, Luoyi Fu,Xinbing Wang and Songwu Lu, Evolving Knowledge Graphs, in IEEE INFOCOM 2019, Paris, France.)图1  演进知识图谱示例演进知识图谱的该如何表示传统知识图谱的三元组结构没有涵盖时间信息那么时间信息该如何进行表示呢一个最简单的方法就是采用四元组在保证原三元组基本信息即主语实体、关系、宾语实体不变的情况下引入第四维参量——时间。图2 从“三元组”到“四元组”知识的跨时间影响cross-time influence如何体现在引入四元组的前提下“EvolvingBipartite Graph”这篇文章对知识的跨时间影响进行了讨论。主要研究问题包含以下两个方面模型刻画知识演进具有哪些典型特征如何通过数学手段对这些特征进行刻画 算法实现在已有知识基础的上如何设计算法来对新产生的知识进行预测通过我们之前的描述想必大家也已经发现新知识的产生过程往往会受到已有知识的影响且受到所有其相关行为的影响。比如在刚刚给出的例子中Bob在2018年到访加拿大这个事件的产生除了受其2017年到访美国这个历史事件的影响还可能受其其他历史访问记录的影响这些其他访问历史记录并未在前面的例子中具体给出。另外历史事件对于当前事件的影响还往往具有时效性。也就是说当我们试图预测Bob在2019年的到访情况时他在2018年的到访情况显然比他在2000年的到访情况具有更大的影响力。后面这一条性质也可以总结为——影响力随时间衰减。通过上述两个方面的基本观察我们可以将历史事件对当前事件的影响力建模为如下形式这里I_f表示某个历史事件对于当前时间产生概率的影响比重。在实际场景中不同事件间的影响力各有差异。回到我们刚刚给出的例子在讨论历史事件对于Bob在2019年的访问行为的影响时一般情况下“Bob于2010年到访美国”这类重大事件的影响力大于“Bob于2010年到访上海闵行”这类一般事件的影响力。但是在我们所讨论的这篇文章中作者为了简便起见将所有不同事件的影响力均设置为一这个设置大大简化了运算但是在刻画真实影响力方面略显不足是后期研究可以继续提升的方向之一。这里f(t_i)表示在历史时刻t_i产生的知识对于当前时刻t新知识产生的影响这个函数是一个递减函数实质上反映了历史事件对于当前事件的影响力随时间衰减这一特性。该论文指出除了衰减特性衰减函数f(t_i)还需要满足一致性等其他约束条件这些条件将在后面为大家进行详细介绍。最后表达式中的求和项是对所有相关历史事件的影响力进行求和这里求和顺序不是按照事件来进行排序的而是按照使劲顺序进行的因此求和项是从起始时刻0到当前时刻t表示对起始时刻至当前时刻这个时间段间的所有历史事件影响力进行求和。衰减函数f(t_i)的一些性质如前所述衰减函数是需要满足一定的约束条件的。使用符号表示主语实体表示宾语实体表示关系表示时间则演进知识图谱中的四元组可以表示为这是一个带有时间戳的事件信息。使用符号表示事件的发生概率。这篇论文假设衰减函数需要满足以下两个方面的条件一致性如果时刻至时刻之间无新事件产生衰减性记时刻至时刻之间发生的事件集合为则R1当时R2当时R3当,,时这里“一致性”的实际含义是如果一段时间内无新的历史事件产生则当前事件发生的概率不变。举个例子如果Bob在2017年到访美国基于这个历史事件我们得到Bob在2018年1月到访美国的概率P如果1月到5月之间无新的历史事件产生Bob没有任何新的访问行为美国方面也没有重大的状态变化如更改政策法规等那么Bob在2018年5月到访美国的概率仍然为P。这个结论还是比较符合人们的常理认知的因为人们行为的改变是由一些自身或者行为对象的改变导致的当没有这种改变时人们的行为也就不会发生变化。通常情况下由于新知识的产生是频繁地时间间隔都是比较小的值如例子中给出的4个月。而“衰减性”约束条件和我们之前的讨论结果相近该论文将其细化成为了三个更加具体的约束条件它们的实际含义分别为发生了相关事件(R1)、发生的相关事件越多R2以及发生的相关事件时间越靠后R3新的相关事件发生的概率越大。同样举个例子如果Bob曾经去过北美国家R1去过的次数较多R2或者去北美国家的时间距离现在较近R3则可以预测他接下来会去北美国家的概率较大。这三条约束条件实质上都反映了历史事件对当前事件的影响力是随时间递减的。经过一定的数学推导该文章指出当衰减函数的形式为时上述所有约束条件都可以得到满足。上式中的表示历史事件的发生时刻表示当前时刻为参数用来调节衰减速率。在这篇文章中作者从数学角度证明了上述表达式可以满足前面给出的所有约束条件。EvolveKG框架一种新的知识演进处理框架基于上述性质论文提出了一种全新的知识演进处理框架——EvolveKG。该框架的一个结构示例如下图图3  EvolveKG框架图EvolveKG分为两个步骤。第一步首先将演进知识图谱转化为导图DerivativeGraph。这里的导图是该论文提出的一个全新概念其数学定义为这个定义为我们展现了演进知识图谱向导图进行转换的具体过程。通过这个定义我们可以看到某个演进知识图谱的导图与原本的知识图谱具有相同的拓扑结构最大的区别在于原知识图谱为一个有向无权图而其对应导图为一个有向加权图这里每一条边的权重对应为该边以及其所连接的主语实体和宾语实体所对应的事件目前的有效影响力。在图3中的Step1我们可以看到左侧所示是一个包含四条基础事件的演进图谱这四个事件的产生时间分别为t1t2t3和t4。右侧所示即为该演进知识图谱对应的导图导图与t时刻的演进知识图谱拓扑结构一致但是每条边拥有一个对应的权重。这里每条边的权重反映了对应事件对当前新知识产生的影响力或者也可以叫做该历史事件的有效性。因此导图实质上刻画了整个演进知识图谱在当前时刻的全网有效性。之所以称其为导图是因为它的获取方式就好比对函数进行求导相当于是一个函数与其导函数的关系由此得名。接下来是第二步对导图中包含的数据进行有偏训练。这里的“有偏”指的是各条数据的重要性程度有所差异。而在该论文所研究的问题中数据的重要性程度体现为它们对当前知识的影响力也就是根据衰减函数计算得到的值。那么这种“偏移”该如何实现呢该论文提出可以分别从数据端或者损失端来刻画这种偏移程度。下图所示是一个普通的训练过程框架图图4  一般训练过程框架该图表示系统包含m个训练数据根据所设计的损失函数可以得到每一条数据所对应的损失l_i将它们相加后可以得到最终的总损失L最后通过相应的优化函数迭代地减小总损失值。该论文提出数据的“偏移”可以分别在数据端或者损失端进行实现。数据端指的是提高重要数据影响力较大的数据的采样率而损失端指的是根据每个数据的重要程度为其对应损失乘上一个权重系数这样不同数据在总损失中的占比权重可以方便的进行调整。论文采用的训练方法为后者具体的实验过程如图3中Step2所示。基于上述框架论文对衰减函数的正确性以及导图有效信息量随时间的变化规律进行了数学分析与证明。由于涉及量数学推导过程我们在这里不再继续深入感兴趣的读者可以查看该论文来获得更加详细的信息。但是这里值得一提的是我们通过导图得了三种不同量级的知识演化速度使得知识变化与事件发展之间建立了一个可以相互解释、相互支撑的桥梁!下面放上我们的主要定理证明可以具体参见原文实验验证文中基于两个大规模数据集对所提出算法的有效性进行了验证。这里的算法目标是——以历史数据为训练数据集通过对其进行学习来预测当前时刻新知识的产生情况。两个数据集分别为ICEWS和GDELT数据集的统计特性如下另外论文添加了两个对比算法定义分别为UTFUniform Training with the Full historical facts使用全部历史数据进行训练并对所有历史数据赋予相等的权重 UTRUniform Training with only Recent historical facts仅适用近期历史数据进行训练。通过将所提出的算法与UTR进行对比可以获知历史数据是否对当前知识的产生具有影响若无影响则UTF的性能应与所提出算法相近而通过与UTF的对比可以获知历史数据对于当前知识的影响是否是均匀的还是递减的。论文分别采用MeanRank和Hits10作为评价指标这两个指标被普遍用于知识图谱预测准确度的衡量中。其具体定义在这里不进行详述感兴趣的读者可以上网查找相关资料。MeanRank越低或者Hits10越低时预测准确度越高。预测结果如下图所示图5  MeanRank指标图6  Hits10指标从上图中可以看出论文所提出的EvolveKG算法在MeanRank指标和Hits10指标上均优于两种对比算法这说明论文之前的假设历史知识对于当前知识的产生具有影响且该影响力随时间递减是正确的。未来展望虽然这篇推文中我们仅以文章“Evolving Knowledge Graph”为例为大家介绍了演进知识图谱的概念但是演进知识图谱的探索之路刚开始可以挖掘的内容远远不止这些。举些例子这篇论文里将时间维度转换为了图中边的权重那么是否可以效仿实体和关系将时间维度也映射到一个特定的向量空间呢再如如何更加全面有效地刻画跨时间影响挖掘时间维度上知识演进带来的额外信息都是未来可以继续研究的方向。OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。
http://www.fuzeviewer.com/news/49562/

相关文章:

  • 昆明做网站seo云南网站建设锐网
  • 网站建设项目规划审批网站推广要点
  • wap网站制作动态零食店网站建设计划书
  • 房屋在线设计网站手机网站开发多少钱
  • 重庆建设网站哪里好百度seo排名工具
  • 吃什么补肾治早射seo按照搜索引擎的
  • 医疗网站建设免费中信建设有限责任公司电话
  • 广西壮族自治区住房和城乡建设厅网站建设网站网站
  • 辽宁旅游网站开发莆田专业建站公司
  • 四川学校网站建设公免费微信营销系统
  • 成都网站建设哪些公司好网站开发 进度表
  • 网页建站工具视频网站后台登陆
  • 单位做员工招退工在什么网站南通百度seo代理
  • 漳州网站建设公司首选公司哪个做砍价活动的网站好
  • 安徽省城乡建设网站凡客做网站怎么样
  • 做汽车介绍视频的网站吗wordpress 绿色公益主题
  • 如何建立商城网站电商网站建设在哪里找设计师
  • 渭南做网站都有哪些网站定制开发是什么意思
  • 北京网站模板百度收录的网站标题 --
  • 小程序网站app定制开发仙桃做企业网站的
  • 怎么让网站绑定域名访问如何制作网站最简单的方法
  • 临沂龙文网站建设深圳建筑工地招工招聘信息
  • 美美淘-专做女鞋拿货选款网站广告设计公司清晨必发图片
  • 建网站找那家好个人网站建设网站排名优化
  • 学校asp网站英雄传奇手机版网页版
  • 铜川市网站建设如何做网站关键词排名
  • 吉祥物在线设计网站als冰桶挑战赛的网络营销方式
  • 艺之都网站建设微信app开发制作企业网站页面实训报告
  • 做一个网站需要投入多少钱广州市开发区建设网站
  • 郑州市重点项目建设办公室网站网络营销有哪些模式