0%

在信息爆炸的时代,数据呈现出规模巨大、模态多样和高速增长等特征,“信息过载”问题日益严重[1],如何从海量信息中快速准确地获取用户感兴趣地信息已经成为亟需解决的问题[2]。在这种背景下,为使海量自然语言信息变成结构化的形式方便分析[3],信息抽取技术应运而生。信息抽取从大规模的无结构文本中提取出用户感兴趣的信息,并以结构化或半结构化的形式输出[4],其主要包括三项子任务:实体抽取、关系抽取和事件抽取。实体抽取是关系抽取和事件抽取的基础,只有先从句中抽取出基本的信息单元,包括人名、地名、机构名、日期、数额、百分比等实体信息,才能深入理解实体之间的语义关系,提炼实体间语义关系的任务便是关系抽取。关系抽取包括广义和狭义两个层面。实体间的关系可被形式化描述为关系三元组,包括两个从句中抽取的实体和一个关系描述,广义的关系抽取式从句子中自动识别这样一组由一对实体和联系这对实体的关系构成的三元组[5],而狭义的关系抽取以句子和已知的实体对为输入,得到这对实体之间的联系。本文中的关系抽取以广义为主。

阅读全文 »

直觉是我生活的信条,做事三分钟热度和偏爱美国短篇小说成了生活选择的结果。所以随手从新书书架上取下的《弗兰妮与祖伊》挑战了我阅读的极限——塞林格文字里大段的对白和杂乱的天才与信仰,使我迷恋起那种缠绕而疯狂的黑洞式的阅读体验。作者从二十岁立志写作,真正意义上笔耕不辍几十年,研究百家宗教论述,颅内思维碰撞与湮灭。这与思想者博览全书后的哲学笔记不同,塞林格没有笃定的立场和咄咄逼人的嘴,他把人物写得活生生就像邻居一家就是为了真诚地说这就是他最想告诉你的事。于是这次我的直觉在触到塞林格的那一刻起,抓住了这个神秘得像书后作者的话上的剪影一样的美国作家,这就是《九故事》《弗兰妮与祖伊》《抬高房梁,木匠们》《西摩:小传》成为我的偏爱的开始,也是大名鼎鼎的《麦田里的守望者》再次被我翻开的契机。

阅读全文 »