一种基于中文知识图谱的个性化推荐方法与系统
2019-11-22

一种基于中文知识图谱的个性化推荐方法与系统

本发明属于计算机软件技术领域,具体为一种基于中文知识图谱的个性化推荐方法与系统。本发明利用中文知识图谱中概念实体间的超链接关系度量出任意两个词条间的语义关联,并结合一种改进的显式语义分析模型(ESA)来实现由两组标签分别刻画的用户和待推荐物品之间的精准推荐。对于两组即便没有共同标签词条的标签组,本发明提出的改进ESA模型借助中文知识图谱也能度量出两者间的语义距离,即匹配程度,从而极大地拓展了基于标签描述的个性化推荐技术的应用场合,具有广泛的商业应用价值。

第一模块是构建中文知识图谱。首先,将百科网站的概念实体,即词条,映射成知识图谱(即一个由许多点和边组成的网络)中的结点,词条页面上出现的其它参考词条数的倒数作为该结点的权重;词条间的超链接关系(参考词条)则映射成网络边。图谱中的边在一定程度上代表了相连的两个结点(词条)之间的语义联系。该模块可为后续模块中标签之间语义距离的度量提供语料库。

图1为本发明的系统框架。

该模型的具体建立过程如下:

图3为以“旅游”为例建立的中文知识图谱示例。图4是改进的ESA模型构建示例。具体实施方式下面结合附图和实施例对本发明做进一步详细说明。

第一模块是构建中文知识图谱。首先,将百科网站的概念实体,即词条,映射成知识图谱(即一个由许多点和边组成的网络)中的结点,词条页面上出现的其它参考词条数的倒数作为该结点的权重;词条间的超链接关系(参考词条)则映射成网络边。图谱中的边在一定程度上代表了相连的两个结点(词条)之间的语义联系。该模块可为后续模块中标签之间语义距离的度量提供语料库。

上述三个模块,依次工作,实现了本发明的方法流程。

E.Gabrilovich,S.Markovitch.Computingsemanticrelatednessusingwikipedia-basedexplicitsemanticanalysis.1nProc.0fIJCAI,2007〇

第一模块是构建中文知识图谱。首先,将百科网站的概念实体,即词条,映射成知识图谱(即一个由许多点和边组成的网络)中的结点,词条页面上出现的其它参考词条数的倒数作为该结点的权重;词条间的超链接关系(参考词条)则映射成网络边。图谱中的边在一定程度上代表了相连的两个结点(词条)之间的语义联系。该模块可为后续模块中标签之间语义距离的度量提供语料库。

J.Hannon,M.Bennett,andB.Smyth.Recommendingtwitteruserstofollowusingcontentandcollaborativefilteringapproaches.1nProc.0fRecSys,2010•

图3为以“旅游”为例建立的中文知识图谱示例。图4是改进的ESA模型构建示例。具体实施方式下面结合附图和实施例对本发明做进一步详细说明。

本发明属于计算机软件技术领域,具体涉及一种基于中文知识图谱的个性化推荐方法与系统。背景技术