异构信息网络中基于元路径的搜索与挖掘
2.3 用户引导的相似性搜索
到目前为止,我们已经看到,不同的元路径意味着不同的相似的语义。但是,如何
才能选择一个特定的搜索任务的最佳元路径或它们的组合?现在,我们介绍了元路径何 可以帮助用户引导的相似性搜索。
如该图2.2所示,不同的用户可能偏好不同的相似性度量,即使对于相同的查询实体。鉴于DBLP网络,它们共享相同的格式的相似性查询可以具有不同的语义含义。在图2.2,无论是查询1和查询10目标是找到与Christos Faloutsos具有相似关系的作者,但是,如果我们用同样的排名函数来回答这两个查询,结果可能不理想。在查询1,隐藏的相似性语义是通过两个例子Jimeng Sun” 和 “Hanghang Tong”。人类的知识判断,作者都是数据挖掘研究人员和卡内基梅隆大学(CMU)Faloutsos的学生。当用户发出查询1,他们可能会寻找卡内基梅隆大学其它的与Faloutsos定期合作的数据挖掘研究人员。然而,在查询1'我们可以从用户的指导,查询很可能寻找其他类似Faloutsos的有名的数据挖掘研究人员。在IMDB(http://www.imdb.com/)数据集,查询2代表搜索有关同一主题(即蝙蝠侠)的电影,同时查询2'代表一个搜索大约在同一时间,在同类型制作的电影。
表2.2 DBIS中和Anhai Doan最相似的前五位
为了提供个性化的相似性搜索,研究文献[10]可满足用户的不同的搜索意图,我们会要求用户提供几个例子,连同查询实体。整个系统可以分为离线和在线组件。在离线的一部分,用不同的基于元路径的排名模式进行培训。在在线部分,查询的意图会被识别和查询将被分派到相应的排序模型。最后选定的相似度排名模式将返回所有其他类似的对象查询实体,给出的查询与指导为例。
- 8 -
相关推荐: