专利名称:基于Spark的节点相似度计算方法、装置及终端专利类型:发明专利发明人:魏红亮
申请号:CN201810811936.0申请日:20180723公开号:CN110751161A公开日:20200204
摘要:本发明实施例提供一种基于Spark的节点相似度计算方法、装置及终端,方法包括:获取待处理的二部图中的节点数据,对节点数据进行序列化处理;根据处理后的节点数据生成概率转移矩阵和相似度矩阵;对概率转移矩阵和相似度矩阵进行多级自适应分片迭代处理,获得中间结果矩阵;将中间结果矩阵与预先设置的衰减系数做乘积运算,获得最终结果矩阵;根据最终结果矩阵获得节点之间的相似度。本发明提供的技术方案,具体为一种基于Spark的大规模矩阵乘法算法,能够对数据进行多级自适应分片,并可以将Simrank计算公式过程拆分为两部分,降低了计算规模和中间数据存储规模;从而能够高效地计算亿级别节点之间的相似度。
申请人:优视科技(中国)有限公司
地址:510000 广东省广州市天河区黄埔大道西平云路163号广电平云广场B塔13层自编01单元
国籍:CN
代理机构:北京同立钧成知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容