Every day to be a little better

2018年02月的文章

big data

NLP文本相似度

admin阅读(248)评论(0)

NLP文本相似度 处理角度 语义角度 文字角度 相似度 余弦相似度 – 一个向量空间中两个向量夹角的余弦值作为衡量两个个体之间差异的大小 – 余弦值接近1,夹角趋于0,表明两个向量越相似 – cos(𝜃)...

big data

MapReduce

admin阅读(246)评论(0)

MapReduce MapReduce它是属于并发计算,MapReduce是一个海量数据分流处理技术,自身是基于hadoop平台 ###传统Hash应用 流量分发 选择key对象(cookie、随机值等) > Hash() % max > ...