属性值特点词典构建。构建属性值特点词典是为了提高产品被对应搜索引擎检索与收率的概率,以上文设计为基础,通过分词可以有效的将标题转换为产品的属性值。 但问题在于,每一个网站的名字在电商网页中都会重复多次的出现,若将它填写到属性值特点词典的构建中,会干扰到后面的剖析环节中增加噪声。
因此,在构建属性值特点词典时,第一要获得到网页中有关的产品内容,借助匹配算法,对网页中去掉标题后的内容进行比对,并将获得到的结果看作新的标题。再对新标题进行分词处置,并在其中加入词性标注,将最后获得到的标题中的名词、形容词、数目词等词性的序列视为属性特点词典。