关键词:
图像特征
协同过滤
混合策略
数据稀疏性
面料推荐
摘要:
随着信息技术和成像技术的迅速发展,网络中的图像信息量呈飞速增长的趋势,使得信息过载现象越发明显,用户难以快速从庞大的图像集中获取自己喜好的图像。因此,推荐技术逐渐受到人们的广泛关注,并被应用于多个领域。同样,在纺织面料领域,由于面料品类多样化的发展,纺织企业的面料样品库中积累了数量庞大且种类繁多的样本,如何在用户需求不明确的情况下,帮助客户快速查找到符合其偏好的面料已经成为纺织面料生产企业亟待解决的问题。因此,将推荐算法引入到面料图像领域显得尤为重要。然而传统的面料图像推荐研究存在诸多问题,例如未考虑面料视觉特征对用户偏好的影响、用户兴趣动态变化问题、数据稀疏性问题以及用户相似度计算结果不够准确等。此外,用户的推荐需求分为2种,包括:(1)基于单用户数据的个性化推荐需求;(2)基于多用户数据的多样化推荐需求。
本课题针对上述问题,从用户的2种需求出发,基于图像特征和用户评分数据研究纺织面料在基于单用户数据推荐场景下和基于多用户数据推荐场景下的推荐算法,满足用户不同的需求,提高推荐结果的准确性、实时性和多样性,并搭建纺织面料图像推荐系统。本课题的主要研究内容如下:
(1)采集纺织面料图像,提取面料主色并进行纹理分类,收集用户交互数据,构建了面料图像数据集、用户评分数据集和推荐评估体系。首先,采用Canon 9000F Mark II平板扫描仪采集面料图像,并对采集后的图像进行裁剪、纹理增强等预处理操作。然后,采用基于HSV颜色空间的颜色快速量化算法提取面料图像的主颜色集和对应百分占比,并通过手工打标签的方式对面料纹理种类进行分类。总计得到30580张图像,其中平纹面料图像4520张,绒面面料图像4200张,斜纹面料图像3810张,色织条纹面料图像3530张,嵌线条纹面料图像3300张,针点面料图像1310张,鸟眼面料图像650张,色织格子面料图像4840张,嵌线格子面料图像约3100张,千鸟格面料图像1320张。最后,将用户评分数据集按8:2比例划分为训练集和测试集。纺织面料推荐数据集为后续推荐研究提供数据支撑和验证依据。
(2)针对用户的个性化推荐需求和单用户纺织面料推荐场景,结合用户评分面料包含的颜色和纹理特征属性,提出了基于特征属性的纺织面料推荐算法。为了解决现有纺织面料推荐研究忽略面料颜色和纹理特征对用户偏好影响的问题,提出了基于面料特征属性兴趣度的评分预测方法,该方法将用户的显性评分转换为对面料特征属性的隐性兴趣度,充分挖掘交互面料中隐含的用户偏好信息。同时,考虑到用户兴趣的动态变化,将时间加权函数融入了面料特征属性兴趣度计算过程中,以动态反映用户喜好的变化趋势。最后基于兴趣度计算目标用户对潜在面料的评分,将评分最高的N张面料推荐给用户。实验结果显示:在不同的面料图像推荐数量N下,本文算法的准确率、召回率和F1值均始终高于其他算法,且准确率始终保持在54.20%以上,验证了所提算法可以有效应用基于单用户数据的纺织面料推荐场景。
(3)针对用户的多样化推荐需求和多用户纺织面料推荐场景,分析了基于特征属性的纺织面料推荐算法和基于用户的协同过滤推荐算法的优缺点,采用级联式混合策略将两种算法相融合,提出了基于协同过滤的纺织面料推荐算法。首先为了缓解数据稀疏性问题,将基于特征属性的纺织面料推荐算法计算得到的评分预测结果填充进评分矩阵中,有效提升了填充数据的可靠性。然后对用户相似度计算方法进行了改进,分别提出了基于评分矩阵的相似度计算方法与基于面料特征属性兴趣度的相似度计算方法,并通过自调节因子将两相似度相融合,提高了邻居用户定位精度。最后基于邻居用户集合计算目标用户对潜在面料的评分,将评分最高的N张面料推荐给用户。实验结果表明采用改进后相似度计算方法和自调节因子的算法的推荐性能优于其他算法。接着在不同的N值下,将所提算法与其他5种算法进行了横向对比,结果表明该算法准确率高的同时显著地提高了推荐结果的多样性值,且准确率最低值为71.05%,提供了相关且多样的面料类型,证明了所提算法在多用户纺织面料推荐场景中的有效性和适用性。
结合上述构建的纺织面料推荐数据集和基于协同过滤的纺织面料推荐算法,本文搭建了一套纺织面料图像推荐系统,提供了简洁且交互友好的用户界面。所建立的系统在推荐准确率、实时性和多样性方面优于现有的纺织面料推荐算法,为纺织面料推荐技术的应用提供了思路和参考。