关键词:
同伴推动抽样
男男性行为者
HIV感染
机器学习算法
摘要:
目的:运用同伴推动抽样(Respondent Driven Sampling,RDS)方法,深入了解新疆某市男男性行为人群(Men who have sex with men,MSM)的人口学特征、行为学特征,推断该人群的人类免疫缺陷病毒(Human Immunodeficiency Virus,HIV)流行率,并分析MSM的HIV感染状况及相关危险因素;采用不同机器学习算法建立MSM的HIV感染风险预测模型;判断模型的预测能力,找出最优预测模型。
方法:2021~2022年采用同伴推动抽样法在新疆某市招募MSM开展问卷调查,收集人口学信息和性行为情况,检测HIV和梅毒抗体;根据同性性角色分为主动组、被动接受组、两者兼有组,分析不同性角色的MSM的性行为特征及HIV感染情况,采用6种机器学习算法:K-近邻算法(k-Nearest Neighbors,k-NN)、极致梯度提升(e Xtreme Gradient Boosting,XGBoost)、随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)、多层感知机(Multilayer Perceptron,MLP)、Logistic回归建立MSMHIV感染风险预测模型,根据模型性能的评价指标ROC曲线下面积(AUC)、灵敏度、特异度和准确度判别最优模型。
结果:1、采用RDS从2021年10月-2022年12月招募MSM703人,本次调查共选取种子30人,年龄从20~52岁不等;18名种子招募满5人;人数最多的招募链为82人、13名种子的招募人数小于15人;相关变量分别在4至7轮达到平衡。2、MSM人群特征:调查对象平均年龄为28.70±8.09岁,45.95%集中在25~35岁,73.57%为未婚,53.60%文化程度在大专及以上,47.60%通过网络途径招募,57.36%近6个月性伴类型其中既有固定性伴又有临时性伴,63.36%的人近6个月同性性伴数≥5人。梅毒感染率为6.01%,HIV感染率为8.26%,90.99%的人最近一年做过HIV检测;艾滋病防治相关知识总体知晓率为84.53%;3组MSM在年龄、招募途径首次性伴性别、性倾向、首次男男性行为年龄、与临时性伴安全套使用情况、参加志愿者小组活动情况和HIV感染率近5年性行为、与妻子安全套使用情况、担心自己感染、最近一年做过检测、知晓检测结果上的差异的有统计学意义(P<0.05);MSM人群HIV感染的相关危险因素分析:多因素logistic回归分析结果显示,户籍、招募途径、性角色、近6个月同性性伴人数、商业性行为和梅毒感染是MSM人群HIV感染的相关危险因素;不同性角色中,主动组HIV感染风险低于两者兼有组,被动接受组HIV感染风险与两者兼有组相近。3、使用全部变量建模和使用拉索(Least absolute shrinkage and selection operator,Lasso)选择得到的变量建模两种方案,一共定义12个工作流。在验证集上,全部变量数据建模RF、SVM、k-NN、MLP、XGBoost和Logistic回归的AUC值分别为0.9916、0.9842、0.9570、0.9779、0.9822、0.9192;Lasso选择得到的变量数据建模RF、SVM、k-NN、MLP、XGBoost和Logistic回归的AUC值分别为0.9893、0.9842、0.9540、0.9778、0.9800、0.9441。RF在六种分类模型中的分类性能表现最好,灵敏度为0.9617,特异度为0.9562,准确度为0.9590,AUC值为0.9893。
结论:使用RDS调查获得了较为典型的MSM样本,结果显示新疆MSM群体存在较高的高危行为发生率和较低的艾滋病相关知识知晓率,未来艾滋病预防干预需要进一步加强对MSM的艾滋病相关知识普及、降低高危行为发生率以及减少性伴的健康教育;MSM人群首次性行为年轻化趋势明显,被动接受组平均年龄小,提示应注重在校青少年的宣传干预教育,把防控关口前移,同时不断加强被动组的干预检测工作,提高其风险意识;不同性角色MSM人群的行为特征和HIV感染风险存在差异,主动组HIV感染风险低于被动接受组和两者兼有组,应分类施策,减少HIV在该人群中的传播;机器学习算法有效地提高了MSM人群中HIV感染的预测效能,RF模型为识别MSM人群中HIV感染者并为其提供咨询与治疗提供了帮助,有助于合理分配医疗资源。MSM人群应当注意采用安全措施、提高预防HIV感染的风险意识,减少患病的可能性。