一种多模态数据驱动的社会工作领域建模优化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态数据驱动的社会工作领域建模优化方法
申请号:CN202510424096
申请日期:2025-04-07
公开号:CN119939482B
公开日期:2025-06-20
类型:发明专利
摘要
本发明涉及一种多模态数据驱动的社会工作领域建模优化方法,属于数据处理领域,优化方法包括:构建社会工作多模态数据,并进行数据预处理后将文本转换为嵌入向量;采用流行度偏差正则化处理器通处理社会工作领域的数据输入;动态选择降维维度,并采用UMAP算法将BERT嵌入空间中的向量降维;将文档聚类到相似的嵌入组中,通过计算数据点之间的密度关系形成层次化的聚类结构,并通过密度阈值划分最终的簇;计算每个词在主题集群中的词频和该词在整个语料库中的逆文档频率,并计算语义相似度来重新分配离群点。本发明优化BERTopic模型的多模态兼容性,支持从不同数据来源提取并融合主题信息,增强社会议题的分析深度。
技术关键词
多模态 轮廓系数 相关性搜索方法 离群点 数据 融合主题信息 文本 优化器 社会学 矩阵 主题关键词 动态 密度 术语 语义 频率 集群 生成树