一种融合图像、文本与BIM模态的施工场景预测方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种融合图像、文本与BIM模态的施工场景预测方法及装置
申请号:CN202510846123
申请日期:2025-06-24
公开号:CN120411789B
公开日期:2025-09-23
类型:发明专利
摘要
本发明提供的一种融合图像、文本与BIM模态的施工场景预测方法及装置,涉及智慧施工预测管理技术领域。本发明通过提取BIM模型的BIM语义信息构建BIM语义图,结合YOLO模型进行施工现场视频的目标检测识别,得到目标检测结果;并与CLIP跨模态对齐实现图像、文本与BIM的多模态数据深度融合,得到多模态异构图;将多模态异构图输入时空序列模型进行预测,输出未来若干时刻施工场景的预测结果,并动态映射至数字孪生平台,实现风险预警与可视化展示。本申请能够实时捕捉施工动态变化,精准预测施工进度与风险,提升施工管理智能化水平。
技术关键词
场景预测方法 语义向量 三维建筑模型 文本 图像 YOLO模型 多模态 表达式 数字孪生 异构 施工现场 碰撞检测算法 采样点 节点特征 坐标 矩阵 面片