四川网站备案咨询网建个注册页面网站

张小明 2026/1/8 4:51:00
四川网站备案咨询网,建个注册页面网站,建设局网站施工合同范本,wordpress评论置顶在机器人操作、数字孪生等工业智能化场景中#xff0c;精确的3D场景理解是核心技术基础。尤其在工厂环境中#xff0c;零部件布局密集、尺度差异大、遮挡严重#xff0c;传统分割方法往难以同时保证实例分割与部件级分割的精度。针对这一难题#xff0c;《Hierarchical Ima…在机器人操作、数字孪生等工业智能化场景中精确的3D场景理解是核心技术基础。尤其在工厂环境中零部件布局密集、尺度差异大、遮挡严重传统分割方法往难以同时保证实例分割与部件级分割的精度。针对这一难题《Hierarchical Image-Guided 3D Point Cloud Segmentation in Industrial Scenes via Multi-View Bayesian Fusion》提出了一种分层图像引导的3D点云分割框架融合YOLO-World检测、SAM分割与多视角贝叶斯融合策略在减少人工标注依赖的同时显著提升了工业场景下的分割鲁棒性与准确性。论文链接https://arxiv.org/pdf/2512.06882一、工业3D分割面临的核心挑战工业场景的3D点云分割长期受以下问题制约严重遮挡与边界模糊产线设备往往紧密排列遮挡导致物体几何边界不完整基于纯点云的方法易出现分割断裂或粘连。多尺度物体并存场景中同时存在机械臂、传送带等大物体与螺丝、接头等小部件端到端模型难以兼顾粗粒度与细粒度特征。标注成本高昂点云逐点标注费时费力且目前缺乏公开的工业部件级3D分割数据集。2D-3D投影不一致单纯依靠单视角2D分割投影到3D时易因视角变化导致语义不一致与边缘错位。二、相关工作直接3D点云分割传统方法使用分组方法但依赖于几何邻近性和手工启发式规则限制了对复杂场景的扩展性。近年来基于深度神经网络的分割方法广泛使用直接从无序点云中学习特征以预测语义标签。然而由于缺乏明确的拓扑和邻接结构这些模型难以捕捉稳定的局部几何信息因此需要密集的点级标注且在大规模杂乱场景中表现不佳。此外现有的标注3D数据集规模小标注精细3D模型工作量大目前尚无公开支持工业场景部件级分割的数据集。基于2D监督的图像引导3D分割为克服3D监督的限制一些方法将3D点云投影到2D图像并使用生成的掩码将2D语义转移到3D空间。SAM、YOLO-World、GLIP等视觉基础模型受益于大规模2D数据集和弱监督训练能以低成本实现高质量分割。然而SAM不提供类别标签YOLO-World和GLIP仅提供类别预测而无像素级掩码难以直接用于3D分割。将点云渲染为2D图像会引入遮挡和视角相关变化常导致跨视角边界和语义不一致。缺乏鲁棒融合策略的现有方法无法确保一致的3D分割。此外大多数基础模型训练于通用类别不能直接适应工厂场景现有2D图像数据集也缺乏工业环境覆盖。提出的制造场景3D点云分割方法我们提出一种由2D预测引导的两阶段分层分割框架逐步从粗实例到细粒度部件细化场景理解图2。框架始于自适应渲染根据物体尺寸和点密度使用尺度感知参数将3D点云投影为2D图像。在每个阶段YOLO-World检测物体并提供提示给SAM生成2D掩码再反投影到3D。实例级分割使用俯视图投影高效标记大物体部件级分割通过贝叶斯更新融合多视角掩码解决不一致性并在遮挡和视角变化下提高标签稳定性。自适应2D图像渲染与分割我们提出一种尺度自适应渲染策略基于物体几何和密度计算点半径。渲染后的2D图像使用YOLO-World和SAM两阶段方法进行分割YOLO-World检测物体实例或部件并生成类别感知边界框作为SAM的提示以生成高质量像素级掩码。这种提示驱动设计使SAM能在杂乱、遮挡和尺度变化下生成准确分割。通过2D掩码投影的3D点云分割获取各阶段准确2D掩码后我们将其几何和语义先验转移到3D空间。为适应两个阶段的不同目标我们设计了不同的投影方法实例级分割俯视图 使用轻量高效的基于2D掩码投影的策略快速对大规模密集点云进行粗实例分割。部件级分割多视角反投影 围绕每个实例点云采样多个视角在各视角上使用YOLO-WorldSAM生成部件级2D掩码并通过反投影和深度引导KD树匹配将其映射回3D点。多视角掩码一致性与贝叶斯更新融合为处理跨视角语义不一致我们通过贝叶斯更新递归融合每个点的多视角观测估计一致的类别分布。每个视角的观测被建模为软类别分布并引入几何感知置信度评分以增强在遮挡和噪声下的鲁棒性。最终通过选择置信度高于阈值的类别标签构建带标签的点集并通过DBSCAN聚类去除异常值进一步提升部件级分割准确性。三、实验与评估我们在真实工业场景和公开数据集上评估了系统性能。实验环境为Intel i9-13900HK CPU、NVIDIA RTX 4090 GPU、32GB RAM、Ubuntu 22.04。2D图像检测与分割评估我们在200张图像上微调实例级YOLO-World模型涵盖2类传输系统和机械臂在600张图像上训练部件级模型涵盖6类。实验表明我们的分层方法在部件级掩码精度上优于直接单阶段方法尤其在处理小结构和遮挡时表现更好。3D分割结果与评估通过消融实验验证贝叶斯融合在多视角投影中处理特征不一致和遮挡的有效性。实验显示直接投影会导致错误分割而贝叶斯融合能显著提升边界清晰度和部件识别准确性图5。定量评估也显示贝叶斯融合在各类别上的mIoU均有提升表2。全场景分割结果图6展示了整个工业环境的完整分割结果。实例级分割清晰分离了机械臂和传输系统部件级分割则准确标记了所有工站的组件展现了框架在复杂工业场景中的有效性。在公开数据集上的泛化评估我们在PartNet数据集上进行实验验证框架在通用3D场景中的泛化能力。通过组合多个物体构建复杂场景并使用GLIP作为检测模型无需微调我们的方法取得了与其他专门方法相近的部件分割精度表3。四、结论与未来工作我们提出了一种由2D检测-分割引导的分层3D分割框架通过YOLO-World提供标签与提示结合SAM实现从物体到部件的精确分割并利用贝叶斯融合解决跨视角一致性问题。在真实工厂数据和公开数据集上的实验验证了其在遮挡和杂乱环境下的鲁棒性。未来工作将考虑融入深度等多模态信息提升小部件和严重遮挡部件的分割能力并尝试在多视角一致性建模方面进行改进直接在2D分割层保证视角一致性减少后续融合步骤引入的误差。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

建立公司网站要多少钱目前做啥网站能致富

还有没有人不知道AI已经进化到这地步了?不用懂乐理、不用会乐器,输入几个关键词就能一键生成完整音乐!还能恶搞朋友,给他写一首专属音乐。今天就给大家分享4款免费AI写歌工具,看看有没有你感兴趣的。不用懂任何音乐知识…

张小明 2026/1/8 1:28:49 网站建设

网站开发哪种语言更安全安徽和县住房城乡建设局网站

第一章:MCP续证的时间限制Microsoft Certified Professional(MCP)认证作为IT从业者技术能力的重要凭证,其续证时间限制是每位持证者必须关注的核心问题。微软对多数MCP相关认证设定了明确的有效期,通常为两年。若未在有…

张小明 2026/1/8 1:13:18 网站建设

凡科做的网站能被收录吗wordpress.htaccess

反向旅游悄然兴起,12月冬季去旅行,不再是昔日热门景区里人挤人的景象,反而是转向「花费少一点、游玩更舒适一点」的温暖秘境,从避寒前往南边的小众小城,到那些各有风情的过冬好去处,这些目的地凭借合适的气…

张小明 2026/1/8 1:13:22 网站建设

网站基础知识域名5个点东莞哪里建设网站好

iOS自动化工具开发技术指南 【免费下载链接】WeChatRedEnvelopesHelper iOS版微信抢红包插件,支持后台抢红包 项目地址: https://gitcode.com/gh_mirrors/we/WeChatRedEnvelopesHelper 技术原理深度解析 iOS自动化工具开发基于系统级交互模拟技术,通过越狱开…

张小明 2026/1/7 7:40:58 网站建设

用dw做网站的步骤南昌网站设计怎么选

第一章:金融客服Agent情绪识别技术概述在金融服务领域,客户与客服代理(Agent)的交互质量直接影响用户满意度和品牌信任度。情绪识别技术通过分析语音、文本甚至视频信号,自动判断对话中客户的情绪状态,如愤…

张小明 2026/1/8 1:13:23 网站建设

物流官方网站威海seo

还在为电子书信息整理而烦恼吗?Calibre-Douban插件就是你的救星!这款基于网络技术的Calibre插件,能够智能获取豆瓣图书网站的完整书籍信息,让电子书库瞬间变得井井有条。📚 【免费下载链接】calibre-douban Calibre ne…

张小明 2026/1/8 8:47:15 网站建设