36 氪获悉,近日,国际顶级会议 ICCV 2025(计算机视觉国际大会)公布论文录用结果,格灵深瞳共有 6 篇论文入选,成果涉及视觉基座模型、人脸 3D 重建、文档几何校正、人体动作生成、鲁棒三维重建等多个视觉 AI 研究关键方向。在视觉基座模型方面,格灵深瞳与华为诺亚研究院合作的论文入选。该成果通过引入区域 Transformer 层和高效的区域聚类判别损失,有效提升视觉模型对局部区域信息的感知与表达能力,使其在 OCR、目标检测和分割等密集视觉任务中表现突出。
36氪
10分钟前