智能工艺规划深度研究报告

从二维图纸/三维数模自动生成工艺文件及审核排错

生成日期：2026-05-05（第二次深度研究更新）

1. 概述

根据二维图纸（DWG/DXF）或三维数模（STEP/IGES）自动生成工艺文件，以及对现有工艺图纸进行审核排错，是智能制造的核心场景之一。传统 CAPP（计算机辅助工艺规划）长期依赖规则引擎和人工知识编码，近年深度学习、图神经网络和多模态大语言模型（VLM/LLM）的突破为该问题提供了全新路径。

2. 技术路线全景

路线 A：传统规则/CAPP（知识工程驱动）

原理：通过工艺知识库（加工方法库、机床库、刀具库）和推理引擎，将零件特征映射为工艺方案。

派生式 CAPP：基于成组技术，按零件族检索标准工艺并修改。代表：开目 CAPP、CAXA 工艺。
生成式 CAPP：自动推理工艺路线，依赖完整的规则库。

优势：规则可解释、与行业标准高度一致。局限：知识获取困难、覆盖不全、扩展性差。

路线 B：深度学习特征识别 → 工艺推理

原理：使用 CNN/ViT/GNN 自动识别图纸或 3D 模型中的加工特征，再基于特征推理工艺。

2D 图纸：YOLOv11-obb 检测标注区域 → VLM（Florence-2/Donut）解析结构化内容
3D 模型：BRepNet/UV-Net/BRepFormer 识别加工特征 → GNN 预测加工工艺

路线 C：多模态 LLM 端到端生成

原理：VLM 理解图纸图像 → LLM 推理工艺方案 → 生成工艺文档。结合 RAG 技术注入行业知识。

优势：通用性强、可处理自然语言交互、快速迭代。局限：需要领域微调、推理精度受限、成本较高。

路线 D：混合方案（推荐）

确定性规则引擎 + AI 特征识别 + LLM 推理 + RAG 知识库，是当前最可行的落地架构。

3. 二维图纸智能理解

3.1 技术方案：混合 VLM 管道

BLUEPRINT 系统（arXiv:2602.13345，2025）

当前最先进的工程图纸检索系统，提出布局感知多模态检索框架：

零样本文档/图纸分类（CLIP + 启发式，准确率 93-95%）
YOLOv8-S 区域检测（标题栏、零件清单、修订表等）
VLM 模型 OCR 提取结构化信息
标识符归一化（图号、版本号、设施代码）
混合稀疏+稠密检索（BM25 + ANN）与区域感知重排

在 375 条查询的基准测试中，nDCG@3 达到 0.626，Succ@3 达到 0.715，全面超越 LLaVA、Pixtral、PaLI-Gemma 等通用大 VLM。

来源：BLUEPRINT - Multimodal Retrieval for Engineering Drawings

多阶段混合框架（Khan et al., 2025, arXiv:2510.21862）

被 ICIEA 2026 接收的完整工程图纸自动解释系统：

空间分解：分离标题栏与视图区
内容分解：分离符号（目标检测）与文本（OCR）
方向归一化：旋转文本校正后再读取
OBB 检测识别 PMI（产品制造信息）块
Florence-2 / Donut 微调版本进行结构化信息提取

来源：Multi-Stage Hybrid Framework for Engineering Drawings

3.2 GD&T 自动提取

Florence-2 微调方案（arXiv:2411.03707）

在 400 张工程图纸上全参数微调 Florence-2（0.23B 参数），与 GPT-4o/Claude-3.5-Sonnet 零样本推理对比：

指标	GPT-4o (零样本)	Claude-3.5 (零样本)	Florence-2 (微调)
Precision	较高但 Recall 低	中等	全面超越
幻觉率	中等	最高（55.99%）	降低 43.15%
F1-Score	受限于 P-R 权衡	同左	最高

结论：小模型（0.23B）+ 领域微调在工程图纸场景下显著优于大模型零样本推理。

来源：Fine-Tuning VLM for GD&T Extraction

3.3 OCR 工具选型对比

工具	架构	图纸场景表现	适用场景	License
PaddleOCR 3.0	PP-OCRv5 + PP-StructureV3 + PaddleOCR-VL-1.5	中英文混合识别优秀，表格分析强	标题栏/明细表/结构化文档	Apache 2.0
Tesseract	LSTM（传统ML）	工程图纸非标准字体表现弱	常规文档 OCR	Apache 2.0
Florence-2 VLM	统一视觉-语言 Seq2Seq	OCR-free 端到端解析，微调后精度最高	标注语义理解/GD&T 提取	MIT

2025-2026 新趋势：OCR 正在 VLM 化。dots.ocr-3B、PaddleOCR-VL-0.9B、DeepSeek-OCR-3B、OlmOCR-2-7B 等新一代模型在 OmniDocBench 上达到 75-83% 准确率。

来源：PaddleOCR 3.0 Technical Report · Best OCR Tools 2026

3.4 2D 标注到 3D 特征映射

LLM 辅助的上下文感知映射（arXiv:2602.18296）

提出 确定性优先 + VLM 升级 的混合框架：

VLM 将图纸标注语义化（类型、数值、修饰符）
确定性评分器：类型一致性 + 维度一致性 + 上下文感知路由
低置信度时升级到 GPT-4o 多模态推理
最终人工审核（HITL）

20 对 CAD-图纸组合实验：Precision 83.67%、Recall 90.46%、F1 86.29%。

来源：Context-Aware 2D-3D Mapping

3.5 图纸布局检测

标题栏检测：Gann et al. (2025) 提出 FasterRCNN + GPT-4o 联合管道（arXiv:2504.08645）
GD&T 符号检测：Reddy et al. (2025) 对比 YOLOv11 vs Faster R-CNN vs RetinaNet，YOLOv11 达最佳精度-速度平衡（Springer JIM）
DBAL-YOLO (2026)：改进 YOLOv11n 架构，工程图纸结构检测精度 98.8%

4. 三维模型特征识别

4.1 BRep 表示与图神经网络

三维 CAD 模型的标准表示是 BRep（边界表示），天然适合用图结构建模（节点=面，边=拓扑邻接）。

4.2 主流模型对比

模型	年份	核心架构	MFCAD 精度	MFInstSeg Acc	参数量	来源
CADNet	2020	AAG + GNN	99.95%	–	0.53M	IDETC 2020
UV-Net	2021	UV-Grid CNN + GCN	99.95%	–	1.23M	arXiv:2006.10211
BRepNet	2021	Topological Walks	99.9%	–	1.8M	CVPR 2021
Hier. CADNet	2022	层次化 GCN	99.90%	–	6.6M	CAD 147:103226
BRepGAT	2023	图注意力网络	–	–	–	JCDE 10:2384
AAGNet	2024	多任务 GNN	99.15%	99.56%	–	RCIM 86:102661
BrepMFR	2024	Transformer + GAT + 域适应	99.99%	–	–	CAGD 111:102318
BRepFormer	2025	纯 Transformer	–	99.62%	–	arXiv:2504.07378
BRT	2025	Transformer + Bezier 嵌入	优于 UV-Net/BRepNet	–	–	arXiv:2504.07134
FeatureFox	2026	Panoptic Graph Segmentation	–	–	–	arXiv:2604.26770

4.3 模型输入表示方式对比

表示方式	精度损失	适用模型	特点
BRep 直接输入	无	BRepNet, UV-Net, AAGNet, BRepFormer	保留原始拓扑，工业标准格式
UV-Grid	极低	UV-Net	参数域规则采样，兼顾几何与拓扑
点云	中等	PointNet++, DGCNN	MFCAD 上仅 ~91%，远低于 BRep 方法
体素	高	3D-CNN	分辨率受限，显存占用大
网格	中等	MeshCNN	三角面片近似，MFCAD 99.89%

4.4 STEP 文件解析技术栈

STEP 文件 (ISO 10303 AP203/214/242)
  ↓
OpenCascade (C++) / pythonOCC (Python) / OCP / CadQuery
  ↓
BRep 拓扑树：Shape → Compound → Solid → Shell → Face → Wire → Edge → Vertex
  ↓
每个几何元素附带精确数学描述（NURBS曲线/曲面、平面、圆柱面等）
  ↓
输入 GNN/Transformer 模型进行特征识别

关键 API：TopExp_Explorer 遍历拓扑，BRepAdaptor_Surface 获取面参数，BRep_Tool 提取几何。

来源：pythonOCC GitHub

4.5 数据集演进

数据集	年份	模型数	特征类型	核心创新
MFCAD	2020	15,488	16 种	首个 BRep 特征识别数据集
MFCAD++	2022	59,665	24 种	大量特征交叉重叠
MFInstSeg	2024	62,495	24 种	实例级标注
MFTRCAD	2024	28,661	26 种	含拓扑关系标注
CBF	2025	20,000	多种	面向复杂几何的工业级挑战
CADSynth	2024	100,000	多种	大规模合成，支持域适应

4.6 特征交互与分解

实际零件加工特征交叉重叠是 NP-hard 问题，当前方法演进：

语义分割（BRepNet/UV-Net）：面级分类，无法区分同类型不同实例
实例分割（AAGNet 2024）：均值漂移聚类分离特征实例
全景图分割（FeatureFox 2026）：二值边缘边界模型 + 连通分量恢复
域适应（BrepMFR）：合成数据训练→真实数据测试，准确率从 81.50% → 92.74%

5. LLM/VLM 驱动的工艺生成

5.1 MechRAG 系统（Nature Communications Engineering, 2025）

架构：CLIP 多模态嵌入 + RAG 检索 + LLM 生成（GPT-4V）
能力：制造方法识别（80.78% 基准准确率，增强后进一步提升）、成本评估、独特性分析
创新：将 CAE 仿真数据与 CAD 几何数据联合嵌入共享向量空间

来源：MechRAG - Nature Communications Engineering

5.2 Text-to-CAD → CAD-to-Process

CADSmith（arXiv:2603.26512）多 Agent 管道

Agent	职责
Planner	自然语言 → 结构化设计规范
Coder	RAG 检索 API 文档生成 CadQuery 代码
Executor	沙箱中执行代码
Validator	OpenCASCADE 内核检查 + VLM Judge
Refiner	接收反馈生成修正代码

性能：100% 执行成功率，Chamfer Distance 降低 38 倍，复杂零件中位 F1 = 0.886。

来源：CADSmith

关联工作：GenCAD（MIT, 2025）从图像生成参数化 CAD 命令序列；Text2CAD（NeurIPS 2024 Spotlight）170K 模型 + 660K 文本标注的大规模基准。

5.3 RAG 工艺知识库架构

企业工艺知识库（历史工艺卡、GB/JB标准、切削参数手册）
  ↓
文档分块 + 向量化（CLIP/Titan embedding）+ 知识图谱（GraphRAG/RDF）
  ↓
三层检索：向量检索 + 图谱检索 + 去重重排序
  ↓
LLM 生成：工艺路线 + 工序参数 + 工时定额
  ↓
结构化输出：工艺路线卡/工序卡/检验卡

Document GraphRAG（MDPI Electronics, 2025）：三层检索策略集成，使用 GraphDB + Chroma 向量数据库，在制造领域文档问答中表现优异。

Microsoft GraphRAG：Leiden 层次化聚类 + 社区摘要，答案精度提升最高 35%。

来源：Document GraphRAG · Microsoft GraphRAG

5.4 CAPP 系统演进

阶段	特征	代表技术
第一代	派生式 CAPP (Variant)	基于零件族编码检索标准工艺
第二代	创成式 CAPP (Generative)	规则引擎 + 决策树
第三代	AI 增强型 CAPP	机器学习 + 知识图谱 + 优化算法
第四代 (新兴)	LLM 驱动型 CAPP	大语言模型 + RAG + 多智能体协作

来源：Natural language-driven production planning

6. 图纸审核与错误检测

6.1 审核维度

审核类型	检测内容	技术方案
GD&T 合规性	符号语法、基准引用、修饰符正确性	VLM 检测 + 规则引擎校验
尺寸完整性	缺尺寸、冗余尺寸、过约束	尺寸链分析 + 优化求解器
公差合理性	公差与加工工艺不匹配、累积超差	RSS/Worst Case/Monte Carlo 分析
标注规范性	表面粗糙度/焊接符号是否符合 GB/T	YOLO 目标检测 + 规则检查
2D-3D 一致性	2D 图纸与 3D 模型是否矛盾	2D-3D 特征映射 + 尺寸对比

6.2 商业工具链

工具	厂商	核心能力
CoLab AutoReview	CoLab Software	AI 图纸审查，GD&T 语法/语义检查，跨图纸一致性，DFM 分析
EVOLVE Design	OGP/IIGDT	GD&T 验证引擎，内嵌 ASME Y14.5/ISO 1101 标准引用
RD8	RD8 Tech	自动公差路径检测，RSS/Worst Case/Monte Carlo 秒级计算
SOLIDWORKS Inspection	Dassault	OCR 读取图纸标注 → FAI 首件检验，节省 90% 时间
MBDVidia	Capvidia	MBD CAD 翻译，语义 PMI 验证，100% 自动化 FAI 工作流
Autodesk Tolerance Analysis	Autodesk	最坏情况/RSS/统计分析，输出 Cpk/Σ/DPMO
Sigmetrix Cetol 6σ	Sigmetrix	全面三维模型基公差分析 + GD&T Advisor
High QA IM/360	High QA	3D MBD 集成，自动 GD&T/PMI 提取，APQP/AS9100 合规
Dessia 2D Checker	Dessia	AI 驱动跨图纸一致性验证，声称减少 90% 验证时间
PTC Creo ModelCHECK	PTC	模型和图纸可配置检查，建模最佳实践验证

来源：CoLab AutoReview · RD8 · EVOLVE Design · MBDVidia

6.3 AI 审核前沿

YOLOv11 符号检测（Springer JIM, 2025）：YOLOv11 vs Faster R-CNN vs RetinaNet，YOLOv11 精度-速度最优
混合深度学习 (2025)：GD&T 符号检测达 94.8% 精度，97.3% F1
DBAL-YOLO (2026)：改进 YOLOv11n + Dynamic Snake Conv + BiFPN，工程图纸结构检测 98.8%
BLUEPRINT（arXiv:2602.13345）：布局感知多模态检索框架
Foundation EGI：DSL 框架自动化 GD&T 生成，仅需数十个样本
VizCad AI：Grad-CAM + GNN 可解释 AI，高亮触发警报的面或边

来源：DBAL-YOLO · Foundation EGI · VizCad AI

7. 工具链与开源生态

7.1 二维图纸解析

工具	语言	功能	License
ezdxf	Python	DXF R12-R2018 全版本读写，EntityQuery DSL	MIT
ODA SDK	C++/C#/Java	DWG 读写，高性能，完整实体访问	商业（会员制）
LibreDWG	C	GNU DWG 库，支持 R13-R2018	GPL-3.0

7.2 三维模型处理

工具	语言	功能	License
pythonOCC	Python	OpenCascade Python 绑定，完整 OCCT API	LGPL-2.1
FreeCAD API	Python/C++	参数化建模 + Path 工作台 CAM 能力	LGPL-2.1
ocp-freecad-cam	Python	CadQuery/Build123d → FreeCAD 参数化刀具路径	Apache 2.0
cadunpack	Python	STEP 装配体遍历 + 钣金展开 + DXF 输出	MIT
trimesh	Python	STL/OBJ/GLTF 网格处理	BSD-3

7.3 AI 模型与框架

工具	用途	最新进展
PaddleOCR 3.0	图纸 OCR	PP-OCRv5 精度提升 13%，PaddleOCR-VL-1.5（109 语言）
Florence-2	图纸标注检测+解析	0.23B VLM，微调后超越 GPT-4o/Claude
Donut	OCR-free 文档理解	端到端文档理解，表格/表单提取
YOLOv11-obb	方向边界框标注检测	OBB 检测，工程图纸符号精度 98.8%
vLLM	VLM 推理部署	高吞吐服务引擎

7.4 CAPP/工艺规划开源框架

项目	功能	License
SAMPO	自适应制造调度（遗传+多Agent算法）	BSD-3
PyCAALP	装配序列+产线规划（MIP优化）	MIT
CaSkade-Planner	基于能力的工艺规划（SMT求解）	MIT
FreeCAD-APLAN	FreeCAD 装配序列规划插件	LGPL-2.1

7.5 STEP-NC 标准

ISO 14649（STEP-NC） 是 CAD/CAM/CNC 之间的高层数据交换标准：

基于特征的面向对象方法，描述”要加工什么”而非”刀具怎么动”
ISO 14649-10（通用过程数据）、ISO 14649-11（铣削）、ISO 14649-12（车削）
支持双向数据流：CAD→CAM 和 CNC→CAM 闭环优化
近期已扩展至增材制造领域

来源：STEP-NC 扩展至增材制造

8. 落地案例与市场格局

8.1 商业 CAPP 系统对比

系统	厂商	核心能力	2025-2026 动态
Teamcenter MPP / Easy Plan	Siemens	3D工艺规划+MBD工艺标注	2026年推出轻量化 Web 方案 Easy Plan
DELMIA	Dassault	数字化制造+工艺仿真	3DEXPERIENCE 云平台持续扩展
Windchill MPMLink	PTC	MBD工艺+BOM管理	2025年汉诺威发布 Windchill AI 助手
开目 CAPP	开目软件	二维/三维工艺规划+知识库	2025年3月发布 AI 智能体 “小沐”
CAXA 工艺	数码大方	工艺卡片模板定制	CAXA CAPP 3D 工艺深度融合
华天 InforCenter	华天软件	PLM+工艺设计管理	CrownCAD 云 CAD + 三维机加大师

开目 AI 智能体”小沐”：深度融合 AI 与工业场景，基于工艺领域大模型实现 AI 赋能的三维工艺设计、完整工艺数据自动生成。在航空、航天、航发等行业高端客户占有率领先。

8.2 中国市场实践

海智在线（工业零部件数字化平台）

覆盖 80 万+工厂，全球 30 万+专业人士
AI 以图搜图：上传 CAD 文件，24 小时内获得多个工厂报价
AI 报价引擎：结合设备参数/材料库/工艺模块
2025 年获第七届工业互联网大赛全国总决赛二等奖

上汽通用（机械加工工艺智能开发）

基于 MBD + 智能算法的四阶段工艺开发流程
产品信息识别 → 智能工艺推理 → 工艺路线编排 → 文件自动生成
成效：规划周期缩短 75%，人工工时缩短 85.8%，数据一致性 100%
独创：自动定位无解原因的”自动找错”技术（已获专利）

宁波”4M”路径（2025年度制造业数字化转型典型案例）

Method：龙头企业+服务商联合开发行业 AI 模型
Model：“1+N+X” 工业互联网平台体系
Machine：攻关高端数控系统/智能传感
Man：甬江人才工程，数字经济人才 14.2 万
2026-2028 新行动方案：100 个标志性场景项目、20 个工业垂类大模型

其他典型

方天软件”方小智”：AI 全自动生成加工工艺与标准工时，工艺设计人力成本降低 72%
中信戴卡：AI 驱动”灯塔工厂”再升级，制造垂直大模型实现工艺调优/质量管控
中控技术 TPT：时序大模型 + UCS 通用控制系统，兰州石化年效益超 2000 万元

8.3 政策驱动

工信部《“人工智能+制造”专项行动实施意见》（2025.12）：到 2027 年推广 500 个典型应用场景，选树 1000 家标杆企业
国务院《关于深入实施”人工智能+“行动的意见》：加快 AI 在设计、中试、生产、服务全环节落地
工业软件设备更新：2026 年第二批 915 亿元”两新”设备更新资金已下达
《智能制造典型场景参考指引(2025年版)》：“工艺数字化设计”场景明确要求”应用 AI 技术实现工序排布和工艺指令自动生成”

8.4 市场规模

中国 PLM 市场：2021 年 22.06 亿元，预计 2026 年达 53.87 亿元（CAGR 20.72%）
中国 CAPP 市场：2018-2022 年复合增速 14%，预计 2027 年达到 36 亿元

9. 实施建议与路径

9.1 技术选型矩阵

场景	推荐方案	技术栈
2D图纸→结构化信息	VLM 管道	YOLOv11-obb + Florence-2/Donut 微调
3D模型→加工特征	GNN/Transformer 特征识别	pythonOCC + BRepNet/UV-Net/BRepFormer
工艺文件生成	RAG + LLM	GraphRAG + GPT-4o/Claude + 工艺知识库
图纸审核排错	规则引擎 + VLM	确定性规则 + VLM 检测 + RD8/EVOLVE/CoLab

9.2 分阶段实施路径

Phase 1（3-6个月）：2D 图纸结构化

部署 YOLOv11-obb + Florence-2 管道
标注 500-1000 张企业图纸微调模型
输出结构化 JSON（GD&T、尺寸、材料等）

Phase 2（6-9个月）：工艺推理引擎

构建企业工艺知识图谱
部署 Document GraphRAG 系统
LLM 基于特征信息生成工艺方案

Phase 3（9-12个月）：3D 特征识别

pythonOCC 解析 STEP 文件
BRepFormer/BRT 识别加工特征（精度 99.62%+）
与 Phase 2 工艺引擎对接

Phase 4（12个月+）：审核排错闭环

规则引擎校验 GD&T + 公差
2D-3D 一致性检查
人机协同（HITL）审核流

10. 关键挑战

数据集匮乏：高质量带标注 CAD/工艺数据集稀缺，公开数据集（MFCAD++ 59K、CADSynth 100K）规模有限
域偏移：合成数据训练的模型在真实 CAD 上性能显著下降（99.99% → 81.50%），域适应是关键
特征交互：实际零件加工特征交叉重叠，分解为独立加工操作是 NP-hard 问题
知识形式化：加工经验（如”深孔需分次钻削”）难以用规则完全覆盖
DWG 格式壁垒：Autodesk 私有格式，依赖 ODA SDK（商业授权）
端到端集成：多模块（解析→识别→推理→生成）接口标准化复杂
幻觉问题：LLM 零样本推理在 GD&T 提取中幻觉率高达 55.99%，需微调或混合架构

11. 技术成熟度评估

技术方向	成熟度	关键瓶颈
多模态 RAG 工艺检索	中高	图像检索精度仍需改进
Text-to-CAD 生成	中	复杂多体装配仍困难
GD&T 符号检测	高	YOLOv11/Florence-2 已达 >94% 精度
3D 加工特征识别	高	BRepFormer 99.62%，BrepMFR 99.99%
图纸完整性审查	中高	AI 审查工具快速发展
LLM 驱动 CAPP	低中	长链约束推理仍弱，需混合架构

参考文献索引

学术论文

Khan et al. (2025). BLUEPRINT: Rebuilding a Legacy: Multimodal Retrieval for Complex Engineering Repositories. arXiv:2602.13345 · https://arxiv.org/abs/2602.13345
Khan et al. (2024). Fine-Tuning VLM for Automated Engineering Drawing Information Extraction. arXiv:2411.03707 · https://arxiv.org/abs/2411.03707
Khan et al. (2025). Multi-Stage Hybrid Framework for Automated Interpretation of Multi-View Engineering Drawings. arXiv:2510.21862 · https://arxiv.org/abs/2510.21862
Khan et al. (2026). Context-Aware Mapping of 2D Drawing Annotations to 3D CAD Features Using LLM-Assisted Reasoning. arXiv:2602.18296 · https://arxiv.org/abs/2602.18296
CADSmith (2026). A Multi-Agent Pipeline for Text-to-CAD Generation. arXiv:2603.26512 · https://arxiv.org/abs/2603.26512
BRepFormer (2025). Transformer-Based B-rep Geometric Feature Recognition. arXiv:2504.07378 · https://arxiv.org/abs/2504.07378
BRT (2025). Bringing Attention to CAD: Boundary Representation Learning via Transformer. arXiv:2504.07134 · https://arxiv.org/abs/2504.07134
FeatureFox (2026). Sample-Efficient Panoptic Graph Segmentation for Machining Feature Recognition. arXiv:2604.26770 · https://arxiv.org/abs/2604.26770
MechRAG (2025). A multimodal large language model for mechanical engineering. Nature Communications Engineering · https://www.nature.com/articles/s44172-025-00517-z
Lambourne et al. (2021). BRepNet: A Topological Message Passing System for Solid Models. CVPR 2021 · https://github.com/autodeskailab/BRepNet
Jayaraman et al. (2021). UV-Net: Learning from Boundary Representations. CVPR 2021 · https://arxiv.org/abs/2006.10211
Colligan et al. (2022). Hierarchical CADNet: Learning from B-Reps for Machining Feature Recognition. Computer-Aided Design 147 · https://doi.org/10.1016/j.cad.2022.103226
Wu et al. (2024). AAGNet: Multi-task Machining Feature Recognition. RCIM 86 · https://doi.org/10.1016/j.rcim.2023.102661
Zhang et al. (2024). BrepMFR: Enhancing MFR through Deep Learning and Domain Adaptation. CAGD 111 · https://doi.org/10.1016/j.cagd.2024.102318
Reddy et al. (2025). Intelligent GD&T Symbol Detection in Mechanical Drawings. J. Intelligent Manufacturing · https://link.springer.com/article/10.1007/s10845-025-02669-3
Gann et al. (2025). Title Block Detection and Information Extraction for Building Engineering Drawings. arXiv:2504.08645 · https://arxiv.org/abs/2504.08645
Document GraphRAG (2025). Knowledge Graph Enhanced RAG for Manufacturing. MDPI Electronics · https://www.mdpi.com/2079-9292/14/11/2102
PaddleOCR 3.0 Technical Report (2025). arXiv:2507.05595 · https://arxiv.org/abs/2507.05595
Natural language-driven production planning (2025). Springer · https://link.springer.com/article/10.1007/s10845-025-02732-z
STEP-NC extension to additive manufacturing (2025). Springer · https://link.springer.com/article/10.1007/s00170-025-15290-8
Florence-VL (2025). Enhancing VLMs with Generative Vision Encoder. CVPR 2025 · https://openaccess.thecvf.com/content/CVPR2025/html/Chen_Florence-VL
Generative AI meets CAD (2025). Int J Adv Manuf Technol · https://link.springer.com/article/10.1007/s00170-025-15830-2

开源工具

ezdxf — Python DXF library: https://github.com/mozman/ezdxf
pythonOCC — OpenCascade Python binding: https://github.com/tpaviot/pythonocc-core
ocp-freecad-cam — FreeCAD CAM via CadQuery: https://github.com/voneiden/ocp-freecad-cam
PaddleOCR 3.0 — OCR toolkit: https://github.com/PaddlePaddle/PaddleOCR
Florence-2 — Unified Vision Foundation Model: https://github.com/microsoft/Florence
SAMPO — Adaptive manufacturing scheduling: https://github.com/aimclub/SAMPO
AAGNet — Multi-task machining feature recognition: https://github.com/whjdark/AAGNet
BrepMFR — MFR with domain adaptation: https://github.com/zhangshuming0668/BrepMFR
BRepNet — Topological message passing: https://github.com/autodeskailab/BRepNet
UV-Net — Learning from BRep: https://github.com/autodeskailab/UV-Net
Hierarchical CADNet: https://gitlab.com/qub_femg/machine-learning/hierarchical-cadnet
FreeCAD-APLAN — Assembly planning: https://github.com/martcram/FreeCAD-APLAN
Open CASCADE Technology: https://dev.opencascade.org/
trimesh — Mesh processing: https://github.com/mikedh/trimesh
Microsoft GraphRAG: https://microsoft.github.io/graphrag/

商业软件

Siemens Teamcenter MPP / Easy Plan: https://plm.sw.siemens.com/en-US/teamcenter/
Dassault DELMIA: https://www.3ds.com/products-services/delmia/
PTC Windchill MPMLink: https://www.ptc.com/en/products/windchill/mpmlink
开目 CAPP: https://www.kmsoft.com.cn/
CAXA 工艺: https://cad.caxa.com/pc/functionCapp3d
华天软件: https://www.hoteamsoft.com/capp
CoLab AutoReview: https://www.colabsoftware.com/product/autoreview
EVOLVE Design (OGP/IIGDT): https://www.ogpnet.com/products/software/evolve-software/evolve-design/
RD8 Tolerance Analysis: https://www.rd8.tech/software
MBDVidia (Capvidia): https://www.capvidia.com/products/mbdvidia
SOLIDWORKS Inspection: https://www.solidworks.com/product/solidworks-inspection
Sigmetrix Cetol 6σ: https://www.sigmetrix.com
High QA IM/360: https://www.highqa.com/3d-mbd-integration/
Dessia 2D Checker: https://www.dessia.io/blog/ai-2d-drawing-verification
Foundation EGI: https://www.foundationegi.com/media/automating-gd-t-drawings
VizCad AI: https://viz-cad.com/blog/train-ai-automate-cad-tolerance-review
ODA SDK: https://www.opendesign.com/

标准与规范

ISO 10303 (STEP) — Product data representation and exchange
ISO 14649 (STEP-NC) — Data model for CNC controllers
ASME Y14.5 — GD&T standard
ISO 1101 — Geometric tolerancing standard

中国政策与行业报告

工信部《“人工智能+制造”专项行动实施意见》, 2025.12 (工信部联科〔2025〕279号)
国务院《关于深入实施”人工智能+“行动的意见》, 2025
《智能制造典型场景参考指引(2025年版)》
宁波市《2025年度制造业数字化转型典型案例集》, 中国信通院
中国 PLM 市场研究: https://pdf.dfcfw.com/pdf/H3_AP202211281580628638_1.pdf

报告基于公开学术资源、技术文档和产品资料整理，使用 Jina MCP、Tavily、Exa 等搜索服务进行多轮深度检索。具体商业软件功能以厂商最新发布为准。

第二次深度研究更新日期：2026-05-05