智能工艺规划深度研究报告
从二维图纸/三维数模自动生成工艺文件及审核排错
生成日期:2026-05-05(第二次深度研究更新)
1. 概述
根据二维图纸(DWG/DXF)或三维数模(STEP/IGES)自动生成工艺文件,以及对现有工艺图纸进行审核排错,是智能制造的核心场景之一。传统
CAPP(计算机辅助工艺规划)长期依赖规则引擎和人工知识编码,近年深度学习、图神经网络和多模态大语言模型(VLM/LLM)的突破为该问题提供了全新路径。
2. 技术路线全景
路线
A:传统规则/CAPP(知识工程驱动)
原理:通过工艺知识库(加工方法库、机床库、刀具库)和推理引擎,将零件特征映射为工艺方案。
- 派生式
CAPP:基于成组技术,按零件族检索标准工艺并修改。代表:开目
CAPP、CAXA 工艺。
- 生成式
CAPP:自动推理工艺路线,依赖完整的规则库。
优势:规则可解释、与行业标准高度一致。
局限:知识获取困难、覆盖不全、扩展性差。
路线 B:深度学习特征识别 →
工艺推理
原理:使用 CNN/ViT/GNN 自动识别图纸或 3D
模型中的加工特征,再基于特征推理工艺。
- 2D 图纸:YOLOv11-obb 检测标注区域 →
VLM(Florence-2/Donut)解析结构化内容
- 3D 模型:BRepNet/UV-Net/BRepFormer 识别加工特征 → GNN
预测加工工艺
路线 C:多模态 LLM 端到端生成
原理:VLM 理解图纸图像 → LLM 推理工艺方案 →
生成工艺文档。结合 RAG 技术注入行业知识。
优势:通用性强、可处理自然语言交互、快速迭代。
局限:需要领域微调、推理精度受限、成本较高。
路线 D:混合方案(推荐)
确定性规则引擎 + AI 特征识别 + LLM 推理 + RAG
知识库,是当前最可行的落地架构。
3. 二维图纸智能理解
3.1 技术方案:混合 VLM 管道
BLUEPRINT
系统(arXiv:2602.13345,2025)
当前最先进的工程图纸检索系统,提出布局感知多模态检索框架:
- 零样本文档/图纸分类(CLIP + 启发式,准确率 93-95%)
- YOLOv8-S
区域检测(标题栏、零件清单、修订表等)
- VLM 模型 OCR 提取结构化信息
- 标识符归一化(图号、版本号、设施代码)
- 混合稀疏+稠密检索(BM25 + ANN)与区域感知重排
在 375 条查询的基准测试中,nDCG@3 达到 0.626,Succ@3 达到
0.715,全面超越 LLaVA、Pixtral、PaLI-Gemma 等通用大
VLM。
来源:BLUEPRINT - Multimodal Retrieval
for Engineering Drawings
多阶段混合框架(Khan
et al., 2025, arXiv:2510.21862)
被 ICIEA 2026 接收的完整工程图纸自动解释系统:
- 空间分解:分离标题栏与视图区
- 内容分解:分离符号(目标检测)与文本(OCR)
- 方向归一化:旋转文本校正后再读取
- OBB 检测识别 PMI(产品制造信息)块
- Florence-2 / Donut 微调版本进行结构化信息提取
来源:Multi-Stage Hybrid Framework for
Engineering Drawings
3.2 GD&T 自动提取
Florence-2
微调方案(arXiv:2411.03707)
在 400 张工程图纸上全参数微调 Florence-2(0.23B 参数),与
GPT-4o/Claude-3.5-Sonnet 零样本推理对比:
| 指标 |
GPT-4o (零样本) |
Claude-3.5 (零样本) |
Florence-2 (微调) |
| Precision |
较高但 Recall 低 |
中等 |
全面超越 |
| 幻觉率 |
中等 |
最高(55.99%) |
降低 43.15% |
| F1-Score |
受限于 P-R 权衡 |
同左 |
最高 |
结论:小模型(0.23B)+ 领域微调
在工程图纸场景下显著优于大模型零样本推理。
来源:Fine-Tuning VLM for GD&T
Extraction
3.3 OCR 工具选型对比
| 工具 |
架构 |
图纸场景表现 |
适用场景 |
License |
| PaddleOCR 3.0 |
PP-OCRv5 + PP-StructureV3 + PaddleOCR-VL-1.5 |
中英文混合识别优秀,表格分析强 |
标题栏/明细表/结构化文档 |
Apache 2.0 |
| Tesseract |
LSTM(传统ML) |
工程图纸非标准字体表现弱 |
常规文档 OCR |
Apache 2.0 |
| Florence-2 VLM |
统一视觉-语言 Seq2Seq |
OCR-free 端到端解析,微调后精度最高 |
标注语义理解/GD&T 提取 |
MIT |
2025-2026 新趋势:OCR 正在 VLM
化。dots.ocr-3B、PaddleOCR-VL-0.9B、DeepSeek-OCR-3B、OlmOCR-2-7B
等新一代模型在 OmniDocBench 上达到 75-83% 准确率。
来源:PaddleOCR 3.0 Technical
Report · Best OCR
Tools 2026
3.4 2D 标注到 3D 特征映射
LLM
辅助的上下文感知映射(arXiv:2602.18296)
提出 确定性优先 + VLM 升级 的混合框架:
- VLM 将图纸标注语义化(类型、数值、修饰符)
- 确定性评分器:类型一致性 + 维度一致性 + 上下文感知路由
- 低置信度时升级到 GPT-4o 多模态推理
- 最终人工审核(HITL)
20 对 CAD-图纸组合实验:Precision 83.67%、Recall 90.46%、F1
86.29%。
来源:Context-Aware 2D-3D
Mapping
3.5 图纸布局检测
- 标题栏检测:Gann et al. (2025) 提出 FasterRCNN +
GPT-4o 联合管道(arXiv:2504.08645)
- GD&T 符号检测:Reddy et al. (2025) 对比 YOLOv11
vs Faster R-CNN vs RetinaNet,YOLOv11 达最佳精度-速度平衡(Springer
JIM)
- DBAL-YOLO (2026):改进 YOLOv11n
架构,工程图纸结构检测精度 98.8%
4. 三维模型特征识别
4.1 BRep 表示与图神经网络
三维 CAD 模型的标准表示是
BRep(边界表示),天然适合用图结构建模(节点=面,边=拓扑邻接)。
4.2 主流模型对比
| 模型 |
年份 |
核心架构 |
MFCAD 精度 |
MFInstSeg Acc |
参数量 |
来源 |
| CADNet |
2020 |
AAG + GNN |
99.95% |
– |
0.53M |
IDETC 2020 |
| UV-Net |
2021 |
UV-Grid CNN + GCN |
99.95% |
– |
1.23M |
arXiv:2006.10211 |
| BRepNet |
2021 |
Topological Walks |
99.9% |
– |
1.8M |
CVPR 2021 |
| Hier. CADNet |
2022 |
层次化 GCN |
99.90% |
– |
6.6M |
CAD
147:103226 |
| BRepGAT |
2023 |
图注意力网络 |
– |
– |
– |
JCDE 10:2384 |
| AAGNet |
2024 |
多任务 GNN |
99.15% |
99.56% |
– |
RCIM
86:102661 |
| BrepMFR |
2024 |
Transformer + GAT + 域适应 |
99.99% |
– |
– |
CAGD
111:102318 |
| BRepFormer |
2025 |
纯 Transformer |
– |
99.62% |
– |
arXiv:2504.07378 |
| BRT |
2025 |
Transformer + Bezier 嵌入 |
优于 UV-Net/BRepNet |
– |
– |
arXiv:2504.07134 |
| FeatureFox |
2026 |
Panoptic Graph Segmentation |
– |
– |
– |
arXiv:2604.26770 |
4.3 模型输入表示方式对比
| 表示方式 |
精度损失 |
适用模型 |
特点 |
| BRep 直接输入 |
无 |
BRepNet, UV-Net, AAGNet, BRepFormer |
保留原始拓扑,工业标准格式 |
| UV-Grid |
极低 |
UV-Net |
参数域规则采样,兼顾几何与拓扑 |
| 点云 |
中等 |
PointNet++, DGCNN |
MFCAD 上仅 ~91%,远低于 BRep 方法 |
| 体素 |
高 |
3D-CNN |
分辨率受限,显存占用大 |
| 网格 |
中等 |
MeshCNN |
三角面片近似,MFCAD 99.89% |
4.4 STEP 文件解析技术栈
STEP 文件 (ISO 10303 AP203/214/242)
↓
OpenCascade (C++) / pythonOCC (Python) / OCP / CadQuery
↓
BRep 拓扑树:Shape → Compound → Solid → Shell → Face → Wire → Edge → Vertex
↓
每个几何元素附带精确数学描述(NURBS曲线/曲面、平面、圆柱面等)
↓
输入 GNN/Transformer 模型进行特征识别
关键 API:TopExp_Explorer
遍历拓扑,BRepAdaptor_Surface
获取面参数,BRep_Tool 提取几何。
来源:pythonOCC
GitHub
4.5 数据集演进
| 数据集 |
年份 |
模型数 |
特征类型 |
核心创新 |
| MFCAD |
2020 |
15,488 |
16 种 |
首个 BRep 特征识别数据集 |
| MFCAD++ |
2022 |
59,665 |
24 种 |
大量特征交叉重叠 |
| MFInstSeg |
2024 |
62,495 |
24 种 |
实例级标注 |
| MFTRCAD |
2024 |
28,661 |
26 种 |
含拓扑关系标注 |
| CBF |
2025 |
20,000 |
多种 |
面向复杂几何的工业级挑战 |
| CADSynth |
2024 |
100,000 |
多种 |
大规模合成,支持域适应 |
4.6 特征交互与分解
实际零件加工特征交叉重叠是 NP-hard 问题,当前方法演进:
- 语义分割(BRepNet/UV-Net):面级分类,无法区分同类型不同实例
- 实例分割(AAGNet
2024):均值漂移聚类分离特征实例
- 全景图分割(FeatureFox 2026):二值边缘边界模型 +
连通分量恢复
- 域适应(BrepMFR):合成数据训练→真实数据测试,准确率从
81.50% → 92.74%
5. LLM/VLM 驱动的工艺生成
5.1 MechRAG
系统(Nature Communications Engineering, 2025)
- 架构:CLIP 多模态嵌入 + RAG 检索 + LLM
生成(GPT-4V)
- 能力:制造方法识别(80.78%
基准准确率,增强后进一步提升)、成本评估、独特性分析
- 创新:将 CAE 仿真数据与 CAD
几何数据联合嵌入共享向量空间
来源:MechRAG -
Nature Communications Engineering
5.2 Text-to-CAD →
CAD-to-Process
CADSmith(arXiv:2603.26512)多
Agent 管道
| Agent |
职责 |
| Planner |
自然语言 → 结构化设计规范 |
| Coder |
RAG 检索 API 文档生成 CadQuery 代码 |
| Executor |
沙箱中执行代码 |
| Validator |
OpenCASCADE 内核检查 + VLM Judge |
| Refiner |
接收反馈生成修正代码 |
性能:100% 执行成功率,Chamfer Distance 降低 38
倍,复杂零件中位 F1 = 0.886。
来源:CADSmith
关联工作:GenCAD(MIT, 2025)从图像生成参数化 CAD
命令序列;Text2CAD(NeurIPS 2024 Spotlight)170K 模型 + 660K
文本标注的大规模基准。
5.3 RAG 工艺知识库架构
企业工艺知识库(历史工艺卡、GB/JB标准、切削参数手册)
↓
文档分块 + 向量化(CLIP/Titan embedding)+ 知识图谱(GraphRAG/RDF)
↓
三层检索:向量检索 + 图谱检索 + 去重重排序
↓
LLM 生成:工艺路线 + 工序参数 + 工时定额
↓
结构化输出:工艺路线卡/工序卡/检验卡
Document GraphRAG(MDPI Electronics,
2025):三层检索策略集成,使用 GraphDB + Chroma
向量数据库,在制造领域文档问答中表现优异。
Microsoft GraphRAG:Leiden 层次化聚类 +
社区摘要,答案精度提升最高 35%。
来源:Document GraphRAG ·
Microsoft
GraphRAG
5.4 CAPP 系统演进
| 阶段 |
特征 |
代表技术 |
| 第一代 |
派生式 CAPP (Variant) |
基于零件族编码检索标准工艺 |
| 第二代 |
创成式 CAPP (Generative) |
规则引擎 + 决策树 |
| 第三代 |
AI 增强型 CAPP |
机器学习 + 知识图谱 + 优化算法 |
| 第四代 (新兴) |
LLM 驱动型 CAPP |
大语言模型 + RAG + 多智能体协作 |
来源:Natural
language-driven production planning
6. 图纸审核与错误检测
6.1 审核维度
| 审核类型 |
检测内容 |
技术方案 |
| GD&T 合规性 |
符号语法、基准引用、修饰符正确性 |
VLM 检测 + 规则引擎校验 |
| 尺寸完整性 |
缺尺寸、冗余尺寸、过约束 |
尺寸链分析 + 优化求解器 |
| 公差合理性 |
公差与加工工艺不匹配、累积超差 |
RSS/Worst Case/Monte Carlo 分析 |
| 标注规范性 |
表面粗糙度/焊接符号是否符合 GB/T |
YOLO 目标检测 + 规则检查 |
| 2D-3D 一致性 |
2D 图纸与 3D 模型是否矛盾 |
2D-3D 特征映射 + 尺寸对比 |
6.2 商业工具链
| 工具 |
厂商 |
核心能力 |
| CoLab AutoReview |
CoLab Software |
AI 图纸审查,GD&T 语法/语义检查,跨图纸一致性,DFM 分析 |
| EVOLVE Design |
OGP/IIGDT |
GD&T 验证引擎,内嵌 ASME Y14.5/ISO 1101 标准引用 |
| RD8 |
RD8 Tech |
自动公差路径检测,RSS/Worst Case/Monte Carlo 秒级计算 |
| SOLIDWORKS Inspection |
Dassault |
OCR 读取图纸标注 → FAI 首件检验,节省 90% 时间 |
| MBDVidia |
Capvidia |
MBD CAD 翻译,语义 PMI 验证,100% 自动化 FAI 工作流 |
| Autodesk Tolerance Analysis |
Autodesk |
最坏情况/RSS/统计分析,输出 Cpk/Σ/DPMO |
| Sigmetrix Cetol 6σ |
Sigmetrix |
全面三维模型基公差分析 + GD&T Advisor |
| High QA IM/360 |
High QA |
3D MBD 集成,自动 GD&T/PMI 提取,APQP/AS9100 合规 |
| Dessia 2D Checker |
Dessia |
AI 驱动跨图纸一致性验证,声称减少 90% 验证时间 |
| PTC Creo ModelCHECK |
PTC |
模型和图纸可配置检查,建模最佳实践验证 |
来源:CoLab
AutoReview · RD8 · EVOLVE
Design · MBDVidia
6.3 AI 审核前沿
- YOLOv11 符号检测(Springer JIM, 2025):YOLOv11 vs
Faster R-CNN vs RetinaNet,YOLOv11 精度-速度最优
- 混合深度学习 (2025):GD&T 符号检测达 94.8%
精度,97.3% F1
- DBAL-YOLO (2026):改进 YOLOv11n + Dynamic Snake
Conv + BiFPN,工程图纸结构检测 98.8%
- BLUEPRINT(arXiv:2602.13345):布局感知多模态检索框架
- Foundation EGI:DSL 框架自动化 GD&T
生成,仅需数十个样本
- VizCad AI:Grad-CAM + GNN 可解释
AI,高亮触发警报的面或边
来源:DBAL-YOLO ·
Foundation
EGI · VizCad
AI
7. 工具链与开源生态
7.1 二维图纸解析
| 工具 |
语言 |
功能 |
License |
| ezdxf |
Python |
DXF R12-R2018 全版本读写,EntityQuery DSL |
MIT |
| ODA SDK |
C++/C#/Java |
DWG 读写,高性能,完整实体访问 |
商业(会员制) |
| LibreDWG |
C |
GNU DWG 库,支持 R13-R2018 |
GPL-3.0 |
7.2 三维模型处理
| 工具 |
语言 |
功能 |
License |
| pythonOCC |
Python |
OpenCascade Python 绑定,完整 OCCT API |
LGPL-2.1 |
| FreeCAD API |
Python/C++ |
参数化建模 + Path 工作台 CAM 能力 |
LGPL-2.1 |
| ocp-freecad-cam |
Python |
CadQuery/Build123d → FreeCAD 参数化刀具路径 |
Apache 2.0 |
| cadunpack |
Python |
STEP 装配体遍历 + 钣金展开 + DXF 输出 |
MIT |
| trimesh |
Python |
STL/OBJ/GLTF 网格处理 |
BSD-3 |
7.3 AI 模型与框架
| 工具 |
用途 |
最新进展 |
| PaddleOCR 3.0 |
图纸 OCR |
PP-OCRv5 精度提升 13%,PaddleOCR-VL-1.5(109 语言) |
| Florence-2 |
图纸标注检测+解析 |
0.23B VLM,微调后超越 GPT-4o/Claude |
| Donut |
OCR-free 文档理解 |
端到端文档理解,表格/表单提取 |
| YOLOv11-obb |
方向边界框标注检测 |
OBB 检测,工程图纸符号精度 98.8% |
| vLLM |
VLM 推理部署 |
高吞吐服务引擎 |
7.4 CAPP/工艺规划开源框架
| 项目 |
功能 |
License |
| SAMPO |
自适应制造调度(遗传+多Agent算法) |
BSD-3 |
| PyCAALP |
装配序列+产线规划(MIP优化) |
MIT |
| CaSkade-Planner |
基于能力的工艺规划(SMT求解) |
MIT |
| FreeCAD-APLAN |
FreeCAD 装配序列规划插件 |
LGPL-2.1 |
7.5 STEP-NC 标准
ISO 14649(STEP-NC) 是 CAD/CAM/CNC
之间的高层数据交换标准:
- 基于特征的面向对象方法,描述”要加工什么”而非”刀具怎么动”
- ISO 14649-10(通用过程数据)、ISO 14649-11(铣削)、ISO
14649-12(车削)
- 支持双向数据流:CAD→CAM 和 CNC→CAM 闭环优化
- 近期已扩展至增材制造领域
来源:STEP-NC
扩展至增材制造
8. 落地案例与市场格局
8.1 商业 CAPP 系统对比
| 系统 |
厂商 |
核心能力 |
2025-2026 动态 |
| Teamcenter MPP / Easy Plan |
Siemens |
3D工艺规划+MBD工艺标注 |
2026年推出轻量化 Web 方案 Easy Plan |
| DELMIA |
Dassault |
数字化制造+工艺仿真 |
3DEXPERIENCE 云平台持续扩展 |
| Windchill MPMLink |
PTC |
MBD工艺+BOM管理 |
2025年汉诺威发布 Windchill AI 助手 |
| 开目 CAPP |
开目软件 |
二维/三维工艺规划+知识库 |
2025年3月发布 AI 智能体 “小沐” |
| CAXA 工艺 |
数码大方 |
工艺卡片模板定制 |
CAXA CAPP 3D 工艺深度融合 |
| 华天 InforCenter |
华天软件 |
PLM+工艺设计管理 |
CrownCAD 云 CAD + 三维机加大师 |
开目 AI 智能体”小沐”:深度融合 AI
与工业场景,基于工艺领域大模型实现 AI
赋能的三维工艺设计、完整工艺数据自动生成。在航空、航天、航发等行业高端客户占有率领先。
8.2 中国市场实践
海智在线(工业零部件数字化平台)
- 覆盖 80 万+工厂,全球 30 万+专业人士
- AI 以图搜图:上传 CAD 文件,24 小时内获得多个工厂报价
- AI 报价引擎:结合设备参数/材料库/工艺模块
- 2025 年获第七届工业互联网大赛全国总决赛二等奖
上汽通用(机械加工工艺智能开发)
- 基于 MBD + 智能算法的四阶段工艺开发流程
- 产品信息识别 → 智能工艺推理 → 工艺路线编排 → 文件自动生成
- 成效:规划周期缩短 75%,人工工时缩短
85.8%,数据一致性 100%
- 独创:自动定位无解原因的”自动找错”技术(已获专利)
宁波”4M”路径(2025年度制造业数字化转型典型案例)
- Method:龙头企业+服务商联合开发行业 AI 模型
- Model:“1+N+X” 工业互联网平台体系
- Machine:攻关高端数控系统/智能传感
- Man:甬江人才工程,数字经济人才 14.2 万
- 2026-2028 新行动方案:100 个标志性场景项目、20 个工业垂类大模型
其他典型
- 方天软件”方小智”:AI
全自动生成加工工艺与标准工时,工艺设计人力成本降低 72%
- 中信戴卡:AI
驱动”灯塔工厂”再升级,制造垂直大模型实现工艺调优/质量管控
- 中控技术 TPT:时序大模型 + UCS
通用控制系统,兰州石化年效益超 2000 万元
8.3 政策驱动
- 工信部《“人工智能+制造”专项行动实施意见》(2025.12):到
2027 年推广 500 个典型应用场景,选树 1000 家标杆企业
- 国务院《关于深入实施”人工智能+“行动的意见》:加快
AI 在设计、中试、生产、服务全环节落地
- 工业软件设备更新:2026 年第二批 915
亿元”两新”设备更新资金已下达
- 《智能制造典型场景参考指引(2025年版)》:“工艺数字化设计”场景明确要求”应用
AI 技术实现工序排布和工艺指令自动生成”
8.4 市场规模
- 中国 PLM 市场:2021 年 22.06 亿元,预计 2026 年达 53.87 亿元(CAGR
20.72%)
- 中国 CAPP 市场:2018-2022 年复合增速 14%,预计 2027 年达到 36
亿元
9. 实施建议与路径
9.1 技术选型矩阵
| 场景 |
推荐方案 |
技术栈 |
| 2D图纸→结构化信息 |
VLM 管道 |
YOLOv11-obb + Florence-2/Donut 微调 |
| 3D模型→加工特征 |
GNN/Transformer 特征识别 |
pythonOCC + BRepNet/UV-Net/BRepFormer |
| 工艺文件生成 |
RAG + LLM |
GraphRAG + GPT-4o/Claude + 工艺知识库 |
| 图纸审核排错 |
规则引擎 + VLM |
确定性规则 + VLM 检测 + RD8/EVOLVE/CoLab |
9.2 分阶段实施路径
Phase 1(3-6个月):2D 图纸结构化
- 部署 YOLOv11-obb + Florence-2 管道
- 标注 500-1000 张企业图纸微调模型
- 输出结构化 JSON(GD&T、尺寸、材料等)
Phase 2(6-9个月):工艺推理引擎
- 构建企业工艺知识图谱
- 部署 Document GraphRAG 系统
- LLM 基于特征信息生成工艺方案
Phase 3(9-12个月):3D 特征识别
- pythonOCC 解析 STEP 文件
- BRepFormer/BRT 识别加工特征(精度 99.62%+)
- 与 Phase 2 工艺引擎对接
Phase 4(12个月+):审核排错闭环
- 规则引擎校验 GD&T + 公差
- 2D-3D 一致性检查
- 人机协同(HITL)审核流
10. 关键挑战
- 数据集匮乏:高质量带标注
CAD/工艺数据集稀缺,公开数据集(MFCAD++ 59K、CADSynth
100K)规模有限
- 域偏移:合成数据训练的模型在真实 CAD
上性能显著下降(99.99% → 81.50%),域适应是关键
- 特征交互:实际零件加工特征交叉重叠,分解为独立加工操作是
NP-hard 问题
- 知识形式化:加工经验(如”深孔需分次钻削”)难以用规则完全覆盖
- DWG 格式壁垒:Autodesk 私有格式,依赖 ODA
SDK(商业授权)
- 端到端集成:多模块(解析→识别→推理→生成)接口标准化复杂
- 幻觉问题:LLM 零样本推理在 GD&T
提取中幻觉率高达 55.99%,需微调或混合架构
11. 技术成熟度评估
| 技术方向 |
成熟度 |
关键瓶颈 |
| 多模态 RAG 工艺检索 |
中高 |
图像检索精度仍需改进 |
| Text-to-CAD 生成 |
中 |
复杂多体装配仍困难 |
| GD&T 符号检测 |
高 |
YOLOv11/Florence-2 已达 >94% 精度 |
| 3D 加工特征识别 |
高 |
BRepFormer 99.62%,BrepMFR 99.99% |
| 图纸完整性审查 |
中高 |
AI 审查工具快速发展 |
| LLM 驱动 CAPP |
低中 |
长链约束推理仍弱,需混合架构 |
参考文献索引
学术论文
- Khan et al. (2025). BLUEPRINT: Rebuilding a Legacy: Multimodal
Retrieval for Complex Engineering Repositories. arXiv:2602.13345 ·
https://arxiv.org/abs/2602.13345
- Khan et al. (2024). Fine-Tuning VLM for Automated Engineering
Drawing Information Extraction. arXiv:2411.03707 ·
https://arxiv.org/abs/2411.03707
- Khan et al. (2025). Multi-Stage Hybrid Framework for Automated
Interpretation of Multi-View Engineering Drawings. arXiv:2510.21862
· https://arxiv.org/abs/2510.21862
- Khan et al. (2026). Context-Aware Mapping of 2D Drawing
Annotations to 3D CAD Features Using LLM-Assisted Reasoning.
arXiv:2602.18296 · https://arxiv.org/abs/2602.18296
- CADSmith (2026). A Multi-Agent Pipeline for Text-to-CAD
Generation. arXiv:2603.26512 ·
https://arxiv.org/abs/2603.26512
- BRepFormer (2025). Transformer-Based B-rep Geometric Feature
Recognition. arXiv:2504.07378 ·
https://arxiv.org/abs/2504.07378
- BRT (2025). Bringing Attention to CAD: Boundary Representation
Learning via Transformer. arXiv:2504.07134 ·
https://arxiv.org/abs/2504.07134
- FeatureFox (2026). Sample-Efficient Panoptic Graph Segmentation
for Machining Feature Recognition. arXiv:2604.26770 ·
https://arxiv.org/abs/2604.26770
- MechRAG (2025). A multimodal large language model for mechanical
engineering. Nature Communications Engineering ·
https://www.nature.com/articles/s44172-025-00517-z
- Lambourne et al. (2021). BRepNet: A Topological Message Passing
System for Solid Models. CVPR 2021 ·
https://github.com/autodeskailab/BRepNet
- Jayaraman et al. (2021). UV-Net: Learning from Boundary
Representations. CVPR 2021 · https://arxiv.org/abs/2006.10211
- Colligan et al. (2022). Hierarchical CADNet: Learning from
B-Reps for Machining Feature Recognition. Computer-Aided Design 147
· https://doi.org/10.1016/j.cad.2022.103226
- Wu et al. (2024). AAGNet: Multi-task Machining Feature
Recognition. RCIM 86 ·
https://doi.org/10.1016/j.rcim.2023.102661
- Zhang et al. (2024). BrepMFR: Enhancing MFR through Deep
Learning and Domain Adaptation. CAGD 111 ·
https://doi.org/10.1016/j.cagd.2024.102318
- Reddy et al. (2025). Intelligent GD&T Symbol Detection in
Mechanical Drawings. J. Intelligent Manufacturing ·
https://link.springer.com/article/10.1007/s10845-025-02669-3
- Gann et al. (2025). Title Block Detection and Information
Extraction for Building Engineering Drawings. arXiv:2504.08645 ·
https://arxiv.org/abs/2504.08645
- Document GraphRAG (2025). Knowledge Graph Enhanced RAG for
Manufacturing. MDPI Electronics ·
https://www.mdpi.com/2079-9292/14/11/2102
- PaddleOCR 3.0 Technical Report (2025). arXiv:2507.05595 ·
https://arxiv.org/abs/2507.05595
- Natural language-driven production planning (2025). Springer ·
https://link.springer.com/article/10.1007/s10845-025-02732-z
- STEP-NC extension to additive manufacturing (2025). Springer ·
https://link.springer.com/article/10.1007/s00170-025-15290-8
- Florence-VL (2025). Enhancing VLMs with Generative Vision
Encoder. CVPR 2025 ·
https://openaccess.thecvf.com/content/CVPR2025/html/Chen_Florence-VL
- Generative AI meets CAD (2025). Int J Adv Manuf Technol ·
https://link.springer.com/article/10.1007/s00170-025-15830-2
开源工具
- ezdxf — Python DXF library: https://github.com/mozman/ezdxf
- pythonOCC — OpenCascade Python binding:
https://github.com/tpaviot/pythonocc-core
- ocp-freecad-cam — FreeCAD CAM via CadQuery:
https://github.com/voneiden/ocp-freecad-cam
- PaddleOCR 3.0 — OCR toolkit:
https://github.com/PaddlePaddle/PaddleOCR
- Florence-2 — Unified Vision Foundation Model:
https://github.com/microsoft/Florence
- SAMPO — Adaptive manufacturing scheduling:
https://github.com/aimclub/SAMPO
- AAGNet — Multi-task machining feature recognition:
https://github.com/whjdark/AAGNet
- BrepMFR — MFR with domain adaptation:
https://github.com/zhangshuming0668/BrepMFR
- BRepNet — Topological message passing:
https://github.com/autodeskailab/BRepNet
- UV-Net — Learning from BRep:
https://github.com/autodeskailab/UV-Net
- Hierarchical CADNet:
https://gitlab.com/qub_femg/machine-learning/hierarchical-cadnet
- FreeCAD-APLAN — Assembly planning:
https://github.com/martcram/FreeCAD-APLAN
- Open CASCADE Technology: https://dev.opencascade.org/
- trimesh — Mesh processing: https://github.com/mikedh/trimesh
- Microsoft GraphRAG: https://microsoft.github.io/graphrag/
商业软件
- Siemens Teamcenter MPP / Easy Plan:
https://plm.sw.siemens.com/en-US/teamcenter/
- Dassault DELMIA: https://www.3ds.com/products-services/delmia/
- PTC Windchill MPMLink:
https://www.ptc.com/en/products/windchill/mpmlink
- 开目 CAPP: https://www.kmsoft.com.cn/
- CAXA 工艺: https://cad.caxa.com/pc/functionCapp3d
- 华天软件: https://www.hoteamsoft.com/capp
- CoLab AutoReview:
https://www.colabsoftware.com/product/autoreview
- EVOLVE Design (OGP/IIGDT):
https://www.ogpnet.com/products/software/evolve-software/evolve-design/
- RD8 Tolerance Analysis: https://www.rd8.tech/software
- MBDVidia (Capvidia): https://www.capvidia.com/products/mbdvidia
- SOLIDWORKS Inspection:
https://www.solidworks.com/product/solidworks-inspection
- Sigmetrix Cetol 6σ: https://www.sigmetrix.com
- High QA IM/360: https://www.highqa.com/3d-mbd-integration/
- Dessia 2D Checker:
https://www.dessia.io/blog/ai-2d-drawing-verification
- Foundation EGI:
https://www.foundationegi.com/media/automating-gd-t-drawings
- VizCad AI:
https://viz-cad.com/blog/train-ai-automate-cad-tolerance-review
- ODA SDK: https://www.opendesign.com/
标准与规范
- ISO 10303 (STEP) — Product data representation and exchange
- ISO 14649 (STEP-NC) — Data model for CNC controllers
- ASME Y14.5 — GD&T standard
- ISO 1101 — Geometric tolerancing standard
中国政策与行业报告
- 工信部《“人工智能+制造”专项行动实施意见》, 2025.12
(工信部联科〔2025〕279号)
- 国务院《关于深入实施”人工智能+“行动的意见》, 2025
- 《智能制造典型场景参考指引(2025年版)》
- 宁波市《2025年度制造业数字化转型典型案例集》, 中国信通院
- 中国 PLM 市场研究:
https://pdf.dfcfw.com/pdf/H3_AP202211281580628638_1.pdf
报告基于公开学术资源、技术文档和产品资料整理,使用 Jina
MCP、Tavily、Exa
等搜索服务进行多轮深度检索。具体商业软件功能以厂商最新发布为准。
第二次深度研究更新日期:2026-05-05