计算机视觉是一门学科,根据场景中存在的结构特性,研究如何从2D图像重构,中断和理解3D场景。
计算机视觉层次结构
计算机视觉分为以下三个基本类别 -
- 低级视觉 - 它包括用于特征提取的过程图像。
- 中级视觉 - 它包括物体识别和3D场景解释
- 高级视觉 - 它包括对活动,意图和行为等场景的概念性描述。
计算机视觉与图像处理图像处理将图像转换为图像。 图像处理的输入和输出都是图像。
计算机视觉是从其图像中构建对物理对象的明确而有意义的描述。 计算机视觉的输出是3D场景中结构的描述或解释。
应用
计算机视觉在以下领域中应用 -
- 机器人领域
- 本地化 - 自动确定机器人位置
- 导航
- 避免障碍
- 装配(插入孔,焊接,喷漆)
- 操作(例如PUMA机器人操作器)
- 人机器人交互(HRI):智能机器人与人交互和服务
- 医学领域
- 分类和检测(例如病变或细胞分类和肿瘤检测)
- 2D/3D分割
- 3D人体器官重建(MRI或超声波)
- 视觉引导的机器人手术
- 安全领域
- 生物识别技术(虹膜,指纹,脸部识别)
- 监视 - 检测某些可疑的活动或行为
- 运输
- 工业自动化应用
- 工业检查(缺陷检测)
- 部件
- 条码和包装标签阅读
- 对象排序
- 文件理解(例如OCR)
//更多请阅读:https://www.yiibai.com/ai_with_p ... omputer_vision.html
|