AI 机器视觉是什么?
原理与应用?
看完这篇一次了解!

AI 机器视觉是什么?

AI 机器视觉是人工智能的一个分支,使机器和人一样「看懂」图像与物件后进行判断与决策,常用在工业自动化与机器人领域如: 视觉瑕疵检测、3D 视觉定位分类计数,甚至影像监控/辨识等应用,也是新兴的 AR + AI 视觉系统技术核心。

技术原理与组成

从 AOI 这种 Rule-based 到深度学习技术(为机器学习的分支,透过模拟人脑的类神经网路,形成数学函数集并代入资料做训练与运算,能处理非结构化资料,使机器和人一样进行判断),通常包含以下5个环节。

影像输入

包含工业相机、IP Cam 拍摄或现成图像资料等来源。 除了像素规格,光源也至关重要,需考量亮度/光通量、色温、色彩再现性等,确保影像符合实际需求与品质。

影像处理与特征提取

影像处理或转换如二值化、滤波、增强、降噪和缩放等操作,提高影像品质和可用性后,提取有用的特征如: 边缘、纹理、色彩,或文章里的词组,选择最具代表性的特征,以降低计算成本并提高识别性能。

AI 建模与训练

常由人工或 AI 技术进行标记与训练,并建立 AI 模型,透过特征来识别和分类模式。 常用的模型包括支持向量机(SVM)、卷积神经网络(CNN)和循环神经网络(RNN)等。

物件识别与评估

训练后的模型依照需求识别图像中的物体、人物、文字或模式等。然而,该如何评估模型性能?
评估指标通常包含精确度(模型正确预测的样本数除以总样本数,但对于不平衡的数据集,精确度可能不是一个很好的指标)、混淆矩阵(一个矩阵表格,包括真正例、假正例、真反例和假反例的结果)和置信度(信心值)等。

决策和输出

根据识别的资讯进行决策如: 辨识物件与方位后,控制机器手臂取放OCR 字符读取、组装/设备操作步骤 SOP 确认等应用。

机器视觉的应用与难题

从自动驾驶到厂区智慧巡检,可用人眼做判断与检测/检查的部分,就有机器视觉的应用机会,但仍面临原始资料品质差与样本数不足的挑战,且无法直接把模型从某领域转移到另一个领域使用,AI 建模成本(训练时间、能耗、人力与样本数等)也至关重要,即便是简单的机械式指针读取与辨识,一般传统 AI 可能需上百甚至 上千张样本进行训练。
AI 并不是要取代人类,而是帮助人类更高效、准确地运用资源甚至解放双手等,以 AR 扩增实境 + AI 的视觉系统来说,由于可搭载于穿戴式装置,作业员组装设备时,AI 可对现实世界物件做辨识与判断,并透过 AR 眼镜,即时提供操作员组装指引,或自动检查线路是否正确连接等。
AR 和 AI 的结合能够以合宜成本,提高资源运用效率、良率和确保工安等优点与全新应用,这种技术的应用有望在未来持续扩大,提供更多创新的解决方案。