第23章:计算机视觉与物联网
摄像头是物联网的“眼睛”。计算机视觉 (CV) 技术让设备能够“看懂”画面。
23.1 计算机视觉基础
- 图像处理:去噪、边缘检测、色彩空间转换 (RGB -> HSV)。
- OpenCV:最流行的开源 CV 库。
import cv2 img = cv2.imread('image.jpg') gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 转灰度 faces = face_cascade.detectMultiScale(gray, 1.1, 4) # 人脸检测
23.2 深度学习模型
- **CNN (卷积神经网络)**:图像分类的基础。
- **YOLO (You Only Look Once)**:实时目标检测的霸主。它能同时识别出图中有哪些物体(分类)以及它们在哪里(定位)。
- 版本:YOLOv5, YOLOv8 (Ultralytics)。适合部署在边缘设备上。
23.3 边缘视觉推理
在树莓派或 Jetson Nano 上跑大模型很吃力,需要优化。
- TensorRT:NVIDIA 推出的推理加速引擎,针对 GPU 优化。
- OpenVINO:Intel 推出的工具套件,针对 CPU/VPU 优化。
23.4 应用场景
- 智能安防:人脸识别门禁、周界入侵报警。
- 工业质检:识别产品表面的划痕、缺陷。
- 智慧零售:货架缺货检测、客流热力图分析。
除了视觉,语音也是重要的人机交互方式。下一章我们将探讨语音识别与控制。