클라이언트 프로그램에서는 크게 두가지 기능을 수행합니다.
첫번째로 영상을 실시간으로 촬영하고, 이를 UDP 소켓을 통해 서버로 전송하는 기능입니다.
빠른 영상 전송을 위해 영상의 크기는 320x240 크기로 고정시켰으며, 이는 설정파일을 통해
사용자가 직접 변경할 수 있습니다.
두번째로 UDP 소켓에서 명령어를 전달받아 기기의 모터 및 센서를 제어하는 기능입니다.
라즈베리파이 기기에서는 디바이스 드라이버를 통해 외부 라이브러리 사용하지 않고
구현하였으며, 직접 설계한 1Byte 명령어에 맞추어 기기의 센서와 모터를 제어합니다.
모터 제어에 있어 방향 및 속도 조절을 위해 Breadboard에 H bridge 회로를 직접 구현했습니다.
사용법
- Cmake 및 OpenCV 라이브러리 설치
- module 폴더에서 make를 통해 커널 컴파일 및 모듈 등록
- build 폴더에서 cmake 및 make를 통해 컴파일
- build 폴더에서 main 파일 실행
(상위 폴더에서 ini 설정파일 수정을 통해 ip 및 port 번호 수정)
서버 프로그램에서는 2가지 동작 모드로 클라이언트를 제어합니다.
첫번째로 수동 조작 모드입니다. 사용자가 클라이언트에서 수신된 영상을 통해 기기를 제어하는 것으로
키보드의 방향키와 +- 키를 통해 기기의 속도와 방향을 제어합니다.
두번째로 자동 조작 모드입니다. 인공지능을 통해 탐지된 객체 종류에 따라 우선순위를 두어 자동으로
추적합니다. 1순위 사람, 2순위 개와 고양이, 3순위 나머지 객체 종류로 두어 추적하고 있으며, 동일 순위의
객체가 다수가 탐지될 경우 랜덤 추적합니다. 순위가 낮은 객체를 추적하던 중 높은 순위으 객체가 난입할 경우
추적 대상을 높은 순위의 객체로 변경합니다.
객체 추적을 위해 사용된 인공지능은 Yolov5와 deepsort이며, tab키를 통하여 수동 조작과 자동 조작을
변경할 수 있게 구현했습니다.
사용법
- keyboard, OpenCV, tensorflow, pytorch 설치
- 실행 및 클라이언트 접속 대기
- 완료 후 조작