인공지능/컴퓨터비전

이번에 Object Detection 경진대회를 나가게 되면서 YOLOv8을 사용해보게 되었다. 이번 글에서는 YOLO라는 모델에 대한 자세한 설명보다는, Custom Dataset을 어떻게 YOLOv8에 Training 시키는지에 대한 자세한 설명과 코드 위주로 정리해보고자 한다. 1. YOLOv8이란? 우선, 기본적으로 YOLO(You Only Look Once)라는 모델은 객체 탐지(Object Detection)를 위한 딥러닝 모델 중 하나로서, 실시간 객체 탐지 및 분류 태스크에 널리 사용된다. 공식 깃허브 : GitHub - ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > OpenVINO > CoreML > TFLite NEW - YO..
1. LeNet-5란? LeNet-5은 1998년에 개발된 초기 CNN 구조로, 이후 딥러닝의 기반을 마련한 모델이라고 할 수 있다. 2. 각 Layer 살펴보기 (1) Input Layer (입력층) LeNet-5의 입력은 32x32 크기의 흑백 이미지이다. Input 이미지는 0과 1 사이의 값으로 정규화된다. (2) C1 Layer (Convolution) LeNet-5는 두 개의 Convolution Layer을 가지고 있는데, 첫 번째 Convolution layer는 6개의 5x5 크기의 필터를 사용한다. 합성곱 연산 결과 6장의 28x28 feature map을 얻게 된다. 활성화 함수는 sigmoid 함수를 사용한다. (3) S2 Layer (Subsampling) Convolution l..
본 포스팅에서는 OpenCV와 Python을 활용하여 얼굴 검출을 수행하는 방법을 소개합니다. 얼굴 검출은 컴퓨터 비전 분야에서 매우 중요한 작업 중 하나로, 이미지나 비디오에서 얼굴을 자동으로 인식하는 기술을 말합니다. 여기서는 하르 캐스케이드(Haar Cascade)라고 하는 객체 검출기를 사용하였고, 실행 환경은 Google Colab에서 실행하였습니다. 1. OpenCV 설치하기 OpenCV가 설치되어 있지 않은 분들만 다음 코드를 콜랩에서 실행하여 설치해 주시면 됩니다. !pip install opencv-python 2. Haar Cascade 파일 다운로드 얼굴 검출을 위해 미리 학습된 Haar Cascade 파일이 필요합니다. OpenCV 공식 GitHub 저장소에서 다양한 학습된 모델을 ..
OpenCV란? OpenCV는 "Open Source Computer Vision Library"의 약자로, 이미지 처리 및 컴퓨터 비전 분야 개발하는 데 사용되는 라이브러리입니다. C++, Python, Java 등 다양한 프로그래밍 언어에서 사용할 수 있고, 본 글에서는 Python을 사용하여 OpenCV를 설치하는 방법을 알아봅니다. OpenCV 설치하기 OpenCV는 pip를 통하여 설치할 수 있습니다. 파이썬 3.x를 설치한 후 다음 명령어를 사용하여 OpenCV를 설치 합니다. # pip 명령어로 설치 pip install opencv-python 정상적으로 설치 되었다면 다음 코드를 실행하였을 때 설치한 OpenCV의 버전이 출력됩니다. import cv2 print(cv2.__version..
Data Augmentation이란? 데이터 증강(data augmentation)은 딥러닝 기반의 컴퓨터 비전 분야에서 중요한 역할을 한다. 데이터 증강은 제한된 양의 훈련 데이터를 더 다양한 형태로 변형시켜 모델의 성능을 향상시키는 것을 목표로 한다. 이번 글에서는 OpenCV를 활용한 Data Augmentation을 구현하는 것을 목표로 한다. 1. 이미지 불러오기 및 표시 먼저 OpenCV를 사용하여 이미지를 불러오고 imshow()를 사용하여 이미지를 표시한다. import cv2 # 이미지 파일 경로 image_path = "image.jpg" # 이미지 불러오기 image = cv2.imread(image_path) # 이미지 표시 cv2.imshow("Original Image", ima..
코딩하는뚜뚜
'인공지능/컴퓨터비전' 카테고리의 글 목록