CS/딥러닝 6

[딥러닝] Data Clustering

Data Clustering 개요 데이터 클러스터링(Data Clustering)은 비슷한 특성을 가진 데이터들을 같은 그룹으로 묶는 과정을 의미한다. 이를 통해 데이터를 분류하거나 단순화할 수 있으며, 레이블이 없는 데이터를 처리하므로 비지도 학습으로 분류된다. 클러스터링은 데이터의 이해를 돕고, 숨겨진 패턴을 발견하는 데 유용하게 사용된다. 데이터 클러스터링은 크게 Hard Clustering과 Soft Clustering으로 나뉜다. Hard Clustering은 각 데이터 포인트를 하나의 클러스터에 할당하는 방식이고, 대표적인 알고리즘으로 K-means Algorithm이 있다. 반면, Soft Clustering은 데이터 포인트를 여러 클러스터에 확률적으로 할당하는 방식으로, Expectatio..

CS/딥러닝 2023.10.09

[딥러닝] 선형 판별 분석(LDA)

Linear Discriminant Analysis 개요 선형 판별 분석(Linear Discriminant Analysis, LDA)은 데이터를 차원 축소하고 분류하는 지도 학습 기법 중 하나다. LDA는 PCA와 유사한 점을 가지고 있지만, 클래스 레이블 정보를 활용하며, 분류 목적에 최적화된 축을 찾는 데 중점을 둔다. 이번 시간에선 LDA의 원리와 적용 방법에 대해 다루어보겠다. 본문 Supervised Learning 지도 학습(Supervised Learning) 은 입력 데이터와 그에 상응하는 정답 레이블을 사용하여 모델을 학습시키는 방식을 의미한다. 이러한 방식은 모델이 입력 데이터와 출력 레이블 간의 패턴을 학습하게 해, 미래의 유사한 데이터에 대한 출력을 예측하도록 한다. LDA는 주어..

CS/딥러닝 2023.10.04

[딥러닝] 주성분 분석(PCA)

Principle Component Analysis(PCA) 개요 남자와 여자에 대한 다양한 특징 정보가 주어졌다고 가정해 보자. 이들을 구분하기 위한 정보는 굉장히 많을 것이다. 하지만 실질적으로 우리가 성별을 구분하기 위해서 이 모든 데이터를 활용할 필요가 없다. 예를 들면, 염색체만 확인하면 생물학적으로 남녀를 구분할 수 있다. 이러한 핵심 특징을 추출한다는 아이디어에 기반하여 AI 학습 전에 학습 데이터를 전처리하면 효과적인 머신 러닝을 진행할 수 있다. 여기서 말하는 전처리는 데이터의 차원을 줄이는 것을 의미하는데, 이를 Principle Component Analysis(PCA), 주성분 분석이라고 한다. 본문 비지도학습 PCA는 비지도 학습에 속한다. 비지도 학습(Unsupervised le..

CS/딥러닝 2023.09.30

[딥러닝] 비선형 회귀 분석(2)

Non-linear regression 본문 구현 import numpy as np import matplotlib.pyplot as plt from sklearn.kernel_ridge import KernelRidge # 1. 비선형 데이터 생성 rng = np.random.default_rng(0) X = rng.uniform(0, 10, 100)[:, np.newaxis] y = np.sin(X).ravel() + np.sin(6 * X).ravel() + rng.normal(0, 0.1, X.shape[0]) # X 값을 정렬 X_sorted = np.sort(X, axis=0) # 플로팅 plt.figure(figsize=(10,6)) plt.scatter(X, y, color='blue', ..

CS/딥러닝 2023.09.26

[딥러닝] 비선형 회귀 분석(1)

Non-linear Regression 개요 지난 시간에는 데이터를 선형적으로 모델링하는 선형 회귀의 기본 개념과 그 적용 방법에 대해 다루었다. 선형 회귀는 많은 상황에서 유용하게 쓰이지만, 현실 세계의 데이터는 종종 복잡한 패턴과 비선형 관계를 가질 때가 많다. 선형 회귀만으로는 이런 복잡한 관계를 정확하게 포착하기 어렵다. 이번 시간에는 선형 모델의 한계를 극복하기 위해 도입되는 비선형 회귀 분석을 중점적으로 다루어 보겠다. 비선형 회귀는 데이터의 복잡한 패턴을 더 정밀하게 잡아내는 데 효과적이다. 그리고 비선형 현상을 선형적으로 근사하는 여러 방법과 원리도 함께 살펴볼 것이다. 이를 통해 데이터의 복잡한 구조를 더욱 깊게 이해하고, 더 정확한 예측과 분석을 수행할 수 있는 기초를 다질 수 있을 것..

CS/딥러닝 2023.09.25

[딥러닝] 머신러닝과 1차 선형 회귀

머신러닝 개요 개요 인공지능(Artificial Intelligence)은 인공적인 방법을 통해 인간의 지능을 모방하는 컴퓨터과학의 분야 중 하나다. 이는 합리적인 추론을 통해 문제를 해결하거나, 기계가 세상에 대한 지식을 표현하거나, 경로를 추적하거나, 데이터를 학습하여 입력과 출력 사이의 함수를 찾는 등 다양한 분야에서 응용되고 있다. 즉, 기계가 인간처럼 사고하고 학습하며 작업을 수행하는 능력을 가진 것을 인공지능이라고 한다. 이러한 인공지능은 매우 넓은 분야로서, 여러 하위 분야를 포함하고 있다. 주요 분야로는 머신러닝(Machine Learning), 로보틱스(Robotics), 전문가 시스템(Expert Systems), 자연어 처리(Natural Language Processing), 컴퓨터..

CS/딥러닝 2023.09.11