티스토리 뷰

1.1 머신러닝 소개

머신러닝 : 데이터를 이용해서 명시적으로 정의되지 않은 패턴을 컴퓨터로 학습하여 결과를 만들어내는 학문 분야

 

** 머신러닝의 3가지 특징

1. 데이터

머신러닝은 항상 데이터를 기반으로 한다. 머신러닝은 알고리즘이 아닌 데이터 학습을 통해 실행 동작이 바뀐다. 

2. 패턴인식

머신러닝은 통계학을 비롯해 딥러닝을 이용하여 데이터의 패턴을 유추하는 방법이 주축이 된다.

데이터를 보고 패턴을 추리는 것이 머신러닝의 핵심이다.

3. 컴퓨터를 이용한 계산

머신러닝은 단순히 수학적인 모델의 구축이나 증명에만 그치는 것이 아니라 실제 데이터에 대해 계산해서 결과를 만들어낸다.

 

1.2 머신러닝을 이해하는 데 필요한 배경지식

수학(선형대수, 미분, 통계, 확률) / 프로그래밍

머신러닝의 패턴인식 기법은 대부분 수치 연산으로 동작한다. 

 

1.3 머신러닝 발전사

고전적 인공지능 시대 > 신경망 시대 > 통계학적 머신러닝 시대 > 빅데이터 시대 > 딥러닝 시대 > 현재 트랜드

 

** 머신러닝의 3가지 관점(제이슨 아이스너 Jason Eisner) : 머신러닝 기법이 잘 동작하는 데 필요한 핵심 연구 방향

1. 통찰력

통찰력을 중시하는 경우는 결국 데이터가 어떤 패턴을 가지고 있다고 믿으며, 그 패턴에 대한 지식을 확보하는 것을 중요시한다는 뜻이다. 이처럼 데이터에 대한 믿음(prior)을 중시하는 대표적인 기법으로 베이지언(Bayesian)기법이 있다. 베이지언 기법은 현재의 가정에서 부족한 부분을 보완할 수 있는 데이터를 특히 중요하게 생각한다.

2. 데이터 적합성

데이터 적합성을 중시하는 기법들은 관측된 데이터를 가장 중요하게 생각한다. 데이터에 대한 지식이 희박한 경우 또는 데이터가 아주 많아서 기존 지식 없이도 머신러닝 기법이 잘 동작하는 상황을 가정한다. 이 경우는 노이즈에 영향을 많이 받으므로 보다 많은 데이터를 이용하여 노이즈의 영향을 줄이는 기술이 많이 쓰인다. 대표적으로 딥러닝과 랜덤 포레스트가 여기에 해당한다. 

3. 이론적 엄점성

이론적 엄정성은 머신러닝 알고리즘 이론에 대한 분석에 집중한다. 머신러닝 알고리즘이 어느 정도의 성능을 보장하고, 거대한 스케일의 데이터를 얼마나 쉽게 다루며, 잘못될 확률이 얼마나 적은지에 대한 해답을 구하는 부분이다. 많은 머신러닝 이론이 성능 보장을 위해 개발되었다. 이에 해당하는 대표적인 기법으로는 스펙트럴 러닝(spectral learning), 서포트 벡터 머신(support vector machine), 블록 최적화(convex optimization)가 있다.

 

1.4 머신러닝의 분류

머신러닝 기법은 풀고자 하는 목표에 따라 크게 지도학습, 비지도학습, 강화학습으로 분류할 수 있으며, 풀어내는 기법에 따라 통계와 딥러닝으로 분류할 수 있다. 

 

** 풀고자 하는 목표에 따른 분류

머신러닝

- 지도학습 : 값/레이블을 예측하는 시스템 구축

     - 회귀 : 값 예측

     - 분류 : 항목 선택

     - 랭킹/추천 : 순서 배열

- 비지도학습 : 패턴 추출 (데이터의 성질을 직접적으로 추측)

     - 군집화/토픽 모델링 : 비슷한 데이터를 묶음

     - 밀도 추정 : 데이터 분포 예측

     - 차원 축소 : 데이터 차원을 간추림

- 강화학습 : 상호작용 가능한 시스템 구축 (각각의 행동에 대한 피드백을 받아서 다음 행동을 정하는 알고리즘 학습)

 

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
글 보관함