3.1 데이터형 1) 텍스트 데이터 다른 데이터에 비해 쉽게 구할 수 있다. 데이터의 의미 단위가 개별 단어나 연속하는 단어로 이루어져 있으므로 다른 데이터에 비해 의미 단위를 조각내기도 쉽다. 하지만 단위 데이터를 쉽게 조각내기 힘든 이미지 데이터나 음성 데이터와 달리 의미를 파악하려면 단어 간의 관계를 유추하거나 문법을 분석해야 한다. 의미 단위인 단어의 유형이 너무 다양하다. 2) 수치 데이터 금융 생산 공정, 관측 장치 등으로부터 얻을 수 있다. 많은 양을 쉽게 얻을 수 있지만 항상 노이즈가 섞여 있다. 노이즈가 생기는 이유는 다양하지만 일반적으로는 센서 노이즈와 현상의 무작이성이 원인이다. 따라서 노이즈에 강한 머신러닝 기법을 사용한다. 대부분 숫자 피처를 가지기 때문에 텍스트에 비해 데이터 밀..
머신러닝의 4가지 핵심 개념 1. 모델 : 데이터를 바라보는 시점과 가정 2. 손실함수 : 모델의 수식화된 학습목표 3. 최적화 : 손실함수로 표현된 모델을 실제로 학습 4. 모델 평가 : 모델의 성능이 실제 상황에서 어떨지 추정 2.1 모델 : 문제를 바라보는 관점 현재 상태를 어떠한 시각으로 바라보고 어떠한 기대를 하고 있는가 하는 것이 모델이다. ** 머신러닝의 과정 : 모델 정하기 -> 모델 수식화하기 -> 모델 학습하기 -> 모델 평가하기 모델이란 가정에 따라 생성될 수 있는 함수들의 집합이다. 이런 의미에서 보면 '모델이 바뀐다'는 것은 어떤 함수의 꼴이 완전히 달라진다는 것이다. 정해진 함수 안에서 함수의 파라미터를 데이터를 통해 추측하는 것을 학습이라고 한다. 머신러닝의 러닝이 바로 이 학..
1.1 머신러닝 소개 머신러닝 : 데이터를 이용해서 명시적으로 정의되지 않은 패턴을 컴퓨터로 학습하여 결과를 만들어내는 학문 분야 ** 머신러닝의 3가지 특징 1. 데이터 머신러닝은 항상 데이터를 기반으로 한다. 머신러닝은 알고리즘이 아닌 데이터 학습을 통해 실행 동작이 바뀐다. 2. 패턴인식 머신러닝은 통계학을 비롯해 딥러닝을 이용하여 데이터의 패턴을 유추하는 방법이 주축이 된다. 데이터를 보고 패턴을 추리는 것이 머신러닝의 핵심이다. 3. 컴퓨터를 이용한 계산 머신러닝은 단순히 수학적인 모델의 구축이나 증명에만 그치는 것이 아니라 실제 데이터에 대해 계산해서 결과를 만들어낸다. 1.2 머신러닝을 이해하는 데 필요한 배경지식 수학(선형대수, 미분, 통계, 확률) / 프로그래밍 머신러닝의 패턴인식 기법은..
- Total
- Today
- Yesterday
- 1358
- 삼성청년소프트웨어아카데미
- 브루트포스
- 파이썬
- 덱
- 딕셔너리
- dp
- 11051
- 수학
- 프로그래머스
- 싸피
- 조합
- 10815
- 스택
- 10971
- 러스트
- 백트래킹
- 10816
- 10845
- 큐
- 17478
- 1182
- 자료구조
- heapq
- 1764
- 1715
- 백준
- 1759
- 2805
- 빌림
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |