Machine Learning

머신러닝에 관심을 가지기 시작하면서.....

엘호리스 2018. 7. 17. 14:52

관심

머신러닝..... 들어봤고 관심은 있는데.... 어떻게 하는거지?


머신러닝에 대해 알고 싶어서 검색을 해보면.... 다양하고 복잡해 보이는 수식 때문에 흥미가 떨어집니다.


마치 치트키 같은 이미지가 떠오르는 머신러닝은 수학이라는 도구를 사용할 줄 모르면 친해지기 힘들죠.


그냥 단순히 머신러닝은 좋다는 개념에서 벗어나 이를 통해 어떤 가치를 창출 할 수 있는지

그리고 이를 활용하는 능력까지 목표로 삼고 머신러닝 학습을 시작하며 블로그 포스팅을 시작합니다.



일상생활 머신러닝

스팸 메일 분류, 사진에서 얼굴 인식, 유튜브 추천 서비스, 관심 있는 분야 구글 애드워드 광고 시스템 등



머신러닝이 급속도로 발전할 수 있었던 환경요소

- 대량 데이터 수집 가능한 환경 조성

스마트폰 보급으로 인해 데이터의 양, 그리고 다양한 데이터들이 생산되기 시작.
쉽게 데이터를 확보할 수 있는 환경이 조성되었다.

- 대량 데이터 처리 가능한 환경 조성

하드웨어 성능의 발달. SSD 같은 저장장치의 가격도 점점 내려가고 있으며 소프트웨어 적으로 하둡(Hadoop)이나 스파크(Spark) 같은 분산처리 기술도 발달해서 데이터를 대량으로 처리 가능한 환경이 조성되었다.



머신러닝이 주로 하는 일

  • 회귀(Regression)
  • 분류(Classification)
  • 클러스터링(Clustering)

회귀 - 연속된 데이터를 가지고 향후 예측값을 구하는 것. ex) 과거 주가 데이터를 이용해 향후 주가를 예측하는 것

분류 - ex) 해당 메일이 스팸인지 아닌지를 판단해 분류하는 것

클러스터링 - 비지도 학습 ex) 한국 남자 평균 상의 사이즈를 분류하기 위해 클러스터를 3개로 나눈다고 가정하자.(S,M,L 사이즈)

이때, 우리는 S사이즈는 몇부터 ~ 몇 까지야 라고 알려주지 않고 한국 남자들 상의 사이즈 데이터만 제공하고 나누려 하는 클러스터 갯수만 지정해준다. 이것을 클러스터링이라 한다.