안녕하세요. 아쿠쿠(@akuku)입니다. 하루하루 소통이 즐거운 공간 스팀잇에 적응하는 중입니다. 스팀잇이 너무 재밌어 이것만 하고 싶은데 미래를 준비하려니 머신러닝도 배워야겠습니다. 매주 수업이 끝나면 공유하고 싶은 내용들 정리해봅니다.
요즘 공부하고 있는 머신 러닝, 하나씩 정리해봅니다.
머신 러닝으로 할 수 있는 것
요즘은 빅 데이터라는 표현이 많이 줄었지요. 몇 년 전에는 데이터 과학 영역에서 ‘빅 데이터’라는 키워드가 가장 핫 했습니다.
덕분에 플랫폼 회사, 통신사, 서비스 회사들은 주로 솔루션 회사를 통해 데이터 전략과 관련한 컨설팅을 진행하고 각각 분절된 형태로 보유하고 있던 서버를 합치는 시도를 하게 됩니다. 그래서 가지게 된 게 ‘큰 데이터 통!’ 데이터를 모아놓으면 돈을 잘 벌 수 있으리라 예상했겠지만 아직은 그렇지 못합니다.
출처: 패스트 캠퍼스 R을 활용한 머신러닝 CAMP, 고려대학교 산업경영공학부 강필성 교수님 강의자료
요즘 머신러닝 수업을 들으며 ‘왜 그런걸까?’에 대한 답을 얻었습니다.
더 잘하고 계신 분들도 많겠지만 아직은 설명/분석 수준으로 데이터를 활용하고 있다고 생각합니다. 준비하는 일들을 마무리 하면 예측과 최적화 단계까지 활용 사례의 폭을 넓힐 수 있겠네요.
데이터를 설명하고 예측과 최적화를 위해 활용함에 있어 왜 ‘머신러닝’을 이야기 하는 걸까요?
우선 머신러닝과 데이터 마이닝의 의미부터 확인해보겠습니다.
머신러닝은 '특정한 과업을 달성하기 위해 경험이 축적될수록 과업 수행의 성능이 향상되는 컴퓨터 프로그램 또는 에이전트를 개발하는 것’ 으로 정의하고 있습니다.
데이터 마이닝은 대량의 데이터로부터 의미 있는 규칙이나 패턴을 추출하는 일련의 활동을 의미합니다.
어쩐지 닮아있는 데가 있지 않나요?
그 동안 어렴풋하게 ‘빅데이터’, ‘머신러닝’, ‘데이터 마이닝’을 알고 있는 저에게는 이 정도 가르침 만으로도 따로 있던 점들을 한번 이어보는 데 개념적으로 큰 도움이 됐습니다. 기업이나 공공에 쌓인 데이터를 이해하기 위해 통계적 기법으로 접근했었고 활용을 위해 마케터가 고객 필터링 조건을 걸어 결과물을 얻고 있었습니다. 앞으로의 활용은 가늠하기 어려운 규모의 데이터 안에서 의미 있는 규칙과 패턴을 추출하는데 집중하게 됩니다. 데이터가 다양해질수록 즉 경험이 축적될수록 결과물의 품질이 좋아지는 알고리즘을 찾아 보정하는 게 앞으로 우리가 할 일. 예전처럼 직접 테이블 안의 셀에 담긴 값을 들여다보던 때와는 다른 과정일 수 있습니다. 아직 현업은 과도기적 단계를 경험하고 있으리라 생각합니다.
출처: 패스트 캠퍼스 R을 활용한 머신러닝 CAMP, 고려대학교 산업경영공학부 강필성 교수님 강의자료
많은 분들이 이미 몇 차례 보신적이 있을 듯한 ‘워드 클라우드’도 데이터 활용의 좋은 예입니다. 대통령의 연설문에서 이용되는 키워드의 빈도를 수치화하고 다시 인지하기 좋은 형태로 시각화 하는 알고리즘이 패키지화 되어있어 쉽게 만들 수 있죠.
어쩌면 지겨울 대통령 연설을 다 듣거나 전문을 읽어보지 않아도 느낌이 오지 않나요?
출처: 패스트 캠퍼스 R을 활용한 머신러닝 CAMP, 고려대학교 산업경영공학부 강필성 교수님 강의자료
이렇게 하나 둘 잘 모르고 어렴풋하게 이해하고 있던 머신러닝과 데이터 과학에 대해 배우고 있습니다. 저도 아직 프로젝트를 준비하는 과정에 머물러 있습니다만 알게 된 것들 공유하며 제 것으로 만들고자 합니다.
제가 참여하고 있는 과정의 커리큘럼이 궁금한 분들은 링크를 확인하세요.
http://www.fastcampus.co.kr/data_camp_mlearning/
여러분이 머신 러닝, 데이터 과학을 공부 한다면 어떤 문제를 해결하고 싶으신가요?
아니면 뭐가 궁금한지 알려주세요~
오늘 시간 남으실 때 읽어보면 도움이 될 글
1. 탐스 슈즈와 닮았다, 뉴비의 스팀잇 서바이벌 가이드. 보팅 전략편
2. 어느 직장인의 외로운 사업투자, 스타트업 투자 경험담
3. 인센티브 보너스 PS PI의 시즌, 모르면 손해 부자의 보너스 사용법
스스로 홍보하는 프로젝트에서 나왔습니다.
오늘도 좋은글 잘 읽었습니다.
오늘도 여러분들의 꾸준한 포스팅을 응원합니다.
매번 감사드립니다!
유익한 내용 잘 읽어 보았습니다.
머신러닝과 빅데이터의 이해를 높혔습니다~
감사합니다. 팔로우 보팅합니다~^^
칭찬 감사합니다. 미약하지만 제가 이해한 것들을 더 쉽게 공유해나가고 싶습니다.
교수님께서(기계공학과 교수님ㅎㅎ) 마케팅을 한다니까 머신러닝을 공부하라고 추천해주셨는데, 잘 안알아보다가 아쿠쿠님 덕분에 좀이라도 지식을 쌓고갑니다ㅎㅎ
패스트캠퍼스 제가아는 마케팅회사맞나요?ㅎㅎ관심있게 보고있었는데.. 거기서 교육받으시나봐요!
그러게요. 마케팅에 머신러닝이 필수가 되지 않을까요?
패스트 캠퍼스에서 마케팅 교육도 진행하고 있더라고요.
저는 머신러닝을 패컴에서 배우고 있답니다~
안녕하세요 윤리뷰에요!.
유익한 내용! 저는 빅데이터란 말도 접한지 얼마안되었는데 정보의 바다는 쉴틈이 없이 쏟아져 나오네요ㅠㅠㅠ
맞아요, 정보의 흐름 따라가기도 벅찬 요즘입니다. ㅠ
헉헉~
오오...패스트캠퍼스에서 공부하고 있으시군요!
데이터 사이언스 관련 포스팅 기대하겠습니다 :)
네, 차근차근 배우는 내용들 정리해 공유하겠습니다!
ㅎㅎ 리스팀하고 갑니다~^^
리스팀 까지 진심으로 감사드립니다~
안녕하세요~ 저는 패스트캠퍼스 강의 곧 들을 생각인데 반갑네요 ^^
그러시군요. 어떤 강의를 듣게 되실런지 호기심이 생겼습니다. ㅎㅎ
알파고나 구글번역을 보면 머신러닝은 넘 무서운 것 같아요......ㅎㅎ
맞아요, 대단하죠. 무서워 하기보다 얼른 올라타야 하지 않을까요? ㅎㅎ
그나저나 추천받았던 유명 계정~ 보유자, @xinnong 님 반갑습니다!
이걸 보고 나니 구글이나 아마존, 페이스 북 같은 곳의 빅데이터는 과연 어떨지 정말 궁금하네요. 글 잘 읽었습니다^^
맞아요. 가장 잘 할 회사들이죠.
그런 이유로 미국 주식에 직접 투자한다면 언급하신 회사들이 탑픽일 듯 합니다.
머신 러닝, 데이터 과학을 공부 한다면
어떤 문제를 해결하고 싶으신가요?
라는 질문을 받고 생각을 좀 해봤습니다.
전 세계의 기아를 해결할 수 있는 방법?
독재국가를 (예를들면 북한) 전복하고
민주주의 국가로 탈바꿈시킬수 있는 방법?
자본주의의 지속적 성장을 담보할 수 있는 방법?
그냥 생각해 봤습니다. ^.^;;
우와, 완전 어려운 주제네요.
솔직히 자원 배분의 최적화 관점이라면 1번 문제는 머신 러닝이 도움이 될 수 있다고도 생각하고 있어요. 이기심 때문에 실행이 어려울 뿐~