머신러닝에 대한 글들을 읽으면 좀 오싹하기도 한데요, 왜냐면 머신러닝이 문제해결을 하는 도구로 쓰이지만 정확히 어떻게 문제를 해결하는지에 대해서는 정확하게 알려지지 않았기때문입니다. 오늘날의 '머신러닝 알고리즘'은 인공 지능의 한 형태로 간주되어지고 있지만, '예측 알고리즘'쯤으로 이해한다면 더 이해가 쉬울것같네요. 예를 들면, 어떤 고객이 높은 평가를 한 영화들을 바탕으로 다른 영화를 추천했을때 얼마나 그 영화를 좋아할 것인지 혹은, 한 회사가 이미 고용한 사람들의 데이터를 바탕으로 할때 이 회사에 지원한 사람들을 고용활 확률을 얼마나 될지 등과 같은 예시처럼 말이죠. 이번 블로그에서는 이런 AI의 예측 알고리즘을 바탕으로 할로윈에 AI가 어떻게 기여할 수 있을지를 보려고합니다. 과거부터 현재까지의 할로윈 의상 목록을 바탕으로 올해 어떤 기발한 코스튬 복장을 생각해낼 수 있을지에 대한 연구내용입니다. 좀 황당하지만 할로윈 시즌인 만큼 재미난 주제라고 생각합니다. 이 연구에 대한 저자는 Max Woolf이며, textgenrnn이라는 머신러닝 알고리즘을 내놓았는데요, 이 알고리즘은 초반에 어떤 텍스트도 다 소화해날 수 있는 백지상태로 설계되었습니다. 1년동안 축적된 7,182개의 코스튬을 데이터베이스으로 삼고있다고합니다.
바로 위에 사진들이 AI가 내놓은 결과 중 몇가지 예시인데요, 이 결과물은 인간의 개입이 없었고 AI는 복장을 살펴본후 어떤 단어가 어떤 순서로 써져야할지를 판단을 내립니다. 그리고 스스로 자신의 결과를 자신을 트레이닝하면서 썼던 데이터를 살펴보며 내부적으로 개선을 합니다. 이런 과정을 반복적으로 더 나은 결과를 가져오게되죠.
아래 이미지는 AI가 훈련과정에서 단계별로 코스튬을 생성해나가는 과정입니다.
새로운 할로윈 의상을 만들어내는걸 요청할 때, 창의성 정도를 확인할 수 있습니다. 만약 매우 낮은 창의성 설정을 해두면 거의 대부분 비슷한 것을 반복적인걸 만들어내지만, 창의성 정도를 높이면 특이하고 창의적인 결과물로 범주를 넓혀갑니다.
초창기에 이 뉴럴네트워크는 현재 내놓고 있는 결과물에 대해 아는것이라곤 하나도 없었습니다. 심지어 '문자'와 '공백'의 차이점이나 다른단어의 스펠링 조차 인지하지 못했습니다. 하지만 반복되는 트레이닝을 통해 더 쉽게 학습해나고 있는데요, 신기한건 이 뉴럴시스템이 배운 첫번째 단어는 "Sexy"였습니다. 트레이닝이 진행됨에 따라 "steampunk", "minion", "cardinalfish"및 "Bellatrix"를 어휘에 추가하면서 점점 더 많은 단어를 배우기 시작했죠. 근데 재미난건 실제 존재하지도 않는 '섹시한 할로윈 복장'을 창조해내면서 'sexy'라는 단어를 벌써부터 사용하고 있다는것이죠. 즉, sexy라는 의미를 이해했는 뜻이죠. 놀랍지 않은가요?
뉴럴 네트워크는 트레이닝 데이터에서 복장을 직접 카피함으로써 더 나이지고 있는데요, 이는 인간이 이미 존재하는 할로윈 의상과 비슷한것을 요구하기때문이며, 뉴럴 네트워크에게서는 입력된 데이터내에서 정확하게 복사하는것이 이에 응할 수 있는 좋은 해결책이기때문입니다. 사실 뉴럴 네트워크가 아는 내용은 이미 입력된 데이트세트내에 한정되어있습니다. 예를 들어, 올해의 히트 영화에 대해서는 알지 못하기 때문에 "Black Panther"에 대한 아웃풋보다는 "Pink Panther"에대한 아웃풋을 생성해냅니다. 그리고 "Farty Potter"또는 "Werefish"와 같이 새로운 단어를 만들어내는 경우에는, 단어의 의미를 이해해서 새로운 단어를 생성해낸것이 아니라 뉴럴 네트워크가 그전에 보았던 의상을 기반으로 이에 상응하는 문자 조합을 만들어내는 것이죠.
포스팅을 시작하며 AI에서 오싹한면을 찾아볼 수있다고 했는데요, 이 뉴럴 네트워크에서는 예를 들어, "Bloody Horse", "Gothed pines", "Ballerina trump"와 같은 문자 조합이 어떤과정에서 나온것인지 알길이 없기때문입니다. 심지어 뉴럴네트워크의 가상 두뇌내부를 들여다 본다던지 검사한다 하더라도 AI의 규칙을 해석하기는 매우 어렵습니다. 이러한 이유로 이제는 사람들이 알고리즘을 어떻게 설명할 것인지에 대한 연구를 하고 있습니다. 예를 들어 구글과 Carnegie Mellon 연구진은 강아지 귀모양을 제거한채로 강아지를 인식하는 방법을 최근에 선보였습니다. 그러나 이미지 인식 알고리즘외 수 많은 의사결정 로직 알고리즘에 대한 해석은 훨씬 어려운 것이 사실입니다. 그렇기때문에 AI의 블랙박스를 해석하는것이 인간에게 또 다른 숙제가 되어버렸죠. 어쨌든 어쩌면 오싹하다고 볼 수 있는 AI의 영역에서 조금은 색다르게 할로윈복장에 대한 연구를 이번 포스팅에서 살펴보았는데요, 이번 할로윈에는 어떤 코스튬으로 즐거운 시간을 보내셨나요? 혹은 내년 할로윈에 어떤 코스튬을 준비하고 계신가요? AI를 통해 이색적인 코스튬을 준비해보는것도 또 다른 재미로 다가올 것 같네요.
짱짱맨 호출에 응답하여 보팅하였습니다.
오늘 독자가 만드는 베스트셀러, 스팀달러 에어드랍 프로모션의 첫번째 도서 판매가 시작되었습니다. 북이오(@bukio)의 [스팀달러 에어드랍] 스팀잇 프리세일 「영어 잘하고 싶니?」를 확인하여, 여러분이 베스트셀러를 만들고 수익을 같이 누리세요.
Congratulations @jenna.pulse9! You received a personal award!
You can view your badges on your Steem Board and compare to others on the Steem Ranking
Do not miss the last post from @steemitboard:
Vote for @Steemitboard as a witness to get one more award and increased upvotes!
Congratulations @jenna.pulse9! You received a personal award!
You can view your badges on your Steem Board and compare to others on the Steem Ranking
Vote for @Steemitboard as a witness to get one more award and increased upvotes!