You are viewing a single comment's thread from:

RE: [머신러닝] 파이썬 머신러닝 #3 - 스팀잇 아이디로 성별 예측하기

in #busy6 years ago (edited)

크 멋지네요. @blockchainstudio@jamieinthedark 둘다 남자로 나오는 거 보니 성능이 아주 좋네요ㅋㅋ 아마 확률이 나올텐데 확률도 같이 보여주면 더 재밌을듯ㅎㅎ 앗 우리 곰돌이도 테스트해봐줘요ㅋㅋ

Sort:  

성능이 아주 좋아요~😁
그리고 곰도리 아이디 gomdory는 여성으로 나옵니다.ㅎㅎ

에잉 농담이시겠지만 다큐로 받자면 이건 아이디엔 적용 안되죠. 말 그대로 서구권 세례명에 적용되는 얘기. 가령 한국식 이름에도 아, 화, 희, 등이 끝자리면 여자이름일 확률이 높다는 식의 얘기인데 아이디는 그냥 사물일 수도 있고 짓는 사람이 맘대로 하는 거니까.

재미를 주려고 스팀잇 아이디를 끼워 넣었습니다.😁
한국식 이름도 끝자리로 성별을 예측할 수 있겠네요. 그리고 제이미님 말대로 아이디만으로 성별을 예측하는 것은 어렵습니다.

아이디가 지칭하는 사물의 종류를 기반으로 예측을 하도록 데이터를 넣으면 좀더 정답에 근접할 수 있겠죠. 그래도 이름에 비해선 정확도가 현저히 떨어지겠지만.

아이디만으로 성별을 예측하는 것을 힘듭니다. 아이디를 포함하여 스팀잇에 작성한 글이나 댓글을 분석해서 성별을 예측해야 정확도가 올라갈 것 같습니다.

네, 힘들다는건 제 원래 요지이기도 하죠. 제가 거기에 덧붙여서 얘기한건 아이디가 지칭하는 꽃, 고양이, 나무 등의 사물에서 확률을 조금 더 높여볼 수 있으리라는 얘기입니다. 아이디가 저나 뉴비존님처럼 세례명을 포함할 수도 있고요. 당연히 글, 댓글 등 기타 데이터를 추가 하면 더더욱 높아지겠지만, 원글에서도 아이디만 다루고 있으니 아이디에만 집중해봤죠. ㅎㅎ

이전 답변을 제가 이해를 못했었네요. 맞습니다. 아이디가 지칭하는 사물을 기준으로 하면 정확도를 더 높일 수 있을 거라고 생각됩니다. 답변 감사합니다.

곰돌이도 구해주셨군요ㅋㅋ

ㅋㅋ아 여기서 보니 뭐가 하나 생각났네요. 어제 자정쯤 쓴 글에 비지가 6시간 넘어서 왔는데 이런 경우 처음 봐요!

이럴수가 그런 경우는 계산을 어찌하려나. 20시간 안되어서 태그 안쓰고 글 하나 썼었는데 썼더라면 엉겹결에 보팅받았으려나ㅋㅋ