You are viewing a single comment's thread from:

RE: 2017년 8월 11일 kr-newbie 보안관 활동일지 [ 뉴비 성기사단 모집 ]

in #kr7 years ago

네 그래서 주기적으로 스패머들의 글의 경우 보팅을 철회하고 다운보팅을 하고 있습니다. 하지만 봇이 해당 글이 스팸인지 판단을 따로 못하기 때문에.

블랙리스트에 빠르게 등록하는 것을 제외하면 봇이 보팅 자체를 안하기는 어려운 것 같아요.

영어가 많이 들어가면 보팅을 하지 않는다. 하면 한국인중에 영어로 번역글 올리시는 분들의 경우가 막히고
또 한글번역기로 돌렸을 때는 한글이 많은데도 스패머의 글이라서 막기가 참 어렵습니다.

결국은 한국어인 경우는 문맥이 어색한 경우를 추출해야하고
영어인 경우는 한국인이 아닌 것 같은 경우를 추출해야되는데.

이것을 컴퓨터한테 시키기가 쉽지 않네요. 사람이 하는 것은 참 쉬운데요..

그래서 거의 블랙리스트(스패머) 제보 + 제가 시간이 남을때 손수 작업하기
만 하고 잇습니다.

그나마 가능한 방법을 찾아보자면

머신러닝을 이용한 스팸글 분류기 같은걸 누군가 해주시면 좋을텐데. 현업 수준의 일이라서 부탁하기도 어렵군요 ;;

ㅎㅎㅎ 횩횩님 질문에 답변은 됐으려나 모르겠네요.

횩횩님도 보시면 스패머를 제 글 댓글에 신고해주시면 바로 적용하도록 하겠습니다.

읽어주셔서 감사해요

Sort:  

답변 감사합니다 ㅎㅎ 사실 정확한 알고리즘 짜는것이 참 어렵죠 ㅎㅎ 특히 특정 단어 사용이 아닌 번역글을 스팸글로 잡아내기는 알고리즘으로는 매우 어려울 것 같네요 구글번역기가 오타낸걸 잡아내려면 한국인의수작업만 가능하겠네요 ㅎㅎ 네 앞으로 보이면 댓글에 신고하겠습니다 ㅎㅎ