RE: @pomocnik - bot reagujący na spam w komentarzach

You are viewing a single comment's thread from:

RE: @pomocnik - bot reagujący na spam w komentarzach

View the full context

alcik (53)in #polish • 7 years ago

Przez chwilę się zastanawiałem czy byłby sens rozdzielać zbiory dokumentów ze wzorcami na przykład na główny zbiór oraz zbiory językowe włączające się dla konkretnych tagów (np. polski dla #polish i #pl-.*) ale to chyba nie ma sensu bo nie widziałem jeszcze (jeszcze!) spamu po polsku.

Chyba, że w innych językach jest inaczej?

7 years ago in #polish by alcik (53)

$0.00

Sort:

Trending

[-]

jacekw (69) 7 years ago

Teraz połowa zbioru treningowego, dla wiadomości które nie są spamem jest po polsku, a połowa po angielsku. Spamowe są tylko po angielsku, ale nic nie stoi na przeszkodzie, żeby dodać też jakieś polskie.

I to są dane przeznaczone dla tagu #polish (= zoptymalizowane pod ten tag) Jakby ktoś chciał to uruchomić np na tagu #deutsch albo globalnie na całym steemie to dane trzeba oczywiście dopasować.

$0.07

1 vote