Na Kaspersky Lab existe um posto conhecido como analista de conteúdo. Em poucas palavras, a tarefa do analista é criar bases de dados que filtram o conteúdo usado em nossos produtos. Os filtros são incluídos nas soluções de segurança, tanto para os usuários finais quanto clientes corporativos. Um dos módulos responsável pela filtragem de conteúdo é chamado de Parental Control (para usuários domésticos) e Control Web (para empresas). Usando as ferramentas implementadas no Controle Parental, os pais são capazes de restringir o acesso de seus filhos a sites inadequados Para que isso aconteça, temos que saber em que categoria cada site é classificado e analisar o conteúdo armazenado nele. É justamente aí que entra em jogo nossa base de dados.
Em primeiro lugar, não é possível criar uma base de dados manualmente: segundo o Google, hoje a internet contém cerca de 15 bilhões de páginas da web. Por esse motivo, a maior parte do trabalho é realizada por robôs. Eles analisam o conteúdo da Internet, usando o nossa rede em nuvem KSN e automaticamente entregam o veredicto sobre cada site. Os veredictos são usados em nossas soluções de segurança móvel (incluindo o Safe Browser para iOS) e, claro, o resto dos nossos produtos. A tarefa do analista é ensinar os robôs a categorizar corretamente o conteúdo na Internet. Um robô tem que avaliar palavras-chave e combinações em uma página Web e decidir se o conteúdo cai dentro de determinada categoria. Se o código do site contém tais combinações como “ver pornografia online”, “pornô online”, e fotografias muito coloridas, o robô classificará o site com a etiqueta “Pornografia e erotismo”, com base em um conjunto de critérios.
Como parte de suas responsabilidades de trabalho, os analistas da web, por vezes, tem que assistir o “conteúdo impróprio” e é por isso que eles muitas vezes são chamados pelos seus colegas de trabalho como “analistas de pornô”. No entanto, é necessário esclarecer que, além de páginas para adultos, também tem de trabalhar com outras categorias como:
- Drogas;
- Crueldade e violência;
- Armas;
- Jogo;
- Linguagem obscena.
Como regra geral, as categorias acima referidas são marcadas como restritas pelo administrador do Controle Parental ou Web.
Alguém poderia pensar: assistir pornografia no trabalho, que trabalho bom! Mas isso não é tão agradável quando se trata do mundo real. Em primeiro lugar, esse conteúdo pode variar -por isso, nem todos se sentiriam confortáveis assistindo a alguns tipos de fetiche, zoofilia ou em outras coisas desagradáveis. Em segundo lugar, deve-se ser psicologicamente resistente, capaz de abstrair certas emoções e poder trabalhar com conteúdo cruel e violento. Estas qualidades pessoais são explicitamente necessárias para o preenchimento da vaga de emprego como analista de conteúdo.
Mas isso não é tudo sobre o trabalho. É difícil descrever o processo e todas as peculiaridades de pesquisar o conteúdo perverso na Internet em detalhes, mas, em geral, a jornada de trabalho típica é assim:
1 .Pela manhã: verificar e-mail
Este processo ajuda a entrar no clima para o trabalho e avaliar o volume de tarefas para o dia.
2 . Reunião
Todos os dias, às 11 horas a equipe se reúne na sala de reunião e discute tudo que foi feito ontem e o escopo de trabalho para hoje. Esta é uma parte que ajuda a exercitar a disciplina e garantir a transparência dos processos quando se trabalha em equipe.
3 . Pausa para café
Trabalhar é importante, mas um café sempre ajuda!
4 . Perguntas dos usuários de usuários
Diariamente, nossa equipe de suporte técnico tem que lidar com dezenas de perguntas dos usuários relacionadas com o bloqueio incorreto de algumas páginas da web. Tais pedidos são passados para nossa equipe de analistas de conteúdo que cuidam do inquérito, analisa e fornecer o feedback para os usuários. Além disso, trabalhamos com questões como o mau funcionamento do Antibanner em nossos produtos. Oficialmente, cada pedido leva até três dias de trabalho, mas como sempre, quanto mais cedo resolver, melhor.
5 . Trabalhar com categorias de conteúdo
A maior parte do trabalho do analista de conteúdo é a criação de novas categorias e checar as já existentes. Agora nós cuidamos de 15 categorias em 7 idiomas. É por isso que os critérios mais importantes para um candidato ao cargo de analista de conteúdo da web é a fluência na segunda língua estrangeira, além do Inglês. Os candidatos com licenciatura em filologia ou lingüística são bons porque poessuem um pensamento analítico. Em poucas palavras, o candidato deve ser uma pessoa de “letras e matemática” -raro de se encontrar.
6 . Teste ao vivo
Para classificar o conteúdo, os robôs usam bancos de dados criados e acompanhados pelos analistas de conteúdo. Obviamente, antes de serem liberados, esses bancos passam por uma série de testes. O mais importante deles é o teste ao vivo que usa páginas web reais. Esse teste é realizado diariamente. Uma lista dos mais populares sites globais é formado a cada manhã e aqueles que não foram incluídos em nossa lista de teste antes, são enviados para nossos analistas classificarem. Os analistas entregam seu veredicto sobre os novos sites e atualizam o teste manualmente. Este último destina-se a garantir que as categorias atribuídas a sites por robôs correspondem ao veredicto do analista. Como o conteúdo do site pode mudar, portanto, temos de trabalhar permanentemente com este teste. Como regra geral, podemos iniciar um teste ao vivo três vezes por dia: de manhã, à tarde e à noite.
7 . Educação
Os funcionários da nossa equipe são famosos por proteger as crianças de conteúdos inadequados na internet: eles escrevem artigos, postam em blogs, são entrevistados ou convidados como porta-vozes de uma série de conferências.
No entanto, apesar de uma série de artigos, discursos ou entrevistas, a proteção das crianças contra conteúdo explícito ainda é um tema quente.
Provavelmente há um milhão de maneiras de encontrar recursos com conteúdo inapropriado. As ferramentas Control Parental ou Web não são balas de prata, no entanto, fazemos o nosso melhor para proteger os usuários, bem como a sua família ou colegas, de conteúdo impróprio na Internet.
Tradução: Juliana Costa Santos Dias