Je comprends très bien votre intérêt pour cet article, je préfère donc vous prévenir : nous parlerons de pornographie uniquement dans le troisième paragraphe. De plus, nous parlons d’un poste officiel chez Kaspersky Lab, celui de l’analyste de contenu. Pour faire simple, le travail de l’analyste de contenu est de créer des bases de données pour les filtres de contenu qui sont utilisés dans nos produits. Ces filtres sont inclus aussi bien dans nos solutions de sécurité destinées aux particuliers que dans celles conçues pour les entreprises. Le contrôle parental est un des modules responsables du filtrage du contenu dans les solutions destinées aux particuliers, tandis que le contrôle Web fait la même chose dans les solutions destinées aux entreprises. En utilisant les outils mis en place dans le contrôle parental, les parents peuvent restreindre l’accès aux sites Web inappropriés à leurs enfants. Pour cela, l’entreprise de sécurité doit savoir à quelle catégorie appartient chaque site et le type de contenu stocké sur ces sites. Et c’est là que notre base de données entre en jeu.
Il n’est pas possible de filtrer les bases de données manuellement : selon Google, Internet contient désormais plus de 15 milliards de pages Web. C’est pourquoi une grande partie de l’analyse est réalisée par des robots. Ils analysent le contenu Internet grâce à notre Cloud KSN et rendent un verdict automatique pour chaque site Internet. Les verdicts réalisés dans le Cloud sont utilisés par nos solutions de sécurité mobile (y compris par notre navigateur sécurisé pour iOS), et bien évidemment, le reste de nos produits les utilise pour renforcer les composants du filtrage de contenu. Le travail de l’analyste est d’apprendre au robot à classer correctement le contenu sur Internet. Les robots doivent évaluer les mots clés, les combinaisons de mots et les images des sites Web pour ensuite classer le contenu de ces sites dans différentes catégories. Si le code d’un site Web contient une combinaison comme « regarder des fils pornos en ligne » ou « porno gratuit » et un grand nombre d’images dénudées, le robot classera le site dans la catégorie « pornographie et érotique ».
Regarder le « contenu inapproprié » fait parfois partie du travail des analystes et c’est pourquoi leurs collègues les taquinent souvent en les appelant les « analystes de porno ». Je dois préciser qu’à part ce type de site, nous travaillons également avec d’autres catégories de contenu, dont certaines très dangereuses :
- La drogue
- La cruauté et la violence
- Les armes
- Les jeux d’argent
- Le langage obscène
En règle générale, les catégories mentionnées ci-dessus sont automatiquement bloquées par l’administrateur quand le contrôle parental ou le contrôle Web sont activés.
Mais on pourrait alors penser : regarder des films pornos au travail… sympa ! Mais ce n’est pas ce que l’on pourrait croire. Premièrement, ce genre de contenu peut varier, et il peut être très difficile de devoir regarder certains contenus extrêmes fétichistes ou même zoophiles. Deuxièmement, il faut être psychologiquement résistant et savoir se protéger de ses émotions afin de pouvoir travailler sur la catégorie « cruauté et violence ». Ces qualités personnelles sont explicitement requises dès les premiers entretiens pour toute personne souhaitant devenir analyste de contenu.
Mais ce n’est pas tout… il est difficile de décrire le processus de travail et comment rechercher ce genre de contenu en détail, mais en général, une journée de travail typique ressemble à cela :
1. Lecture matinale des e-mails
Personnellement, ce processus m’aide à me mettre au travail et à évaluer ma quantité de travail pour la journée.
2. Réunion
Tous les jours à 11h, notre équipe se réunit dans la salle de réunion et discute de tout ce que nous avons effectué la veille ainsi que du travail à faire pendant la journée. Cela fait partie du processus qui nous aide à rester disciplinés et qui assure la transparence de notre travail lorsque nous travaillons en équipe.
3. Pause café
Le travail c’est important mais impossible de travailler sans une bonne tasse de café !
4. Répondre aux demandes des utilisateurs
Notre équipe de support technique travaillent quotidiennement sur des dizaines de demandes des utilisateurs liées au blocage incorrect de sites Web par les modules de filtrage de contenu. De telles plaintes sont envoyées à nos équipes d’analystes de contenu qui s’occupent de celles-ci, les analysent, et répondent à nos utilisateurs. Nous travaillons également avec sur des problèmes liés à l’Anti-bannière de nos produits. Officiellement, chaque demande prend jusqu’à trois jours de travail, mais comme on dit toujours, le plus tôt sera le mieux.
5. Travailler avec les catégories de contenu
La plus grande partie du travail de l’analyste de contenu consiste à créer de nouvelle catégories ainsi qu’à renforcer celles qui existent déjà. Nous disposons désormais de 15 catégories et ce, dans 7 langues différentes. C’est pourquoi la qualité la plus importante pour quelqu’un qui souhaiterait devenir un analyste de contenu est de parler couramment une autre langue, à part l’anglais, et c’est pourquoi nous acceptons les candidats qui possèdent un diplôme de philologie ou de linguistique, et cela va sans dire, qui disposent de capacités de raisonnement analytique. Pour résumer, le candidat idéal doit être une personne de « sciences et de lettres », ce qui est assez rare.
6. Tests en direct
Au moment de classifier le contenu, les robots utilisent des bases de données créées et supportées par les analystes de contenus. Évidemment, avant d’être publiées, les bases de données passent à travers une série de tests. Le plus important d’entre eux est un test en direct qui utilise de vrais sites Internet. Ce test est effectué chaque jour. Une liste des sites Internet les plus populaires est formée chaque matin, et ceux qui n’avaient pas encore été inclus dans notre liste sont envoyés à nos analystes pour être analysés. Les analystes donnent ensuite leur verdict sur les nouveaux sites et les mettent à jour manuellement. Cette dernière action permet de s’assurer que les catégories assignées aux sites Web par les robots correspondent bien au verdict des analystes. Le contenu d’un site Web pouvant changer, nous devons constamment effectuer ce test. En règle générale, nous lançons le test en direct trois fois par jour : le matin, l’après-midi, et le soir et nous effectuons des rondes pour nous en occuper.
7. Éducation
Les employés de notre département sont des experts connus pour protéger les enfants du contenu inapproprié sur Internet : ils écrivent des articles, ils postent sur des blogs, et ils sont interviewés ou invités à des conférences.
Néanmoins, malgré tous les articles, les discours et les interviews, la protection de enfants contre le contenu inapproprié est toujours un sujet sensible.
Bien évidemment, il existe des millions de façons de trouver des sources contenant des contenus explicites. Le contrôle parental et le contrôle Web ne sont pas infaillibles, néanmoins, nous faisons de notre mieux pour protéger les utilisateurs ainsi que leurs familles ou leurs collègues en leur fournissant des outils afin d’organiser au mieux leurs défenses.