Identificación de texto en Segurmática Antivirus



Document title: Identificación de texto en Segurmática Antivirus
Journal: Telem@tica (La Habana)
Database: PERIÓDICA
System number: 000403817
ISSN: 1729-3804
Authors: 1
1
1
Institutions: 1Segurmática. Empresa de Consultoría y Seguridad Informática, La Habana. Cuba
Year:
Season: Ene-Abr
Volumen: 13
Number: 1
Pages: 1-11
Country: Cuba
Language: Español
Document type: Artículo
Approach: Analítico
Spanish abstract Cuando se escanea un fichero con Segurmática Antivirus, no se busca en bruto con todos sus algoritmos, de ser así el proceso tardaría considerablemente si la cantidad de ficheros escaneados es grande. Realmente lo que hace es distribuir los algoritmos según el tipo de archivo que se escanea. Esta práctica resulta muy útil cuando el volumen de firmas y de métodos de identificaciones y descontaminaciones es muy grande. Cuando se trata de buscar en archivos de texto el resultado es aún mayor si se tiene en cuenta la cantidad de variantes de clasificaciones posibles, mientras aumenta la especialización disminuye la cantidad de algoritmos por especialidad o tipos. Es muy común el uso de lenguajes interpretados o scripts para explotar vulnerabilidades en los programas clientes (Internet Explorer, Mozilla Firefox, Chrome, etc.) y existen diversas técnicas para la identificación de tipos de textos, cada una con sus ventajas y desventajas. Es necesario entonces contar con una biblioteca que le permita al antivirus identificar distintos tipos de texto mediante el análisis del contenido de los archivos a partir de las técnicas existentes, además de extender su arquitectura de búsqueda y optimizar cada vez más el proceso
English abstract When scanning a file with Segurmática Antivirus, it not will search with all algorithms, if so the process could be delay considerably if the number of files scanned is large. Really what it does is distribute the algorithms depending on the type of file being scanned. This practice is very useful when the volume of signa-tures, identifications and decontaminations is very large. When it comes to search in text files the result is even greater if one takes into account the number of possible classifications and variants, while increase the speciali-zations decrease the number of algorithms by specialty or type. Is very common use interpreted languages or scripts to exploit vulnerabilities in clients programs (Internet Ex-plorer, Mozilla Firefox, Chrome, etc.) and there are several techniques for the identification of text types, each with its advantages and disadvantage. Therefore is necessary to have a library that could allow to the antivirus identify different types of text by the content analyze of the files with the existing techniques, aswell as extend the existing search architecture and optimize the process every time more
Disciplines: Ciencias de la computación,
Literatura y lingüística,
Bibliotecología y ciencia de la información
Keyword: Procesamiento de datos,
Lingüística aplicada,
Análisis y sistematización de la información,
Análisis de textos,
Reconocimiento de patrones,
Léxico,
Seguridad informática
Keyword: Computer science,
Literature and linguistics,
Library and information science,
Data processing,
Applied linguistics,
Information analysis,
Text analysis,
Pattern recognition,
Lexicon,
Computer security
Full text: Texto completo (Ver HTML)