Show simple item record

dc.contributor.advisorMelgar Sasieta, Héctor Andrés
dc.contributor.authorCastañeda Rojas, Edson Bryanes_ES
dc.date.accessioned2016-11-26T17:22:22Zes_ES
dc.date.available2016-11-26T17:22:22Zes_ES
dc.date.created2016es_ES
dc.date.issued2016-11-26es_ES
dc.identifier.urihttp://hdl.handle.net/20.500.12404/7513
dc.description.abstractWeb scraping o extracción de datos Web es el proceso de recolección de información de uno o más sitios Web de manera automatizada, emulando la interacción entre un usuario y un servidor, dicho proceso se basa en el análisis de estructuras HTML y no requiere la autorización de los propietarios. El uso de estructuras repetitivas o plantillas, facilita el funcionamiento de un programa informático que extrae contenido Web, dicha intrusión genera un incremento considerable en el uso de recursos, considerando la permanente ejecución de instrucciones para obtener tanto contenido como sea posible. Con la finalidad de reducir la vulnerabilidad de los sitios Web frente a procesos de extracción de contenido masivo, en el presente trabajo se planteó un patrón de diseño de software tomando como referencia el patrón Template View de Martin Fowler, al cual se agregó una capa de aleatorización que permita generar estructuras HTML no predecibles. Mediante la aplicación de una herramienta de extracción de contenido a un sitio Web de prueba, cuya capa de presentación se desarrolló tomando en cuenta el patrón de diseño propuesto, se logró verificar una reducción considerable de la cantidad de datos extraídos.es_ES
dc.description.uriTesises_ES
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.rightsAtribución-NoComercial-SinDerivadas 2.5 Perú*
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/*
dc.sourcePontificia Universidad Católica del Perúes_ES
dc.sourceRepositorio de Tesis - PUCPes_ES
dc.subjectPatrones de softwarees_ES
dc.subjectSitios Web--Medidas de segurdidades_ES
dc.titlePropuesta de patrón de diseño de software orientado a prevenir la extracción automatizada de contenido webes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
thesis.degree.nameMagíster en Ingeniería de Softwarees_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgradoes_ES
thesis.degree.disciplineIngeniería de Softwarees_ES
renati.discipline612357es_ES
renati.levelhttps://purl.org/pe-repo/renati/level#maestroes_ES
renati.typehttp://purl.org/pe-repo/renati/type#tesises_ES
dc.publisher.countryPEes_ES


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial-SinDerivadas 2.5 Perú
Except where otherwise noted, this item's license is described as Atribución-NoComercial-SinDerivadas 2.5 Perú