Metodología Para El Análisis De Demanda Laboral Mediante Datos De Internet El Caso Colombiano

From
Revision as of 10:01, 18 April 2022 by RonnieHomer854 (talk | contribs) (Created page with "Para la recolección de la información se utilizó la metodología de web-scraping. Esta consiste en examinar las propiedades del código bajo el que se muestran las webs en...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Para la recolección de la información se utilizó la metodología de web-scraping. Esta consiste en examinar las propiedades del código bajo el que se muestran las webs en los navegadores y recolectar la información precisa conforme a los factores de identificación que se le da a la programación. Los análisis económicos y ejercicios econométricos con esta clase de datos se hacen cada vez más frecuentes. Con la aplicación de este género de metodologías, se puede aprovechar la estructura estática de la programación de las páginas web y las características del lenguaje HTML, aprovechando su estructura basada en tags, para obtener la información9.

Una vez conseguido el resultado de clasificación, por medio del web service, se realizó un proceso de revisión manual para la identificación de patrones que claramente dicho servicio no clasificó adecuadamente, dada la propia naturaleza coloquial del lenguaje colombiano, fyd-accidentes laborales iquique como por servirnos de un ejemplo el caso del "todero", "islero", "oficiales de construcción", entre otros, a los que se les aplicó el análisis de patrones de palabras, tanto del título de la vacante como la descripción, para poder asignar una clasificación acorde al requerimiento del empresario. NET a la clasificación CIUO 08 de la OIT para ejercicios de comparación con las estadísticas nacionales e internacionales. De esta forma, se partió de una información existente pero desordenada y se edificó una base de datos con seiscientos cincuenta y cuatro trescientos diez vacantes (anuncios) que corresponden a 2 doscientos uno cuatrocientos setenta y nueve puestos para dos mil catorce con las variables más relevantes (ver anejo 1), para su análisis estadístico.