Web Scrapping: obtenir dades del desenvolupament econòmic amb l'R
04/10/2022 - 08/11/2022 09:30 - 13:30 934 049 171 o.estrategiesde@diba.cat
L'Oficina Tècnica d'Estratègies per al Desenvolupament Econòmic de la Gerència de Serveis de Promoció Econòmica i Ocupació organitza aquest curs amb l'objectiu que les persones participants adquireixin coneixements i habilitats per posar en marxa processos de planificació estratègica per al desenvolupament econòmic local.
Objectiu general:
- Conèixer el funcionament del programari lliure R i els mètodes i eines que es fan servir per baixar dades del web i extreure'n la informació desitjada.
Objectius específics:
- Estar familiaritzats amb les principals tecnologies per tractar la informació guardada al web.
- Ser capaços de reconèixer diferents formats utilitzats per emmagatzemar informació.
- Saber com extreure la informació donats aquests formats usant paquets d'R específics.
Continguts:
- Mòdul 1. Introducció al llenguatge de programació lliure i obert R.
- Introducció a R i a l'entorn Rstudio. Instal·lació, documentació i paquets.
- Dades univariants i multivariants. Vectors i matrius. Bases de dades.
- Estadística descriptiva. Estadístics, taules i gràfics.
- Lleis de distribució. Inferència estadística. Mostratge aleatori.
- Funcions i programació amb R.
- Estadística multivariant. Exemples: Anàlisi de components principals, MDS, anàlisi de correspondències i anàlisi de conglomerats.
- Documents dinàmics amb Rmarkdown.
- Mòdul 2. Tecnologies web, eines per extreure i emmagatzemar informació web.
- Introducció a tecnologies Web. Web scrapping i projectes de web scrapping.
- Representació de les dades al web HEM, XML, JSON. Altres tecnologies.
- Expressions regulars per la gestió de dades.
- Parsing HEM i XML. Ús de CSS selectors i de Xpath.
- Descàrrega de dades fent servir APIs de programes.
- Casos d'estudi
Assistents
Treballar o estar vinculat a la Xarxa d'Observatoris del Desenvolupament Econòmic Local.
Lugar
Tu privacidad es nuestra prioridad
Para proteger tu intimidad, antes de continuar queremos asegurarnos que sabes que, tanto nosotros como nuestros colaboradores, utilizamos algunas “cookies” en la web para facilitarte el uso:
- Propias y de terceros con fines estadísticos, con las que no se recoge información de los usuarios ni se registran las direcciones IP de acceso.
- Propias y de terceros para garantizar el funcionamiento básico, como la sesión de usuario, y aspectos de personalización, como el idioma de nuestras páginas.
Guardamos la aceptación de cookies durante 30 días para mejorar la experiencia de navegación. Recuerda que puedes eliminar las cookies de tu navegador. - De terceros para mostrarte información de nuestras redes sociales, como Facebook, X, YouTube, etc. Al acceder a estos sitios web podrás decidir si aceptas o no sus políticas de privacidad y de cookies.