Web Scrapping: obtenir dades del desenvolupament econòmic amb l'R
04/10/2022 - 08/11/2022 09:30 - 13:30 934 049 171 o.estrategiesde@diba.cat
L'Oficina Tècnica d'Estratègies per al Desenvolupament Econòmic de la Gerència de Serveis de Promoció Econòmica i Ocupació organitza aquest curs amb l'objectiu que les persones participants adquireixin coneixements i habilitats per posar en marxa processos de planificació estratègica per al desenvolupament econòmic local.
Objectiu general:
- Conèixer el funcionament del programari lliure R i els mètodes i eines que es fan servir per baixar dades del web i extreure'n la informació desitjada.
Objectius específics:
- Estar familiaritzats amb les principals tecnologies per tractar la informació guardada al web.
- Ser capaços de reconèixer diferents formats utilitzats per emmagatzemar informació.
- Saber com extreure la informació donats aquests formats usant paquets d'R específics.
Continguts:
- Mòdul 1. Introducció al llenguatge de programació lliure i obert R.
- Introducció a R i a l'entorn Rstudio. Instal·lació, documentació i paquets.
- Dades univariants i multivariants. Vectors i matrius. Bases de dades.
- Estadística descriptiva. Estadístics, taules i gràfics.
- Lleis de distribució. Inferència estadística. Mostratge aleatori.
- Funcions i programació amb R.
- Estadística multivariant. Exemples: Anàlisi de components principals, MDS, anàlisi de correspondències i anàlisi de conglomerats.
- Documents dinàmics amb Rmarkdown.
- Mòdul 2. Tecnologies web, eines per extreure i emmagatzemar informació web.
- Introducció a tecnologies Web. Web scrapping i projectes de web scrapping.
- Representació de les dades al web HEM, XML, JSON. Altres tecnologies.
- Expressions regulars per la gestió de dades.
- Parsing HEM i XML. Ús de CSS selectors i de Xpath.
- Descàrrega de dades fent servir APIs de programes.
- Casos d'estudi
Assistents
Treballar o estar vinculat a la Xarxa d'Observatoris del Desenvolupament Econòmic Local.