Web Scrapping: obtenir dades del desenvolupament econòmic amb l'R
04/10/2022 - 08/11/2022 09:30 - 13:30 934 049 171 o.estrategiesde@diba.cat
L'Oficina Tècnica d'Estratègies per al Desenvolupament Econòmic de la Gerència de Serveis de Promoció Econòmica i Ocupació organitza aquest curs amb l'objectiu que les persones participants adquireixin coneixements i habilitats per posar en marxa processos de planificació estratègica per al desenvolupament econòmic local.
Objectiu general:
- Conèixer el funcionament del programari lliure R i els mètodes i eines que es fan servir per baixar dades del web i extreure'n la informació desitjada.
Objectius específics:
- Estar familiaritzats amb les principals tecnologies per tractar la informació guardada al web.
- Ser capaços de reconèixer diferents formats utilitzats per emmagatzemar informació.
- Saber com extreure la informació donats aquests formats usant paquets d'R específics.
Continguts:
- Mòdul 1. Introducció al llenguatge de programació lliure i obert R.
- Introducció a R i a l'entorn Rstudio. Instal·lació, documentació i paquets.
- Dades univariants i multivariants. Vectors i matrius. Bases de dades.
- Estadística descriptiva. Estadístics, taules i gràfics.
- Lleis de distribució. Inferència estadística. Mostratge aleatori.
- Funcions i programació amb R.
- Estadística multivariant. Exemples: Anàlisi de components principals, MDS, anàlisi de correspondències i anàlisi de conglomerats.
- Documents dinàmics amb Rmarkdown.
- Mòdul 2. Tecnologies web, eines per extreure i emmagatzemar informació web.
- Introducció a tecnologies Web. Web scrapping i projectes de web scrapping.
- Representació de les dades al web HEM, XML, JSON. Altres tecnologies.
- Expressions regulars per la gestió de dades.
- Parsing HEM i XML. Ús de CSS selectors i de Xpath.
- Descàrrega de dades fent servir APIs de programes.
- Casos d'estudi
Assistents
Treballar o estar vinculat a la Xarxa d'Observatoris del Desenvolupament Econòmic Local.
Place
Your privacy is our priority
To protect your privacy, before continuing we want to make sure that you know that, both we and our collaborators, use some “cookies” on the website to facilitate its use:
- Own and third party for statistical purposes, with which no user information is collected nor access IP addresses are recorded.
- Our own and third parties to guarantee basic functioning, such as the user session, and personalization aspects, such as the language of our pages.
We save the acceptance of cookies for 30 days to improve the browsing experience. Remember that you can delete cookies from your browser at any time. - From third parties to show you information from our social networks, such as Facebook, X, YouTube, etc. By accessing these websites you can decide whether or not you accept their privacy and cookie policies.