====== Ciência de Dados ====== ===== Encontro #1 - Processamento de Linguagem Natural (NLP) ===== Data: 18/02/2017 - das 14h30 às 18h00 {{gallery>:temas:cienciadedados}} No primeiro encontro de Ciência de Dados do Calango Hacker Clube, Jerônimo, Otávio, Faísca e Paulo falaram sobre os diferentes desafios que enfrentam profissionalmente, na academia ou como parte de seus esforços voluntários por mais transparência. ==== NER em português ==== Jerônimo mostrou as experiências que está fazendo na busca por uma forma de reconhecer entidades nomeadas (NER) de textos em português. O desafio é extrair nomes de pessoas ou lugares de textos escritos na língua portuguesa. Links úteis: * [[https://github.com/jeroavf/nlp_with_python | Repositório do Jerônimo no github]] * [[http://nlp.lsi.upc.edu/freeling/node/1 | Freeling]]: ver o Analyzer * [[http://nlp.stanford.edu/software/CRF-NER.shtml | Stanford CRF NER]] (Java) * [[http://www.nltk.org/ | nltk]] (Python) ==== Crawling e NLP em sites de hackerspaces ==== Otávio mostrou até onde conseguiu avançar no entendimento dos hackerspaces a partir da extração de dados das páginas listadas em [[http://www.hackerspaces.org]]. Links úteis: * [[http://docs.python-requests.org/en/master/ | requests]] (python) * [[https://www.crummy.com/software/BeautifulSoup/ | BeautifulSoup]] (python) * [[http://www.seleniumhq.org/projects/webdriver/ | Selenium]] * [[http://www.qsrinternational.com/product | NVivo]] (Windows) ==== Olho Nas Emendas ==== Faísca falou da dificuldade de se estimar um trabalho de desenvolvimento sem conhecer as ferramentas. A ideia dele é dar continuidade ao projeto Olho nas Emendas e uma das possibilidades seria a realização de um crowdfunding como foi feito na Operação Serenata de Amor. Links úteis: * [[https://emendas.crowdmap.com/main | ONE]] - Olho nas Emendas ==== Análise de sentimento nas redes sociais ==== Paulo Barros mostrou o trabalho que tem feito utilizando R para analisar tweets positivos e negativos. Ele apresentou as bibliotecas que está utilizando e seus planos futuros. Links úteis: * [[http://www.r2d3.us/uma-introducao-visual-ao-aprendizado-de-maquina-1/ | R2D3]] - Aprendizado de Máquina * [[https://www.rstudio.com/ | RStudio]] * [[http://www.qlik.com/us/products/qlik-sense/desktop | Qlik Sense]] (windows) ===== Encontro #2 - Visualizações de Dados ===== Data: 11/03/2017 - das 14h30 às 18h00 No nosso segundo encontro, Otávio mostrou como está usando a [[https://d3js.org/|biblioteca D3]] para visualização de dados e Paulo Barros nos apresentou a [[http://www.d3noob.org/2013/07/crossfilter-dcjs-and-d3js-for-data.html|tríade D3, DC e Crossfilter]]. ===== Encontro #3 - Aplicação Prática ===== Data: 22/04/2017 - das 14h às 18h No terceiro encontro, uma aplicação prática de técnicas de visualização de dados a partir de informações disponíveis sobre o Calango. Finanças, eventos, etc. Brincamos com o Bokeh: http://bokeh.pydata.org/en/latest/ Falamos sobre iPython e Jupyter Notebooks: https://jupyter.org/ e como utilizá-los dentro do Anaconda https://docs.continuum.io/anaconda/ E conhecemos o Conecta SUS: http://www.conectasus.go.gov.br/