Se tem uma liga no time de curadoria desta Sprint é a crença no poder das comunidades! Aqui, cada pessoa tem sua história recheada de depoimentos do quanto esse tipo de organização mudou e continua mudando as nossas vidas. A PrograMaria, além de ser uma comunidade muito rica para trocar, também traz um lado de luta contra o status quo do que a tecnologia é hoje — hoje, porque a computação nasceu e foi praticada ativamente nas suas primeiras décadas de existência por muitas mulheres! Essa é a história que não podemos esquecer nem permitir que reescrevam. Trazer as mulheres de volta para esse campo que é, sim, delas também, é importante demais. Principalmente na era dos dados.

 

A ONG Girls Who Code indicou que, nos EUA, as mulheres representavam 12% de todas as pessoas graduadas em ciência da computação em 2015 – em 1984, esse número era de 37%.

 

Dentro da tecnologia, certamente as carreiras ligadas a dados têm crescido tanto em oferta de oportunidades de trabalho, quanto em remuneração atrativa. Isso, entretanto, não tem sido suficiente para que as inequidades de gênero tenham se dissipado. As mulheres representam apenas algo entre 15% e 22% da totalidade das pessoas que atuam com ciência de dados, segundo pesquisas do World Economic Forum (Global Gender Gap Report) e da BCG. Os dados do LinkedIn sobre perfis mostram que as mulheres permanecem significativamente sub representadas na força de trabalho STEM (sigla para ciência, tecnologia, engenharia e matemática, em inglês): elas representam apenas 29,2% dos postos de trabalho nestas áreas. Quando se trata especificamente de trabalhos ligados à inteligência artificial (IA), a disponibilidade de talentos em geral aumentou seis vezes entre 2016 e 2022, mas a representação feminina progrediu muito lentamente. Em 2022, das pessoas que trabalhavam com IA, cerca de 30% eram mulheres, somente 4 pontos percentuais a mais do que em 2016.

 

A lacuna de gênero entre as pessoas que atuam na área de dados em geral, e de IA em particular, tem implicações que vão além do campo da tecnologia. Isso porque geramos, gerimos e lidamos com dados o tempo todo em diversos setores como educação, saúde e meio ambiente, entre outros. Não importa onde, é frequente a tomada de decisões em cima de bases de dados que excluem de forma sistemática mulheres e outros recortes minorizados, como pessoas negras, pessoas amarelas, pessoas com deficiências, pessoas gordas, pessoas nordestinas, pessoas trans, pessoas não-binárias… E, muitas vezes, não sabemos que estamos fazendo isso. Não sabemos que há pesquisas médicas sobre o efeito de remédios no corpo feminino que não envolveram teste clínicos com sequer uma mulher. Não sabemos que os sintomas de uma parada cardíaca diferem entre homens e mulheres. Também não lembramos que os dados são usados para reforçar narrativas preconceituosas e erradas que só contam parte da história. Um exemplo é o fato de a população carcerária ser majoritariamente negra. Durante muito tempo, isso foi usado para explicar que, de alguma forma, pessoas negras eram mais violentas ou propensas ao crime — e ainda o é, em determinados círculos. Temos um trabalho enorme pela frente ainda: precisamos evitar o apagamento de certas populações dos dados, entender que grandes quantidades de dados não são sinônimos de amostras representativas, e de fato aprender e ensinar como determinar causalidade para que os dados existentes não contem mentiras que fundamentem a exclusão e, pior, que nos faça acreditar nessas mentiras porque “os dados apontam”. O letramento com relação a dados, análise e estatística são fundamentais para mudar esse cenário.

 

Uma pesquisa de 2022 com 1,3 milhão de pacientes no Canadá mostra que mulheres que são operadas por um cirurgião do sexo masculino têm 15% mais chances de sofrer um resultado ruim e 32% mais chances de morrer, ter complicações e ser readmitidas no hospital do que quando uma mulher realiza a cirurgia; por outro lado, as mulheres cirurgiãs não apresentam resultados diferentes para seus pacientes masculinos e femininos. A lacuna de dados de gênero (gender data gap) pode ajudar a explicar esses resultados: livros didáticos de medicina são ilustrados majoritariamente com imagens de corpos de homens brancos, os medicamentos geralmente têm mais efeitos colaterais negativos para as mulheres e os cientistas do sexo masculino têm menos probabilidade de incorporar análises de gênero e sexo em suas pesquisas.

 

Esta Sprint é voltada a quem já deu seus primeiros passos numa carreira de dados (analista, arquiteta, engenheira, cientista, gerente), então, a discussão assume também outras características. Em vez de focar em ferramentas específicas, a abordagem é mais voltada a decisões de arquitetura, objetivo e aplicações de determinadas tecnologias, além de cases que mostram que o arsenal de dados e estatística para resolver problemas não se resume a Machine Learning ou o que poderia ser considerado Inteligência Artificial. Todos têm seu momento de brilhar ao sol e o importante é entender quando melhor usar cada coisa. Também trouxemos discussões sobre caminhos de carreira.

 

A estruturação dos conteúdos baseou-se em três pilares complementares e não estanques: produto, gestão e, claro, tecnologia. Da perspectiva de produto, a ideia foi sair do conceito clássico e adentrar o mundo de produtos de dados e IA, que trazem necessidades próprias. Em relação à gestão e carreira, buscou-se abordar desde o processo seletivo e definição dos papéis em carreiras técnicas até o aspecto ligado à cultura de dados. O último, e talvez mais robusto pilar, é o de tecnologia, para quem deseja ser o que é conhecido na indústria como contribuidora individual, alguém que quer focar em se tornar especialista técnica. Apesar de diferentes, esses pilares trazem conteúdos que têm ainda mais valor se consumidos completamente, sem moderação! Todos eles provavelmente vão agregar algo na sua carreira e entendimento e, como são curtinhos, você não precisa escolher qual consumir. Com cerca de uma hora e meia por dia, você consegue ler e assistir todos os conteúdos assíncronos com exceção do workshop. Vale abraçar a Sprint na sua inteireza!

Trabalhar com dados é entrar nesse mundo de carreiras promissoras, mas também de responsabilidade ativa. Ao se sentar na frente de uma tela e digitar nossas linhas de código, impactamos vidas com nosso trabalho, com nossas escolhas (não só) técnicas. Como usar ciência de dados para prevenir acidentes? Como algoritmos de IA auxiliam na classificação de exames de mamografia? Como dados não ajudam a contar boas histórias e qualificar advocacy? Esses são cases que trazemos nesta sprint para que, por meio de aplicações concretas e que melhoram a qualidade de vida das pessoas, você não só aprenda, mas se inspire. Além disso, trouxemos os assuntos que chamam mais atenção no momento — como LLM, NLP, IA generativa, data mesh e data lakes — não sem as devidas provocações. Você realmente precisa dessas estruturas? Há maturidade organizacional e técnica para determinadas escolhas? Como traçar as melhores estratégias mesmo que isso não necessariamente envolva a tecnologia da moda? Na PrograMaria, o senso crítico está sempre convidado para a conversa 😉

 

O relatório Estado de Data + AI 2023 da Databricks aponta as seguintes tendências:

●     NLP é responsável por 49% do uso de bibliotecas de ciências de dados em Python

●     A integração de dados é o tópico de crescimento mais rápido: 117% em relação ao ano anterior

●     O volume de dados no Delta Lake cresceu 304% em relação ao ano anterior

 

Participar da curadoria dessa Sprint de Dados: Ampliando Fronteiras foi muito especial pra nós. Espero que pra você também seja um momento de descoberta e reflexão sobre carreira, tecnologia e possibilidades! Você pode. Nunca duvide disso (:

 

CRÉDITOS

Autora

Bianca Ximenes, Especialista em Dados e Machine Learning Foi nomeada pelo Google Developers em 2021 como uma de 21 mulheres ao redor do mundo que estão abrindo novos caminhos relevantes na tecnologia. Atualmente em sabático, antes disso foi Head de IA na Gupy por anos. Também é Doutora em Ciência da Computação com foco em Ética aplicada a Machine Learning e Google Developer Expert em ML. Já impactou mais de 35 milhões de pessoas por meio dos seus produtos de IA e produziu conteúdos técnicos e palestras para mais de 80.000 pessoas.

Saiba mais no LinkedIn

Haydee Svab, Consultora, pesquisadora e cientista de dados na ASK-AR Mãe da Zoé e do David, é sócia e co-fundadora da ASK-AR (consultoria em análise de dados). Atualmente é membro do Conselho de Governança da Open Knowledge Brasil e coordenadora do capítulo RLadies-São Paulo. É mestra em Engenharia e Planejamento de Transportes (Poli-USP), especialista em Democracia Participativa, Repúblicas e Movimentos Sociais (UFMG) e formada em Engenharia Civil/Arquitetura pela USP (Programa Poli-FAU). Enfim, é uma feminista que quer usar dados e ciência para tornar as cidades melhores, mais acolhedoras, mais inteligentes e mais sustentáveis para todas, todos e todes.

Saiba mais no LinkedIn

Revisora

Luciana Fleury, jornalista

https://www.linkedin.com/in/luciana-fleury-1b024083/  

Este conteúdo faz parte da PrograMaria Sprint Dados: ampliando as fronteiras.