O principal objetivo deste artigo é tentar entender melhor o perfil e as características dos escravos qualificados (skilled) em uma das principais regiões de plantations no Brasil - São Paulo na segunda metade do século XIX.
Para tanto, utilizo uma fonte muito rica e relativamente pouco explorada: os anúncios de escravos fugidos na província de São Paulo entre 1854 a 1887, um ano antes da abolição.
Esse segmento dos escravos com ocupações artesanais tem sido pouco estudado ou mesmo desconsiderado na literatura, em parte pela influência da tradição historiográfica que enfatiza anomia e incapacidade dos escravizados sob o regime opressivo da escravidão.
Os anúncios de fugas foram coletados em quatro jornais da capital: Correio Paulistano (1854-1887), Diario de S. Paulo (1865-1878), Jornal da Tarde (1878-1881) e Provincia de São Paulo (1875-1887).
Esses quatro jornais são os únicos disponíveis com publicação consistente e regular nos períodos em que circularam na província de São Paulo. Ainda assim, não há dados para dois anos da série - 1860 e 1861.
Os anúncios trazem grande número de detalhes dos escravos: por exemplo, sexo, idade, local de nascimento e residência, detalhes físicos como cor da pele e altura, marcas de ferimentos e castigos, habilidades como fala, leitura e escrita, além de ocupações.
Cada número desses jornais foi consultado e ao final foram identificados 3.376 escravos fugitivos nos anúncios, residentes na capital e nos municípios do interior de São Paulo entre 1854 e 1887.
Para esse total de 3.376 runaways, porém, as informações são completas apenas para algumas características, como gênero. Para idade, por exemplo, só há dados relativos a 81% dos escravos registrados.
E para ocupações, o tema do artigo, a situação é ainda pior: há apenas 994 escravos com informações sobre o tipo de trabalho em que se ocupavam (29% do total).
Ou seja, os anúncios não registraram as ocupações de 2.382 escravos que fugiram no período.
A distribuição geográfica dos escravos qualificados que fugiram acompanha em linhas gerais a distribuição da produção de café nos municípios da província de São Paulo.
Porém, em termos relativos, a Capital (uma área não cafeeira) teve a maior parcela (25,2%) dos escravos qualificados anunciados, um pencentual muito mais alto do que os escravizados maiores de 10 anos residentes na Capital (3,7%) em 1872.
Esse fato reflete o viés dos jornais baseados na capital da província e que foram utilizados na pesquisa. Os jornais eram lidos em toda a província, mas refletiam mais os acontecimentos na capital.
Mesmo assim, com exceção do caso da Capital, os maiores municípios cafeeiros concentram os maiores percentuais de escravos qualificados: Campinas (15,1%), Itatiba (4,7%), Piracicaba (4,3%), Itu (3,9%), Jundiaí (3,7%), Mogi Mirim (3,4%), Limeira (3,0%) e Rio Claro (2,8%).
Ver o mapa abaixo:
A definição de trabalho qualificado (skilled) adotada corresponde a ofícios e ocupações artesanais. A vantagem é que um conceito amplamente utilizado e relativamente preciso.
A desvantagem é que ofícios artesanais se revelam "gendered occupations" em todas as economias de plantation nas Américas, excluindo portanto a grande maioria das mulheres de sua definição.
As ocupações artesanais incluem atividades como carpinteiros, ferreiros, alfaiates, sapateiros e mecânicos.
Abaixo, i) a lista das ocupações com a classificação de skills e ii) uma figura com o número de runaways ano a ano e a frequência das observações:
As informações dos escravos extraídas dos anúncios incluem características individuais (idade, sexo, altura, corpo, cor, entre outras) e dados relacionados - como município e área de residência (rural ou urbana), província de nascimento e nacionalidade (África ou Brasil).
As características dos escravos e as demais informações relacionadas que foram extraídas dos anúncios são listadas abaixo.
Observem que o número de observações para cada característica (feature) é desbalanceado, como comentado antes.
Uma série de passos foram necessários para preparar os dados para análise. Por exemplo, os anúncios de 1 escravo fugitivo costumavam ser publicados por vários dias, o que fez necessário separar casos únicos dos repetidos.
Da mesma forma, escravos tinham nomes comuns e não recebiam sobrenomes, o que exigiu utilizar características pessoais, nome dos proprietários e outros detalhes para identificar os escravos individualmente.
Várias convenções foram necessárias devido à imprecisão dos anúncios. As idades eram divulgadas de forma ambígua, p. ex., "entre 18 e 22 anos" ou "mais ou menos 25 anos". Adotou-se nesses casos a média ou o número mais próximo como idade estimada.
Outro exemplo: a altura era relatada normalmente com expressões não numéricas ("regular", "alto", "baixo", etc.). A partir de estudos antropométricos, adotou-se a média de 1,64 and 1,66 cm como referência para a altura "regular" e as demais. E assim por diante.
O exercício realizado no paper busca contornar a restrição dos dados sobre as ocupações utilizando modelos de machine learning. Resumidamente, a análise é feita em três passos:
Como são implementados os modelos: o conjunto de 994 fugitivos com ocupações foi dividido em i) um grupo (75% do total) utilizado para treinar os modelos e ii) um grupo de teste (25%) no qual os modelos foram aplicados e suas predições comparadas com os valores observados, isto é, efetivos, reais.
Utilizando o módulo scikit-learn, seis algoritmos foram implementados e seus resultados comparados com diferentes métricas de desempenho.
Todas as medidas utilizadas convergiram para o algoritmo XGBoost classifier como sendo aquele com a maior capacidade de predizer as qualificações (skilled ou low skilled) dos runaways no grupo de teste (25% de 994 escravos). Os resultados resumidos a seguir:
Concluindo: esses resultados são importantes tanto para a análise de aspectos pouco conhecidos da escravidão no Brasil quanto para comparações com outras sociedades escravistas nas Américas.