Edificações: Mapeamento Global do Google
- Adauto Costa

- há 3 dias
- 4 min de leitura
Atualizado: há 3 dias
E se você tivesse, na palma da mão, a localização e o contorno de praticamente todas as edificações do planeta? Imagine poder analisar o crescimento urbano de qualquer cidade, estudar ocupações irregulares, planejar infraestrutura, comparar densidades, detectar áreas de risco ou até modelar paisagens inteiras: praticamente sem precisar vetorizar nada manualmente.
Agora pensa nisso em escala continental. Milhões e milhões de construções, já mapeadas, prontas para serem integradas em SIGs, plataformas web, dashboards analíticos ou projetos acadêmicos. Não é ortofoto. Não é raster. É vetor, pronto para análise, medição, interseções, estatísticas, cruzamentos e modelagem.
É o tipo de dado que, há poucos anos, só grandes instituições ou empresas com recursos massivos conseguiriam produzir. Hoje, está disponível para qualquer pessoa que saiba o que fazer com ele.
Open Buildings: Mapeamento Global de Edificações do Google
O conjunto de dados contém cerca de 1,8 bilhão de edificações detectadas, cobrindo uma área de inferência de aproximadamente 58 milhões de km², abrangendo África, Sul da Ásia, Sudeste Asiático, América Latina e Caribe.
Para cada edificação, são fornecidos o polígono representando o seu contorno no solo, um índice de confiança indicando o nível de certeza de que se trata de uma edificação, e um Plus Code correspondente ao centro da construção.
Não há informações sobre tipo de uso, endereço, nome da edificação ou qualquer outro dado além da geometria.

Como os Dados Vetoriais são Obtidos?
Os contornos das edificações não são desenhados manualmente. Eles são resultado de um processo de detecção automática baseado em imagens de satélite de alta resolução. Esse processo foi desenvolvido no estudo Continental-Scale Building Detection from High Resolution Satellite Imagery, conduzido por Wojciech Sirko, Sergii Kashubin, Marvin Ritter, Abigail Annkah, Yasser Salah Eddine Bouchareb, Yann Dauphin, Daniel Keysers, Maxim Neumann, Moustapha Cisse e John Quinn.
Nesse trabalho, foi utilizado o modelo U-Net, amplamente adotado em segmentação de imagens, ajustado e aprimorado especificamente para identificar edifícios em contextos urbanos e rurais com grande variabilidade espacial. A equipe treinou o modelo sobre um conjunto inicial de imagens rotuladas manualmente e, em seguida, aplicou técnicas de pré-treinamento, autoaprendizagem e pós-processamento para elevar a precisão da detecção.
A abordagem incluiu o uso de imagens com resolução de 50 cm, modelos especializados para separação de instâncias, estratégias de regularização e métodos como mixup e self-training com perda soft KL, que aumentaram significativamente a qualidade das segmentações. O resultado é um pipeline capaz de identificar e vetorizar automaticamente bilhões de edificações, mesmo em regiões com pouca disponibilidade de dados cartográficos tradicionais.
Esse processo técnico de detecção e segmentação é o que torna possível a disponibilização do conjunto de dados em escala continental, já em formato vetorial pronto para uso em SIG.
Download dos Dados das Edificações
O conjunto de dados é dividido em três componentes: polígonos de edificações, pontos de edificações e limiares de confiança. Os polígonos e pontos são fornecidos em arquivos CSV organizados por células S2 nível 4, contendo para cada edificação o centróide (latitude e longitude), área estimada, escore de confiança, o polígono em formato WKT (no caso dos polígonos) e o Plus Code correspondente. Já os limiares de confiança são armazenados em um CSV separado, indicando para cada célula S2 os valores de confiança necessários para alcançar diferentes níveis de precisão, além de estatísticas sobre a quantidade de edificações presentes naquela célula. Quer saber mais? Acesse as Perguntas Frequentes do projeto.
Para baixar, abra a seção Download, localize no mapa a célula que corresponde à sua área de interesse e clique no link disponível para obter o arquivo compactado.

Transformando em Dados Vetoriais
O arquivo CSV disponibilizado é muito grande, podendo facilmente se aproximar ou ultrapassar 2GB. Arquivos desse tamanho, quando carregados diretamente no QGIS em formato CSV, tendem a comprometer a memória e, na maior parte dos casos, fazem o QGIS travar ou ficar inutilizável durante minutos ou horas.
Por isso, a abordagem recomendada é não abrir o CSV inteiro no QGIS. Em vez disso, é mais eficiente realizar um recorte prévio da área de interesse, reduzindo drasticamente o volume de dados. Esse recorte pode ser feito em qualquer linguagem de programação.
Aqui será demonstrado o procedimento em VB .NET, filtrando apenas os registros dentro do retângulo envolvente definido e exportando diretamente para DXF, já pronto para uso em SIG ou CAD. Você precisará da biblioteca netDxf.
Primeiro veja qual é seu retângulo envolvente desejado. Isso pode ser facilmente obtido no Google Earth. Obtenha então as coordenadas do canto inferior esquerdo desse retângulo.

Primeiro, determine o retângulo envolvente da sua área de estudo. A maneira mais simples é visualizá-lo no Google Earth e anotar as coordenadas do canto inferior esquerdo.
No exemplo ilustrado, o canto inferior esquerdo tem aproximadamente Latitude -8.01° e Longitude -35.05°. Em seguida, defina a largura e altura desse retângulo, ou seja, quanto ele se estende em latitude e longitude. No caso, cerca de 0.08° em latitude e 0.09° em longitude.
No código (em Main()), você ajustará essas informações na linha do retângulo envolvente:
Dim boundingBox As New RectangleF(-8.01F, -35.05F, 0.08F, 0.09F)O caminho para o arquivo CSV deve apontar para onde você salvou os dados baixados:
Dim filePath As String = "I:\Cartografia\Open Buildings\07b_buildings.csv"E o caminho do arquivo DXF de saída pode ser definido conforme sua organização de pastas:
Dim dirdxfopenb As String = "d:\ad33\openb.DXF"Após isso, será gerado um arquivo DXF contendo os polígonos das edificações dentro da área selecionada. Caso deseje, você pode ajustar o código para filtrar apenas as edificações com maior valor de índice de confiança.

Gostou do Conteúdo? Compartilhe!



























Comentários