No âmbito do projeto europeu TARGET-X, cofinanciado pelo programa Horizonte Europa, o BUILT CoLAB colaborou com a WatchBuilt no desenvolvimento e aperfeiçoamento de uma solução avançada para monitorização automática do progresso da construção. A plataforma combina Building Information Modelling (BIM), Nuvens de Pontos (NPs) e Inteligência Artificial (IA), com o objetivo de melhorar a automação, precisão e escalabilidade dos processos de monitorização em contextos reais de obra.
Um dos principais desafios deste domínio é o alinhamento preciso entre dados não estruturados de nuvens de pontos e modelos BIM, de forma a permitir comparações fiáveis entre o construído e o projetado. Métodos de captura da realidade, como laser scanning, produzem nuvens de pontos densas que frequentemente contêm ruído, oclusões e diferentes níveis de resolução. Estas limitações, aliadas à natureza dinâmica e em constante evolução dos estaleiros de obra, afetam significativamente a qualidade e utilidade das soluções de acompanhamento do progresso.
Para superar estes obstáculos, o projeto centrou-se na automatização do reconhecimento de estruturas construídas na nuvem de pontos capturada e na associação dessas estruturas aos elementos correspondentes no modelo BIM. Este processo permite avaliações objetivas e consistentes do progresso, reduzindo a dependência de inspeções manuais. Reconhecendo desde cedo que abordagens tradicionais de registo e quantificação baseada em voxelização apresentavam dificuldades perante a variabilidade dos dados reais, foram introduzidas e refinadas iterativamente três melhorias principais: (1) segmentação semântica da nuvem de pontos previamente ao registo; (2) implementação de uma estratégia de registo baseada em pontos-chave para reduzir o ruído e melhorar o alinhamento geométrico; e (3) desenvolvimento de um processo de voxelização dinâmica para permitir uma análise detalhada do progresso por elemento.
Ao incorporar estas melhorias numa pipeline unificada, a plataforma resultante oferece uma base robusta e eficiente para a monitorização da construção em escala. As secções seguintes detalham o processo de desenvolvimento iterativo, a lógica por detrás do design e o impacto no desempenho de cada componente.
Do Conceito à Função: Uma Jornada de Desenvolvimento Iterativo
A solução desenvolvida no âmbito do projeto TARGET-X visa automatizar e melhorar a precisão do acompanhamento do progresso da construção, integrando BIM, NPs e IA numa pipeline unificada e modular. Partindo de um conceito inicial que comparava as condições planeadas (BIM) com as condições construídas (NPs), a plataforma evoluiu por ciclos de desenvolvimento iterativo para ultrapassar limitações detetadas durante a aplicação em obra.
Para ir além destas limitações, a equipa do projeto implementou uma arquitetura modular que integra diversas técnicas avançadas, cada uma dirigida a desafios específicos dos contextos reais. Estas técnicas foram desenvolvidas e validadas iterativamente em múltiplas revisões da pipeline, originando uma plataforma robusta e adaptável, capaz de suportar a monitorização em tempo real da construção.
A solução final está estruturada em quatro etapas principais: segmentação semântica da nuvem de pontos capturada; registo baseado em pontos-chave entre a nuvem real e o modelo projetado; voxelização dinâmica para uma análise detalhada do progresso por elemento; e integração de ferramentas de análise BIM-NPs para interpretação estruturada dos resultados. Cada um destes componentes contribui para uma pipeline mais resiliente às condições comuns encontradas no terreno, como varrimentos incompletos, ruído nos dados ou geometrias ocultas, permitindo o acompanhamento granular do progresso ao nível de elementos individuais da construção. A Figura 1 apresenta o diagrama de fluxo que contempla todas as fases de implementação.

Este diagrama representa o resultado do processo de desenvolvimento iterativo e ilustra o workflow completo implementado na plataforma final – desde o pré-processamento inicial da nuvem de pontos digitalizada (incluindo a remoção de outliers e a redução de dimensão), até à fase final de estimativa de progresso, incluindo a introdução da segmentação semântica, a geração de pontos-chave tanto para a nuvem de pontos real como para a derivada do modelo BIM, e o processo de registo em duas etapas utilizando RANSAC e ICP. Antes da fase de voxelização dinâmica, pode ser ainda aplicada uma filtragem opcional, que conduz à atualização do estado de progresso por elemento. Adicionalmente, embora não representado, podem ser gerados metadados consoante a sua falha de disponibilidade (por exemplo, cores ou valores normais). Esta estrutura modular será detalhada nas secções seguintes.
1. Alinhamento Inicial e Workflow de Registo
O ponto de partida do desenvolvimento centrou-se na criação de uma pipeline base de registo para alinhar as nuvens capturadas com o modelo BIM. A Figura 2 apresenta a nuvem de pontos e o modelo BIM utilizados como exemplo ao longo deste Insight. Nesta primeira iteração, o registo foi realizado diretamente entre a nuvens de pontos capturada, sem qualquer etapa prévia de segmentação semântica ou filtragem.

Os dados reais capturados no local, designados por PCR (Real Point Cloud), e a nuvem de pontos sintética gerada a partir do modelo IFC, designada por PCA (Artificial Point Cloud), foram alinhados através de um processo de registo baseado em pontos-chave. A pipeline iniciava-se com a verificação de metadados essenciais na PCR. Por exemplo, caso não existisse informação de escala, era aplicada uma correção durante o registo; ou se faltassem valores normais, eram estimados por aproximação. Seguidamente, procedia-se à extração de pontos-chave tanto na PCR como na PCA, com o objetivo de reduzir a complexidade computacional. Foram testados vários métodos de extração, tendo sido selecionada a rede GeDi[1] pela sua robustez e adequação a ambientes com ruído em nuvens de pontos. O registo foi efetuado em duas etapas: (1) alinhamento global, utilizando o método RANdom SAmple Consensus (RANSAC)[2], por estimativa de uma matriz de transformação inicial com base nas correspondências espaciais entre os pontos-chave; e (2) refinamento local, com o método Iterative Closest Point (ICP)[3], para otimização do alinhamento inicial por minimização iterativa das distâncias entre pontos. A Figura 3 apresenta os resultados obtidos por aplicação deste processo.
[1] F. Poiesi and D. Boscaini, “Learning General and Distinctive 3D Local Deep Descriptors for Point Cloud Registration,” IEEE Transactions on Pattern Analysis and Machine Intelligence, early access, 2022
[2] M. A. Fischler, R. C. Bolles, Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography, Communications of the ACM 24 (6) (1981) 381–395.
[3] P. J. Besl, N. D. McKay, Method for registration of 3-d shapes, in: Sensor fusion IV: control paradigms and data structures, Vol. 1611, Spie, 1992, pp. 586–606.

Uma vez alinhadas, a PCA e a PCR foram voxelizadas com uma grelha de resolução fixa. A estimativa de progresso foi então realizada com base na comparação da ocupação de voxels: para cada elemento estrutural definido no modelo IFC, contava-se o número de voxels coincidentes entre as duas nuvens e comparava-se com o total. Por exemplo, se 5 em 10 voxels de uma viga coincidissem entre PCA e PCR, considerava-se a viga com 50% de execução. Embora esta versão inicial da pipeline tivesse estabelecido uma base funcional, rapidamente se revelaram as suas limitações em cenários reais de construção – como a ausência de filtragem semântica, que resultava numa menor robustez perante o ruído e a geometria irrelevante. Estas limitações motivaram a reformulação da pipeline de pré-processamento, conduzindo à segunda iteração.
2. Integração de Segmentação Semântica e Filtragem
A segunda iteração introduziu melhorias significativas na fase de pré-processamento, com o objetivo de reduzir o ruído e alinhar apenas os componentes geometricamente relevantes. O principal avanço foi a inclusão de uma etapa de segmentação semântica, permitindo ao sistema classificar e isolar elementos estruturais (como paredes, lajes ou pilares) a partir da nuvem de pontos capturada antes da fase de registo.
Para esta finalidade, foi adotado o modelo SuperPoint Transformer (SPT)[4], selecionado pelo seu forte desempenho em benchmarks como o dataset S3DIS[5] e pela sua capacidade de inferência eficiente, adequada para aplicações em tempo real. Dado o tamanho elevado das nuvens de pontos, o processo de segmentação foi precedido por uma etapa de redução de dimensão para evitar falhas de memória e acelerar o processamento. Esta redução foi feita por voxelização e integrada diretamente na pipeline de pré-processamento. A Figura 5 apresenta os resultados do pré-processamento da nuvem de pontos capturada, incluindo a sua segmentação.
[4] D. Robert, H. Raguet, L. Landrieu, Efficient 3d semantic segmentation with superpoint transformer, in: Proceedings of the IEEE/CVF Inter- national Conference on Computer Vision, 2023, pp. 17195–17204.
[5] I., Armeni, O., Sener, A., Zamir, H., Jiang, I., Brilakis, M., Fischer, S. Savarese, 3D Semantic Parsing of Large-Scale Indoor Spaces, in: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016, pp. 1534-1543.

Para além da segmentação, foram testados dois métodos de filtragem: um com base na distância entre a nuvem real e artificial; e outro com base na curvatura da nuvem real. No final, a filtragem por distância revelou-se mais fiável, especialmente em nuvens de grande escala, enquanto os métodos baseados na curvatura mostraram impacto limitado e acabaram por ser excluídos em iterações posteriores. Esta versão do workflow permitiu que o registo operasse sobre subconjuntos da nuvem de pontos real que eram semanticamente significativos e geometricamente limpos, reduzindo erros de alinhamento e melhorando a estabilidade da matriz de transformação. A pipeline de segmentação–filtragem–registo foi executada em duas etapas: um alinhamento inicial, seguido de um registo refinado sobre o output filtrado. Esta abordagem gerou resultados significativamente melhores, especialmente em cenas com oclusões ou geometrias repetitivas. A Figura 5 apresenta o resultado da implementação desta nova pipeline.

3. Análise Granular com Voxelização Dinâmica
A terceira e última iteração centrou-se no aumento da granularidade e da interpretabilidade da estimativa de progresso, adaptando a voxelização à geometria e ao contexto de cada elemento estrutural individual.
Nas versões anteriores, utilizava-se uma resolução de voxel fixa, o que frequentemente resultava numa representação imprecisa de construções parciais ou em interpretações erradas nas zonas periféricas, ou em áreas afetadas por oclusões (e.g., andaimes, entulho). Para resolver esta limitação, a plataforma implementou uma estratégia de voxelização dinâmica, na qual a resolução da grelha é ajustada automaticamente com base na escala e forma de cada elemento e na densidade da nuvem de pontos envolvente.
A estratégia de cálculo do progresso foi também atualizada. Inicialmente, assumia-se que um voxel do modelo BIM sem correspondência na nuvem de pontos real indicava uma parte por construir. No entanto, esta abordagem resultava frequentemente em subestimações em zonas ocluídas. Para corrigir este problema, foi introduzida uma lógica baseada em regras: quando eram detetados padrões consistentes com continuidade estrutural (por exemplo, camadas horizontais de lajes), os voxels em falta eram inferidos como completos, salvo indicação contrária com base noutros dados geométricos.
A combinação destas melhorias resultou num workflow substancialmente mais robusto e preciso, capaz de acompanhar o progresso ao nível dos elementos individuais e de se adaptar a diferentes cenários de obra. A Figura 6 apresenta o alinhamento final, enquanto as Figuras 7 e 8 apresentam o cálculo do progresso.



Componentes-Chave da Solução Final
O motor de registo resultante combinou diversas inovações:
- Segmentação semântica, para filtragem e categorização ao nível dos elementos;
- Registo baseado em pontos-chave, recorrendo a características geometricamente significativas;
- Voxelização dinâmica, adaptada à geometria e escala de cada elemento;
- Estimativa de progresso baseada em regras, para deteção de elementos incompletos ou obstruídos;
- Arquitetura modular, permitindo a fácil integração em plataformas de monitorização.
Estes componentes funcionam de forma integrada para permitir uma análise detalhada e automatizada das condições reais (as-built) em comparação com o projeto (as-planned), facilitando o acompanhamento rigoroso e a deteção atempada de desvios.
Testes em Contexto Real e Perspetivas Futuras
A solução foi testada num estaleiro de referência no Center Construction Robotics da Universidade RWTH Aachen, localizado no 5G Industry Campus Europe. Estes testes validaram a robustez técnica e a utilidade operacional da pipeline de registo em condições reais de obra.
Os resultados representam um avanço significativo na automação dos fluxos de trabalho de monitorização do progresso e da qualidade da construção. Ao integrar compreensão semântica, processamento adaptativo de dados e análises suportadas por IA, esta solução constitui um passo promissor rumo a uma monitorização escalável, em tempo real, do progresso e da qualidade no setor AEC.
O BUILT CoLAB mantém o seu compromisso em traduzir esforços de I&D em ferramentas práticas que apoiem a transformação digital do ambiente construído.
