O conteúdo desse portal pode ser acessível em Libras usando o VLibras

Defesa de Mestrado – Jhon Jamilton Majin Erazo – 24/6/2021

07/06/2021 14:41
Defesa de Dissertação de Mestrado
Aluno Jhon Jamilton Majin Erazo
Orientador

Coorientador

Prof. Marcelo Ricardo Stemmer, Dr. – DAS/UFSC

Prof. Maurício Edgar Stivanello, Dr. – IFSC

Data 24/6/2021 (quinta-feira) – 14h

Videoconferência (https://meet.google.com/gez-keta-hkj)

Banca Prof. Marcelo Ricardo Stemmer, Dr. – DAS/UFSC (presidente);

Prof. Tiago Loureiro Figaro da Costa Pinto, Dr. – EMC/UFSC;

Prof. Werner Kraus Junior, Dr. – DAS/UFSC.

Título Desenvolvimento de um Sistema de Contagem e Classificação de Veículos utilizando Redes Neurais Convolucionais
Resumo: Com o crescente número de veículos em todo o mundo, o monitoramento e controle do tráfego por meio de tecnologias modernas tornou-se um requisito fundamental. É por isso que os sistemas inteligentes de transporte (ITS, Intelligent Transport Systems) são uma alternativa com grande interesse nas últimas décadas. Nestes sistemas, a contagem e classificação de veículos são dois parâmetros essenciais, que fornecem informações valiosas sobre o estado de tráfego, ocupação das rodovias, níveis de congestionamento, entre outros. Os ITS têm se beneficiado pelo aumento dos recursos computacionais e pela melhoria dos métodos de processamento de imagens, especialmente na detecção de objetos baseada em aprendizado profundo. Na literatura, diferentes abordagens têm sido propostas para realizar a contagem e classificação de veículos utilizando processamento de imagens. Contudo, essas abordagens são dependentes das condições iniciais em que foram projetadas, de modo que não há uma solução geral para estas tarefas. Portanto, neste trabalho é proposto um algoritmo de contagem e classificação de veículos utilizando um modelo de detecção baseado em redes neurais convolucionais (CNN). Este algoritmo consiste em 4 etapas principais: detecção, identificação, contagem por linha virtual e contagem por regiões. A fim de selecionar o modelo de detecção com melhor equilíbrio entre precisão e velocidade a ser implementado no algoritmo, foi realizada a comparação de diferentes detectores avaliados em um novo conjunto de dados. O conjunto de dados é composto por 4.300 imagens de veículos capturadas em diferentes rodovias da cidade de Florianópolis (SC), Brasil. Os resultados experimentais realizados mostram que os melhores índices entre os modelos de detecção foram obtidos utilizando YOLOv4NCIOU com um mAP=88,2 % e uma velocidade de processamento de 18 FPS. Além disso, a precisão média obtida no algoritmo de contagem e classificação de veículos em diferentes vídeos de teste foi de 94 % com uma taxa de processamento em tempo real inferior a 2,0.

Defesa de Mestrado – Yessica Maria Valencia Lemos – 16/6/2021

07/06/2021 14:40
Defesa de Dissertação de Mestrado
Aluna Yessica Maria Valencia Lemos
Orientador

Coorientador

Prof. Marcelo Ricardo Stemmer, Dr. – DAS/UFSC

Prof. Maurício Edgar Stivanello, Dr. – IFSC

Data 16/6/2021 (quarta-feira) – 14h

Videoconferência (https://meet.google.com/gmj-zuqi-yig)

Banca Prof. Marcelo Ricardo Stemmer, Dr. – DAS/UFSC (presidente);

Prof. Mario Lucio Roloff, Dr. – IFC;

Prof. Eric Aislan Antonelo, Dr. – DAS/UFSC;

Prof. Jomi Fred Hübner, Dr. – DAS/UFSC.

Título Inspeção Automática de Defeitos em Ovos Comerciais usando Visão Computacional
Resumo: A produção de ovos em linhas industriais cresceu consideravelmente ao longo dos anos. Essa produção alcança valores superiores a 15.000 ovos por hora, tornando cada vez mais difícil a utilização de operadores humanos para a tarefa de identificação visual e detecção de defeitos. Nesse cenário, as indústrias avícolas, com o objetivo de garantir e aumentar a eficácia e eficiência do processo de controle de qualidade, têm investido em novas soluções tecnológicas. Neste trabalho propõe-se comparar três soluções baseadas em processamento de imagens para realizar a inspeção automática de ovos comerciais, a fim de determinar a solução com o melhor equilíbrio em termos de precisão e velocidade. As abordagens propostas são executadas em um sistema de inspeção visual de ovos com simulação real de linhas de produção avícola. A primeira abordagem consiste na aplicação de técnicas clássicas de processamento de imagens e a segunda e terceira abordagens usam técnicas de aprendizagem profunda: classificação de imagens e segmentação semântica para a classificação do ovo em quatro categorias: normal, sujo, geometricamente anormal e ovos fissurados. Essas abordagens foram validadas com sucesso, alcançando uma acurácia média de 81 %, 85 % e 87 % e um tempo médio de processamento de 0,04 ms, 0,11 ms e 1,35 ms para as abordagens clássicas, classificação de imagens e segmentação semântica, respectivamente. Considerando os critérios de avaliação definidos para este projeto, obteve-se que as abordagens baseadas em técnicas clássicas apresentam um melhor equilíbrio nas métricas de avaliação, permitindo a detecção de várias características dos ovos como cor, formato e defeitos na superfície da casca.

Defesa de Dissertação de Mestrado – Leandro Pohlmann Rocha – 16/6/2021

07/06/2021 14:35
Defesa de Dissertação de Mestrado
Aluno Leandro Pohlmann Rocha
Orientador

Coorientador

Prof. Eduardo Camponogara, Dr. – DAS/UFSC

Prof. Laio Oriel Seman, Dr. – UNIVALI

Data 16/6/2021 (quarta-feira) – 8h30

Videoconferência (https://meet.google.com/dwr-kgmg-geh)

Banca Prof. Eduardo Camponogara, Dr. – DAS/UFSC (presidente);

Prof. Pedro Augusto Munari Junior, Dr. – DEP/UFSCar;

Prof. Marcus Rolf Peter Ritt, Dr. – II/UFRGS;

Prof. Felipe Gomes de Oliveira Cabral, Dr. – DAS/UFSC.

Título Linear Relaxations of Bilinear Terms for the Operational Management of Crude Oil Supply
Resumo: O gerenciamento da cadeia de suprimento de petróleo não refinado envolve a resolução de problemas de programação não linear inteira mista em grande escala (MINLP), composta de operações de descarga e transferência em terminais, controle de estoque e mistura de petróleo bruto para atender às demandas da refinaria. Nos ativos marítimos, o planejamento das operações torna-se mais desafiador, pois as viagens dos navios devem ser programadas com precisão para dar vazão às plataformas de produção do petróleo. Indiscutivelmente, a dificuldade computacional do problema surge devido ao tamanho e combinação de decisões discretas com restrições não lineares, constituída por termos bilineares que modelam as operações de mistura do petróleo. No que diz respeito às funções não lineares, este trabalho contribui avaliando técnicas distintas de aproximação linear dos termos bilineares, especificamente: McCormick envelopes, univariate e bivariate piecewise McCormick, multiparametric disaggregation e normalized multiparametric disaggregation. Os métodos de relaxação geram um problema de programação linear inteira mista (MILP), que pode ser combinada com um algoritmo de programação não linear local (PNL) para atingir um cronograma de operações viável. Concluímos com uma comparação entre essas abordagens de relaxamento juntamente com abordagens MINLP usuais, e demonstramos resultados computacionais em instâncias do problema. O relaxamento utilizando multiparametric disaggregation produz tempos de solução mais rápidos para resultados similares comparativamente aos métodos de otimização global comumente utilizados.

Defesa de Dissertação de Mestrado – Paulo Henrique Foganholo Bizetto – 15/6/2021

04/06/2021 15:41
Defesa de Dissertação de Mestrado
Aluno Paulo Henrique Foganholo Biazetto
Orientador Prof. Gustavo Artur de Andrade, Dr. – DAS/UFSC
Data 15/6/2021 (terça-feira) – 14h

Videoconferência (https://meet.google.com/qdu-prvt-rcj)

Banca Prof. Gustavo Artur de Andrade, Dr. – DAS/UFSC (presidente);

Prof. Marcus Vinícius Americano da Costa Filho, Dr. – UFBA;

Prof. Eduardo Camponogara, Dr. – DAS/UFSC;

Prof. Marcelo de Lellis Costa de Oliveira, Dr. – DAS/UFSC.

Título Development of an Optimal Control Strategy for Temperature Regulation and Thermal Storage Operation of Solar Power Plants
Resumo: O consumo global de energia e eletricidade está aumentando rapidamente devido ao crescimento da população, industrialização e urbanização. Como as fontes de combustíveis fósseis estão se esgotando e emitem gases do efeito estufa, o mundo está investindo em tecnologias de geração de energia  renovável. Pesquisas têm mostrado que as fontes de energia solar, eólica e biomassa são as mais promissoras e podem contribuir para o aumento da produção energética e para a redução dos impactos ambientais ocasionados pela queima dos combustíveis fósseis. Dentre estas fontes renováveis, o Brasil tem um grande potencial para o aproveitamento de energia solar térmica devido à sua localização geográfica. Plantas solares térmicas são compostas de um campo de coletores solares, um ciclo de potência e um sistema de armazenamento térmico que permite que a planta opere em horários escalonados ao invés de somente em modo de despacho da energia solar atual. Assim, os objetivos de controle nestes sistemas são maximizar a energia solar captada no campo de coletores solares e a receita de energia elétrica no bloco de potência de acordo com uma tarifa de energia. Os sistemas de controle destas plantas são complexos devido às suas características não lineares e multivariáveis, bem como as várias restrições de operação. Se comparado com os países detentores de tecnologias de energia solar, o Brasil ainda possui carência de conhecimentos para projeto e operação de tais sistemas. Neste sentido, técnicas de controle avançado e otimização terão que ser desenvolvidas levando em consideração as características particulares do clima e sistema de tarifas da venda de eletricidade no Brasil, o que gera um conhecimento específico para o desenvolvimento de tecnologia local. Nesta dissertação, uma estratégia de controle ótimo para plantas solares térmicas é proposta. Para isso, um modelo matemático fenomenológico foi primeiramente estudado e desenvolvido levando em consideração as principais características da planta. Graças as propriedades físicas dos subsistemas envolvidos, os objetivos de controle podem ser desacoplados e o sistema de controle proposto é projetado de forma descentralizada: um controlador ótimo que visa obter a trajetória ótima dos estados do campo de coletores solares, minimizando uma função custo associada ao rastreamento de referência de temperatura; e outro para calcular a política de controle para o armazenamento/despacho dos tanques térmicos. A metodologia é considerada com uma perspectiva rigorosa de forma a mostrar o que pode ser efetivamente garantido com a utilização dela. Além disso, sua implementação prática é discutida através de uma abordagem direta, na qual o controlador é transformado para um problema de programação não linear. Diversas simulações com tarifas de energia e dados meteorológicos do Brasil são apresentados para ilustrar o desempenho da metodologia proposta. Por fim, um estudo comparativo com uma estratégia de controle clássica apresenta as melhorias na receita da energia produzida neste cenário de simulação. São estimados ganhos de até 13,5% em termos de receita anual, caso a estratégia de controle ótimo seja adotada.

Defesa de Tese de Doutorado – Gabriel Arthur Gerber Andrade – 24/5/2021

11/05/2021 16:12
Defesa de Tese de Doutorado
Aluno Gabriel Arthur Gerber Andrade
Orientador Prof. Luiz Cláudio Villar dos Santos, Dr. – PPGEAS/UFSC
Data

 

24/5/2021  9h  (segunda-feira)

Videoconferência (https://meet.google.com/vbe-nqgq-chn)

 

 

Banca

Prof. Luiz Cláudio Villar dos Santos, Dr. – PPGEAS/UFSC (presidente);

Prof. Rodolfo Jardim de Azevedo, Dr. – IC/UNICAMP;

Prof. Rômulo Silva de Oliveira, Dr. – DAS/UFSC;

Prof. Márcio Bastos Castro, Dr. – INE/UFSC.

Título Test Generation for Shared-Memory Verification of Multicore Chips
Abstract: This thesis contributes to the functional verification of shared-memory behavior during the design of multicore chips. Since non-deterministic behavior is key to exposing shared-memory errors, non-synchronized parallel programs are often used for design verification and prototype test. However, in the verification phase, the slow execution in a simulator requires non-conventional techniques for enabling error exposure and high coverage with shorter programs. In this context, this thesis makes three contributions. The first contribution consists of two techniques that build upon conventional random test generation for efficient shared-memory verification. One technique exploits canonical dependence chains for constraining the random generation of instruction sequences (to raise the coverage of state transitions due to memory events conflicting at a same shared location), another exploits address space constraints for biasing random address assignment (to raise the coverage of state transitions due to eviction events). As compared to a conventional generator, their combination reduced the average verification effort by one order of magnitude in many cases. The second contribution is a new mechanism for directed generation that improves the quality of non-deterministic racy tests. The mechanism exploits general properties of coherence protocols and cache memories for better control on transition coverage (which serves as a proxy for increasing the actual coverage metric adopted in a given verification environment). Being independent of coverage metric, coherence protocol, and cache parameters, the mechanism is reusable across quite different designs and verification environments. Such a model-based generator was faster to reach similar coverage as obtained by a data-driven generator (based on Genetic Programming), reported in a related work. For instance, when executing tests with 1K operations for verifying 32-core designs, our test generator reached 60% coverage ten times faster. The third contribution consists of an hybrid approach that is not a simple combination of data-driven and model-based techniques. It reformulates directed test generation as a double-objective optimization problem, and it explores neighborhoods to avoid explicit enumeration of the coherence state space without excluding optimal solutions from the search space. As compared to purely data-driven and model-based generators, the hybrid approach led to superior coverage evolution with time, when targeting 32-core designs relying on different protocols. For instance, for a MOESI 2-level protocol, the approach was up to 2.7 faster than the model-based generator and around 5 to 19 times faster than the data-driven generator. Finally, the hybrid approach was also compared to a data-driven generator based on Reinforcement Learning. The experimental results showed that the proposed hybrid approach was 2 to 3 times faster to obtain the maximal coverage reached by that generator. The contributions of this thesis were reported in two journal articles (ANDRADE; GRAF; SANTOS, 2020; ANDRADE et al., 2020) and two conference papers (ANDRADE et al., 2018; PFEIFER et al., 2020).

Defesa de Tese de Doutorado – Seyed Jamalaldin Haddadi – 20/5/2021

11/05/2021 16:10
Defesa de Tese de Doutorado
Aluno Seyed Jamalaldin Haddadi
Orientador Prof. Eugênio de Bona Castelan Neto, Dr. – DAS/UFSC
Data

 

20/5/2021  13h  (quinta-feira)

Videoconferência (https://meet.google.com/fxo-qsyt-bzr)

 

 

Banca

Prof. Eugênio de Bona Castelan Neto, Dr. – DAS/UFSC (presidente);

Prof. Guilherme Vianna Raffo, Dr. – UFMG;

Prof. Henrique Simas, Dr. – EMC/UFSC;

Prof. Leandro Buss Becker, Dr. – DAS/UFSC.

Título Improvement of Visual-Inertial ORB-SLAM using Correction in State Estimation
Abstract: The fusion of monocular visual and inertial has gained a lot of attention from robotic systems. Recent results have shown that optimization-based fusion approaches outperform filtering approaches. However, poor initialization can lead to inaccurate state estimation in optimization-based visual-inertial Simultaneous Localization and Mapping (SLAM) systems. Therefore, due to the nonlinearity of visual-inertial systems, initial values (visual scale, gravity, velocity, and Inertial Measurement Unit (IMU) biases) play a crucial role. For this reason, this thesis aims to improve the initial state estimation using two adjustable parameters. Based on the difficulty level of the environment (texture, mid texture, and texture-less), the indoor room is categorized into easy, medium, and difficult, and then two adjustable parameters are regulated based on this difficulty level. This strategy has been tested in two types of implementation; Benchmarking with the public EuRoC dataset and real-world experiment. In benchmarking, by employing the right adjustable parameters, in some scenarios, we could attain satisfactory results compared to stateof-the-arts visual-inertial Odometery and SLAM in terms of positioning accuracy and reduction of accumulative error. In this part, also, from point of hardware’s view, some measurements are performed. While the proposed algorithm is being executed, the maximum CPU usage in each sequence is measured on a Raspberry-Pi singleboard and a Laptop. The results proved that the Raspberry-Pi 3 – because of poor hardware configuration – is under more pressure in terms of CPU usage. The second part is concerned with a real-world experiment in which a monocular-inertial RealSense ZR300 sensor is utilized. The outcomes were satisfactory so that the initialization time was very short and the proposed algorithm could quickly obtain the ORB features.

Defesa de Ex. Qualificação – Marcelo Menezes Morato – 6/5/2021

06/05/2021 06:08
Defesa de Exame de Qualificação
Aluno Marcelo Menezes Morato
Orientador

Coorientador

Prof. Julio Elias Normey-Rico, Dr. – DAS/UFSC

Prof. Olivier Sename, Dr. – GIT/França

Data

Local

6/5/2021  9h30  (quinta-feira)

Videoconferência (https://meet.google.com/emj-repp-fia)

  Prof. Eugênio de Bona Castelan Neto, Dr. – DAS/UFSC (presidente)

Profa. Vilma Alves de Oliveira, Dra. – EESC/USP;

Prof. Márcio André Fernandes Martins, Dr. – UFBA.

Título Predictive Control Methods for Linear Parameter Varying Systems
Resumo: Muitos sistemas não lineares podem ser descritos através de representações Lineares Paramétrico-Variantes (LPV), através da propriedade da inclusão linear diferencial. Ao longo das últimas décadas, o ferramental de modelagem LPV tornou-se muito popular para a síntese de controladores, uma vez que este tipo de representação mantém linearidade entre os canais de entrada e de saída e, portanto, oferece vantagens de síntese típicas de sistemas lineares invariantes no tempo. Nesta apresentação, investigaremos a aplicação de Controle Preditivo baseado em Modelo (MPC) para sistemas representados por modelos LPV. Neste caso, os valores futuros dos parâmetros de agendamento LPV são necessários para a resolução do problema MPC, a cada período de amostragem. Entretanto, estes parâmetros futuros são desconhecidos. Assim, revisitaremos as abordagens clássicas disponíveis para a solução de problemas de controle LPV MPC:  a) abordagens baseadas em tubos e conjuntos terminais; b) abordagens de Programação Não Linear; e c) abordagens robustas (min-max). Além disso, discutiremos os caminhos em aberto e as abordagens mais recentes para este problema, incluindo MPCs sub-ótimos e Programas Quadráticos (QPs) usados para a estimativa dos valores futuros de agendamento. Exemplos em simulação são apresentados para ilustrar as técnicas e discuti-las.

Defesa de Ex. Qualificação – Marduck Montoya Henao – 6/4/2021

02/04/2021 10:29
Defesa de Exame de Qualificação
Aluno Marduck Montoya Henao
Orientador

Coorientador

Prof. Daniel Juan Pagano, Dr. – DAS/UFSC

Prof. Rony Cristiano, Dr. – UFG

Data

Local

6/4/2020  14h  (terça-feira)

Videoconferência (https://meet.google.com/rvb-jvhh-pgf)

  Prof. Hector Bessa Silveira, Dr. – DAS/UFSC (presidente)

Prof. Durval José Tonon, Dr. – UFG;

Prof. Marcelo de Lellis Costa de Oliveira, Dr. – DAS/UFSC.

Título Bifurcation Analysis of Non-Smooth Dynamical Systems with Multiple Boundaries
Resumo: Nesta proposta de trabalho doutorado consideramos os sistemas dinâmicos descontínuos suaves por partes (DPWS) com múltiplas fronteiras de descontinuidade. Em particular, sistemas 2/3DDPWS com duas fronteiras de descontinuidade que normalmente são dados por hipersuperficies (planos). Para o estudo da dinâmica de deslizamento presente na fronteira de descontinuidade se usa o método de convecção de Filippov. O objetivo do trabalho de doutorado é investigar os cenários que podem surgir nos retatos de fase de sistemas descontínuos quando um parâmetro real age como uma perturbação do sistema considerado, ou seja, bifurcações de sistemas DPWS. Sistemas DPWS podem exibir bifurcações clássicas (sela-nó, Hopf,pitchfork, etc) e também bifurcações induzidas pela descontinuidade (DIBs) que são próprias dos sistemas suaves por partes. Dentro de este grupo de bifurcações estão as bifurcações de equilíbrio de fronteira (BEB) e “bifucações sliding” as quais têm um segmento de deslize na fronteira de descontinuidade. Nesse sentido, este trabalho apresenta uma análise qualitativa e geométrica de bifurcações e de seus desdobramentos, em particular, de codimensão 1 e 2, envolvendo equilíbrios naturais, equilíbrios de fronteira, pseudo-equilíbrios, ciclos limite e superfícies invariantes. Apresentamos contribuições originais, as quais foram obtidas a partir do estudo da teoria de sistemas DPWS aplicada em dois casos de estudo em eletrônica de potencias. Uma primeira aplicação é feita para sistemas de equilíbrio de tensão do capacitor em um conversor modular multinível (MMC) e uma segunda aplicação para conversor buck bidirecional dc-dc composto por dois conversores buck conectados em uma estrutura em cascata, sendo o primeiro conversor buck controlado por uma lei de controle de modo deslizante (SMC) e o segundo conversor modelado por um CPL por partes. Além disso, apresentamos simulações numéricas para ter uma melhor compreensão da dinâmica dos sistemas e verificar os resultados teóricos obtidos.

Defesa de Dissertação de Mestrado – João Gabriel Zago – 5/4/2021

25/03/2021 22:26
Defesa de Dissertação de Mestrado
Aluno João Gabriel Zago
Orientador

Coorientador

Coorientador

Prof. Fábio Luis Baldissera, Dr. – DAS/UFSC

Prof. Eric Aislan Antonelo, Dr. – DAS/UFSC

Prof. Rodrigo Saad, Dr. – PPGEAS/UFSC

Data 5/4/2021 (segunda-feira) – 14h

Videoconferência (https://meet.google.com/qvo-nyvb-yme)

Banca Prof. Fábio Luis Baldissera, Dr. – DAS/UFSC (presidente);

Prof. Maurício Fernandes Figueiredo, Dr. – DC/UFSCar;

Prof. Jomi Fred Hübner, Dr. – DAS/UFSC;

Prof. Marcelo Ricardo Stemmer, Dr. – DAS/UFSC.

Título Defense Methods for Convolutional Neural Networks Against Adversarial Attacks
Abstract: Despite its success in image classification, Convolutional Neural Networks (CNNs) arestill fragile to small perturbations in the input images they have to classify: slight changes in the values of some pixels might result in completely different network outputs. Suchimages purposefully perturbed to deceive a classifier are known as adversarial images.This vulnerability of CNNs to adversarial images raises concerns in safety-sensitive ap-plications: involving life-threatening, environmental, or financial implications. This thesis proposed two computationally cheap and complementary methods to help circumvent and alleviate this fragility of CNNs: a) a novel strategy that reduces the success of ad-versarial attacks by obfuscating the softmax output, which does not require any network training; and b) a method that employs Benford’s Law for distinguishing natural images from adversarial ones at the pixel level, providing an extra shield acting at the input layer of vulnerable CNNs. The defense we developed in (a) not only decreases the attack success rate but also forces the attack algorithm to insert larger perturbations in the input images. The study conducted in (b) indicates that: 1) adversarial images tend to deviate significantly more from Benford’s distribution than unaltered images;2) this deviation increases with the magnitude of the perturbation; 3) in some cases,it is possible to identify ongoing attacks by online monitoring this deviation, making it possible to turn off the classifier for the particular requester before it completes an attack. Finally, these two methods are orthogonal in that we expect the CNN classifier to get better protection against attacks while using them simultaneously.

Defesa de Dissertação de Mestrado – Juliano Emir Nunes Masson – 22/3/2021

03/03/2021 14:34
Defesa de Dissertação de Mestrado
Aluno Juliano Emir Nunes Masson
Orientador

Coorientador

Prof. Daniel Ferreira Coutinho, Dr. – DAS/UFSC

Prof. Marcelo Petry, Dr. – UFSC/Blumenau

Data 22/3/2021 (segunda-feira) – 14h

Videoconferência (https://meet.google.com/gep-dgyw-reo)

Banca Prof. Daniel Ferreira Coutinho, Dr. – DAS/UFSC (presidente);

Prof. Maurício Edgar Stivanello, Dr. – IFSC;

Prof. Marcelo Ricardo Stemmer, Dr. – DAS/UFSC;

Prof. Eric Aislan Antonelo, Dr. – DAS/UFSC.

Título Geração de Mapas de Profundidade utilizando Redes Neurais Convolucionais
Resumo: A fotogrametria é um problema clássico de visão computacional e consiste na extração de informação tridimensional a partir de imagens. Ela pode ser descrita de maneira simplificada como sendo o processo de gerar um modelo 3D, de alguma cena capturada por duas ou mais imagens, de diferentes pontos de vista. A possibilidade de extrair a geometria de uma cena através de imagens permite uma vasta gama de aplicações, como a criação de ambientes virtuais para a simulação de robôs autônomos, a virtualização de ambientes reais para venda de imóveis, análise de deformação de superfícies, cálculo do deslocamento de barragens, monitoramento de erosões, planejamento e inspeção de construções, etc. Mesmo com o uso massivo de redes neurais em problemas clássicos de visão computacional mostrando um grande avanço quando comparados aos algoritmos tradicionais (principalmente em tarefas de reconhecimento de objetos), os principais softwares comerciais e bibliotecas de fotogrametria utilizados para as aplicações citadas anteriormente ainda não fazem uso de redes neurais. A partir dessa constatação, esse trabalho tem como objetivo estudar metodologias de geração de mapas de profundidade a partir de imagens de câmeras calibradas (matriz intrínseca e extrínseca conhecidas) utilizando redes neurais convolucionais. Para alcançar o objetivo foi feita uma revisão sistemática dos trabalhos da área, e com base nas estruturas das redes encontradas, foram propostas algumas modificações na rede CasMVSNet. Como a base da fotogrametria é encontrar correspondências entre as imagens, as modificações propostas focaram na etapa de extração de features, trocando as convoluções por convoluções deformáveis e deformáveis moduladas, permitindo uma maior adaptação da rede aos dados de entrada. Para os experimentos foram escolhidos três datasets, o DTU, Tanks and Temples e o BlendedMVS. Para o treinamento foram utilizados o DTU e o BlendedMVS, e para a avaliação quantitativa dos resultados o DTU e o Tanks and Temples. Dentre as modificações propostas, a dconv_todas treinada com o dataset DTU teve uma redução de 22% no consumo de memória gráfica, melhora na completude e na média do resultado quantitativo do DTU e uma pontuação média maior no Thanks and Temples, com uma penalidade de apenas 3.75% no tempo de processamento, em comparação a rede CasMVSNet original.