Introdução
Para o término da faculdade, tive a missão de elaborar um trabalho final de curso. Para essa tarefa, decidi usar minha pesquisa em andamento sobre Ethereum, que envolvia exploração e análise de dados na blockchain Ethereum. Devido à natureza do Ethereum ser essencialmente uma rede, decidi modelá-lo como um grafo, ou mais especificamente: como uma rede complexa.
O que é um grafo?
Um grafo é uma representação matemática de um conjunto de objetos, chamados nós ou vértices, que são conectados por “links” conhecidos como arestas. No contexto de uma rede como a Ethereum, os nós podem representar contas ou endereços, e as arestas podem representar transações ou interações entre essas contas. Os grafos podem ser usados para modelar muitos tipos de relacionamentos e estruturas, tornando-os uma ferramenta poderosa para analisar sistemas complexos.
Métricas de rede em meu TCC
Para meu TCC, calculei algumas métricas de rede para analisar a rede Ethereum. Duas métricas importantes nas quais me concentrei foram agrupamento e assortatividade.
Agrupamento: esta métrica mede o grau em que os nós em um gráfico tendem a se agrupar. Numa rede social, por exemplo, indica a probabilidade de dois amigos de uma pessoa também serem amigos. Na rede Ethereum, um alto agrupamento pode indicar grupos de contas que interagem frequentemente entre si.
Assortatividade: esta métrica mede a tendência dos nós de se conectarem com outros nós que sejam semelhantes de alguma forma. No contexto do Ethereum, a assortatividade poderia revelar se contas com volumes ou saldos de transações semelhantes tendem a interagir mais entre si.
Métricas específicas do nó: centralidade
Também calculei algumas métricas específicas dos nós, principalmente sua centralidade. A centralidade mede a importância ou influência de um nó na rede. Existem vários tipos de centralidade, mas em minha pesquisa concentrei-me na identificação de contas centrais no Ethereum para eventos específicos. Isto envolveu determinar quais contas eram mais importantes para facilitar as transações ou atuar como centros na rede.
Conclusões do artigo
Com o uso dessas métricas, consegui projetar mais recursos em nossos conjuntos de dados, para vários períodos de nosso período de coleta. Com esses novos recursos, algumas coisas puderam ser entendidas sobre esse ecossistema de criptoativos:
A tendência de formação de grupos centrais grandes e fortes é extremamente baixa. Isto corrobora com a ideologia de descentralização do blockchain.
Grandes casas de câmbio e contas de negociação de NFTs foram consideradas endereços de maior impacto (centrais).
As características da rede mudam ao longo do tempo em vez de sofrerem grandes flutuações em eventos importantes, como uma pandemia ou o surgimento de um conflito armado impactante.
Essas descobertas servem como uma base importante para compreender a natureza de um ecossistema tão caótico.
Implicações mais amplas: modelagem de rede em ciência de dados
Através deste projeto, aprendi como o uso da modelagem de redes pode ser útil para outros problemas cotidianos de ciência de dados. A modelagem de rede fornece uma perspectiva única, destacando relacionamentos e interações dentro dos dados, o que nem sempre é aparente através dos métodos de análise tradicionais.
Trabalhos para o Futuro?
Pensei na possível aplicação dessa teoria em outros usos da ciência de dados. Aqui estão algumas ideias:
Análise de redes sociais: Ao modelar as interações nas mídias sociais como uma rede, poderíamos identificar usuários influentes, detectar comunidades e analisar a disseminação de informações ou tendências.
Sistemas de recomendação: plataformas de e-commerce e serviços de streaming podem fazer uso de modelagem de redes para recomendar produtos ou conteúdo aos usuários com base nos relacionamentos e interações entre itens e usuários. Tenho mais algumas ideias sobre isso, trarei em outro post separado futuramente.
Detecção de fraude: As instituições financeiras poderiam modelar suas atividades de maneira semelhante à que modelei o Ethereum. A detecção de fraudes é comumente feita com redes complexas no Ethereum, então não seria absurdo pensar em usá-la em um contexto financeiro tradicional.
Otimização de infraestrutura: Esta é uma aplicação clássica da teoria dos grafos. As empresas podem otimizar a manutenção e expansão de infraestruturas, como redes elétricas ou redes de abastecimento de água, identificando pontos críticos que podem impactar todo o sistema.