Maggie@Foresight Ventures



Principais Insights

  • Para alcançar a descentralização completa em aplicativos Web3, precisamos de avanços tecnológicos em quatro áreas, incluindo disponibilidade de dados (escalabilidade de blockchain), sistemas de arquivos descentralizados, bancos de dados descentralizados e computação descentralizada.

  • Velocidade de recuperação de dados, modelo de incentivo e tokenomics, e o algoritmo de garantia de disponibilidade de dados são fatores-chave que determinam se um protocolo de armazenamento de arquivo/banco de dados será amplamente utilizado ou não.

  • O foco principal para melhorar sistemas de arquivos descentralizados e protocolos de banco de dados será reduzir os tempos de recuperação.

  • A camada de disponibilidade de dados é um método promissor e importante para escalar blockchain. A tecnologia da Celestia ainda precisa de validação de mercado, e ETH e Celestia podem convergir tecnicamente no futuro

Arquiteturas de aplicativos Web2 e Web3.

Comparados aos aplicativos Web2, que geralmente consistem em um frontend, backend e camada de dados com um banco de dados e sistema de arquivos, os DApps Web3 podem ser mais simples, pois precisam apenas de um frontend e um contrato inteligente que serve como backend e banco de dados.



Mas, como esses DApps não têm um sistema de arquivos para armazenar arquivos, suas páginas frontend, imagens e outros arquivos ainda são hospedados em servidores centralizados. Para atingir a descentralização completa, os desenvolvedores agora estão usando sistemas de arquivos descentralizados para armazenar os arquivos necessários, incluindo páginas frontend, metadados NFT e imagens, para DApps.



Para melhorar o armazenamento de dados estruturados e as capacidades de computação de backend, utilizamos tecnologia de disponibilidade de dados para escalar o blockchain. Além disso, dois tipos de produtos surgiram: bancos de dados descentralizados e computação descentralizada.

Ao utilizar blockchain, os desenvolvedores podem armazenar dados financeiros e outras informações críticas relacionadas a DApps. Por outro lado, bancos de dados descentralizados podem ser utilizados para armazenar dados estruturados, como metadados NFT, dados de votação DAO, livros de ordens DEX, dados sociais e assim por diante. Além disso, a computação descentralizada pode ajudar a dimensionar o backend.



No geral, para construir DApps Web3 totalmente descentralizados, flexíveis e ricos, são necessários quatro tipos de produtos e avanços tecnológicos.

  1. Sistema de arquivos descentralizado: armazene páginas da web de frontend DApp, imagens NFT, vídeos e outros arquivos de Dapps.

  2. Banco de dados descentralizado: armazene dados estruturados, como metadados NFT, votos DAO e livro de ordens DEX.

  3. Disponibilidade de dados: dimensione o blockchain e armazene dados financeiros e importantes para DApps.

  4. Ferramentas de computação descentralizadas: dimensione o backend de DApps.



1. Sistema de arquivos descentralizado

O armazenamento descentralizado de arquivos serve como um substituto para o armazenamento centralizado, facilitando a realização de DApps sem servidor. A demanda de DApps para sistemas de arquivos descentralizados está crescendo e será um componente vital da pilha de tecnologia Web3.

Em comparação ao uso de armazenamento centralizado, as principais vantagens do armazenamento descentralizado são a remoção de terceiros confiáveis, maior redundância, eliminação de riscos de ponto único de falha e custos mais baixos.



De acordo com as estatísticas da Messari, o valor de mercado dos 4 principais protocolos de armazenamento de arquivos descentralizados foi de quase US$ 1,6 bilhão, queda de 83% em relação aos US$ 9,4 bilhões. Mais de 17 milhões de terabytes (TB) de capacidade total de armazenamento, alta de 2% YoY, e 532.500 TB de armazenamento usado, alta de 1280% YoY.



Vamos dar uma olhada na situação atual de vários projetos populares de armazenamento descentralizado. Armazenar dados usando todos esses protocolos de armazenamento descentralizado é significativamente mais barato em comparação com a AWS. Enquanto a AWS cobra cerca de US$ 23/TB/mês, esses protocolos de armazenamento descentralizado variam de US$ 0,0002 a US$ 20/TB/mês.

  • IPFS: IPFS é atualmente o protocolo mais amplamente usado para armazenar imagens e metadados para NFTs. É ótimo para armazenar dados acessados ​​com frequência ou "quentes". No entanto, IPFS não tem nenhuma maneira integrada de incentivar o armazenamento, provar que os dados estão armazenados corretamente ou estabelecer acordo entre os participantes como os blockchains fazem. Isso significa que há um risco de perda de dados se eles forem armazenados apenas no IPFS. Por exemplo, o serviço IPFS da Infura exclui dados que não foram acessados ​​em seis meses. Portanto, se você deseja manter seus dados disponíveis por um longo tempo, é melhor executar seu próprio nó IPFS.

  • Filecoin: Filecoin fornece baixos custos de armazenamento e é usado principalmente para armazenar dados “frios”, como dados de arquivo. Filecoin não tem um mecanismo de cobrança integrado para recuperação de dados, alguns mineradores aceitam dados de baixa qualidade para ganhar recompensas enquanto se recusam a facilitar a recuperação de dados. A comunidade Filecoin está abordando ativamente esse problema e implementando medidas para melhorar a qualidade geral dos dados armazenados.

  • Arweave: A ideia de armazenamento permanente da Arweave é bem-vinda para armazenar dados DApp. O ecossistema está se desenvolvendo bem, há sistemas de banco de dados descentralizados usando Arweave para armazenar arquivos de banco de dados, bem como soluções de escalabilidade de segunda camada baseadas em Arweave. Na Arweave, o preço não considera a largura de banda, alguns nós fornecem apenas serviços de armazenamento, não recuperação.

  • Swarm: Taxas de largura de banda são cobradas para armazenamento e recuperação no Swarm. O sistema é altamente descentralizado e tem altos requisitos de largura de banda para nós.

  • StorJ: O StorJ é diferente de outros protocolos, é parcialmente descentralizado e tem boa velocidade de recuperação. Tem se mostrado eficaz para compartilhamento de grandes arquivos de vídeo.

  • Sia: Skynet Labs, fechado devido à falta de novos financiamentos, o que também levou a um declínio no uso do Sia.



Avaliamos principalmente a usabilidade de um protocolo de armazenamento de arquivos descentralizado com base em três fatores:

  1. Velocidade de recuperação de dados. É crucialmente importante, porque determina a eficiência de um sistema de armazenamento em responder a solicitações de DApps e afeta diretamente a experiência do usuário de DApps. Fatores que podem afetar a velocidade de recuperação de dados incluem: se há uma taxa para consultas de dados, o grau de descentralização dos nós, a qualidade do nó, a lógica de encaminhamento de dados e facilidades como CDNs para consultas aceleradas.

  2. Modelo de incentivo e tokenomics. Modelos de incentivo e economia de token impactam a participação de nós de armazenamento, influenciando seu comportamento. Atualmente, o modelo de precificação convencional consiste em taxas de armazenamento mais taxas de largura de banda, o que significa que os usuários precisam pagar uma taxa de armazenamento ao armazenar dados e uma taxa de largura de banda ao acessá-los. Se as consultas de dados forem gratuitas, os nós geralmente não têm motivação para fornecê-las. Além disso, modelos de incentivo e economia de token impactam os ganhos dos mineradores, o que pode afetar o número de nós e a capacidade de armazenamento dos serviços.

  3. Algoritmo de garantia de disponibilidade de dados. É um algoritmo usado em redes descentralizadas para garantir a disponibilidade contínua de dados e o fornecimento adequado de serviços pelos nós. Atualmente, o método mais amplamente usado é o Proof of Random Access.



No geral, acreditamos que,

  1. Os produtos e serviços que alavancam protocolos de armazenamento descentralizados ainda estão em estágios iniciais.

  2. O foco principal para melhorar os protocolos de armazenamento será reduzir os tempos de recuperação.

  3. Velocidade de recuperação de dados, modelo de incentivo e tokenomics, e o algoritmo de garantia de disponibilidade de dados são fatores-chave que determinam se um protocolo será amplamente utilizado ou não.



2. Banco de Dados Descentralizado

Bancos de dados são amplamente utilizados em aplicativos; bancos de dados descentralizados são uma tecnologia crucial para alcançar a descentralização completa em DApps.

Bancos de dados descentralizados podem substituir bancos de dados centralizados para armazenar dados estruturados e importantes que os DApps exigem, como metadados NFT, votação DAO, livros de ordens DEX, dados de mídia social, etc.



Existem muitos projetos de bancos de dados descentralizados, especialmente nos últimos dois anos, quando vários projetos inovadores surgiram.

  • Ceramic: Ceramic é um projeto iniciado em 2019. Os dados são armazenados e gerenciados em unidades de fluxos, e logs de eventos formatados são adicionados aos fluxos. O log será transformado em um arquivo e carregado no IPFS. Fornece consultas de API GraphQL. O Ceramic não tem um modelo de incentivo como o IPFS e oferece suporte à criação, leitura e atualização de dados (CRU).

  • OrbitDB: OrbitDB é um projeto anterior comparado ao Ceramic, que também usa o sistema de arquivos IPFS para armazenamento de arquivos. Ele suporta o armazenamento de bancos de dados NoSQL e arquivos.

  • Tableland: O projeto começou em 2022 e está atualmente em fase de testes públicos. A versão de produção do Tableland será lançada em 2023. O armazenamento de dados requer o uso de contratos inteligentes, que definem instruções SQL e definem permissões de uso. A leitura de dados é realizada off-chain e não requer pagamento. Atualmente, o contrato foi implantado em L2s, como ETH e OP.

  • Polybase: O projeto agora está ativo na rede de testes. É um banco de dados NoSQL que suporta operações CRUD, com cada operação incorrendo em taxas. Além disso, o Polybase oferece suporte para vários sistemas de arquivos para armazenar arquivos de banco de dados, incluindo disco local, IPFS, Filecoin, Polystore e até mesmo AWS S3. O Polybase também utiliza canais de pagamento para pagamentos de consulta de dados, reduzindo a frequência de transações on-chain e evitando atrasos de consulta causados ​​por pagamentos.

  • Web3Q: Também conhecido como EthStorage. Início do projeto em 2022. A testnet está viva. Propôs um novo padrão de URL Web//access protocol para acessar dados

  • Kwill: Kwill é um sistema de banco de dados SQL baseado em Arweave, que usa contratos inteligentes para pagamento.

  • KYVE: KYVE é um sistema de banco de dados baseado no Arwave.

De uma perspectiva técnica:

  • Tanto SQL quanto NoSQL podem ser usados ​​como bancos de dados. A estrutura de dados do SQL requer alta consistência, com suporte mais forte para consultas conjuntas, tornando-o mais maduro e eficiente. O formato KV do NoSQL é mais adequado para o padrão de design do Ethereum, suportando tipos de dados ricos e sendo flexível e facilmente escalável.

  • Em termos de funcionalidade, a melhor opção é dar suporte a CRUD, mas dar suporte a UD adicionará complexidade ao sistema. Se o sistema usar armazenamento local, consultas de valores históricos podem não ser suportadas. Se usar IPFS e Arweave como sistemas de arquivos, o banco de dados precisa ser somente anexado, caso contrário, haverá várias versões dos mesmos dados, dobrando os custos de armazenamento.

  • Ao escolher um sistema de arquivos subjacente, há duas opções: 1) Armazenar arquivos de banco de dados em sistemas de arquivos descentralizados, como IPFS e Arweave; 2) Armazená-los localmente em nós ou na nuvem S3. Se um projeto de banco de dados descentralizado exigir lógica de recuperação ou otimização personalizada, usar armazenamento local ou S3 é uma abordagem mais flexível.



No geral, acreditamos que,

  1. O campo de bancos de dados descentralizados merece muita atenção, pois há uma demanda urgente, enquanto um produto amplamente aceito e utilizado ainda não surgiu.

  2. A maturidade dos bancos de dados descentralizados é menor do que a dos sistemas de armazenamento de arquivos descentralizados. A tecnologia de banco de dados descentralizado é baseada no sistema de arquivos descentralizado e muitos projetos são iniciados em 2022.

  3. O foco principal para melhorar o armazenamento, a velocidade de recuperação de dados, o modelo de incentivo e a tokenomics, e o algoritmo de garantia para disponibilidade de dados são fatores-chave que determinam se um protocolo será amplamente utilizado ou não. Os protocolos estarão na redução dos tempos de recuperação.





3. Disponibilidade de dados

O conceito de disponibilidade de dados se distingue dos sistemas de arquivos e bancos de dados descentralizados, conforme esclarecido nos sites da Ethereum e da Celestia.

  • Ethereum: A disponibilidade de dados é a garantia de que o proponente do bloco publicou todos os dados de transação para um bloco e que os dados de transação estão disponíveis para outros participantes da rede.

  • Celestia: A disponibilidade dos dados diz respeito à disponibilidade dos dados publicados no bloco mais recente.

Enquanto isso, sistemas de arquivos e bancos de dados descentralizados garantem principalmente que os dados armazenados pelos usuários estejam disponíveis, mas não abordam especificamente dados transacionais.





Atualmente, existem vários projetos de disponibilidade de dados, incluindo:

  1. Ethereum. O ETH serve como camada DA (disponibilidade de dados) para o Layer 2 Rollup.

  2. Celestia. Celestia é uma camada DA projetada especificamente que apenas lida com a disponibilidade de dados e não executa transações. Ela desencadeou uma tendência de blockchains modulares em 2022.

  3. EigenDA e outros produtos DA. Garantindo a disponibilidade de dados por meio de comitês.



Ethereum

A Camada 2 do ETH cria e envia lotes de transações para a rede Ethereum e armazena os dados em um contrato inteligente Ethereum na Camada 1. Isso garante a disponibilidade garantida dos dados de transações da Camada 2 por meio da rede ETH.

Embora os rollups possam estender o throughput de ETH por meio de computação off-chain, sua capacidade é limitada pelo throughput de dados do blockchain L1 ETH. Portanto, o Ethereum precisa aumentar suas capacidades de armazenamento e processamento de dados.



Para aumentar a capacidade de DA do Ethereum, o Danksharding foi incluído no roteiro do ETH e é considerado uma das atualizações mais importantes e urgentes atualmente.

Danksharding é um design de sharding, a disponibilidade de dados é delegada a cada shard, e cada validador só precisa executar um nó completo para seu próprio shard, enquanto executa outros shards com capacidade de cliente leve.

Proto-danksharding (EIP-4844) é uma implementação preliminar do Dankshading, que deve ser implementada no segundo semestre de 2023. Ele introduz um blob de dados armazenado off-chain que é montado em ETH por meio de transações, bem como código pré-compilado para validar o Blob. Cada blob tem aproximadamente 125kB de tamanho, enquanto um bloco tem apenas 90kB. Atualmente, no máximo oito blobs podem ser montados por bloco, resultando em armazenamento adicional de 1 MB. No Proto-danksharding, os dados não foram fragmentados e os validadores ainda precisam baixar e verificar diretamente a disponibilidade de todos os dados do Blob. Após a implementação do EIP4844, o Blob pode armazenar 10 vezes mais dados do que o Calldata com o mesmo consumo de gás. Os dados do Rollup podem ser armazenados no Blob no futuro, reduzindo as taxas de transação em uma ordem de magnitude. Uma vez totalmente implementado, o Danksharding se tornará ainda mais barato.

Em resumo, o Danksharding pode melhorar a capacidade de armazenamento de dados do Ethereum, reduzir o custo do ETH usado como DA e se tornar uma camada de DA mais poderosa.



Celestia

Celestia é um blockchain mínimo que apenas ordena e publica transações e não as executa. Ao desacoplar as camadas de consenso e execução de aplicativos, Celestia modulariza a pilha de tecnologia blockchain e desbloqueia novas possibilidades para construtores de aplicativos descentralizados.

  • Celestia é responsável pela camada DA, enquanto ETH lida com consenso e liquidação, e a cadeia de aplicação é responsável pela execução.

  • Celestia é responsável tanto pela camada DA quanto pela camada de consenso, enquanto liquidação e execução são manipuladas pela cadeia de aplicação. Alternativamente, a liquidação pode usar Cevmos, com a execução ainda sendo de responsabilidade da cadeia de aplicação.



A Celestia integra um esquema de codificação Reed-Solomon bidimensional e projetou um esquema de amostragem aleatória para verificar a disponibilidade de dados e recuperá-los, semelhante ao método de validação usado pela ETH.

E a Celestia também tem diferenças significativas da ETH.

  • A Celestia se concentra na camada DA e na camada de consenso, enquanto a ETH também serviu como uma camada de liquidação para Rollups

  • A Celestia não tem uma máquina virtual de contrato inteligente Turing completa, portanto, ela não oferece suporte a contratos inteligentes.

  • O rollup soberano da Celestia pode se bifurcar em várias cadeias, enquanto o Rollup da ETH não pode.

  • A Celestia não tem contratos inteligentes, pontes com rollups soberanos facilitariam principalmente a movimentação do token da camada DA.



O ecossistema de Celestia está crescendo rapidamente.



DA fora da cadeia

DA off-chain inclui principalmente

  • Comitês de Disponibilidade de Dados (DACs) são partes confiáveis ​​que fornecem, ou atestam, a disponibilidade de dados. DACs também são usados ​​por alguns validiums.

  • Os Comitês de Disponibilidade de Dados de Prova de Participação são consideravelmente mais seguros do que os DACs regulares porque eles incentivam diretamente o comportamento honesto. Aqui, qualquer um pode se tornar um validador e armazenar dados off-chain. No entanto, eles devem fornecer um “título”, que é depositado em um contrato inteligente.



Visão geral dos produtos de disponibilidade de dados.

  • ETH: ETH atualmente serve como a camada de disponibilidade de dados para rollups otimistas L2 e rollups zk. A adoção do EIP4844 (Proto-Danksharding) fornecerá benefícios adicionais ao L2. Embora a capacidade de armazenamento do ETH possa não ser tão grande quanto a da Celestia, ela se tornará comparável quando o Danksharding for totalmente implementado.

  • Celestia: Celestia foi projetada para funcionar como uma camada de consenso e disponibilidade de dados. A testnet Celestia entrou no ar em junho de 2022 e seu design modular inovador a tornou cada vez mais popular desde 2022. Celestia precisa estabelecer seu próprio ecossistema e existir em um relacionamento competitivo com Ethereum. Muitos projetos são construídos em Celestia.

  • Avail: Avail foi originalmente lançado pela Polygon em junho de 2022. No entanto, após a saída de seu fundador da Polygon, Avail se tornou um projeto de blockchain modular independente e uma testnet foi lançada. Avail é um consenso autônomo e camada DA como Celestia. A mainnet Avail foi planejada para ser conectada ao Polygon e usar MATIC como moeda base. Comparado aos tokens Celestia, MATIC é um token mais maduro.

  • EigenDA: EigenDA é uma camada DA baseada em Ethereum que incentiva os validadores a manter a rede por meio do re-staking de ETH, eliminando a necessidade de um ônus inicial como o exigido pela Celestia.

  • Outros DA off-chain: Validium usa armazenamento off-chain para disponibilidade de dados, Ethereum para consenso e liquidação, e Validium rollup para execução. Validium pode ser eliminado gradualmente à medida que Celestia e Danksharding ganham ampla adoção.



Concluindo, pensamos,

  • Uma camada de disponibilidade de dados é uma abordagem promissora e importante para dimensionar blockchains.

  • Os produtos DA atuais têm suas próprias vantagens e todos eles merecem atenção contínua.

  • A tecnologia da Celestia ainda precisa ser verificada pelo mercado, e ETH e Celestia também podem convergir tecnicamente no futuro.



4. Computação Descentralizada

Embora tenhamos observado alguns projetos de computação descentralizada, acreditamos que o desenvolvimento da computação descentralizada ainda está em seus estágios iniciais. Um dos maiores desafios enfrentados nessa área é verificar a precisão das computações.



Mais Explicação

A descentralização total nem sempre é necessária. Atualmente, há três tipos principais de arquiteturas DApp disponíveis. Serviços centralizados podem ser benéficos em situações que exigem alto desempenho e envolvem computações complexas arbitrárias.



Parece que alguns indivíduos podem não ter um entendimento completo das diferenças entre a camada de consenso e a camada de liquidação. Para esclarecer, elaborarei sobre as quatro funções no blockchain usando o ZK Rollup do Ethereum como exemplo.

  1. Após as transações ocorrerem na Camada 2, elas são enviadas ao Sequenciador que as agrupa e as enrola antes de enviá-las ao contrato inteligente na blockchain ETH. Conforme o rollup é adicionado à cadeia ETH, o consenso sobre a ordem das transações é confirmado e o ETH se torna a camada de consenso do Rollup. Conforme as transações da Camada 2 são armazenadas na blockchain ETH, o ETH também serve como a camada DA (Data Availability) para a Camada 2.

  2. Os nós da Camada 2 realizam a execução da transação, alteram o estado global da Camada 2 e geram provas de conhecimento zero. A Camada 2 serve como a camada de execução.

  3. A camada 2 envia o ZKP para a ETH, onde o contrato ETH verifica sua validade. Uma vez que a prova é aceita, o novo estado da camada 2 é confirmado. A ETH serve como a camada de liquidação para o rollup zk da camada 2.



Existem outros tipos de projetos relacionados a dados, como:

  1. Projetos que se concentram na indexação de dados on-chain, como The Graph e Space and Time, ou na indexação de dados IPFS, como o Filecoin Indexer.

  2. Redes DNS, incluindo LivePeer, Meson Network, Media.network e outras.

  3. Mercados de reputação de nós de armazenamento como Filgram, Filrep e Cidgravity, com exemplos de UI/UX como Web3.storage e NFT.storage.

Sobre a Foresight Ventures

A Foresight Ventures se dedica a apoiar a inovação disruptiva do blockchain nas próximas décadas. Gerenciamos vários fundos: um fundo de capital de risco, um fundo secundário gerenciado ativamente, um FOF multiestratégia e um fundo secundário de mercado privado, com AUM excedendo US$ 400 milhões. A Foresight Ventures adere à crença de “mentalidade única, independente, agressiva e de longo prazo” e fornece amplo suporte para empresas de portfólio dentro de um ecossistema em crescimento. Nossa equipe é composta por veteranos das principais empresas financeiras e de tecnologia, como Sequoia Capital, CICC, Google, Bitmain e muitas outras.

Site: https://www.foresightventures.com/

Twitter: https://twitter.com/ForesightVen

Médio: https://foresightventures.medium.com

Substack: https://foresightventures.substack.com

Discórdia: https://discord.com/invite/maEG3hRdE3

Linktree: https://linktr.ee/foresightventures

Aviso Legal: Todos os artigos da Foresight Ventures não pretendem ser conselhos de investimento. Os indivíduos devem avaliar sua própria tolerância ao risco e tomar decisões de investimento com prudência.