Esse artigo envolve as principais características desse sistema de arquivos que é padrão em algumas importantes distribuições Linux. O texto foi feito com o objetivo de demonstrar porque a performance do Reiser é tão boa e os motivos pelos quais esse filesystem tem bastante reputação no mundo Linux.
O objetivo desse artigo é proporcionar ao leitor um fácil entendimento de como funciona o ReiserFS, suas vantagens e porque adota-lo como filesystem padrão em detrimento ao mais difundido EXT3.
Esse artigo não tem finalidade de defender um ou outro filesystem, mas apenas explicar porque a performance de um é superior a de outro. A intenção também é "explicar o porque das coisas", pois como iniciante e profundo curioso que sou, não me contentei com as diversas opiniões sugerindo ou que o Reiser é melhor, ou que o EXT3 seja. Com bases nas pesquisas que fiz resolvi enviar esse simples artigo pra comunidade afim de ajudar aqueles que como eu tem curiosidade de entender um pouco mais a forma com que o Reiser trabalha.
Introdução
O REISERFS foi criado por Hans Reiser há cerca de 10 anos atrás que também fundou uma equipe chamada NAMESYS (www.namesys.com) com o objetivo de desenvolver um sistema de arquivos rápido, robusto, seguro e de fácil recuperação em caso de problemas. A partir do Kernel 2.4 o Reiser passou a ser um dos filesystems suportado pelo sistema operacional.
Com o tempo, o Reiser passou a ser incluído como filesystem padrão de algumas distribuições respeitadas, citando: SuSE, Slackware 8.1 e Gentoo. Isso trouxe popularidade a esse sistema de arquivos e hoje o mesmo faz parte da lista de ótimas escolhas para os linuxistas o que implica em muitos debates sobre o desempenho do Reiser em relação a outros sistemas de arquivos, principalmente o EXT3.
Ao observar superficialmente esse file system é inevitável a comparação com as estruturas de banco de dados. Na verdade, o ReiserFS trata uma partição do disco como se fosse uma tabela de uma base de dados onde diretórios, arquivos e metadados são armazenados em uma eficiente estrutura chamada de "árvore balanceada", a B* Tree, o qual é, junto com o recurso de journaling, as duas engrenagens responsáveis pela popularidade do ReiserFS.
Vamos verificar as vantagens e desvantagens do Reiser em torno da questão de segurança e integridade dos dados e velocidade na manipulação de arquivos pelo filesystem.
[1] Comentário enviado por angeloshimabuko em 07/06/2006 - 20:06h
O Reiserfs versão 3 não garante a integridade dos dados, apenas dos metadados (informações referentes aos arquivos: permissões, donos, datas, etc.). O único dos principais sistemas de arquivos para Linux que preserva a integridade dos dados é o Ext3 (opção data=journal). O XFS e o JFS também fazem o journaling apenas de metadados. A otimização do uso de espaço em disco no Reiserfs v3 acarreta perda de desempenho; os principais testes de benchmark realizados utilizam a opção notail; além disso, sem a opção notail o consumo de CPU é muito grande. Mesmo com a opção notail o desempenho do Reiserfs v3 é muito bom com arquivos pequenos (o termo pequeno é muito vago na literatura atual: alguns dizem até 10 KB, outros 20 KB); tem sido superior aos outros 3 sistematicamente com arquivos menores que 10 KB, e o XFS tem vencido os testes com arquivos maiores que 100 KB; não encontrei dados para compará-los com arquivos na faixa intermediária. O grande problema do Reiserfs v3 é o índice de fragmentação e a ausência de ferramenta para desfragmentação (o Hans prometeu uma para o Reiser4). O XFS possui uma (xfs_fsr) e o JFS aparentemente também tem. Para desfragmentar volumes com o Ext3 e o Reiserfs v3 deve-se fazer um backup (ou dump), apagar (ou reformatar) e restaurar tudo. Finalmente, o Reiserfs não utiliza a estrutura de árvore para armazenar os arquivos, exceto quando são menores que 4 KB; para arquivos maiores são utilizados ponteiros para alocação de blocos não-formatados (indirect items), de forma análoga ao Ext3 (ambos são ditos usar alocação por blocos). O XFS e o JFS usam alocação por extensão (extents), i.e., utilizam uma estrutura, também em árvore, para ordenar (decrescentemente) e alocar conjuntos de blocos contíguos para diminuir a fragmentação de arquivos.
[4] Comentário enviado por DooM em 08/06/2006 - 08:45h
Obrigado pelos esclarecimentos Angelo, você poderia citar algum link ou outra fonte que eu pudesse dar uma olhada? Como dito no inicio, esse artigo foi feito com base nos links relacionados na referencia bibliografica o que inclui o próprio site da Namesys.
Obviamente não encontrei os defeitos que você citou sobre a performance do disco, a não segurança a integridade dos dados e os locais que pesquisei todos citam a utilização de arvore.
Onde poderia checar mais informações como as prestadas por você?
Obrigado pela ajuda e possível esclarecimento.
[6] Comentário enviado por angeloshimabuko em 08/06/2006 - 12:27h
Um excelente artigo que li sobre o Reiserfs foi do Florian Buchholz em: <http://homes.cerias.purdue.edu/~florian/reiser/reiserfs.php>. Veja o benchmark feito por Hans Ivers em 2006 (<http://www.debian-administration.org/articles/388>), que cita outros 2 testes. Um bom artigo de referência sobre os principais sistemas de arquivos e sua escalabilidade, embora desatualizado, foi escrito por Bryant, Forester e Hawkes: "Filesystem performance and scalability in Linux 2.4.17"; para a Usenix de 2002.
[7] Comentário enviado por agk em 08/06/2006 - 14:24h
Eu utilizo reiserfs há bastante tempo e nunca tive problemas.
Quanto a utilizar reiserfs e nfs há vários relatos de que o sistema fica instável, mas não é o meu caso.
Sem contar que o reiserfs tem suporte a partições criptografadas (os outros tipos de sistemas de arquivos também devem ter, mas eu desconheço) e isso aumenta bastante a segurança local do sistema.
[8] Comentário enviado por removido em 09/06/2006 - 08:28h
Ótimo artigo.
eu passei para ReiserFS, e gostei das definições aqui encontradas. Veio a reforçar o que eu havia ouvido sobre este filesystem.
muito bom.
[9] Comentário enviado por coffnix em 09/06/2006 - 22:59h
Perfect!!!
Gostei do artigo. Realmente, discutir sobre o melhor sistema de arquivos é como discutir qual a melhor distro a se usar: "depende da utilização e necessidade de cada um"
Para o que eu uso, que é meu pc doméstico, realmente, ganhei mais desempenho, velocidade e segurança de dados armazenados.
Agora, na empresa onde trabalho, os vários servidores usam EXT3 e reiserFS. Pergunta, pra que os 2? NECESSIDADE!
Então é isso. Parabéns DooM e continue contribuindo com a nossa comunidade.
[12] Comentário enviado por juniormardoque em 17/05/2007 - 23:43h
Estava procurando por algum artigo sobre filesystem e encontrei este seu, muito interessante. e me deixou com vontate de pesquizar mais a fundo tudo isso. Valeu DooM continue contribuindo com a comunidade.
[17] Comentário enviado por mauriciotaveira em 20/10/2009 - 12:41h
Olá gostaria de contribuir com o assunto, outra desvantagem do reiserfs que não foi abordada é em relação ao consumo de CPU...
Gostaria se possivel de abrir esse parentese, para comentários e experiencias... Atualmente estou fazendo estudos do uso do reiserfs em cache para o squid3, o que tenho lido é que realmente o desempenho é muito bom...