Porquê o CDF é o contrário do que a ciência precisa.

agosto, 2011

No meu texto anterior chamei a atenção (de forma bastante superficial é verdade) para a questão de como o paper científico transposto do meio físico para o meio digital traz consigo todos os problemas do paper físico aproveitando muito pouco das qualidades do meio digital.
Também chamo atenção para o fato de que Stephen Wolfram também reconhece parte destes problemas e, na tentativa de encontrar alguma solução, criou o formato CDF. Recomendo que assistam ao vídeo do Wolfram apresentando o formato, caso ainda não tenham assistido.

Reparem que ele começa argumentando que os documentos online de hoje são como o papel físico, “monótonos, sem vida, inertes” são as três características que ele nomeia. Vejam, é importante notar que o Wolfram está se referindo especificamente à documentos que podem ser baixados (ou visualizados pelo navegador com a ajuda de um plugin), muito embora faça referência à “documentos online”. Trata-se de uma crítica direta ao formato PDF, que é o mais utilizado para distribuição de arquivos digitais. Acontece que arquivos PDF’s podem estar online, mas não são documentos online, são documentos disponíveis na internet, mas que mesmo abertos via plugin no browser, são lidos localmente na máquina do usuário. Estão, portanto, longe de serem documentos online.

O problema seguinte para o qual o Wolfram chama atenção é que estes documentos disponíveis online não costumam carregar em si uma série de informações relevantes (como, nos exemplos do Wolfram, os dados sem tratamento, algoritmos, instruções para re-execução de código). Este problema esta relacionado, normalmente, ao limite de páginas imposto por alguns periódicos para a publicação de artigos. O vídeo segue mostrando que problemas similares acontecem com apresentações profissionais e livros didáticos. Todos sofrem por serem, mais uma vez citando o próprio Wolfram, “documentos mortos”.

Como o Wolfram pretende solucionar estes problemas? Surpreendentemente, criando mais um formato proprietário (o próprio CDF), que só pode ser gerado por um outro software proprietário (o Mathematica) que custa US$ 2.495,00, e que impõe restrições na maneira como você vai distribuir o conteúdo que gerou. Se você distribuir gratuitamente é obrigado a deixar a marca d’água e logo do Wolfram aparecendo o tempo todo na sua apresentação ou artigo (parte do branding obrigatório da licença gratuíta de uso e distribuição), se comercializar seu conteúdo, é preciso pagar uma taxa para a Wolfram. Todas estas informações (com exceção do valor do Mathematica que pode ser consultado aqui) estão no FAQ na página oficial do CDF.

Em outras palavras, o CDF até pode ser interativo e conter dados que não seriam facilmente distribuídos de outra maneira, mas o faz de forma a ser ainda mais restritivo do que o formato que ele crítica, o PDF.

Com efeito, é possível até questionar se o CDF é tão interativo quanto o Wolfram deseja que ele seja. Sim, é possível ter toda uma gama de dados disponíveis no documento e que podem ser retrabalhados de forma dinâmica, mas por outro lado, estes dados continuam encapsulado, inacessíveis, desconectados. Eles não podem ser acessados por outros CDF’s, não podem receber imput dinâmico de outras fontes de dados, não podem ser atualizados sem que um novo CDF seja gerado.

A ciência precisa sim de uma maneira mais dinâmica de ser apresentada, o cientista precisa sim de mais liberdade na maneira em que expõe seu trabalho e seus resultados. O que a ciência e os cientistas precisam é da plasticidade da Web 2.0, e não de um documento que simula a Web à maneira que o PDF simula o papel.

Isso significa que existe um nicho no mercado para a construção de uma ferramenta capaz de criar documentos, apresentações, artigos e livros didáticos que sejam compatíveis com uma variedade crescente de dispositivos (smartphones, tablets, computadores com diferentes sistemas operacionais e tamanhos de tela). Uma ferramenta capaz de fazer uso, por exemplo, de web standards (HTML, CSS, XML, arquivos de imagens PNG ou arquivos vetoriais SVG além de formatos de vídeo e audio ainda por serem padronizados), além de uma API de acesso padronizada para que os dados contidos nestes documentos verdadeiramente online possam ser extraídos, atualizados, remodelados da maneira como o autor E O leitor/usuário quiserem.

Esta é,  na minha visão, o caminho em que a comunicação da ciência deve seguir. Adoção das práticas cada vez mais consolidadas da Web 2.0 para não só comunicar seus resultados, mas para permitir que eles sejam reinterpretados livremente, acessados sem restrições, incrementados colaborativamente.

Se eu estiver com alguma razão, fica fácil entender por que acredito no fim dos papers científicos como os conhecemos. Eles representam um processo que teve começo, meio e fim, sendo o paper a síntese deste processo. Se a ciência caminha em direção à Web 2.0, então podemos esperar que ela seja levada a cabo de forma mais orgânica e contínua, sem pontos claros de interrupção, sem estar centrada nos resultados finais mas sim num processo contínuo de desenvolvimento. Uma ciência em fase beta, pouco preocupada com sua versão final.

Vejam que não acredito que TODA a ciência irá seguir por este caminho. Mas acredito que boa parte dela irá se dar conta de que está presa em um mundo feito de papel, ainda que este só exista na tela de um computador.