Porquê o CDF é o contrário do que a ciência precisa.

No meu texto anterior chamei a atenção (de forma bastante superficial é verdade) para a questão de como o paper científico transposto do meio físico para o meio digital traz consigo todos os problemas do paper físico aproveitando muito pouco das qualidades do meio digital.
Também chamo atenção para o fato de que Stephen Wolfram também reconhece parte destes problemas e, na tentativa de encontrar alguma solução, criou o formato CDF. Recomendo que assistam ao vídeo do Wolfram apresentando o formato, caso ainda não tenham assistido.

Reparem que ele começa argumentando que os documentos online de hoje são como o papel físico, “monótonos, sem vida, inertes” são as três características que ele nomeia. Vejam, é importante notar que o Wolfram está se referindo especificamente à documentos que podem ser baixados (ou visualizados pelo navegador com a ajuda de um plugin), muito embora faça referência à “documentos online”. Trata-se de uma crítica direta ao formato PDF, que é o mais utilizado para distribuição de arquivos digitais. Acontece que arquivos PDF’s podem estar online, mas não são documentos online, são documentos disponíveis na internet, mas que mesmo abertos via plugin no browser, são lidos localmente na máquina do usuário. Estão, portanto, longe de serem documentos online.

O problema seguinte para o qual o Wolfram chama atenção é que estes documentos disponíveis online não costumam carregar em si uma série de informações relevantes (como, nos exemplos do Wolfram, os dados sem tratamento, algoritmos, instruções para re-execução de código). Este problema esta relacionado, normalmente, ao limite de páginas imposto por alguns periódicos para a publicação de artigos. O vídeo segue mostrando que problemas similares acontecem com apresentações profissionais e livros didáticos. Todos sofrem por serem, mais uma vez citando o próprio Wolfram, “documentos mortos”.

Como o Wolfram pretende solucionar estes problemas? Surpreendentemente, criando mais um formato proprietário (o próprio CDF), que só pode ser gerado por um outro software proprietário (o Mathematica) que custa US$ 2.495,00, e que impõe restrições na maneira como você vai distribuir o conteúdo que gerou. Se você distribuir gratuitamente é obrigado a deixar a marca d’água e logo do Wolfram aparecendo o tempo todo na sua apresentação ou artigo (parte do branding obrigatório da licença gratuíta de uso e distribuição), se comercializar seu conteúdo, é preciso pagar uma taxa para a Wolfram. Todas estas informações (com exceção do valor do Mathematica que pode ser consultado aqui) estão no FAQ na página oficial do CDF.

Em outras palavras, o CDF até pode ser interativo e conter dados que não seriam facilmente distribuídos de outra maneira, mas o faz de forma a ser ainda mais restritivo do que o formato que ele crítica, o PDF.

Com efeito, é possível até questionar se o CDF é tão interativo quanto o Wolfram deseja que ele seja. Sim, é possível ter toda uma gama de dados disponíveis no documento e que podem ser retrabalhados de forma dinâmica, mas por outro lado, estes dados continuam encapsulado, inacessíveis, desconectados. Eles não podem ser acessados por outros CDF’s, não podem receber imput dinâmico de outras fontes de dados, não podem ser atualizados sem que um novo CDF seja gerado.

A ciência precisa sim de uma maneira mais dinâmica de ser apresentada, o cientista precisa sim de mais liberdade na maneira em que expõe seu trabalho e seus resultados. O que a ciência e os cientistas precisam é da plasticidade da Web 2.0, e não de um documento que simula a Web à maneira que o PDF simula o papel.

Isso significa que existe um nicho no mercado para a construção de uma ferramenta capaz de criar documentos, apresentações, artigos e livros didáticos que sejam compatíveis com uma variedade crescente de dispositivos (smartphones, tablets, computadores com diferentes sistemas operacionais e tamanhos de tela). Uma ferramenta capaz de fazer uso, por exemplo, de web standards (HTML, CSS, XML, arquivos de imagens PNG ou arquivos vetoriais SVG além de formatos de vídeo e audio ainda por serem padronizados), além de uma API de acesso padronizada para que os dados contidos nestes documentos verdadeiramente online possam ser extraídos, atualizados, remodelados da maneira como o autor E O leitor/usuário quiserem.

Esta é,  na minha visão, o caminho em que a comunicação da ciência deve seguir. Adoção das práticas cada vez mais consolidadas da Web 2.0 para não só comunicar seus resultados, mas para permitir que eles sejam reinterpretados livremente, acessados sem restrições, incrementados colaborativamente.

Se eu estiver com alguma razão, fica fácil entender por que acredito no fim dos papers científicos como os conhecemos. Eles representam um processo que teve começo, meio e fim, sendo o paper a síntese deste processo. Se a ciência caminha em direção à Web 2.0, então podemos esperar que ela seja levada a cabo de forma mais orgânica e contínua, sem pontos claros de interrupção, sem estar centrada nos resultados finais mas sim num processo contínuo de desenvolvimento. Uma ciência em fase beta, pouco preocupada com sua versão final.

Vejam que não acredito que TODA a ciência irá seguir por este caminho. Mas acredito que boa parte dela irá se dar conta de que está presa em um mundo feito de papel, ainda que este só exista na tela de um computador.

Nenhum comentário
Categoria: blog
Fogo que arde sem se ver: uma reflexão sobre o incêndio na floresta da USP de Ribeirão Preto

Ontem a tarde uma fumaça escura pairava sobre o campus da USP de Ribeirão Preto. Todo aquele carbono, que irritava os olhos e as vias aéreas dos estudantes, professores, funcionários e curiosos, era, até aquela manhã, parte integrante de uma floresta de mais de 700.000 m² de extensão. O estrago foi devastador em todas as dimensões imagináveis. Pra começar, a área atingida passou de 430.000 m². Como se não bastasse, nessa área estava contido o único banco genético de mata mesófila semidecidual do Brasil.

Um banco genético é exatamente o que o nome sugere: um local onde se deposita o material genético dos organismos. Quanto maior a variabilidade genética, melhor. Existem duas razões principais pelas quais o material genético dos indivíduos de uma espécie pode ser depositado num banco genético: (1) porque a espécie é (ou tem potencial para ser) interessante economicamente para o ser humano ou (2) porque a espécie precisa ser conservada. No primeiro caso, é comum os bancos genéticos estarem associados à instituições de pesquisa em melhoramento genético, que utilizam o material lá depositado para conduzir seus experimentos. Já no segundo caso, o panorama é bem diferente.

Como sabemos a variabilidade genética de uma população é um fator fundamental para a sua sobrevivência em longo prazo. Quanto maior a variabilidade genética, maior a chance de que alguma dessas variantes seja resistente às mudanças ambientes que inevitavelmente acontecem quando pensamos numa escala geológica de tempo. E quando áreas de matas nativas são derrubadas para a construção de cidades ou para fins agro-pecuários, a variabilidade genética das populações vegetais e animais diminui junto com o tamanho da floresta.

Sendo assim, quando pensamos em reflorestar uma área nativa degradada, não adianta só aumentarmos o número de indivíduos das espécies de plantas, por que se todos os indivíduos tiverem a mesma matriz genética (isto é, se todos forem descendentes de um grupo muito pequeno), a menor variação ambiental poderá devastar a área novamente. O ideal é plantar sementes de árvores com matrizes genéticas diferentes, para que a variabilidade genética total da população da área reflorestada seja alta (pool gênico diversificado). Isso significa que não adianta pegar as sementes geradas pelas poucas árvores que restaram na área degradada e sair plantando que nem louco, pois isso resultará numa melhoria apenas “aparente” da situação daquele ambiente.

Dessa forma, a existência de bons bancos genéticos é absolutamente fundamental quando pensamos em reflorestamentos. A área florestal que estava em chamas ontem armazenava 45 espécies e tinha uma diversidade de 4000 progênies coletados em mais de 400 localidades diferentes. Quase duas décadas de investimento e pesquisa ali, pegando fogo. Como já foi dito, esse era o único banco genético de plantas de mata mesófila semidecidual no Brasil. Além de funcionar como banco genético, muita pesquisa acadêmica também era realizada nessa área, que também abrigava projetos de ensino e de extensão universitária.

Por cima disso tudo, há um fator agravante sério. Enquanto helicópteros voavam pra lá e pra cá carregando água pra tentar apagar o incêndio, causando alvoroço dentro da USP, fora dos muros da universidade parecia que nada estava acontecendo. Repórteres e jornalistas pareciam ter algo mais importante pra cobrir do que a perda de um valioso banco genético. Quando informado sobre o assunto, o principal jornal regional limitou-se a escrever que “Pacientes que aguardavam atendimento foram retirados às pressas do campus; pelo menos 30 hectares de floresta queimaram”.

Depois de uma noite de intensa movimentação sobre o assunto nas redes sociais, feita principalmente pelos alunos da Biologia, uma manhã com resquícios de fumaça. Ao invés de helicópteros, aves carniceiras sobrevoavam o local em busca de uma refeição fácil. O descaso da mídia fez com que os docentes entrassem em contato com as agências de notícias, quase que implorando para que fosse feita uma reportagem decente sobre o ocorrido. Com esse esforço, as notícias mais recentes (como as do iG, UOL e O Globo) citam o banco genético, mas não explicam para o leitor leigo a importância desses lugares.

O que acontece? Por que o câncer do Gianecchini é considerado uma tragédia enorme em todos os noticiários, mas a perda real de uma área florestal que funcionava como banco genético custa pra virar notícia? É possível que as pessoas de fato se interessem mais por celebridades do que por ciência ou meio ambiente, mas é claro que essa pergunta não tem uma resposta simples. No entanto, talvez fosse interessante pensar sobre isso porque, pelo que parece, tem um incêndio muito mais sério se alastrando por aí, e ele está queimando a curiosidade e a inquietude das pessoas, deixando apenas galhos secos de alienação e indiferença.

11 Comentários
Categoria: blog
Para onde vai o “paper” científico?

Para a lata do lixo seria a resposta mais evidente, não estivessem todos eles se transformando em arquivos digitais que, bem, por enquanto até podem ir para a lixeira… Mas até quando? Essa pergunta também tem uma resposta simples: Até quando o paper científico fizer sentido e continuar importante para uma ciência que, queiram os mais apaixonados ou não, está caminhando na direção de uma profunda reformulação de si mesma.

Eu sei, eu sei. Estou como um profeta do apocalipse segurando uma placa “prepare-se, o fim dos papers esta próximo” e, como qualquer profeta do apocalipse, posso estar parecendo um pouco fora da minha sanidade mental. Mas se pararmos um segundo para olhar para a história da comunicação da ciência, chegaremos à conclusão de que o fim do modelo atual de comunicação de resultados e validação da própria atividade científica não é tão absurda assim.

Livros são tão século XVI…
A ciência (e qualquer outra atividade intelectual na verdade) depende da capacidade de poder registrar a si própria em um meio que possa sobreviver à passagem do tempo e de seus praticantes. Foi a invenção da escrita que permitiu que a filosofia surgisse, e que depois desse frutos na forma da filosofia natural, que iria resultar numa sementinha que começou a crescer no século XVI com a Revolução Científica e terminou virando esta árvore que é a ciência moderna e todas as suas ramificações tão especializadas.

O grande salto para a escrita foi a invenção da imprensa de tipos móveis no século XIII, seguido da constituição de um dos mais antigos meios de comunicação, o livro. Até pouco mais da metade do século XVII os livros eram a forma usual de se comunicar ciência*, mas eram custosos demais (tanto do ponto de vista financeiro quanto do ponto de vista do tempo investido em garantir uma impressão de qualidade). O crescimento da comunidade e de sua produção acabou por deixar claro que o livro de ciência já não era a solução ideal para a comunicar resultados e estabelecer o diálogo entre os cientistas.

A solução veio através do Philosophical Transactions (cuja primeira edição é de 1666) da Royal Society of London, que copiou o modelo usado na época pelos folhetins, mas para distribuir de forma ampla novidades científicas ligadas aos membros da sociedade. Nascia assim o periódico científico, mas não o paper propriamente dito. Levaria ainda bons dois séculos para a ciência encontrar seu próprio estilo de escrita e, com efeito, o paper científico como conhecemos hoje só foi se estabelecer na segunda década do século XX**.

O problema do papel digital…
Não quero entrar na discussão sobre a função do paper e sua validade enquanto meio principal de comunicar avanços científicos. Basta saber que se a invenção do periódico e do paper foi importante pra viabilizar a ampla comunicação da ciência num século em que era extremamente complicado manter o diálogo entre comunidades científicas espalhadas pelas mais diversas localizações geográficas, hoje percorremos o caminho inverso. Os periódicos e o paper dificultam o diálogo da comunidade científica, diminuem a velocidade em que novas descobertas se tornam públicas, limitam o acesso ao conhecimento por um público ampliado (e que paga as contas da ciência) além de esconderem a maior parte do processo científico envolvido na produção do próprio documento.

Pode parecer exagero, mas me arrisco a afirmar que o paper científico, ao menos no que diz respeito à ciência de hoje, tem muito pouco valor informativo, revelando quase nada sobre a verdadeira natureza da atividade científica e de seus processos. É mais fácil aprender “do que a ciência é feita” no Google do que no documento oficialmente utilizado pelos cientistas como meio de contarem uns aos outros sobre o resultado de seus trabalhos.

É claro que se pode argumentar que o paper não precisa ser muito mais do que um “resumão” de meia dúzia de páginas sobre o trabalho de anos de um grupo de cientistas, e se concordo com isso olhando pra uma época que era majoritariamente analógica, discordo completamente quando vivemos em um mundo digital.

Ficam de fora do paper não só os dados detalhados recolhidos durante os anos em que a pesquisa foi levada à cabo, como também toda a série de erros e percalços encontrados no caminho em que o cientista trilhou. Todas estas informações possuem um valor que acaba desprezado na medida em que o paper precisa ter um tamanho redusido para ser publicado. Mas, como sabemos, esta é essencialmente uma limitação do meio impresso e que é reproduzida artificialmente no meio digital.

Infelizmente, temos ainda de lidar com outras tantas limitações que não tem razão de ser no meio digital, mas que foram herdadas de um modelo já bem estabelecido no meio impresso. Ainda precisamos lidar com a dificuldade em se atualizar ou corrigir papers que foram aceitos mesmo em periódicos que só existem online, ou a limitação para o uso de hyperlinks e elementos multimídia como vídeos e trilhas de audio e mesmo imagens animadas.

É ingênuo dizer que não há razão para a ciência não abandonar de vez o pdf (ou qualquer outro formato que limite o uso dos recursos disponíveis em um ambiente digital), estou certo que existem razões. O fato é que a cultura do paper impresso vai mais além do que o simples meio em que se está comunicando ciência. Como McLuhan cansou de nos alertar meio é mensagem, e a própria ciência foi construída em valores que muitas vezes só fazem sentido em um meio impresso. Perdem sua razão de ser em um meio digital  (discuto esse assunto mais a fundo no capítulo 4.2 da minha tese de mestrado, que pode ser acessada livremente). Meu ponto é que seja lá quais forem estas razões, é preciso colocá-las à prova contra a gama de possibilidades que se abre em passar a usar o ambiente digital em sua totalidade, e não como forma de emular uma tecnologia nascida antes da própria ciência.

Críticas ao modelo atual de publicação e sugestões sobre como o ambiente virtual pode ser usado para melhorar estes problemas existem aos montes e eu deixo abaixo algumas sugestões de artigos interessantes neste sentido, além de recomendar meu grupo de Ciência 2.0 no Mendeley.

Seja como for, uma das alternativas ao modelo atual de publicação foi recentemente proposta pelo Stephen Wolfram. A alternativa do Wolfram pode ser vista em mais detalhes no vídeo abaixo, mas volto em breve com um texto novo só para discutir melhor se a solução do Wolfram é ideal***.

Referências e artigos recomendados:
Antelman, K. (2004). Do open-access articles have a greater research impact? College & Research Libraries, 65(5), 372-382. ASSOC COLL RESEARCH LIBRARIES. Retrieved from http://apps.isiknowledge.com/CitedFullRecord.do?product=UA&db_id=WOS&SID=V1@kc79NaoCc98onfd@&search_mode=CitedFullRecord&isickref=136742423

Breivik, M., Hovland, G., & From, P. J. (2009). Trends in Research and Publication: Science 2.0 and Open Access. Modeling, Identification and Control: A Norwegian Research Bulletin, 30(3), 181-190. MIC. doi:10.4173/mic.2009.3.8

Odlyzko, A. (2000). The future of scientific communication. Access to Publicly Financed Research: The Global, 53(1), 13-5. Retrieved from http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.32.3333&rep=rep1&type=pdf

Waldrop, M. (2008). Science 2.0: Great New Tool, or Great Risk? Retrieved April 22, 2010, from http://www.scientificamerican.com/article.cfm?id=science-2-point-0-great-new-tool-or-great-risk

Young, N. S., Ioannidis, J. P. A., & Al-Ubaydli, O. (2008). Why current publication practices may distort science. PLoS medicine, 5(10), e201. Public Library of Science. doi:10.1371/journal.pmed.0050201

 

*Me refiro aqui aos grandes tratados científicos (lembrando que o termo “ciência” e “científico” estão sendo usados de forma anacrônica, à época a ciência ainda não era chamada assim).

**Montgomery, S. “Scientific discourse and its history.” In: Communicating Science, por Eileen Scanlon,Roger Hill e Kirk Junker, 315. Inglaterra: The Open University, 1999.

***Dica: Não é.

4 Comentários
Categoria: blog