Conhecer esse número era importante para a empresa descobrir quanto falta para cumprir a meta de digitalizar todos eles em até dez anos.

Àqueles que sempre se perguntaram quantos livros diferentes existem no mundo, a Google já tem a resposta: são quase 130 milhões ou, para ser mais exato, 129.864.880. A estimativa foi revelada por Leonid Taycher, um engenheiro da empresa que trabalha no projeto Google Books (Google Livros).

A descoberta não é um simples fato curioso para a companhia. É, na verdade, um indicativo do trabalho que ainda falta para a Google completar a sua ambição de organizar toda a informação existente no mundo.

“Quando você faz parte de uma organização que está tentando digitalizar todos os livros já escritos, o primeiro questionamento que se ouve é: Mas, há quantos deles por aí?”, explicou Taycher no comunicado no blog que anunciou o número.

Em princípio, para conseguir uma aproximação razoável, o projeto começou verificando informações em diversos catálogos de livros, como o International Standard Book Numbers (ISBN). Tais sistemas, por mais que fossem de alguma ajuda, não tinham um número preciso. A própria ISBN, por exemplo, só contabiliza livros publicados a partir de 1960 e que estejam disponíveis na parte ocidental do globo.

Assim, os engenheiros da Google desenvolveram programas para coletar os dados em mais de 150 catálogos diferentes, filtrando todas as entradas duplicadas. E outras importantes decisões tiveram de ser tomadas.

Edições em capa dura e em capa mole de uma mesma obra foram contadas como dois livros. E não importa o número de versões que um texto popular como Hamlet de Shakespeare tenha: todas foram contabilizadas, pois podem conter comentários e prefácios diversos. Periódicos foram considerados como um livro particular ou um trabalho coletivo.

Livros em Klingon
Em junho, a companhia já havia digitalizado cerca de 12 milhões de livros, de acordo com o que disse Jon Orwant, engenheiro do Google Books, durante conferência apresentada no evento USENIX de Boston. As obras cobririam algo em torno de 480 idiomas (incluindo três livros na língua  Klingon, da saga “Star Trek”). A coleção virtual resultará em quatro bilhões de páginas ou dois trilhões de palavras.

A Google planeja completar a tarefa em até uma década e algumas informações já foram reveladas pela equipe da empresa. Mais ou menos 20% de todos os livros estão em domínio público e entre 10% e 15% desses ainda são impressos pelas editoras. O restante – a grande maioria dos títulos – está protegido por direitos autorais e a Google vem tentando tomá-los emprestados de 40 grandes bibliotecas pelo mundo.

A principal resistência das editoras é quanto aos livros que não estão sob domínio público, mas também não são mais fabricados pela indústria literária. A Google aguarda uma decisão da corte de Nova York para verificar se poderá ou não digitalizar tais títulos.

Em 2005, a Associação Americana de Editoras e a Associação de Autores entraram com ações, separadamente, contra a companhia de Mountain View, justificando que ela esteva infringindo os direitos autorais ao escanear os livros. A Google alega que pretende vender as versões digitais dessas obras que não estão mais disponíveis nas livrarias, revertendo o lucro para seus legítimos detentores, e deixar que trechos das mesmas sejam exibidos em seu mecanismo de busca, o que, segundo a empresa, não desrespeitaria nenhuma lei americana.

Descobertas
Digitalizar todos os livros trará mais benefícios que a simples adição de resultados aos buscadores, explica Orwant. Uma vez que todos os volumes estejam acessíveis, seu conteúdo poderá ser melhor analisado, o que contribuiria para novas descobertas. Linguistas, por exemplo, teriam mais recursos para verificar quando certa palavra passou a ser muito usada ou quem foram os primeiros a usar esses termos. Algumas questões históricas também poderiam ser respondidas com maior facilidade; quem inventou o cálculo, Isaac Newton, Gottfried Leibniz ou, quem sabe, alguém que sequer ouvimos falar?

“Pode-se procurar não só por uma frase, mas também por um conceito”, diz o engenheiro. “Podemos pegar todas as diferentes maneiras como a ideia de infinito foi inferida, traduzi-las em diferentes idiomas e compará-las em uma pesquisa”.

Orwant, por fim, afirma o que espera ao fim do projeto: “Minha esperança é que assim que começarmos a expor parte dessa coleção, as pessoas passem a fazer perguntas que antes elas não seriam capazes de fazer”, conclui.

(Joab Jackson)