Home Busca

  Pesquisar na web
  Pesquisar no site

Um novo conceito na análise de informações digitais.

X

Google

ONTOWEB® VENCE GOOGLE™ EM AVALIAÇÃO DE QUALIDADE

O lançamento do Ontoweb® está gerando grandes expectativas em relação à melhoria do nível de coleta e análise informacional na Internet. Fala-se na superação do Google™, o principal motor de busca do mundo.

No intuito de mensurar critérios de avaliação das funcionalidades centrais de ambas as ferramentas, foi realizado um comparativo de qualidade informacional, com a seguinte parametrização:

a) foi escolhido um texto aleatório - sobre engenharia genética - com 3.014 palavras e 20.112 caracteres (a íntegra do documento está no final do presente texto, ANEXO II);

b) o documento foi usado como entrada textual para consultas no Ontoweb® e no Google™;

c) ambas as postagens foram realizadas no mesmo dia, hora e minuto (06/02/2006, 15 h e 27 min), com uma pequena diferença de segundos, utilizando o mesmo tipo de computador, navegador e conexão web;

d) o texto não foi corrigido, editado ou nornalizado;

e) o teste foi realizado na “versão padrão” de ambas as ferramentas.

O conjunto de palavras foi “copiado” e “colado” nas áreas de busca de ambas as ferramentas, conforme as telas que seguem:

 

Figura 1: Início da consulta no Ontoweb®.

 

Figura 2: Início da consulta no Google™.

 

Os resultados gerados foram os seguintes:

I) NO ÂMBITO DA EXECUÇÃO DA BUSCA:

Ontoweb® : O sistema realizou a busca em 11,405 segundos e trouxe 8.874 documentos.

Figura 3: Resultados gerados pelo Ontoweb®.

 

Google™: uma vez colado o texto na área de consulta, com as 3.014 palavras, o sistema “travou” e não respondeu à ação de pressionar o botão “pesquisar”. Depois de uma certa insistência, ele emitiu um resultado de erro (“error”, “bad request”), dizendo (em inglês) que solicitação era “ilegal”.

 

Figura 4: Resultado emitido pelo Google™.


II) NO ÂMBITO DA QUALIDADE DOS RESULTADOS:

Ontoweb® : Mesmo considerando somente os primeiros 7.000 caracteres, o Ontoweb® retornou o mesmo texto - utilizado como entrada da busca - em primeiro lugar, marcando algumas palavras em azul e outras em vermelho:

 

 

Engenharia genética

Wikipedia - Ciência - 24/01/2006 08:42:44

da estrutura da molécula do DNA . Em 1961 os franceses François Jacob e Jacques Monod pesquisaram o processo de síntese de proteínas nas células bacterianas. Descobriram que o principal responsável pela síntese é o DNA , que passou então a ser o elemento central das pesquisas de engenharia genética. Em 1972, na Universidade de Stanford, na Califórnia, o norte- americano Paul Berg ligou duas cadeias de DNA . Uma era de origem animal, a outra bacteriana. Esta foi a primeira experiência bem sucedida onde foram ligadas duas cadeias genéticas diferentes, e ...

Figura 5: Documento considerado mais relevante (o mesmo utilizado na pesquisa).

As Palavras em Azul significam palavras idênticas àquelas contidas no texto de entrada (palavras-chave), e são responsáveis por uma parcela do cálculo de aproximação conceitual. As Palavras em Vermelho significam a ativação do mecanismo de engenharia de ontologias. Por exemplo, as palavras “DNA”, “microbiologia” e “biotecnologia” foram identificadas como expressões relevantes no processo de mapeamento conceitual, e, a partir dele, o Ontoweb® concluiu que documentos relativos a “biologia molecular” também estavam relacionados à consulta, e deveriam ser resgatados no processo de busca (embora com menor relevância). Isso fez com que o seguinte texto (contendo expressões em azul e vermelho) fosse resgatado em sétimo lugar:

 

 

ICGEB abre inscrições para bolsas de estudo e cursos na área de biotecnologia

Agência CT - 23/01/2006 17:03:27

Trieste, Roma e Trevisa (Itália). As áreas de pesquisa para o pós- doutorado são Bacteriologia; Biossegurança; Transferência e Desenvolvimento de Biotecnologia; Biologia de Leucócitos; Microbiologia; Biologia Molecular; Imunologia Molecular; Medicina Molecular; Patologia Molecular; Biologia Molecular do Músculo; Estrutura Protéica e Bioinformática; Proteômica; Virologia, Imunologia; Hematologia; Bacteriologia; Virologia Vegetal; Patógenos Vegetais. O pré- doutorado, que acontece em Nova Deli e Trieste, além das disciplinas citadas, conta também ...

Figura 6: Texto resgatado com base em ontologias e palavras-chave.

Além disso, o Ontoweb® também gerou um gráfico com a análise histórica da coleção de documentos resgatados, e hierarquizou-os por ordem de relevância com o assunto pesquisado, marcando-os com selos de cores, de acordo com a aproximação conceitual com o texto de entrada, na seguinte graduação:

 

Legenda:

Textos mais significativos   Textos menos significativos

Figura 7: Legenda para a relevância dos documentos.

Os dois documentos considerados mais relevantes receberam um selo vermelho, em função da maior proximidade conceitual com o tema pesquisado (o resultado integral gerado pelo Ontoweb® está no final desse texto, ANEXO I).

Google: A qualidade dos documentos selecionados pelo Google™ não pode ser avaliada, pois não houve um resultado retornado em condições de ser analisado.

Antes de concluir a avaliação, são necessárias as seguintes ressalvas:

1) O Ontoweb® não é uma ferramenta genérica de buscas na internet, ou um catálogo de sítios web, ou seja, ele não busca “tudo” o que está no Internet;

2) O Ontoweb® foca em fontes específicas de informação (governamentais e comunitárias);

3) O Ontoweb® é uma ferramenta informacional de Governo Eletrônico (conceito ampliado), e sua estrutura de fontes e ontologias está orientada por esse conceito;

4) A versão padrão do Ontoweb® pesquisa somente no período compreendido nos últimos 30 dias (mas é possível acessar períodos maiores no ítem “Análise Avançada”);

5) O Google™, por sua vez, não é uma ferramenta de análise de textos, mas somente de busca de informações;

6) As estruturas ontológicas e a base de conhecimento do Ontoweb estão focadas em assuntos específicos;

7) Ontoweb® possui um ambiente on-line para que novas ontologias sejam criadas, editadas e integradas à base de conhecimento do sistema.

III) CONCLUSÃO:

As ferramentas desempenham funções diversas, embora aproximadas, e cada uma delas possui grande eficiência dentro do seu universo de atuação.

O Ontoweb® tende a ser, no futuro, uma ferramenta genérica de buscas, selecionando e filtrando toda a informação disponível na Internet (seja “piw” ou “hiden web”), mas isso ainda não acontece.

Nas funcionalidades qualitativas onde existe superposição entre as ferramentas, o desempenho do Ontoweb® supera o do Google™.

Por fim, no âmbito do contexto avaliado, orientado pela trilogia “temática/fontes/estrutura ontológica”, o resultado gerado pelo Ontoweb® tem um grau qualitativo muito superior àquele atingido pelo Google™, no que diz respeito à análise de um texto longo (mais de 3.000 palavras) e no âmbito das informações, fontes e ontologias utilizadas.

 Equipe Ontoweb® .

-------------------------------

ANEXO I

RESULTADO INTEGRAL EMITIDO PELO ONTOWEB® (primeiros 10 documentos):

 

 

Engenharia genética

Wikipedia - Ciência - 24/01/2006 08:42:44

da estrutura da molécula do DNA . Em 1961 os franceses François Jacob e Jacques Monod pesquisaram o processo de síntese de proteínas nas células bacterianas. Descobriram que o principal responsável pela síntese é o DNA , que passou então a ser o elemento central das pesquisas de engenharia genética. Em 1972, na Universidade de Stanford, na Califórnia, o norte- americano Paul Berg ligou duas cadeias de DNA . Uma era de origem animal, a outra bacteriana. Esta foi a primeira experiência bem sucedida onde foram ligadas duas cadeias genéticas diferentes, e ...

 

Engenharia genética

Wikipedia - Ciência - 09/01/2006 16:32:54

da estrutura da molécula do DNA . Em 1961 os franceses François Jacob e Jacques Monod pesquisaram o processo de síntese de proteínas nas células bacterianas. Descobriram que o principal responsável pela síntese é o DNA , que passou então a ser o elemento central das pesquisas de engenharia genética. Em 1972, na Universidade de Stanford, na Califórnia, o norte- americano Paul Berg ligou duas cadeias de DNA . Uma era de origem animal, a outra bacteriana. Esta foi a primeira experiência bem sucedida onde foram ligadas duas cadeias genéticas diferentes, e ...

 

Biologia

Wikipedia - Ciência - 09/01/2006 14:05:19

em fisiologia vegetal e fisiologia animal, mas os princípios da fisiologia são universais, independentemente do organismo estudado. Por exemplo, informação acerca da fisiologia duma célula de levedura também se aplica a células humanas, e o mesmo conjunto de técnicas e métodos é aplicado à fisiologia humana ou à de outras espécies, animais e vegetais. A anatomia é uma parte importante da fisiologia e estuda a forma como funcionam e interagem os vários sistemas dum organismo , como, por exemplo, os sistemas nervoso, imunitário, endócrino, respiratório ...

 

Engenharia biológica

Wikipedia - Ciência - 09/01/2006 16:32:15

programada. A nova Biotecnologia tem lançado vários produtos no mercado mundial. Em alguns casos, como os da insulina e do hormônio do crescimento, a inovação consiste em substituir os métodos de obtenção tradicionais. Em outros casos, como o dos anticorpos monoclonais, trata- se de produtos inteiramente novos. [ editar] O IMPACTO DA BIOTECNOLOGIA NOS DIVERSOS SETORES PRODUTIVOS O impacto da Biotecnologia, seja ela clássica ou moderna atinge os setores mais diversos, como observamos no quadro a seguir: [ editar] SETORES, BENS OU SERVIÇOS ...

 

Engenharia biológica

Wikipedia - Ciência - 24/01/2006 08:42:29

programada. A nova Biotecnologia tem lançado vários produtos no mercado mundial. Em alguns casos, como os da insulina e do hormônio do crescimento, a inovação consiste em substituir os métodos de obtenção tradicionais. Em outros casos, como o dos anticorpos monoclonais, trata- se de produtos inteiramente novos. [ editar] O IMPACTO DA BIOTECNOLOGIA NOS DIVERSOS SETORES PRODUTIVOS O impacto da Biotecnologia, seja ela clássica ou moderna atinge os setores mais diversos, como observamos no quadro a seguir: [ editar] SETORES, BENS OU SERVIÇOS ...

 

Comitiva russa analisa experimentos que irão para a Estação Espacial

Agência CT - 20/01/2006 09:03:08

pretendem avaliar a influência da radiação no DNA de bactérias; a UFSC, desenvolver e aperfeiçoar mecanismos para controle da temperatura interna de satélites; o CenPRA, a interação de proteínasque, em insetos, gera luminosidade (comovaga- lumes), para novos medicamentos e usos em saúde pública na detecção de elementos patogênicos; a UFPE, a fabricação de novos materiais a partir da análise atômica de amostras com nanopartículas de prata; e a Embrapa, processos básicos relacionados a plantas com base em sementes de uma espécie nativa do cerrado ...

 

ICGEB abre inscrições para bolsas de estudo e cursos na área de biotecnologia

Agência CT - 23/01/2006 17:03:27

Trieste, Roma e Trevisa (Itália). As áreas de pesquisa para o pós- doutorado são Bacteriologia; Biossegurança; Transferência e Desenvolvimento de Biotecnologia; Biologia de Leucócitos; Microbiologia; Biologia Molecular; Imunologia Molecular; Medicina Molecular; Patologia Molecular; Biologia Molecular do Músculo; Estrutura Protéica e Bioinformática; Proteômica;