|
|
X
|

|
ONTOWEB®
VENCE
GOOGLE™ EM AVALIAÇÃO DE QUALIDADE
O
lançamento do Ontoweb®
está
gerando grandes expectativas em relação
à melhoria
do nível de coleta e análise
informacional na Internet. Fala-se na superação
do Google™,
o principal motor de busca do mundo.
No
intuito de mensurar
critérios de avaliação das
funcionalidades centrais de ambas as ferramentas, foi realizado um
comparativo
de qualidade informacional, com a seguinte
parametrização:
a) foi
escolhido um texto
aleatório - sobre engenharia
genética - com 3.014 palavras e 20.112 caracteres (a
íntegra do documento está
no final do presente texto, ANEXO II);
b) o
documento foi usado
como entrada textual para consultas
no Ontoweb®
e no Google™;
c) ambas
as postagens
foram realizadas no mesmo dia, hora e
minuto (06/02/2006, 15 h e 27 min), com uma pequena
diferença de
segundos,
utilizando o mesmo tipo de computador, navegador e conexão web;
d) o
texto não foi
corrigido, editado ou nornalizado;
e) o
teste foi realizado
na “versão padrão” de ambas
as
ferramentas.
O
conjunto de palavras
foi “copiado” e “colado” nas
áreas de
busca de ambas as ferramentas, conforme as telas que seguem:
|

Figura
1: Início
da
consulta no Ontoweb®.
|

Figura
2: Início
da
consulta no Google™.
|
Os
resultados gerados
foram os seguintes:
I) NO
ÂMBITO DA
EXECUÇÃO
DA BUSCA:
Ontoweb®
: O sistema realizou a busca em 11,405 segundos e trouxe 8.874
documentos.

Figura 3: Resultados
gerados pelo Ontoweb®.
Google™:
uma vez colado o texto na área de consulta, com as 3.014
palavras, o sistema “travou”
e não respondeu à ação de
pressionar o
botão “pesquisar”. Depois de uma certa
insistência, ele emitiu um resultado de erro (“error”,
“bad request”),
dizendo (em
inglês) que solicitação era
“ilegal”.

Figura 4: Resultado
emitido pelo Google™.
II) NO
ÂMBITO DA
QUALIDADE DOS RESULTADOS:
Ontoweb® :
Mesmo
considerando
somente os primeiros 7.000 caracteres,
o Ontoweb®
retornou o mesmo texto -
utilizado como
entrada da busca - em primeiro lugar, marcando algumas palavras em azul
e
outras em vermelho:
Figura 5: Documento
considerado mais relevante (o mesmo utilizado na pesquisa).
As Palavras em Azul significam
palavras
idênticas
àquelas contidas no texto de entrada (palavras-chave), e
são responsáveis por
uma parcela do cálculo de aproximação
conceitual.
As Palavras em Vermelho
significam a
ativação do mecanismo de engenharia de
ontologias. Por
exemplo, as palavras “DNA”, “microbiologia”
e “biotecnologia”
foram identificadas como expressões relevantes no processo
de
mapeamento
conceitual, e, a partir dele, o Ontoweb®
concluiu que
documentos relativos a “biologia
molecular”
também estavam relacionados à
consulta, e deveriam ser
resgatados no processo de busca (embora com menor
relevância).
Isso fez com que
o seguinte texto (contendo expressões em azul e vermelho)
fosse
resgatado em
sétimo lugar:
Figura 6:
Texto resgatado com base em ontologias e palavras-chave.
Além
disso, o Ontoweb®
também
gerou um gráfico com a análise
histórica da
coleção de documentos resgatados, e
hierarquizou-os por ordem de relevância com o assunto
pesquisado,
marcando-os
com selos de cores, de acordo com a aproximação
conceitual com o texto de
entrada, na seguinte graduação:
|
Legenda:

Textos
mais
significativos Textos
menos
significativos
|
Figura 7:
Legenda para a relevância dos documentos.
Os dois
documentos
considerados mais relevantes receberam um selo vermelho,
em função da maior
proximidade conceitual com o tema pesquisado (o resultado integral
gerado pelo Ontoweb®
está no
final desse texto, ANEXO I).
Google™: A
qualidade dos
documentos selecionados pelo Google™
não pode ser avaliada, pois não houve um
resultado
retornado em condições de ser analisado.
Antes de
concluir a
avaliação, são necessárias
as seguintes
ressalvas:
1) O Ontoweb®
não é uma ferramenta
genérica de buscas na internet,
ou
um catálogo de
sítios web,
ou seja, ele não
busca “tudo” o que está
no Internet;
2) O Ontoweb®
foca em fontes
específicas de informação
(governamentais e
comunitárias);
3) O Ontoweb®
é uma ferramenta
informacional de Governo Eletrônico (conceito ampliado), e
sua
estrutura de
fontes e ontologias está orientada por esse conceito;
4) A
versão
padrão do Ontoweb®
pesquisa
somente no período compreendido nos últimos 30
dias (mas
é possível acessar
períodos maiores no ítem
“Análise Avançada”);
5) O Google™,
por sua vez, não é
uma ferramenta de análise de textos, mas somente de busca de
informações;
6) As
estruturas
ontológicas e a base de conhecimento do Ontoweb
estão focadas em assuntos específicos;
7) Ontoweb®
possui um ambiente on-line
para que novas ontologias
sejam
criadas, editadas e integradas à base de conhecimento do
sistema.
III)
CONCLUSÃO:
As
ferramentas
desempenham funções diversas, embora
aproximadas, e cada uma delas possui grande eficiência dentro
do
seu universo
de atuação.
O Ontoweb®
tende a ser, no futuro,
uma ferramenta genérica de buscas, selecionando e filtrando
toda
a informação disponível
na Internet (seja “piw”
ou “hiden
web”),
mas
isso ainda não acontece.
Nas
funcionalidades
qualitativas onde existe superposição
entre as ferramentas, o desempenho do Ontoweb®
supera
o do Google™.
Por fim,
no âmbito
do contexto avaliado, orientado pela
trilogia “temática/fontes/estrutura ontológica”,
o resultado gerado pelo Ontoweb®
tem um grau qualitativo muito
superior àquele atingido
pelo Google™,
no que diz respeito
à análise de um
texto longo (mais de 3.000 palavras) e no âmbito das
informações, fontes e
ontologias utilizadas.
Equipe Ontoweb®
.
-------------------------------
ANEXO I
RESULTADO
INTEGRAL EMITIDO PELO ONTOWEB® (primeiros 10 documentos):
|
|
Biologia
|
|
Wikipedia
- Ciência - 09/01/2006 14:05:19
|
|
em fisiologia vegetal e fisiologia animal,
mas os princípios da fisiologia são
universais, independentemente do organismo
estudado. Por exemplo, informação
acerca da fisiologia
duma célula de
levedura também se
aplica a células humanas, e
o mesmo conjunto de técnicas e métodos
é aplicado à fisiologia humana ou
à de outras
espécies, animais e vegetais. A
anatomia é uma parte importante da fisiologia e estuda a forma
como funcionam e interagem os vários
sistemas dum organismo ,
como, por exemplo, os
sistemas nervoso, imunitário,
endócrino, respiratório ...
|
|