A Internet vem introduzindo vários novos conceitos no mundo atual. Um dos que mais aprecio é a folksonomia, ou a capacidade de várias pessoas categorizarem conteúdo utilizando palavras-chaves ou tags.
Pegue uma unidade de conteúdo ou objeto, como, por exemplo, uma foto. Associe palavras-chaves à ela e deixe que outros façam o mesmo. Com o volume e várias pessoas associando as mesmas palavras a um mesmo objeto observamos o "peso" das palavras-chaves. Quanto mais pessoas fizerem a mesma associação, mais relevante é a palavra-chave.
Consigo imaginar que esse modelo seja apenas o começo do que pode se tornar a folksonomia.
Temos duas dimensões (objeto e palavra-chave) e um sujeito (pessoas). Com isso conseguimos um resultado (categorização) com uma variável (peso).
objeto + palavra-chave = categorização
(objeto + palavra-chave) x peso = categorização relevante
Consigo imaginar um modelo mais avançado para a folksonomia. Um modelo que considere três dimensões e não apenas as duas dimensões iniciais, objetos e palavras-chaves. Imagine acrescentar a essa formula a dimensão da conexão entre palavras-chaves. Imagine palavras-chaves com alguma relação em comum.
"arco-íris" e "colorido" estão, do ponto de vista do significado, eternamente associadas. Podemos dizer o mesmo de "formula1" associado a "carros". Já não poderíamos tirar a mesma conclusão de "carros" associado a "formula1" já que nem todo carro é um Formula 1.
O ponto que quero chegar é se podemos extrair significado da folksonomia como ela é hoje se simplesmente adicionarmos ao modelo a conexão de palavras-chaves.
Imagine uma foto de um arco-íris onde várias pessoas associaram as palavras "arco-íris" e "colorido".
A partir de várias associações bidimencionais como essa, podemos criar conexões entre as palavras-chaves.
Se muitas pessoas associam as palavras "arco-íris" e "colorido" para vários objetos (fotos) diferentes, podemos concluir que "arco-íris" e "colorido" estão de alguma forma conectados.
Uma vez que as palavras-chaves podem estar previamente categorizadas como verbos, adjetivos e substantivos, essas conexões acabam por gerar significado. "Arco-íris são coloridos".
objeto + palavra-chave + conexão = significado
Coloque isso em larga escala, compute o peso e teremos significado relevante.
(objeto + palavra-chave + conexão) x peso = significado relevante
Temos então um modelo tridimencional de folksonomia: objeto, palavra-chave, conexão.
Esse modelo poderia ser um dos pilares da web semântica, desde que houvesse associações suficientes. Isso não me parece utópico, já que muito conteúdo na web está sendo associado a palavras-chaves, tais como fotos, vídeos e artigos.
Colocando em prática, poderíamos associar fotos do Flickr com artigos do Wikipedia automaticamente tendo como base somente a folksonomia feita pelos usuários do Flickr, a nuvem de conexões entre palavras-chaves e o significado dos artigos do Wikipedia ("Arco-íris são coloridos")
Talvez eu tenha viajado bastante nesse artigo. Talvez eu devesse escrevê-lo em inglês e enviá-lo para Universidade de Stanford. :)
Douglas, uma vez extraindo significados simples podemos evoluir para significados mais complexos. A base do modelo já estaria criada. Bem observado.
Postado por: Fabio Seixas em novembro 18, 2007 2:36 PM
Fábio, achei muito interessante sua idéia.
Se eu roubar ela e ficar rico, tudo bem por você? hehehe brincadeira.
Suas observações me lembram algumas coisas de mineração de dados. Extrair essas relações entre palavras a partir de uma base de dados e gerar informação conclusiva.
Sinceramente eu não acho que seja algo tão distante e "impossível". Não creio que isso pudesse gerar a Web Semântica, mas daria a certas partes da Web muito mais 'significado'.
A questão é, como traduzir essa idéia em aplicação real e útil para os internautas.
Abraço!
Postado por: Felipe Hummel em novembro 18, 2007 3:06 PM
Fabão,
Sua idéia me parece tão lógica que fica aquela impressão de "ué, mas será que isso já não existe?" ou então "lógico! como não pensei nisso antes?". Ou melhor, já pensei e inclusive conversei sobre isso em uma das viagens a SP do último mês, mas não com tanta linha de raciocínio ;-).
Eu acredito que o caminho é por aí sim, para a tal semântica da web. Essa pode não ser a solução, mas a base - e como o Douglas observou, dela se pode tirar análises e relacionamentos mais complexos.
Felipe, a utilidade disso é justamente a aplicação, ora essa. Imagina um mecanismo de busca que possa avaliar a semântica de seus termos e exibir resultados similares, com sinônimos, por exemplo. Isso é apenas uma pontinha do iceberg, vem muito mais pela frente.
Abraço
Postado por: Manoel Netto em novembro 19, 2007 7:31 AM
A utilidade que eu me referia era mais em termos concretos, um serviço, algo diretamente com o usuário final. A utilidade para máquinas de busca é a primeira que vem a mente (também foi a primeira que um amigo meu retrucou quando comentei o post).
Na verdade, mesmo em máquinas de busca seria necessário fazer um estudo, ver se o benefício de algo mais "semântico" justificaria os custos.
De qualquer modo, é interessante e viável (creio) , ainda fiquei pensando na idéia. Qualquer coisa, Manoel, nós criamos uma startup pra desenvolver a idéia e repassamos uma porcentagem pro Fábio! hehehe
Abraço!
Postado por: Felipe Hummel em novembro 19, 2007 1:29 PM
Postado por: Renato Cruz em novembro 19, 2007 8:55 PM
Onde entra a grana?
Objeto + Palavra + Conexão + Valor $$
$ = retorno da palavra chave em anuncios
$ = valor da palavra chave caso seja um produto
$ = qualquer outra ideia que encha o bolso de grana
Acho que o google ja deve ter alguma coisa embutida nas buscas. Não?
Abraços, Fabio
Postado por: Fabio Cipriani em novembro 20, 2007 11:09 AM
tudo bem... vc assassinou "o portuga" com DIMENÇÕES.... mas tem uma grande idéia ae!
=D
Postado por: Fabio Yagui em novembro 20, 2007 3:49 PM
Fábio
Acho que é a primeira vez que comento aqui, mesmo que já leia há tempos... Seus textos estão cada vez mais afinados... é bom ler algo mais aprofundado, menos twitado... Só peço que faça uma pequena revisão ortográfica nos textos antes de publicá-los... Hoje a quantidade de varições de "dimensão" foi dureza!!! :)
Abraços
Postado por: Leo Carbonell em novembro 20, 2007 5:07 PM
O português foi devidamente ressuscitado. :)
Postado por: Fabio Seixas em novembro 20, 2007 6:39 PM
Grande Fabio,
ótimo artigo! Também acredito muito no desenvolvimento de técnicas de Folksonomia. Acho que as possibilidades de aplicação são muito grandes e benéficas para diversas áreas.
E a grande questão realmente é como dar relevância para essas referências, e o seu pensamento está muito bom.
Ano que vem voltarei a ler seu artigo para ver se as coisas caminharam nessa linha ou foram por outro caminho. :)
Desculpe a ignorância, Fábio (sério), mas já não existem experimentos assim em buscas semânticas? Muito bacana o texto.
Postado por: Leon Santiago em novembro 22, 2007 12:44 PM
Perguntas:
Quem vai ficar "retaggeado" as fotos alheias?
Imagine que um grupinho descolado comece espalhar tags erradas distorcendo o modelo. (Existe espírito de porco para tudo. E eles geralmente são organizados). Como contornar esse problema?
Postado por: Guilherme em novembro 23, 2007 10:06 AM
Postado por: Pedro Menezes em novembro 26, 2007 5:24 PM
Eu estou tentando criar um site que sirva para fazer brainstorm para os criativos das agências de publicidade. Funciona assim: as pessoas postam uma palavra e os internautas atribuem tags, dizendo a primeira coisa que vem nas suas cabeças sinônimos, antônimos, frases, etc).
Postado por: Onildo Filho em dezembro 18, 2007 7:19 AM
Comente
Aviso legal:
-Não publico comentários anônimos. "josé", "júnior", "maria" e qualquer nome que não informe claramente quem está fazendo o comentário será considerado anônimo. Seja homem (ou se preferir, tenha peito) e assuma sua posição;
-Se quiser que seu comentário seja publicado, informe claramente algum site que o identifique. Pode ser blog, Twitter, Orkut, Facebook ou qualquer perfil na internet e que, por sua vez, também não seja anônimo;
-Não publico comentários desrespeitosos, com palavras de baixo calão, preconceituosos ou que firam qualquer lei desse país;
-Não publico comentários que aparentam ser meras propagandas ou link building;
-Eu publico críticas, desde que respeitem as regras acima.