Fabio Seixas, versão txt

« Power Point real rules | Main | Braincast #9 episódio 10: Tendências »

Evolução da folksonomia
novembro 18, 2007, 4:15 AM por Fabio Seixas

A Internet vem introduzindo vários novos conceitos no mundo atual. Um dos que mais aprecio é a folksonomia, ou a capacidade de várias pessoas categorizarem conteúdo utilizando palavras-chaves ou tags.

Pegue uma unidade de conteúdo ou objeto, como, por exemplo, uma foto. Associe palavras-chaves à ela e deixe que outros façam o mesmo. Com o volume e várias pessoas associando as mesmas palavras a um mesmo objeto observamos o "peso" das palavras-chaves. Quanto mais pessoas fizerem a mesma associação, mais relevante é a palavra-chave.

Consigo imaginar que esse modelo seja apenas o começo do que pode se tornar a folksonomia.

Temos duas dimensões (objeto e palavra-chave) e um sujeito (pessoas). Com isso conseguimos um resultado (categorização) com uma variável (peso).

objeto + palavra-chave = categorização

(objeto + palavra-chave) x peso = categorização relevante

Consigo imaginar um modelo mais avançado para a folksonomia. Um modelo que considere três dimensões e não apenas as duas dimensões iniciais, objetos e palavras-chaves. Imagine acrescentar a essa formula a dimensão da conexão entre palavras-chaves. Imagine palavras-chaves com alguma relação em comum.

"arco-íris" e "colorido" estão, do ponto de vista do significado, eternamente associadas. Podemos dizer o mesmo de "formula1" associado a "carros". Já não poderíamos tirar a mesma conclusão de "carros" associado a "formula1" já que nem todo carro é um Formula 1.

O ponto que quero chegar é se podemos extrair significado da folksonomia como ela é hoje se simplesmente adicionarmos ao modelo a conexão de palavras-chaves.

Imagine uma foto de um arco-íris onde várias pessoas associaram as palavras "arco-íris" e "colorido".

A partir de várias associações bidimencionais como essa, podemos criar conexões entre as palavras-chaves.

Se muitas pessoas associam as palavras "arco-íris" e "colorido" para vários objetos (fotos) diferentes, podemos concluir que "arco-íris" e "colorido" estão de alguma forma conectados.

Uma vez que as palavras-chaves podem estar previamente categorizadas como verbos, adjetivos e substantivos, essas conexões acabam por gerar significado. "Arco-íris são coloridos".

objeto + palavra-chave + conexão = significado

Coloque isso em larga escala, compute o peso e teremos significado relevante.

(objeto + palavra-chave + conexão) x peso = significado relevante

Temos então um modelo tridimencional de folksonomia: objeto, palavra-chave, conexão.

Esse modelo poderia ser um dos pilares da web semântica, desde que houvesse associações suficientes. Isso não me parece utópico, já que muito conteúdo na web está sendo associado a palavras-chaves, tais como fotos, vídeos e artigos.

Colocando em prática, poderíamos associar fotos do Flickr com artigos do Wikipedia automaticamente tendo como base somente a folksonomia feita pelos usuários do Flickr, a nuvem de conexões entre palavras-chaves e o significado dos artigos do Wikipedia ("Arco-íris são coloridos")


Talvez eu tenha viajado bastante nesse artigo. Talvez eu devesse escrevê-lo em inglês e enviá-lo para Universidade de Stanford. :)




Lomadee, uma nova espécie na web. A maior plataforma de afiliados da América Latina.



Adicionar à: del.icio.us | Rec6 | My Yahoo 2.0
permalink | comentários (16) | trackback (0)
Link para este post:


Trackback Pings

TrackBack URL para esse post:
http://www.fabioseixas.com.br/mt/mt-tb.cgi/446

Comentários

E isso associado a informações de "quem" e "onde" o conteúdo foi criado pode trazer até mesmo feedback.

"O arco-íris do Fabio Seixas é mais colorido que o do fulano"

Ou mesmo "As muheres do Brasil tem mais beleza que as da Argentina"

Entrei na mesmo linha de viagem que a sua?

Postado por: Doufer em novembro 18, 2007 11:45 AM


Douglas, uma vez extraindo significados simples podemos evoluir para significados mais complexos. A base do modelo já estaria criada. Bem observado.

Postado por: Fabio Seixas em novembro 18, 2007 2:36 PM


Fábio, achei muito interessante sua idéia.
Se eu roubar ela e ficar rico, tudo bem por você? hehehe brincadeira.

Suas observações me lembram algumas coisas de mineração de dados. Extrair essas relações entre palavras a partir de uma base de dados e gerar informação conclusiva.

Sinceramente eu não acho que seja algo tão distante e "impossível". Não creio que isso pudesse gerar a Web Semântica, mas daria a certas partes da Web muito mais 'significado'.

A questão é, como traduzir essa idéia em aplicação real e útil para os internautas.

Abraço!

Postado por: Felipe Hummel em novembro 18, 2007 3:06 PM


Fabão,

Sua idéia me parece tão lógica que fica aquela impressão de "ué, mas será que isso já não existe?" ou então "lógico! como não pensei nisso antes?". Ou melhor, já pensei e inclusive conversei sobre isso em uma das viagens a SP do último mês, mas não com tanta linha de raciocínio ;-).

Eu acredito que o caminho é por aí sim, para a tal semântica da web. Essa pode não ser a solução, mas a base - e como o Douglas observou, dela se pode tirar análises e relacionamentos mais complexos.

Felipe, a utilidade disso é justamente a aplicação, ora essa. Imagina um mecanismo de busca que possa avaliar a semântica de seus termos e exibir resultados similares, com sinônimos, por exemplo. Isso é apenas uma pontinha do iceberg, vem muito mais pela frente.

Abraço

Postado por: Manoel Netto em novembro 19, 2007 7:31 AM


A utilidade que eu me referia era mais em termos concretos, um serviço, algo diretamente com o usuário final. A utilidade para máquinas de busca é a primeira que vem a mente (também foi a primeira que um amigo meu retrucou quando comentei o post).

Na verdade, mesmo em máquinas de busca seria necessário fazer um estudo, ver se o benefício de algo mais "semântico" justificaria os custos.

De qualquer modo, é interessante e viável (creio) , ainda fiquei pensando na idéia. Qualquer coisa, Manoel, nós criamos uma startup pra desenvolver a idéia e repassamos uma porcentagem pro Fábio! hehehe

Abraço!

Postado por: Felipe Hummel em novembro 19, 2007 1:29 PM


Esta última edição da revista Meio Digital aborda este tema em uma das suas matérias. Vale a leitura: http://www.meioemensagem.com.br/revista_meio_digital

Postado por: Renato Cruz em novembro 19, 2007 8:55 PM


Onde entra a grana?

Objeto + Palavra + Conexão + Valor $$

$ = retorno da palavra chave em anuncios
$ = valor da palavra chave caso seja um produto
$ = qualquer outra ideia que encha o bolso de grana

Acho que o google ja deve ter alguma coisa embutida nas buscas. Não?

Abraços, Fabio

Postado por: Fabio Cipriani em novembro 20, 2007 11:09 AM


tudo bem... vc assassinou "o portuga" com DIMENÇÕES.... mas tem uma grande idéia ae!
=D

Postado por: Fabio Yagui em novembro 20, 2007 3:49 PM


Fábio

Acho que é a primeira vez que comento aqui, mesmo que já leia há tempos... Seus textos estão cada vez mais afinados... é bom ler algo mais aprofundado, menos twitado... Só peço que faça uma pequena revisão ortográfica nos textos antes de publicá-los... Hoje a quantidade de varições de "dimensão" foi dureza!!! :)

Abraços

Postado por: Leo Carbonell em novembro 20, 2007 5:07 PM


O português foi devidamente ressuscitado. :)

Postado por: Fabio Seixas em novembro 20, 2007 6:39 PM


Grande Fabio,

ótimo artigo! Também acredito muito no desenvolvimento de técnicas de Folksonomia. Acho que as possibilidades de aplicação são muito grandes e benéficas para diversas áreas.

E a grande questão realmente é como dar relevância para essas referências, e o seu pensamento está muito bom.

Ano que vem voltarei a ler seu artigo para ver se as coisas caminharam nessa linha ou foram por outro caminho. :)

Abração

Postado por: Filipe em novembro 20, 2007 8:21 PM


Wow! Acho que vou ter de tomar uma Coca Cola e reler seu post...

Postado por: Henrique Cintra em novembro 21, 2007 10:34 PM


Desculpe a ignorância, Fábio (sério), mas já não existem experimentos assim em buscas semânticas? Muito bacana o texto.

Postado por: Leon Santiago em novembro 22, 2007 12:44 PM


Perguntas:

Quem vai ficar "retaggeado" as fotos alheias?

Imagine que um grupinho descolado comece espalhar tags erradas distorcendo o modelo. (Existe espírito de porco para tudo. E eles geralmente são organizados). Como contornar esse problema?

Postado por: Guilherme em novembro 23, 2007 10:06 AM


Fabio, o Google já está começando... Repare no "Pesquisas relacionadas a: futebol" lá embaixo.
http://www.google.com.br/search?hl=pt-BR&client=firefox-a&rls=org.mozilla:pt-BR:official&hs=VcQ&sa=X&oi=spell&resnum=0&ct=result&cd=1&q=futebol&spell=1
Ainda tem que melhorar muito, mas já é um começo.

Postado por: Pedro Menezes em novembro 26, 2007 5:24 PM


Eu estou tentando criar um site que sirva para fazer brainstorm para os criativos das agências de publicidade. Funciona assim: as pessoas postam uma palavra e os internautas atribuem tags, dizendo a primeira coisa que vem nas suas cabeças sinônimos, antônimos, frases, etc).

Postado por: Onildo Filho em dezembro 18, 2007 7:19 AM


Comente

Aviso legal:
-Não publico comentários anônimos. "josé", "júnior", "maria" e qualquer nome que não informe claramente quem está fazendo o comentário será considerado anônimo. Seja homem (ou se preferir, tenha peito) e assuma sua posição;

-Se quiser que seu comentário seja publicado, informe claramente algum site que o identifique. Pode ser blog, Twitter, Orkut, Facebook ou qualquer perfil na internet e que, por sua vez, também não seja anônimo;

-Não publico comentários desrespeitosos, com palavras de baixo calão, preconceituosos ou que firam qualquer lei desse país;

-Não publico comentários que aparentam ser meras propagandas ou link building;

-Eu publico críticas, desde que respeitem as regras acima.




Lembrar?

(você pode utilizar algum HTML)


Please enter the security code you see here


   Powered by Movable Type