WordNet

WordNet
DesenvolvedorUniversidade de Princeton
Lançamento estável
Edição 2024 / 1 de novembro de 2024; há 18 meses[1]
Repositórioen-word.net
LicençaLicença BSD
Websitewordnet.princeton.edu

O WordNet é um banco de dados lexical de relações semânticas entre palavras, que as conectam em relações semânticas, incluindo sinônimos, hipônimos e merônimos. Os sinônimos são agrupados em conjuntos de sinônimos (synsets) com breves definições e exemplos de uso. Pode, portanto, ser visto como uma combinação e extensão entre um dicionário e um tesauro. Sua principal aplicação é na análise automática de texto e em aplicações de inteligência artificial. Foi criado inicialmente em inglês,[2] e o banco de dados WordNet em inglês, juntamente com suas ferramentas de software, foram disponibilizados sob uma licença do tipo BSD e podem ser baixados gratuitamente. A última versão oficial lançada pela Universidade de Princeton (3.0) para Unix/Linux/Solaris/etc. foi lançada em dezembro de 2006.[3] Atualmente, a Princeton não tem planos de lançar novas versões devido a problemas de pessoal e financiamento.[4] Novas versões ainda são lançadas anualmente através do site Open English WordNet. Versões antigas ainda estão disponíveis em wordnet.princeton.edu.[3] Atualmente, existem WordNets em mais de 200 idiomas.[5]

História e membros da equipe

O WordNet foi criado em 1985, inicialmente apenas em inglês, no Laboratório de Ciência Cognitiva da Universidade de Princeton, sob a direção do professor de psicologia George Armitage Miller. Posteriormente, foi dirigido por Christiane Fellbaum. O projeto foi inicialmente financiado pelo Escritório de Pesquisa Naval dos EUA e, posteriormente, também por outras agências governamentais americanas, incluindo a DARPA, a Fundação Nacional da Ciência, o Disruptive Technology Office ("Escritório de Tecnologia Disruptiva", antigo Advanced Research and Development Activity) e a REFLEX. George Miller e Christiane Fellbaum receberam o Prêmio Antonio Zampolli de 2006 por seu trabalho com o WordNet.[6]

A Global WordNet Association é uma organização sem fins lucrativos que oferece uma plataforma para discutir, compartilhar e conectar WordNets para todos os idiomas do mundo. Christiane Fellbaum e Piek Th.J.M. Vossen são seus copresidentes.[7]

Conteúdo do banco de dados

Exemplo da entrada "hambúrguer" no WordNet.

Em 2017, o banco de dados continha 155.287 palavras organizadas em 117.659 conjuntos de sinônimos, totalizando 206.941 pares palavra-sentido; em formato compactado, tem cerca de 12 megabytes.[4]

Inclui as categorias lexicais substantivos, verbos, adjetivos e advérbios, mas ignora preposições, determinantes e outras palavras funcionais.[8]

Distribuições

O banco de dados WordNet é distribuído como um pacote de dicionário (geralmente num único arquivo) para os seguintes softwares:

  • Babylon[9]
  • GoldenDict[10]
  • Lingoes[11]
  • LexSemantic: plataforma digital para publicação de obras de referência (dicionários, enciclopédias, etc.). Inclui o WordnetPlus.[12]

Ver também

Referências

  1. «Open English WordNet (2024 version)» (em inglês). Consultado em 17 de março de 2026 
  2. G. A. Miller, R. Beckwith, C. D. Fellbaum, D. Gross, K. Miller. 1990. WordNet: An online lexical database. Int. J. Lexicograph. 3, 4, pp. 235–244.
  3. a b «Downloading WordNet and associated packages and tools». wordnet.princeton.edu (em inglês). Consultado em 17 de março de 2026 
  4. a b «WordNet Statistics» (em inglês). Wordnet.princeton.edu. Consultado em 17 de março de 2026 
  5. «WordNets in the World». Global WordNet Association (em inglês). Consultado em 19 de janeiro de 2020 
  6. «Winners of the 2006 Antonio Zampolli Prize». LREC (em inglês). 2006. Consultado em 17 de março de 2026 
  7. «About Global WordNet Association». Global WordNet (em inglês). Consultado em 17 de março de 2026 
  8. «Why is WordNet missing: of, an, the, and, about, above, because, etc.». Wordnet.princeton.edu (em inglês). Consultado em 17 de março de 2026 
  9. «Babylon WordNet» (em inglês). Babylon.com. Consultado em 17 de março de 2026 
  10. «GoldenDict - Browse /dictionaries at Sourceforge.net» (em inglês). Sourceforge.net. 1 de dezembro de 2010. Consultado em 5 de janeiro de 2014 
  11. «Lingoes WordNet». Lingoes.net. 16 de novembro de 2007. Consultado em 17 de março de 2026 
  12. «LexSemantic». lexsemantic.com (em inglês). Consultado em 17 de março de 2026 

Ligações externas

Ícone de esboço Este artigo sobre software é um esboço. Você pode ajudar a Wikipédia expandindo-o.

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.