Data stream mining

Data Stream Mining é o processo de extrair estruturas de conhecimento de registros de dados rápidos e contínuos. Uma data stream é uma sequência ordenada de instâncias que, em muitas aplicações de data stream mining, pode ser lida apenas uma vez ou poucas vezes, usando recursos limitados de computação e armazenamento.[1]

Em muitas aplicações de data stream mining, seu objetivo é prever a classe ou valor das novas instâncias da data stream dado um conhecimento sobre membros de classe e valores anteriores da data stream. As técnicas de machine learning podem ser utilizadas para a previsão de tarefas a partir de exemplos de rotulados de forma automatizada. Muitas vezes, os conceitos do campo da aprendizagem incrementais para lidar com alterações estruturais, aprendizado on-line e demandas em tempo real. Em muitas aplicações, especialmente de operação não estacionárias, uma distribuição subjacente pode ser usada como uma regra para a sua rotulagem, mudando ao longo do tempo. Este problema é conhecido como conceito de deriva.[2][3]

Exemplos de data streams incluem o computador de tráfego de rede, conversas por telefone, transações em ATM, pesquisas na web e dados de sensor. Data stream mining pode ser considerada um subcampo de data mining, machine learning, e descoberta de conhecimento.[4]

Software de data stream mining

  • MOA (Online Massivo e Análise): free open-source software específico para a mining data streams com o conceito de deriva. Ele possui diversos algoritmos de aprendizado (classificação, regressão, clustering, detecção de anexos e recommender systems). Também contém um prequential método de avaliação, o EDDM conceito deriva de métodos, um leitor de ARFF real conjuntos de dados, e artificial fluxo de geradores, como o SEA conceitos, STAGGER, girando hiperplano, árvore aleatória e aleatória radius baseado em funções. MOA suporte bi-direcional interação com Wekamachine learning.
  • RapidMiner: Software comercial para descoberta de conhecimento, data mining e machine learning também com data stream mining, a aprendizagem de diferentes conceitos e o conceito de acompanhamento à deriva (se utilizado em combinação com o seu data stream mining de plugin (anteriormente:plugin do Conceito Deriva))

Eventos

Ver também

Livros

Referências

  1. Gaber, Mohamed Medhat; Zaslavsky, Arkady; Krishnaswamy, Shonali (1 de junho de 2005). «Mining data streams: a review». ACM SIGMOD Record (2): 18–26. ISSN 0163-5808. doi:10.1145/1083784.1083789. Consultado em 19 de agosto de 2021 
  2. Babcock, Brian; Babu, Shivnath; Datar, Mayur; Motwani, Rajeev; Widom, Jennifer (3 de junho de 2002). «Models and issues in data stream systems». Madison, Wisconsin: Association for Computing Machinery. PODS '02: 1–16. ISBN 978-1-58113-507-7. doi:10.1145/543613.543615. Consultado em 18 de agosto de 2021 
  3. Lemaire, Vincent; Salperwyck, Christophe; Bondu, Alexis (6 de julho de 2014). «A Survey on Supervised Classification on Data Streams». Springer, Cham (em inglês): 88–125. doi:10.1007/978-3-319-17551-5_4. Consultado em 19 de agosto de 2021 
  4. «Mining Data Streams Bibliography». users.monash.edu. Consultado em 19 de agosto de 2021 

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.