Logotipo
Unionpédia
Comunicação
Disponível no Google Play
Novo! Faça o download do Unionpédia em seu dispositivo Android™!
Livre
Acesso mais rápido do que o navegador!
 

Clustering

Índice Clustering

O clustering ou análise de agrupamento de dados é o conjunto de técnicas de prospecção de dados (data mining) que visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança.

48 relações: Agrupamento difuso (fuzzy), Algoritmo de maximização de expectativa, Aprendizado de máquina, Aprendizagem não supervisionada, Arcnet, Índice Jaccard, Bioconductor, Bioinformática, Ciência de dados, Computação granular, Conectiva, Conjunto de dados flor Iris, Conjunto difuso, Corretor ortográfico, Data stream mining, Detecção de anomalias, Distância de Mahalanobis, Ecologia da paisagem, Extração de características, Filogenética computacional, Geografia, Hashing sensível à localidade, Inferência estatística, Informação mútua, K-means, K-medoides, Maldição da dimensionalidade, Mapa de calor, Matriz de distâncias, Método da silhueta, Mediana (estatística), Medidas de similaridade, Mineração de dados, Neural gas, OpenSSI, Otimização de Intervalos Naturais de Jenks, Paul McNicholas, Processo de Dirichlet, Prova de importância, Quantização de cores, Raça alpina, Raça armenoide, Raça dinárica, Raça lapã, Scikit-learn, Sistema Operacional Distribuído, Sistema Unificado de Linguagem Médica, Taxonomia.

Agrupamento difuso (fuzzy)

O agrupamento difuso (fuzzy clustering, também conhecido como agrupamento suave, soft clustering, ou soft k-means) é uma forma de agrupamento em que cada elemento pode pertencer a mais de um grupo (cluster).

Novo!!: Clustering e Agrupamento difuso (fuzzy) · Veja mais »

Algoritmo de maximização de expectativa

Em estatística, o algoritmo de expectativa-maximização (EM) é um método iterativo para estimar parâmetros em modelos estatísticos, quando o modelo depende de variáveis latentes, ou seja, não observadas.

Novo!!: Clustering e Algoritmo de maximização de expectativa · Veja mais »

Aprendizado de máquina

O  ou também (em inglês: machine learning) é um subcampo da Engenharia e da ciência da computação que evoluiu do estudo de reconhecimento de padrões e da teoria do aprendizado computacional em inteligência artificial.

Novo!!: Clustering e Aprendizado de máquina · Veja mais »

Aprendizagem não supervisionada

A aprendizagem não supervisionada é uma área da inteligência artificial (IA) que envolve o uso de algoritmos para encontrar padrões ou estruturas em conjuntos de dados não rotulados.

Novo!!: Clustering e Aprendizagem não supervisionada · Veja mais »

Arcnet

Attached Resource Computer NETwork (ARCNET ou ARCnet) é um protocolo de comunicação de rede local (LAN), com funcionalidade semelhantes a Ethernet ou Token Ring.

Novo!!: Clustering e Arcnet · Veja mais »

Índice Jaccard

O índice de Jaccard, também conhecido como coeficiente de similaridade de Jaccard, é uma estatística usada para mensurar a similaridade e a diversidade de conjuntos de amostras.

Novo!!: Clustering e Índice Jaccard · Veja mais »

Bioconductor

O é um projeto de software livre, de código aberto e de desenvolvimento aberto para análise e compreensão de dados genômicos gerados por experimentos em laboratórios na área de biologia molecular.

Novo!!: Clustering e Bioconductor · Veja mais »

Bioinformática

Mapa do cromossomo X humano (a partir do site NCBI). O mapeamento do genoma humano é uma das maiores conquistas da bioinformática Bioinformática é um campo interdisciplinar que corresponde à aplicação das técnicas da informática, no sentido de análise da informação, nas áreas de estudo da biologia.

Novo!!: Clustering e Bioinformática · Veja mais »

Ciência de dados

Ciência de dados (data science) é uma área interdisciplinar, que localiza-se em uma interface entre a estatística e a ciência da computação e utiliza o método científico; processos, algoritmos e sistemas, para extrair conhecimento e tomar decisões a partir de dados dos diversos tipos, sendo eles ruidosos, nebulosos, estruturados ou não-estruturados.

Novo!!: Clustering e Ciência de dados · Veja mais »

Computação granular

Computação granular (GrC) é um paradigma de computação emergente de processamento de informações.

Novo!!: Clustering e Computação granular · Veja mais »

Conectiva

A Conectiva foi uma companhia fundada em 28 de Agosto de 1995 em Curitiba, Paraná, Brasil, por um grupo de amigos, em sua maioria funcionários públicos do Banco do Brasil, juntamente com Arnaldo Carvalho de Melo, que foi um pioneiro em distribuições Linux e softwares livres no Brasil e em toda a América Latina.

Novo!!: Clustering e Conectiva · Veja mais »

Conjunto de dados flor Iris

O conjunto de dados flor Iris ou conjunto de dados Iris de Fisher é um conjunto de dados multivariados introduzido pelo estatístico e biólogo britânico Ronald Fisher em seu artigo de 1936, O uso de múltiplas medições em problemas taxonômicos, como um exemplo de análise discriminante linear.

Novo!!: Clustering e Conjunto de dados flor Iris · Veja mais »

Conjunto difuso

Na matemática, conjuntos difusos, conjuntos nebulosos ou conjuntos fuzzy, são conjuntos aos quais os elementos têm graus de pertinência.

Novo!!: Clustering e Conjunto difuso · Veja mais »

Corretor ortográfico

No software, um corretor ortográfico é um recurso de ''software'' que verifica erros ortográficos em um texto.

Novo!!: Clustering e Corretor ortográfico · Veja mais »

Data stream mining

Data Stream Mining é o processo de extrair estruturas de conhecimento de registros de dados rápidos e contínuos.

Novo!!: Clustering e Data stream mining · Veja mais »

Detecção de anomalias

Em mineração de dados, a detecção de anomalias (também detecção de outliers) é a identificação de itens, eventos ou observações raros que levantam suspeitas por serem significativamente diferentes da maioria dos dados.

Novo!!: Clustering e Detecção de anomalias · Veja mais »

Distância de Mahalanobis

Em estatística, a distância de Mahalanobis é uma medida de distância introduzida pelo matemático indiano Prasanta Chandra Mahalanobis em 1936.

Novo!!: Clustering e Distância de Mahalanobis · Veja mais »

Ecologia da paisagem

Ecologia da paisagem é a ciência que estuda e procura melhorar o relacionamento entre os processos ecológicos no ambiente e ecossistemas particulares.

Novo!!: Clustering e Ecologia da paisagem · Veja mais »

Extração de características

Em aprendizagem de máquina, reconhecimento de padrões e em processamento de imagens, a extração de características é uma forma especial de redução dimensional.

Novo!!: Clustering e Extração de características · Veja mais »

Filogenética computacional

Filogenética computacional é a aplicação de algoritmos computacionais, métodos e programas para a análise filogenética.

Novo!!: Clustering e Filogenética computacional · Veja mais »

Geografia

Paisagem africanaGeografia (do grego γεωγραφία, geographia, literalmente "descrição da Terra") é uma área da ciência dedicada ao estudo responsável por examinar a superfície do planeta Terra e compreender todos os aspectos físicos e humanos deste.

Novo!!: Clustering e Geografia · Veja mais »

Hashing sensível à localidade

Na ciência da computação, o hashing sensível à localidade (LSH, na sigla em inglês) é uma técnica algorítmica que agrupa itens de entrada semelhantes associando-os a um mesmo hash com alta probabilidade.

Novo!!: Clustering e Hashing sensível à localidade · Veja mais »

Inferência estatística

Inferência estatística é um ramo da Estatística cujo objetivo é fazer afirmações a partir de um conjunto de valores representativo (amostra) sobre um universo (população), assume-se que a população é muito maior do que o conjunto de dados observados, a amostra.

Novo!!: Clustering e Inferência estatística · Veja mais »

Informação mútua

Diagrama mostrando as relações aditivas e subtrativas de várias medidas de informação associadas com as variaveis correlacionadas ''X'' e ''Y''. A área contida pelos dois círculos é a entropia conjunta Η(''X'',''Y''). O círculo na esquerda (vermelho e violeta) é a entropia individual H(''X''), sendo o círculo vermelho a entropia condicional Η(''X''|''Y''). O círculo na direita (azul e violeta) é H(''Y''), sendo o azul Η(''Y''|''X''). O círculo violeta é a informação mútua ''I''(''X'';''Y'') Em teoria das probabilidades e teoria da informação, a informação mútua (em inglês MI de:en:Mutual information) de duas variáveis aleatórias é a medida da dependência mútua entre as duas variáveis.

Novo!!: Clustering e Informação mútua · Veja mais »

K-means

Em mineração de dados, agrupamento k-means é um método de segregar em torno de centros (centroides) diversos dados, criando o que analogamente na química chamamos de clustering que gera o efeito de particionar n observações dentre k grupos onde cada observação pertence ao grupo mais próximo da média.

Novo!!: Clustering e K-means · Veja mais »

K-medoides

O problema -medoids é um problema de agrupamento semelhante ao k -means.

Novo!!: Clustering e K-medoides · Veja mais »

Maldição da dimensionalidade

A maldição da dimensionalidade refere-se a vários fenômenos que surgem quando estamos lidando com a análise e organização de dados em espaços de alta dimensão, mas que não ocorrem em ambientes de baixa dimensão, como o espaço físico tridimensional que experimentamos no dia a dia.

Novo!!: Clustering e Maldição da dimensionalidade · Veja mais »

Mapa de calor

Um mapa de calor é uma técnica de visualização de dados que mostra a magnitude de um fenômeno por meio de cor em duas dimensões.

Novo!!: Clustering e Mapa de calor · Veja mais »

Matriz de distâncias

Na matemática, ciência da computação e na teoria dos grafos, uma matriz de distâncias é uma matriz (array bidimensional) contendo as distâncias, tomadas em pares, de um conjunto de pontos.

Novo!!: Clustering e Matriz de distâncias · Veja mais »

Método da silhueta

Silhueta refere-se a um método de interpretação e validação da consistência dentro de agrupamentos de dados.

Novo!!: Clustering e Método da silhueta · Veja mais »

Mediana (estatística)

Mediana é o valor que separa a metade maior e a metade menor de uma amostra, uma população ou uma distribuição de probabilidade.

Novo!!: Clustering e Mediana (estatística) · Veja mais »

Medidas de similaridade

Em estatística e campos relacionados, uma medida de similaridade ou função de similaridade ou métrica de similaridade é uma função de valoreal que quantifica a similaridade entre dois objetos.

Novo!!: Clustering e Medidas de similaridade · Veja mais »

Mineração de dados

(também conhecida pelo termo inglês data mining) é o processo de explorar dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

Novo!!: Clustering e Mineração de dados · Veja mais »

Neural gas

Neural gás é uma rede neural artificial, inspirado pela auto-organização de mapa e introduzido em 1991 pela Thomas Martinetz e Klaus Schulten.

Novo!!: Clustering e Neural gas · Veja mais »

OpenSSI

OpenSSI é uma solução de clustering de Sistema de Imagem Única (SSI) baseado em Linux.

Novo!!: Clustering e OpenSSI · Veja mais »

Otimização de Intervalos Naturais de Jenks

O método de otimização de Jenks, também chamado de método de classificação de quebras naturais de Jenks, é um método de agrupamento de dados projetado para determinar o melhor arranjo de valores em diferentes classes.

Novo!!: Clustering e Otimização de Intervalos Naturais de Jenks · Veja mais »

Paul McNicholas

Paul D. McNicholas é um estatístico irlandês-canadense, professor do Departamento de Matemática e Estatística da Universidade McMaster.

Novo!!: Clustering e Paul McNicholas · Veja mais »

Processo de Dirichlet

Em teoria das probabilidades, os processos de Dirichlet, que recebem este nome em homenagem ao matemático alemão Johann Peter Gustav Lejeune Dirichlet, são uma família de processos estocásticos cujas observações são distribuições de probabilidade.

Novo!!: Clustering e Processo de Dirichlet · Veja mais »

Prova de importância

Prova de importância (do inglês, proof-of-importance ou POI), é um algoritmo usado para garantir consenso na block chain usada pela NEM, uma plataforma e criptomoeda criada em 2015.

Novo!!: Clustering e Prova de importância · Veja mais »

Quantização de cores

Na computação gráfica, quantização de cores ou quantização de imagem colorida é quantização aplicada em espaço de cores; Esse é um processo que reduz o número de cores distintas usadas em uma imagem, normalmente com a intenção de que a nova imagem possivelmente deva ficar visualmente similar à imagem original.

Novo!!: Clustering e Quantização de cores · Veja mais »

Raça alpina

Heinrich Kiepert, geógrafo descrito por Hans F. K. Günther como alpino exemplar A raça alpina (ou tipo alpino), também conhecida como alpinídea, celta, celto-lígure, lígure, ocidental, cevenol, oriental escura, pamiro-alpina, auvernesa, récia, alpo-cárpata, celto-eslava, eslava ou europeia central, foi um conceito racial da antropologia física, utilizado historicamente para descrever um dos principais subgrupos da chamada raça caucasiana.

Novo!!: Clustering e Raça alpina · Veja mais »

Raça armenoide

Exemplos armênios de Felix von Luschan A raça armenoide, armênia, armenídea, síria, judaica ou ponto-zabrossiana é um conceito racial da antropologia física, utilizado para descrever um dos principais subgrupos da chamada raça caucasiana.

Novo!!: Clustering e Raça armenoide · Veja mais »

Raça dinárica

Niccolò Paganini, identificado por Hans F. K. Günther como exemplar dinárico A raça dinárica, dinarídea, adriática, albanesa, Fazedora de Campaniforme ou prospectora é um conceito racial da antropologia física, utilizado para descrever um dos principais subgrupos da chamada raça caucasiana.

Novo!!: Clustering e Raça dinárica · Veja mais »

Raça lapã

lapão A raça lapã (ou tipo lapão), também conhecida como lapídea, laponoide, hiperbórea, sami ou protoasiática ocidental, foi um conceito racial da antropologia física, utilizado historicamente para descrever uma população associada por vezes à chamada raça caucasiana, por vezes à mongoloide, e por vezes como uma raça à parte.

Novo!!: Clustering e Raça lapã · Veja mais »

Scikit-learn

A scikit-learn (originalmente scikits.learn) é uma biblioteca de aprendizado de máquina de código aberto para a linguagem de programação Python.

Novo!!: Clustering e Scikit-learn · Veja mais »

Sistema Operacional Distribuído

Um sistema operacional distribuído é um software que roda sobre uma coleção de nós computacionais independentes, separados fisicamente mas conectados.

Novo!!: Clustering e Sistema Operacional Distribuído · Veja mais »

Sistema Unificado de Linguagem Médica

O Sistema Médico Unificado de Linguagem (em inglês: Unified Medical Language System (UMLS)) é um compêndio de muitos vocabulários controlados nas ciências biomédicas (criado em 1986).

Novo!!: Clustering e Sistema Unificado de Linguagem Médica · Veja mais »

Taxonomia

Taxonomia (do grego antigo τάξις, táxis, "arranjo" e νομία, nomia, "método") é a disciplina biológica que define os grupos de organismos biológicos com base em características comuns e dá nomes a esses grupos.

Novo!!: Clustering e Taxonomia · Veja mais »

Redireciona aqui:

Análise de agrupamento de dados.

CessanteEntrada
Ei! Agora estamos em Facebook! »