Logotipo
Unionpédia
Comunicação
Disponível no Google Play
Novo! Faça o download do Unionpédia em seu dispositivo Android™!
Livre
Acesso mais rápido do que o navegador!
 

N-grama

Índice N-grama

Nos campos de linguística computacional e probabilidade, um n-grama é uma sequência contígua de n itens de uma determinada amostra de texto ou fala.

51 relações: Aminoácido, Amostra (estatística), Aprendizado de máquina, Énuplo, Biologia computacional, BLAST, Cadeias de Markov, Caractere, Claude Shannon, Colocação, Compressão de dados, Corpus linguístico, COVID-19, Criptoanálise, Distribuição de probabilidade, Distribuição multinomial, Espaço vetorial, Estimativa de frequência de Good-Turing, Extração de características, Fonema, Função de verossimilhança, Grafema, Inferência bayesiana, Interpolação linear, Letra, Linguística computacional, Máquina de vetores de suporte, Média aritmética ponderada, Modelo oculto de Markov, N-grama, Oligômero, Palavra, Par de bases, Polímero, Probabilidade, Probabilidade a posteriori, Probabilidade a priori, Processamento de linguagem natural, Reconhecimento ótico de caracteres, Reconhecimento de fala, Reconhecimento inteligente de caracteres, Recuperação de informação, Sílaba, Sequenciação de proteínas, Sequenciamento de DNA, Similaridade por cosseno, Teoria da comunicação, Teoria da informação, Trade-off, Trade-off Espaço-Tempo, ..., Tradução automática. Expandir índice (1 mais) »

Aminoácido

Aminoácidos são compostos de carbono (C), hidrogênio (H), oxigênio (O) e nitrogênio (N) - também chamado de azoto em Portugal - e alguns contêm enxofre (S), como a metionina e a cisteína.

Novo!!: N-grama e Aminoácido · Veja mais »

Amostra (estatística)

Em estatística e metodologia da pesquisa quantitativa, uma amostra é um conjunto de dados coletados e/ou selecionados de uma população estatística por um procedimento definido.

Novo!!: N-grama e Amostra (estatística) · Veja mais »

Aprendizado de máquina

O  ou também (em inglês: machine learning) é um subcampo da Engenharia e da ciência da computação que evoluiu do estudo de reconhecimento de padrões e da teoria do aprendizado computacional em inteligência artificial.

Novo!!: N-grama e Aprendizado de máquina · Veja mais »

Énuplo

Énuplo (também conhecido como ênuplo, énupla, ênupla, n-tuplo, n-upla ou simplesmente tupla) é uma sequência ordenada de n elementos, que pode ser definida pela recursão do par ordenado.

Novo!!: N-grama e Énuplo · Veja mais »

Biologia computacional

Biologia Computacional é um campo de estudo interdisciplinar que aplica técnicas da ciência da computação, matemática aplicada e estatística para problemas da biologia.

Novo!!: N-grama e Biologia computacional · Veja mais »

BLAST

BLAST (sigla em inglês que significa: Basic Local Alignment Search Tool), é um algoritmo para comparar informações de sequências biológicas primárias, tais como seqüências de aminoácidos de diferentes proteínas ou nucleotídeos de seqüencias de DNA.

Novo!!: N-grama e BLAST · Veja mais »

Cadeias de Markov

Em matemática, uma cadeia de Markov (cadeia de Markov em tempo discreto ou DTMC) é um caso particular de processo estocástico com estados discretos (o parâmetro, em geral o tempo, pode ser discreto ou contínuo) com a propriedade de que a distribuição de probabilidade do próximo estado depende apenas do estado atual e não na sequência de eventos que precederam, uma propriedade chamada de Markoviana, chamada assim em homenagem ao matemático Andrei Andreyevich Markov.

Novo!!: N-grama e Cadeias de Markov · Veja mais »

Caractere

Um (ou carácter em português europeu antes do Acordo Ortográfico de 1990), no contexto da informática, é o nome que se dá a cada um dos símbolos que se podem usar para produzir um programa de computador, bem como os textos e imagens apresentados na tela quando se executa um programa em modo texto.

Novo!!: N-grama e Caractere · Veja mais »

Claude Shannon

Claude Elwood Shannon (—) foi um matemático, engenheiro eletrônico e criptógrafo estadunidense, conhecido como "o pai da teoria da informação".

Novo!!: N-grama e Claude Shannon · Veja mais »

Colocação

O conceito colocação é utilizado em linguística com dois sentidos diferentes: a) combinação frequente, preferencial ou usual de palavras (nomeadamente substantivo + adjectivo e verbo + substantivo); ou b) combinação aparentemente livre de palavras, gerada a partir das regras da língua, mas onde actua qualquer tipo de restrição lexical determinada pela norma. c)Exemplos:O garoto ficou com a primeira colocação no campeonato Na primeira acepção, o termo foi usado pela primeira vez por J. R. Firth em 1957 e é usado frequentemente na lexicologia inglesa de Halliday. Designa combinações frequentes de unidades lexicais fixadas na norma ou uma combinação de palavras que se distingue pela sua alta frequência de uso, como desejar ardentemente, etc., o que motiva que este tipo de construções seja catalogado como sendo unidades semi-idiomáticas. Na segunda acepção, uma colocação (ou semi-frasema) AB (ódio mortal, amor cego, por exemplo) é uma combinação de duas ou mais palavras A (ódio, amor) e B (mortal, cego), cujo significado inclui o significado da palavra A (‘ódio‘, ‘amor‘) mais um significado ‘C’. O novo significado da combinação é ‘A + C’ (e não ‘A + B’), de tal maneira que a palavra B (mortal, cego) exprime ‘C’ (‘intenso’) e não ‘B’ (‘que causa ou pode causar a morte’). Este termo B não é seleccionado livremente: *ódio cego, *amor mortal, *amor letal, *felicidade mortal.

Novo!!: N-grama e Colocação · Veja mais »

Compressão de dados

A compressão de dados é o ato de reduzir o espaço ocupado por dados num determinado dispositivo.

Novo!!: N-grama e Compressão de dados · Veja mais »

Corpus linguístico

Corpus linguístico é o conjunto de textos escritos e registros orais em uma determinada língua e que serve como base de análise.

Novo!!: N-grama e Corpus linguístico · Veja mais »

COVID-19

COVID-19 (do inglês: coronavirus disease 2019, em português: doença por coronavírus 2019) é uma doença infeciosa causada pelo coronavírus da síndrome respiratória aguda grave 2 (SARS-CoV-2).

Novo!!: N-grama e COVID-19 · Veja mais »

Criptoanálise

A máquina Enigma, utilizada na cifragem e decifragem de mensagens secretas. A criptoanálise é a arte de tentar descobrir o texto cifrado e/ou a lógica utilizada em sua encriptação (chave).

Novo!!: N-grama e Criptoanálise · Veja mais »

Distribuição de probabilidade

Em teoria da probabilidade e em estatística, uma distribuição de probabilidade descreve o comportamento aleatório de um fenômeno dependente do acaso.

Novo!!: N-grama e Distribuição de probabilidade · Veja mais »

Distribuição multinomial

Em probabilidade e estatística, a distribuição multinomial é uma generalização da distribuição binomial para casos onde temos mais de dois possíveis resultados, sendo assim é uma distribuição de probabilidade discreta e multivariada.

Novo!!: N-grama e Distribuição multinomial · Veja mais »

Espaço vetorial

Um espaço vetorial (também chamado de espaço linear) é uma coleção de objetos chamada vetores, que podem ser somados um a outro e multiplicados ("escalonados") por números, denominados escalares.

Novo!!: N-grama e Espaço vetorial · Veja mais »

Estimativa de frequência de Good-Turing

Estimativa de frequência Good-Turing é uma técnica estatística para prever a probabilidade de ocorrência de objetos pertencentes a um número de espécies desconhecidos, dado observações passadas desses objetos e suas espécies.

Novo!!: N-grama e Estimativa de frequência de Good-Turing · Veja mais »

Extração de características

Em aprendizagem de máquina, reconhecimento de padrões e em processamento de imagens, a extração de características é uma forma especial de redução dimensional.

Novo!!: N-grama e Extração de características · Veja mais »

Fonema

Em linguística, um fonema é a menor unidade sonora (fonológica) de uma língua.

Novo!!: N-grama e Fonema · Veja mais »

Função de verossimilhança

Em estatística, a função de verossimilhança ou função de probabilidade é uma função dos parâmetros de um modelo estatístico que permite inferir sobre o seu valor a partir de um conjunto de observações.

Novo!!: N-grama e Função de verossimilhança · Veja mais »

Grafema

Grafema é a unidade fundamental ou mínima de um sistema de escrita, podendo representar um fonema nas escritas alfabéticas, uma sílaba nas escritas silábicas ou em abjads, ou ainda uma ideia numa escrita ideográfica ou logográfica.

Novo!!: N-grama e Grafema · Veja mais »

Inferência bayesiana

A inferência bayesiana (IB) consiste na avaliação de hipóteses pela máxima verossimilhança, uma decorrência imediata da fórmula de Bayes, e é fundamental para métodos computacionais relacionados à inteligência, mineração de dados, ou linguística histórica, sejam eles métodos bayesianos de aprendizado de máquina (AM) ou não-bayesianos.

Novo!!: N-grama e Inferência bayesiana · Veja mais »

Interpolação linear

Na matemática, Interpolação linear é um método no qual instanciamos um novo conjunto de dados utilizando interpolação polinomial em vista de construir novos pontos de dados no alcance de pontos já conhecidos.

Novo!!: N-grama e Interpolação linear · Veja mais »

Letra

''A Specimen'': diagramação de amostras de fontes e idiomas, por William Caslon. Antigas letras do alfabeto grego pintadas num vaso Uma letra é um grafema num sistema alfabético de escrita, como o Alfabeto grego e seus descendentes.

Novo!!: N-grama e Letra · Veja mais »

Linguística computacional

A Linguística Computacional ou Processamento de língua natural (PLN, em inglês Natural Language Processing, sigla NLP) é um campo multidisciplinar que envolve a Inteligência Artificial, a Informática, a Estatística e a Linguística e que se utiliza de processos computacionais para manipulação da linguagem humana.

Novo!!: N-grama e Linguística computacional · Veja mais »

Máquina de vetores de suporte

Uma máquina de vetores de suporte (SVM, do inglês: support-vector machine) é um conceito na ciência da computação para um conjunto de métodos de aprendizado supervisionado que analisam os dados e reconhecem padrões, usado para classificação e análise de regressão.

Novo!!: N-grama e Máquina de vetores de suporte · Veja mais »

Média aritmética ponderada

A média aritmética ponderada é bastante similar à média aritmética comum.

Novo!!: N-grama e Média aritmética ponderada · Veja mais »

Modelo oculto de Markov

Um modelo oculto de Markov (ou modelo escondido de Markov) é um modelo estatístico em que o sistema modelado é assumido como um processo de Markov com parâmetros desconhecidos, e o desafio é determinar os parâmetros ocultos a partir dos parâmetros observáveis.

Novo!!: N-grama e Modelo oculto de Markov · Veja mais »

N-grama

Nos campos de linguística computacional e probabilidade, um n-grama é uma sequência contígua de n itens de uma determinada amostra de texto ou fala.

Novo!!: N-grama e N-grama · Veja mais »

Oligômero

Em química, um consiste de um finito número de unidades de monômeros (ολιγος, ou oligos, é a palavra grega para "uns poucos"), em contraste a um polímero o qual, ao menos em princípio, consiste de um número não limitado de monômeros.

Novo!!: N-grama e Oligômero · Veja mais »

Palavra

Na língua portuguesa, uma palavra (do latim parábola, que por sua vez deriva do grego translit. parabolé) pode ser definida como sendo um conjunto de letras ou sons de uma língua, juntamente com a ideia associada a este conjunto.

Novo!!: N-grama e Palavra · Veja mais »

Par de bases

Acima, um par base de GC com três ligações de hidrogênio.

Novo!!: N-grama e Par de bases · Veja mais »

Polímero

230x230px Um polímero (do grego, poli-, "muitos" + -meros, "parte"), é um material ou substância composta por moléculas muito grandes conhecidas como macromoléculas que, por sua vez, são compostas de várias unidades repetíveis, os monômeros, que são capazes de reagir consigo mesmas, ou com outros monômeros em alguns casos, como vários tipos de nylon.

Novo!!: N-grama e Polímero · Veja mais »

Probabilidade

A palavra probabilidade deriva do Latim probare (provar ou testar).

Novo!!: N-grama e Probabilidade · Veja mais »

Probabilidade a posteriori

Em estatística bayesiana, a probabilidade a posteriori de um evento aleatório ou uma proposição incerta é a probabilidade condicionada que é atribuída depois que evidências ou planos de fundo relevantes são levados em conta.

Novo!!: N-grama e Probabilidade a posteriori · Veja mais »

Probabilidade a priori

Em probabilidade bayesiana, uma distribuição de probabilidade a priori para uma quantidade indeterminada p, também chamada simplesmente de prior relativo a p (suponha, por exemplo, que p seja a proporção de votantes em determinado político numa eleição futura) é a distribuição de probabilidade que expressaria a incerteza sobre o valor de p antes de qualquer dado ou medida (por exemplo, uma pesquisa de opinião).

Novo!!: N-grama e Probabilidade a priori · Veja mais »

Processamento de linguagem natural

10.1145/1643823.1643908 Processamento de língua natural (PLN) é uma subárea da ciência da computação, inteligência artificial e da linguística que estuda os problemas da geração e compreensão automática de línguas humanas naturais.

Novo!!: N-grama e Processamento de linguagem natural · Veja mais »

Reconhecimento ótico de caracteres

OCR é um acrónimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos.

Novo!!: N-grama e Reconhecimento ótico de caracteres · Veja mais »

Reconhecimento de fala

Reconhecimento de fala é uma área interdisciplinar originária da linguística computacional cujo objetivo é desenvolver métodos e tecnologias que permitam o reconhecimento e a transcrição de linguagem falada de maneira automática.

Novo!!: N-grama e Reconhecimento de fala · Veja mais »

Reconhecimento inteligente de caracteres

Em ciência da computação, o reconhecimento inteligente de caracteres (ICR) é um avançado reconhecimento óptico de caracteres (OCR) ou – mais especificamente – sistema de reconhecimento de escrita à mão, que permite que as fontes e estilos diferentes de escritas à mão serão aprendidas pelo computador durante o processamento, para melhorar os níveis de precisão e reconhecimento.

Novo!!: N-grama e Reconhecimento inteligente de caracteres · Veja mais »

Recuperação de informação

Recuperação de informação (RI) é uma área de pesquisa que lida com o armazenamento de documentos e, principalmente, a recuperação da informação associada a eles a partir de uma necessidade de informação do usuário, por meio de um grupo de tarefas como a busca ad-hoc, a filtragem, o roteamento e possivelmente outras.

Novo!!: N-grama e Recuperação de informação · Veja mais »

Sílaba

Representação da estrutura da formação da sílaba Sílaba é uma emissão de voz completa, representada por um ou mais fonemas.

Novo!!: N-grama e Sílaba · Veja mais »

Sequenciação de proteínas

Sequenciação de proteínas é a determinação das sequências de aminoácidos que constituem um péptido; e também a determinação da conformação que adopta e se é complexado com outras moléculas não-péptidas.

Novo!!: N-grama e Sequenciação de proteínas · Veja mais »

Sequenciamento de DNA

Máquinas que realizam o sequenciamento de DNA O é uma série de métodos de biologia molecular que têm como finalidade determinar a ordem das bases nitrogenadas adenina (A), guanina (G), citosina (C) e timina (T) da molécula de DNA ou ADN A montagem do genoma é feito através da união de um grande número de sequências de DNA que são juntadas para criar uma representação do cromossomo original do DNA em estudo.

Novo!!: N-grama e Sequenciamento de DNA · Veja mais »

Similaridade por cosseno

A similaridade por cosseno é uma medida da similaridade de entre dois vetores num espaço vetorial que avalia o valor do cosseno do ângulo compreendido entre eles.

Novo!!: N-grama e Similaridade por cosseno · Veja mais »

Teoria da comunicação

A teoria da comunicação é uma descrição proposta dos fenômenos da comunicação, as relações entre eles, um enredo descrevendo essas relações e um argumento para esses três elementos.

Novo!!: N-grama e Teoria da comunicação · Veja mais »

Teoria da informação

A teoria matemática da informação estuda a quantificação, armazenamento e comunicação da informação.

Novo!!: N-grama e Teoria da informação · Veja mais »

Trade-off

Trade-off e tradeoff são termos da língua inglesa que definem uma situação em que há conflito de escolha.

Novo!!: N-grama e Trade-off · Veja mais »

Trade-off Espaço-Tempo

Em ciência da computação, especificamente em informática teórica, se estuda o quanto de espaço em memória e tempo determinados algoritmos utilizam.

Novo!!: N-grama e Trade-off Espaço-Tempo · Veja mais »

Tradução automática

A tradução automática (TA) é o processo automático de tradução de uma mensagem de um idioma original para outro através de um programa de computador, sendo um dos exemplos mais conhecidos a ferramenta Google Tradutor.

Novo!!: N-grama e Tradução automática · Veja mais »

CessanteEntrada
Ei! Agora estamos em Facebook! »