Como funciona a relevância no Solr

Existem fatores básicos (BEM básicos) que determinam o score de um documento para uma uma busca. São eles:

  • TF (Term Frequency) – Quanto mais vezes um determinado termo aparece num documento, mais importante é aquele documento;
  • IDF (Inverse Document Frequency) – Documentos que tem termos raros contam mais do os que tem termos extremamente comuns;
  • Coord (Coordination Factor) – Se uma busca tem mais de um termo, quanto mais termos são encontrados num documento, maior o seu score;
  • LengthNorm – Campos com menos termos tem mais importância do que campos com muitos termos. Abordamos este assunto mais profundamente no post Omitnorms – Desvendando os segredos desta propriedade;
  • Index-Time boost – Se foi definido boost para um documento em tempo de indexação, pesquisas que retornem aquele documento farão com que ele tenha maior relevância;
  • Query Clause Boost – Quando é definido um boost em tempo de query, a parte que recebeu o boost terá maior peso no cálculo de relevância dos documentos.

Valeu

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s