Lucene Результаты Score

голоса
37

В Lucene, если у вас несколько индексов, которые охватывают только один раздел каждый. Почему же поиск по различным индексам возвращать результаты с различными оценками? Результаты различных серверов совпадают точно.

то есть, если я искал:

  • Имя - Джон Смит
  • DOB - 11/11/1934

Partition 0 возвратит оценку 0,345

Раздел 1 возвратит оценку 0,337

И точно совпадать по имени и DOB.

Задан 02/08/2008 в 10:28
источник пользователем
На других языках...                            


3 ответов

голоса
19

Скоринг содержит обратную частоту документа (IDF). Если термин «Джон Смит» находится в одном из разделов, 0, 100 раз и в группе 1, один раз. Счет для поиска John Smith будет выше поиском в разделе 1 , как этот термин более скудный.

Чтобы обойти это, вы завянет должны иметь указательный быть по всем разделам, или вам нужно будет переопределить IDF.

Ответил 02/08/2008 d 10:51
источник пользователем

голоса
13

Поскольку оценка определяется по индексу, если я не ошибаюсь полностью.

Если у вас есть разные индексы (больше / меньше или различные данные, которые были проиндексированы), оценка будет отличаться:

http://lucene.apache.org/core/3_6_0/scoring.html

(Внимание: Содержит Math :-))

Ответил 02/08/2008 d 10:52
источник пользователем

голоса
8

Вы также можете быть заинтересованы в выходе explain()методы , и полученный Explanationобъект , который даст вам представление о том , как все забито , как они есть.

Ответил 02/08/2008 d 21:03
источник пользователем

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more