组合卦与django中的排名搜索1.10
我们在django 1.10中搜索,我们需要用卦搜索进行用户排名搜索。组合卦与django中的排名搜索1.10
我们的代码是这样的:
def get_queryset(self):
search = self.request.GET.get('text', '')
vector = SearchVector('name',weight='A',
config=settings.SEARCH_LANGS[
settings.LANGUAGE
],
) + SearchVector(
'content',
weight='B',
config=settings.SEARCH_LANGS[
settings.LANGUAGE
],
)
query = SearchQuery(search)
return Article.objects.annotate(
rank=SearchRank(
vector,
query
),
similarity=TrigramSimilarity(
'name', search
) + TrigramSimilarity(
'content', search
),
).filter(
rank__gte=0.3
).filter(
similarity__gt=0.3
).order_by(
'-similarity'
)[:20]
但这代码不会返回任何查询,而不使用三元我们还没有问题,但是,结合他们之间我们不能得到的查询。
我们如何结合trigram和排名搜索在Django 1.10?
我们更深入地调查了解搜索是如何进行权重的。
根据documents您可以根据字段赋予权重,甚至可以赋予权重,同样我们可以使用trigrams按相似性或距离进行过滤。
然而,没有指定一个使用这两个和进一步调查的例子,它作为重量的工作进一步理解。
一个小逻辑告诉我们,如果我们在所有的等级中寻找一个共同的词,那么相似度的变化远远大于范围,然而往往会降低这个范围的值。
现在,就我们所知,文本搜索是基于您要过滤的字段中包含的文本,而不是放在配置中的语言。例如,放置标题,使用的模型有一个标题字段和一个内容字段,其中最常见的词是how change
,查看加权词(范围函数作为查询,因此我们可以使用values
或values_list
来查看排名和相似度,这是数字值,我们可以查看加权词查看矢量对象),我们看到,如果权重被分配,但拆分词的组合:发现'perfil'和'cambi',但我们没有找到'cambiar'或'como' ;然而,所有模型都包含与'lorem ipsun ...'相同的文本,并且如果它们是整体并且具有权重B,则该句子的所有单词;我们的结论是,搜索是根据字段的内容完成的,以便过滤比我们用来配置搜索的语言更多的内容。
这就是说,我们在这里介绍我们用于一切的代码。
首先,我们需要使用八卦必要的情况下启用数据库:从postgres
包
from __future__ import unicode_literals
from django.db import migrations, models
import django.db.models.deletion
from django.contrib.postgres.operations import UnaccentExtension
from django.contrib.postgres.operations import TrigramExtension
class Migration(migrations.Migration):
initial = True
dependencies = [
]
operations = [
...
TrigramExtension(),
UnaccentExtension(),
]
导入操作的迁移和从任意文件迁移运行。
下一步是使过滤器返回querys之一来改变问题的代码,如果所述第二失败:
def get_queryset(self):
search_query = SearchQuery(self.request.GET.get('q', ''))
vector = SearchVector(
'name',
weight='A',
config=settings.SEARCH_LANGS[settings.LANGUAGE_CODE],
) + SearchVector(
'content',
weight='B',
config=settings.SEARCH_LANGS[settings.LANGUAGE_CODE],
)
if self.request.user.is_authenticated:
queryset = Article.actives.all()
else:
queryset = Article.publics.all()
return queryset.annotate(
rank=SearchRank(vector, search_query)
similarity=TrigramSimilarity(
'name', search
) + TrigramSimilarity(
'content', search
),
).filter(Q(rank__gte=0.3) | Q(similarity__gt=0.3)).order_by('-rank')[:20]
与上面的代码陆续被渗出一个查询的问题,和如果选择的词不出现在两次搜索中的任何一个中,则问题更大。我们使用一个Q
对象来使用OR
连接器进行过滤,以便如果其中一个未返回所需值,请发送另一个到位。
虽然这已经足够,但是欢迎他们深入阐述这些权重和trigramas如何工作,以深入探讨最新版本的Django提供的大部分新优势。
感谢您分享您找到的解决方案。 – Private