组合卦与django中的排名搜索1.10

问题描述：

我们在django 1.10中搜索，我们需要用卦搜索进行用户排名搜索。组合卦与django中的排名搜索1.10

我们的代码是这样的：

def get_queryset(self): 
     search = self.request.GET.get('text', '') 
     vector = SearchVector('name',weight='A', 
      config=settings.SEARCH_LANGS[ 
       settings.LANGUAGE 
      ], 
      ) + SearchVector(
      'content', 
      weight='B', 
      config=settings.SEARCH_LANGS[ 
       settings.LANGUAGE 
      ], 
      ) 
     query = SearchQuery(search) 
     return Article.objects.annotate(
      rank=SearchRank(
       vector, 
       query 
       ), 
      similarity=TrigramSimilarity(
       'name', search 
       ) + TrigramSimilarity(
       'content', search 
       ), 
      ).filter(
      rank__gte=0.3 
      ).filter(
      similarity__gt=0.3 
      ).order_by(
      '-similarity' 
      )[:20]

但这代码不会返回任何查询，而不使用三元我们还没有问题，但是，结合他们之间我们不能得到的查询。

我们如何结合trigram和排名搜索在Django 1.10？

答

我们更深入地调查了解搜索是如何进行权重的。

根据documents您可以根据字段赋予权重，甚至可以赋予权重，同样我们可以使用trigrams按相似性或距离进行过滤。

然而，没有指定一个使用这两个和进一步调查的例子，它作为重量的工作进一步理解。

一个小逻辑告诉我们，如果我们在所有的等级中寻找一个共同的词，那么相似度的变化远远大于范围，然而往往会降低这个范围的值。

现在，就我们所知，文本搜索是基于您要过滤的字段中包含的文本，而不是放在配置中的语言。例如，放置标题，使用的模型有一个标题字段和一个内容字段，其中最常见的词是how change，查看加权词（范围函数作为查询，因此我们可以使用values或values_list来查看排名和相似度，这是数字值，我们可以查看加权词查看矢量对象），我们看到，如果权重被分配，但拆分词的组合：发现'perfil'和'cambi'，但我们没有找到'cambiar'或'como' ;然而，所有模型都包含与'lorem ipsun ...'相同的文本，并且如果它们是整体并且具有权重B，则该句子的所有单词;我们的结论是，搜索是根据字段的内容完成的，以便过滤比我们用来配置搜索的语言更多的内容。

这就是说，我们在这里介绍我们用于一切的代码。

首先，我们需要使用八卦必要的情况下启用数据库：从postgres包

from __future__ import unicode_literals 

from django.db import migrations, models 
import django.db.models.deletion 
from django.contrib.postgres.operations import UnaccentExtension 
from django.contrib.postgres.operations import TrigramExtension 

class Migration(migrations.Migration): 

    initial = True 

    dependencies = [ 
    ] 

    operations = [ 
     ... 
     TrigramExtension(), 
     UnaccentExtension(), 

    ]

导入操作的迁移和从任意文件迁移运行。

下一步是使过滤器返回querys之一来改变问题的代码，如果所述第二失败：

def get_queryset(self): 
     search_query = SearchQuery(self.request.GET.get('q', '')) 

     vector = SearchVector(
      'name', 
      weight='A', 
      config=settings.SEARCH_LANGS[settings.LANGUAGE_CODE], 
     ) + SearchVector(
      'content', 
      weight='B', 
      config=settings.SEARCH_LANGS[settings.LANGUAGE_CODE], 
     ) 

     if self.request.user.is_authenticated: 
      queryset = Article.actives.all() 
     else: 
      queryset = Article.publics.all() 

     return queryset.annotate(
      rank=SearchRank(vector, search_query) 
      similarity=TrigramSimilarity(
       'name', search 
      ) + TrigramSimilarity(
       'content', search 
      ), 
     ).filter(Q(rank__gte=0.3) | Q(similarity__gt=0.3)).order_by('-rank')[:20]

与上面的代码陆续被渗出一个查询的问题，和如果选择的词不出现在两次搜索中的任何一个中，则问题更大。我们使用一个Q对象来使用OR连接器进行过滤，以便如果其中一个未返回所需值，请发送另一个到位。

虽然这已经足够，但是欢迎他们深入阐述这些权重和trigramas如何工作，以深入探讨最新版本的Django提供的大部分新优势。

感谢您分享您找到的解决方案。 – Private

组合卦与django中的排名搜索1.10

相关推荐