【python django2.0入门教程】orm之queryset 数据查询api:all get filter distinct first last count -凯发k8官方网
在orm增删改操作文章里,主要讲了orm的增删改查的基本操作,这节我们主要是讲orm查询操作,查询操作是django的orm框架中最重要的内容之一,下面是我们常用到的与查询相关的api。
注意,本章节的例子都是在上节的modesl.py基础上做的。
<1>all(): 查询所有结果 <2>filter(**kwargs) 它包含了与所给筛选条件相匹配的对象 <3>get(**kwargs): 返回与所给筛选条件相匹配的对象,返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。 <4>exclude(**kwargs) 它包含了与所给筛选条件不匹配的对象 <5>values(*field) 返回一个valuequeryset 一个特殊的queryset,运行后得到的并不是一系列model的实例化对象,而是一个可迭代的字典序列 <6>values_list(*field) 它与values()非常相似,它返回的是一个元组序列,values返回的是一个字典序列 <7>order_by(*field) 对查询结果排序 <8>reverse() 对查询结果反向排序 <9>distinct() 从返回结果中剔除重复纪录 <10>count() 返回数据库中匹配查询(queryset)的对象数量。 <11>first() 返回第一条记录 <12>last() 返回最后一条记录 <13>exists() 如果queryset包含数据,就返回true,否则返回false <14>annotate() 使用聚合函数 <15>dates() 根据日期获取查询集 <16>datetimes() 根据时间获取查询集 <17>none() 创建空的查询集 <18>union() 并集 <19>intersection() 交集 <21>difference() 差集 <22>select_related() 附带查询关联对象 <23>prefetch_related() 预先查询 <24>extra() 附加sql查询 <25>defer() 不加载指定字段 <26>only() 只加载指定的字段 <27>using() 选择数据库 <28>select_for_update() 锁住选择的对象,直到事务结束。 <29>raw() 接收一个原始的sql查询注意:一定要区分出object与queryset的区别 !!!
1、检索所有对象all()
使用all()方法,可以获取某张表的所有记录。返回当前queryset(或queryset子类)的副本。通常用于获取全部queryset对象。
def orm(requst):#获取所有文章,对应sql:select * from articleall_article = models.article.objects.all()print(all_article)return httpresponse('orm')保存之后,我们通过浏览器访问,然后查看 terminal,看到我们的打印出来的查询结果,一共有四篇文章。
查询出来的是一个queryset的对象。
2、用filter过滤对象
filter(**kwargs)
返回满足查询参数的对象集合。
查找的参数(**kwargs)应该满足下文字段查找中的格式。多个参数之间是和and的关系。
常用例子:
# 大于,>,对应sql:select * from article where id > 724 article.objects.filter(id__gt=724) # 大于等于,>=,对应sql:select * from article where id >= 724 article.objects.filter(id__gte=724) # 小于,<,对应sql:select * from article where id < 724 article.objects.filter(id__lt=724) # 小于等于,<=,对应sql:select * from article where id <= 724 article.objects.filter(id__lte=724) # 同时大于和小于, 1 < id < 10,对应sql:select * from article where id > 1 and id < 10 article.objects.filter(id__gt=1, id__lt=10) # 包含,in,对应sql:select * from article where id in (11,22,33) article.objects.filter(id__in=[11, 22, 33]) # 不包含,not in,对应sql:select * from article where id not in (11,22,33) article.objects.filter(pub_date__isnull=true) # 不为空:isnull=false,对应sql:select * from article where pub_date is not null article.objects.filter(pub_date__isnull=true) # 匹配,like,大小写敏感,对应sql:select * from article where name like '%sre%',sql中大小写不敏感 article.objects.filter(name__contains="sre") # 匹配,like,大小写不敏感,对应sql:select * from article where name like '%sre%',sql中大小写不敏感 article.objects.filter(name__icontains="sre") # 范围,between and,对应sql:select * from article where id between 3 and 8 article.objects.filter(id__range=[3, 8]) # 以什么开头,大小写敏感,对应sql:select * from article where name like 'sh%',sql中大小写不敏感 article.objects.filter(name__startswith='sre') # 以什么开头,大小写不敏感,对应sql:select * from article where name like 'sh%',sql中大小写不敏感 article.objects.filter(name__istartswith='sre') # 以什么结尾,大小写敏感,对应sql:select * from article where name like '%sre',sql中大小写不敏感 article.objects.filter(name__endswith='sre') # 以什么结尾,大小写不敏感,对应sql:select * from article where name like '%sre',sql中大小写不敏感 article.objects.filter(name__iendswith='sre') # 排序,order by,正序,对应sql:select * from article where name = '关键词' order by id article.objects.filter(name='关键词').order_by('id') # 多级排序,order by,先按name进行正序排列,如果name一致则再按照id倒叙排列 article.objects.filter(name='关键词').order_by('name','-id') # 排序,order by,倒序,对应sql:select * from article where name = '关键词' order by id desc article.objects.filter(name='关键词').order_by('-id')3、查询单一对象 get
filter方法始终返回的是querysets,那怕只有一个对象符合过滤条件,返回的也是包含一个对象的querysets,这是一个集合类型对象,你可以简单的理解为python列表,可迭代可循环可索引。
如果你确定你的检索只会获得一个对象,那么你可以使用get()方法来直接返回这个对象。get返回与所给筛选条件相匹配的对象,返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。
4、查询不匹配条件的对象 exclude
exclude(**kwargs)
返回一个新的queryset,它包含不满足给定的查找参数的对象。
查找的参数(**kwargs)应该满足下文字段查找中的格式。多个参数通过and连接,然后所有的内容放入not() 中。
下面的示例排除所有created_time晚于2018-7-15且headline为“hello” 的记录:
article.objects.exclude(created_time__gt=datetime.date(2018,7,15), headline='hello')下面的示例排除所有pub_date晚于2005-1-3或者headline 为“hello” 的记录:
article.objects.exclude(created_time__gt=datetime.date(2018,7,15)).exclude(headline='hello')5、查询返回一个字典 values
返回一个valuequeryset,一个特殊的queryset,运行后得到的并不是一系列model的实例化对象,而是一个可迭代的字典序列。每个字典表示一个对象,键对应于模型对象的属性名称。
例:
#values()与普通的模型对象比较: def orm(requst):article = models.article.objects.filter(title__startswith='增加')article_values = models.article.objects.filter(title__startswith='增加').values()print(article)print('----------------------------------------------')print(article_values)return httpresponse('orm')#打印结果6、查询返回一个元组 values_list
values_list(*fields, flat=false)
与values()类似,只是在迭代时返回的是元组而不是字典。每个元组包含传递给values_list()调用的相应字段或表达式的值,因此第一个项目是第一个字段等。
看例子:
from django.db.models.functions import lower values_list=models.article.objects.values_list('id','title') values_list_lower = models.article.objects.values_list('id', lower('title'))如果只传递一个字段,还可以传递flat参数。 如果为true,它表示返回的结果为单个值而不是元组。 如下所示:
values_list=models.article.objects.values_list('id').order_by('id')values_list_flat = models.article.objects.values_list('id', flat=true).order_by('id')如果有多个字段,传递flat将发生错误。
**7、查询返回一个元组 order_by
**
order_by(*fields)
默认情况下,根据模型的meta类中的ordering属性对queryset中的对象进行排序
上面的结果将按照created_time降序排序,然后再按照title升序排序。"-created_time"前面的负号表示降序顺序。 升序是默认的。 要随机排序,使用"?",如下所示:
article = models.article.objects.order_by('?')注:order_by(’?’)可能耗费资源且很慢,这取决于使用的数据库。
若要按照另外一个模型中的字段排序,可以使用查询关联模型的语法。即通过字段的名称后面跟两个下划线(__),再加上新模型中的字段的名称,直到希望连接的模型。
article = models.article.objects.order_by('category__name', 'title')如果排序的字段与另外一个模型关联,django将使用关联的模型的默认排序,或者如果没有指定meta.ordering将通过关联的模型的主键排序。 例如,因为blog模型没有指定默认的排序:
article = models.article.objects.order_by('category') #等于: article = models.article.objects.order_by('category__id')如果blog设置了ordering = [‘name’],那么第一个queryset将等同于:
article = models.article.objects.order_by('category__name')还可以通过调用表达式的desc()或者asc()方法:
article = models.article.objects.order_by(coalesce('summary', 'title').desc())8、对查询结果反向排序 reverse
反向排序queryset中返回的元素。 第二次调用reverse()将恢复到原有的排序。
如要获取queryset中最后三个元素,可以这样做:
这与python直接使用负索引有点不一样。 django不支持负索引,只能曲线救国。
9、从返回结果中剔除重复纪录 distinct
distinct(*fields)
去除查询结果中重复的行。
默认情况下,queryset不会去除重复的行。当查询跨越多张表的数据时,queryset可能得到重复的结果,这时候可以使用distinct()进行去重。
10、返回数据库中匹配查询(queryset)的对象数量 count
**返回一个整数,该整数表示数据库中与queryset匹配的对象的数量。
**
**例子:
**
#返回数据库中的条目总数article = models.article.objects.count()#返回标题中包含“增加”的条目数article_filter = models.article.objects.filter(title__contains='增加').count()count()调用在幕后执行select count(*),因此您应该始终使用count(),而不是将所有记录加载到python对象中,然后对结果调用len()(除非无论如何都需要将对象加载到内存中,在这种情况下,len()会更快)。
注意,如果您想要查询一个queryset中的项目数量,并且正在从它检索模型实例(例如,通过遍历它),那么使用len(queryset)可能会更高效,因为它不会像count()那样导致额外的数据库查询。
11、返回由queryset匹配的第一个对象 first*()*
返回由queryset匹配的第一个对象,如果没有匹配的对象,则返回none。如果queryset没有定义任何排序,那么queryset将由主键自动排序。
例子:
p = models.article.objects.order_by('title', 'created_time').first()#文章的'上一页'就是通过这个实现的previous_blog = article.objects.filter(created_time__gt=article_obj.created_time).first()注意,first()是一种简洁的写法,下面的代码示例与上面的示例等价:
try: p = models.article.objects.order_by('title', 'created_time')[0]except indexerror: p = none12、返回最后一条记录last()
与first()类似,它是返回queryset中的最后一个对象。
#文章下一页netx_blog = article.objects.filter(created_time__lt=article_obj.created_time).last()1****3、返回最后一条记录exists()
如果queryset包含数据,就返回true,否则返回false —只判断是否有记录
如果 queryset 包含任何结果,则返回 true,否则返回 false。这尽可能以最简单和最快的方式执行查询,但它确实执行与普通 queryset 查询几乎相同的查询。
exists() 对于与 queryset 中的对象成员资格以及 queryset 中的任何对象(特别是大型 queryset 的上下文)中存在的相关搜索都很有用。
查找具有唯一字段(例如 primary_key)的模型是否为 queryset 的成员的最有效方法是:
entry = entry.objects.get(pk=123) if some_queryset.filter(pk=entry.pk).exists(): print("entry contained in queryset")这将比以下要求更快,需要对整个查询集进行评估和迭代:
if entry in some_queryset: print("entry contained in queryset")查找查询集是否包含任何项目:
if some_queryset.exists(): print("there is at least one object in some_queryset")这将比以下更快:
if some_queryset: print("there is at least one object in some_queryset")…但不是很大程度上(因此需要大量查询来提高效率)。
14、使用提供的聚合表达式查询对象annotate()
函数原型annotate(*args, **kwargs),返回queryset。
表达式可以是简单的值、对模型(或任何关联模型)上的字段的引用或者聚合表达式(平均值、总和等)。
annotate()的每个参数都是一个annotation,它将添加到返回的queryset每个对象中。
关键字参数指定的annotation将使用关键字作为annotation 的别名。 匿名参数的别名将基于聚合函数的名称和模型的字段生成。 只有引用单个字段的聚合表达式才可以使用匿名参数。 其它所有形式都必须用关键字参数。
例如,如果正在操作一个blog列表,你可能想知道每个blog有多少entry:
>>> from django.db.models import count>>> q = blog.objects.annotate(count('entry'))# the name of the first blog>>> q[0].name'blogasaurus'# the number of entries on the first blog>>> q[0].entry__count42blog模型本身没有定义entry__count属性,但是通过使用一个关键字参数来指定聚合函数,可以控制annotation的名称:
>>> q = blog.objects.annotate(number_of_entries=count('entry'))# the number of entries on the first blog, using the name provided>>> q[0].number_of_entries3515、根据日期获取查询集dates()
dates(field, kind, order=‘asc’)
返回一个queryset,表示queryset内容中特定类型的所有可用日期的datetime.date对象列表。
field参数是模型的datefield的名称。 kind参数应为"year",“month"或"day”。 结果列表中的每个datetime.date对象被截取为给定的类型。
“year” 返回对应该field的所有不同年份值的列表。
"month"返回字段的所有不同年/月值的列表。
"day"返回字段的所有不同年/月/日值的列表。
order参数默认为’asc’,或者’desc’。 它指定如何排序结果。
例子:
>>> entry.objects.dates('pub_date', 'year') [datetime.date(2005, 1, 1)] >>> entry.objects.dates('pub_date', 'month') [datetime.date(2005, 2, 1), datetime.date(2005, 3, 1)] >>> entry.objects.dates('pub_date', 'day') [datetime.date(2005, 2, 20), datetime.date(2005, 3, 20)] >>> entry.objects.dates('pub_date', 'day', order='desc') [datetime.date(2005, 3, 20), datetime.date(2005, 2, 20)] >>> entry.objects.filter(headline__contains='lennon').dates('pub_date', 'day') [datetime.date(2005, 3, 20)]16、根据时间获取查询集datetimes()
datetimes(field_name, kind, order=‘asc’, tzinfo=none)
返回queryset,为datetime.datetime对象的列表,表示queryset内容中特定种类的所有可用日期。
field_name应为模型的datetimefield的名称。
kind参数应为"hour",“minute”,“month”,“year”,“second"或"day”。
结果列表中的每个datetime.datetime对象被截取到给定的类型。
order参数默认为’asc’,或者’desc’。 它指定如何排序结果。
tzinfo参数定义在截取之前将数据时间转换到的时区。
17、 创建空的查询集none()
调用none()将创建一个不返回任何对象的查询集,并且在访问结果时不会执行任何查询。
例子:
>>> entry.objects.none()18、并集union()
union(*other_qs, all=false)
django中的新功能1.11。也就是集合中并集的概念!
使用sql的union运算符组合两个或更多个queryset的结果。例如:
>>> qs1.union(qs2, qs3)默认情况下,union操作符仅选择不同的值。 要允许重复值,请使用all=true参数。
19、交集intersection()
intersection(*other_qs)
django中的新功能1.11。也就是集合中交集的概念!
使用sql的intersect运算符返回两个或更多个queryset的共有元素。例如:
>>> qs1.intersection(qs2, qs3)21、差集difference()
difference(*other_qs)
django中的新功能1.11。也就是集合中差集的概念!
使用sql的except运算符只保留queryset中的元素,但不保留其他queryset中的元素。例如:
>>> qs1.difference(qs2, qs3)22、附带查询关联对象select_related()
select_related(*fields)
沿着外键关系查询关联的对象的数据。这会生成一个复杂的查询并引起性能的损耗,但是在以后使用外键关系时将不需要再次数据库查询。
下面的例子解释了普通查询和select_related()查询的区别。 下面是一个标准的查询:
# 访问数据库。e = entry.objects.get(id=5)# 再次访问数据库以得到关联的blog对象。b = e.blog下面是一个select_related查询:
# 访问数据库。e = entry.objects.select_related('blog').get(id=5)# 不会访问数据库,因为e.blog已经在前面的查询中获得了。b = e.blogselect_related()可用于objects任何的查询集:
from django.utils import timezone# find all the blogs with entries scheduled to be published in the future. blogs = set()for e in entry.objects.filter(pub_date__gt=timezone.now()).select_related('blog'):# 没有select_related(),下面的语句将为每次循环迭代生成一个数据库查询,以获得每个entry关联的blog。blogs.add(e.blog)filter()和select_related()的顺序不重要。 下面的查询集是等同的:
entry.objects.filter(pub_date__gt=timezone.now()).select_related('blog') entry.objects.select_related('blog').filter(pub_date__gt=timezone.now())可以沿着外键查询。 如果有以下模型:
from django.db import modelsclass city(models.model):# ...passclass person(models.model):# ...hometown = models.foreignkey(city,on_delete=models.set_null,blank=true,null=true,)class book(models.model):# ...author = models.foreignkey(person, on_delete=models.cascade)调用book.objects.select_related('author__hometown').get(id=4)将缓存相关的person 和相关的city:
b = book.objects.select_related('author__hometown').get(id=4) p = b.author # doesn't hit the database. c = p.hometown # doesn't hit the database. b = book.objects.get(id=4) # no select_related() in this example. p = b.author # hits the database. c = p.hometown # hits the database.在传递给select_related()的字段中,可以使用任何foreignkey和onetoonefield。
在传递给select_related的字段中,还可以反向引用onetoonefield。也就是说,可以回溯到定义onetoonefield 的字段。 此时,可以使用关联对象字段的related_name,而不要指定字段的名称。
23、预先查询prefetch_related()
prefetch_related(*lookups)
在单个批处理中自动检索每个指定查找的相关对象。
与select_related类似,但是策略是完全不同的。
假设有这些模型:
from django.db import modelsclass topping(models.model):name = models.charfield(max_length=30)class pizza(models.model):name = models.charfield(max_length=50)toppings = models.manytomanyfield(topping)def __str__(self): # __unicode__ on python 2return "%s (%s)" % (self.name,", ".join(topping.name for topping in self.toppings.all()),)并运行:
>>> pizza.objects.all() ["hawaiian (ham, pineapple)", "seafood (prawns, smoked salmon)"...问题是每次queryset要求pizza.objects.all()查询数据库,因此self.toppings.all()将在pizza pizza.__str__()中的每个项目的toppings表上运行查询。
可以使用prefetch_related减少为只有两个查询:
>>> pizza.objects.all().prefetch_related('toppings')这意味着现在每次self.toppings.all()被调用,不会再去数据库查找,而是在一个预取的queryset缓存中查找。
还可以使用正常连接语法来执行相关字段的相关字段。 假设在上面的例子中增加一个额外的模型:
class restaurant(models.model):pizzas = models.manytomanyfield(pizza, related_name='restaurants')best_pizza = models.foreignkey(pizza, related_name='championed_by')以下是合法的:
>>> restaurant.objects.prefetch_related('pizzas__toppings')这将预取所有属于餐厅的比萨饼,和所有属于那些比萨饼的配料。 这将导致总共3个查询 - 一个用于餐馆,一个用于比萨饼,一个用于配料。
>>> restaurant.objects.prefetch_related('best_pizza__toppings')这将获取最好的比萨饼和每个餐厅最好的披萨的所有配料。 这将在3个表中查询 - 一个为餐厅,一个为“最佳比萨饼”,一个为一个为配料。
当然,也可以使用best_pizza来获取select_related关系,以将查询数减少为2:
>>> restaurant.objects.select_related('best_pizza').prefetch_related('best_pizza__toppings')24、附加sql查询extra()
extra(select=none, where=none, params=none, tables=none, order_by=none, select_params=none)
有些情况下,django的查询语法难以简单的表达复杂的where子句,对于这种情况,可以在extra()生成的sql从句中注入新子句。使用这种方法作为最后的手段,这是一个旧的api,在将来的某个时候可能被弃用。仅当无法使用其他查询方法表达查询时才使用它。
例如:
>>> qs.extra( ... select={'val': "select col from sometable where othercol = %s"}, ... select_params=(someparam,), ... )相当于:
>>> qs.annotate(val=rawsql("select col from sometable where othercol = %s", (someparam,)))25、不加载指定字段defer()
defer(*fields)
在一些复杂的数据建模情况下,模型可能包含大量字段,其中一些可能包含大尺寸数据(例如文本字段),将它们转换为python对象需要花费很大的代价。
当最初获取数据时不知道是否需要这些特定字段的情况下,如果正在使用查询集的结果,可以告诉django不要从数据库中检索它们。
通过传递字段名称到defer()实现不加载:
entry.objects.defer("headline", "body")具有延迟加载字段的查询集仍将返回模型实例。
每个延迟字段将在你访问该字段时从数据库中检索(每次只检索一个,而不是一次检索所有的延迟字段)。
可以多次调用defer()。 每个调用都向延迟集添加新字段:
# 延迟body和headline两个字段。 entry.objects.defer("body").filter(rating=5).defer("headline")字段添加到延迟集的顺序无关紧要。对已经延迟的字段名称再次defer()没有问题(该字段仍将被延迟)。
可以使用标准的双下划线符号来分隔关联的字段,从而加载关联模型中的字段:
blog.objects.select_related().defer("entry__headline", "entry__body")如果要清除延迟字段集,将none作为参数传递到defer():
# 立即加载所有的字段。 my_queryset.defer(none)defer()方法(及其兄弟,only())仅适用于高级用例,它们提供了数据加载的优化方法。
26、只加载指定的字段only()
only(*fields)
only()方法与defer()相反。
如果有一个模型几乎所有的字段需要延迟,使用only()指定补充的字段集可以使代码更简单。
假设有一个包含字段biography、age和name的模型。 以下两个查询集是相同的,就延迟字段而言:
person.objects.defer("age", "biography") person.objects.only("name")每当你调用only()时,它将替换立即加载的字段集。因此,对only()的连续调用的结果是只有最后一次调用的字段被考虑:
# this will defer all fields except the headline. entry.objects.only("body", "rating").only("headline")由于defer()以递增方式动作(向延迟列表中添加字段),因此你可以结合only()和defer()调用:
# final result is that everything except "headline" is deferred. entry.objects.only("headline", "body").defer("body") # final result loads headline and body immediately (only() replaces any # existing set of fields). entry.objects.defer("body").only("headline", "body")当对具有延迟字段的实例调用save()时,仅保存加载的字段。
27、选择数据库using()
using(alias)
如果正在使用多个数据库,这个方法用于指定在哪个数据库上查询queryset。方法的唯一参数是数据库的别名,定义在databases。
例如:
# queries the database with the 'default' alias. >>> entry.objects.all() # queries the database with the 'backup' alias >>> entry.objects.using('backup')28、锁住选择的对象,直到事务结束。select_for_update()
elect_for_update(nowait=false, skip_locked=false)
返回一个锁住行直到事务结束的查询集,如果数据库支持,它将生成一个select ... for update语句。
例如:
entries = entry.objects.select_for_update().filter(author=request.user)所有匹配的行将被锁定,直到事务结束。这意味着可以通过锁防止数据被其它事务修改。
一般情况下如果其他事务锁定了相关行,那么本查询将被阻塞,直到锁被释放。使用select_for_update(nowait=true)将使查询不阻塞。如果其它事务持有冲突的锁,那么查询将引发databaseerror异常。也可以使用select_for_update(skip_locked=true)忽略锁定的行。nowait和skip_locked是互斥的。
目前,postgresql,oracle和mysql数据库后端支持select_for_update()。但是,mysql不支持nowait和skip_locked参数。
29、接收一个原始的sql查询raw()
raw(raw_query, params=none, translations=none)
接收一个原始的sql查询,执行它并返回一个django.db.models.query.rawqueryset实例。
这个rawqueryset实例可以迭代,就像普通的queryset一样。
参考链接:https://www.django.cn/course/show-18.html
总结
以上是凯发k8官方网为你收集整理的的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇:
- 下一篇: