最近在看数据库优化相关的文章,顺便也整合下django 相关的资料,里面我主要关注的是一些简单介绍和它的一些参数,比如索引等,以备以后查阅
ORM简介
- MVC框架中包括一个重要的部分,就是ORM,它实现了数据模型与数据库的解耦,即数据模型的设计不需要依赖于特定的数据库,通过简单的配置就可以轻松更换数据库
- ORM是“对象-关系-映射”的简称,主要任务是:
- 根据对象的类型生成表结构
- 将对象、列表的操作,转换为sql语句
- 将sql查询到的结果转换为对象、列表
- 这极大的减轻了开发人员的工作量,不需要面对因数据库变更而导致的无效劳动
- Django中的模型包含存储数据的字段和约束,对应着数据库中唯一的表
使用MySql数据库
- 在虚拟环境中安装mysql包
pip install mysql-python
- 在mysql中创建数据库
create databases test2 charset=utf8
- 打开settings.py文件,修改DATABASES项
DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'test2', 'USER': '用户名', 'PASSWORD': '密码', 'HOST': '数据库服务器ip,本地可以使用localhost', 'PORT': '端口,默认为3306', } }
开发流程
- 在models.py中定义模型类,要求继承自models.Model
- 把应用加入settings.py文件的installed_app项
- 生成迁移文件
- 执行迁移生成表
- 使用模型类进行crud操作
定义模型
- 在模型中定义属性,会生成表中的字段
- django根据属性的类型确定以下信息:
- 当前选择的数据库支持字段的类型
- 渲染管理表单时使用的默认html控件
- 在管理站点最低限度的验证
- django会为表增加自动增长的主键列,每个模型只能有一个主键列,如果使用选项设置某属性为主键列后,则django不会再生成默认的主键列
- 属性命名限制
- 不能是python的保留关键字
- 由于django的查询方式,不允许使用连续的下划线
定义属性
- 定义属性时,需要字段类型
- 字段类型被定义在django.db.models.fields目录下,为了方便使用,被导入到django.db.models中
- 使用方式
- 导入from django.db import models
- 通过models.Field创建字段类型的对象,赋值给属性
- 对于重要数据都做逻辑删除,不做物理删除,实现方法是定义isDelete属性,类型为BooleanField,默认值为False
字段类型
- AutoField:一个根据实际ID自动增长的IntegerField,通常不指定
- 如果不指定,一个主键字段将自动添加到模型中
- BooleanField:true/false 字段,此字段的默认表单控制是CheckboxInput
- NullBooleanField:支持null、true、false三种值
- CharField(max_length=字符长度):字符串,默认的表单样式是 TextInput
- TextField:大文本字段,一般超过4000使用,默认的表单控件是Textarea
- IntegerField:整数
- DecimalField(max_digits=None, decimal_places=None):使用python的Decimal实例表示的十进制浮点数
- DecimalField.max_digits:位数总数
- DecimalField.decimal_places:小数点后的数字位数
- FloatField:用Python的float实例来表示的浮点数
- DateField[auto_now=False, auto_now_add=False]):使用Python的datetime.date实例表示的日期
- 参数DateField.auto_now:每次保存对象时,自动设置该字段为当前时间,用于"最后一次修改"的时间戳,它总是使用当前日期,默认为false
- 参数DateField.auto_now_add:当对象第一次被创建时自动设置当前时间,用于创建的时间戳,它总是使用当前日期,默认为false
- 该字段默认对应的表单控件是一个TextInput. 在管理员站点添加了一个JavaScript写的日历控件,和一个“Today"的快捷按钮,包含了一个额外的invalid_date错误消息键
- auto_now_add, auto_now, and default 这些设置是相互排斥的,他们之间的任何组合将会发生错误的结果
- TimeField:使用Python的datetime.time实例表示的时间,参数同DateField
- DateTimeField:使用Python的datetime.datetime实例表示的日期和时间,参数同DateField
- FileField:一个上传文件的字段
- ImageField:继承了FileField的所有属性和方法,但对上传的对象进行校验,确保它是个有效的image
字段选项
- 通过字段选项,可以实现对字段的约束
- 在字段对象时通过关键字参数指定
- null:如果为True,Django 将空值以NULL 存储到数据库中,默认值是 False
- blank:如果为True,则该字段允许为空白,默认值是 False
- 对比:null是数据库范畴的概念,blank是表单验证证范畴的
- db_column:字段的名称,如果未指定,则使用属性的名称
- db_index:若值为 True, 则在表中会为此字段创建索引
- default:默认值
- primary_key:若为 True, 则该字段会成为模型的主键字段
- unique:如果为 True, 这个字段在表中必须有唯一值
关系
- 关系的类型包括
- ForeignKey:一对多,将字段定义在多的端中
- ManyToManyField:多对多,将字段定义在两端中
- OneToOneField:一对一,将字段定义在任意一端中
- 可以维护递归的关联关系,使用'self'指定,详见“自关联”
- 用一访问多:对象.模型类小写_set
ORM操作
增
models.UserInfo.object.create(name=new_name)
删
models.UserInfo.object.get(id=xxx,None)
models.delete()
改
obj = models.UserInfo.object.get(id=xx,None) obj = new_xxx obj.save() #相当于修改后提交数据
查
querylist=models.Entry.objects.all() print([e.title for e in querylist]) print([e.title for e in querylist]) entry = models.Entry.objects.get(id=?)
附加:
Django ORM用到三个类:Manager、QuerySet、Model。Manager定义表级方法(表级方法就是影响一条或多条记录的方法),我们可以以models.Manager为父类,定义自己的manager,增加表级方法;QuerySet:Manager类的一些方法会返回QuerySet实例,
QuerySet是一个可遍历结构,包含一个或多个元素,每个元素都是一个Model 实例,它里面的方法也是表级方法,
前面说了,Django给我们提供了增加表级方法的途径,那就是自定义manager类,而不是自定义QuerySet类,一般的我们没有自定义QuerySet类的必要;
django.db.models模块中的Model类,我们定义表的model时,就是继承它,它的功能很强大,通过自定义model的instance可以获取外键实体等,
它的方法都是记录级方法(都是实例方法,貌似无类方法),不要在里面定义类方法,比如计算记录的总数,
查看所有记录,这些应该放在自定义的manager类中。以Django1.6为基础。
1.多表连接查询:感觉django太NX了。
'''
自定义文章归档model管理器
1.新加一个数据处理的方法
2.改变原有的queryset
'''
class ArticleManager(models.Manager):
def distinct_date(self):
distinct_date_list = []
date_list = self.values('date_publish')
for date in date_list:
date = date['date_publish'].strftime('%Y/%m')
if date not in distinct_date_list:
distinct_date_list.append(date)
return distinct_date_list
class A(models.Model):
name = models.CharField(u'名称')
date_publish = models.DateTimeField(auto_now_add=True,verbose_name='发布时间')
#课14 关联自定义manager 管理器
objects = ArticleManager()
class Meta:
verbose_name = '用户'
verbose_name_plural = verbose_name
ordering = ['-date_publish']
def __unicode__(self):
return self.name
class B(models.Model):
aa = models.ForeignKey(A)
B.objects.filter(aa__name__contains='searchtitle')
1.5 反向查询,补上记录1.5,感觉django太太太NX了。
class A(models.Model):
name = models.CharField(u'名称')
class B(models.Model):
aa = models.ForeignKey(A,related_name="FAN_set")
bb = models.CharField(u'名称')
查A: A.objects.filter(FAN__bb='XXXX'),都知道related_name的作用,A.FAN_set.all()是一组以A为外键的B实例,
可前面这样的用法是查询出所有(B.aa=A且B.bb=XXXX)的A实例,还可以通过__各种关系查找,很好用!!!
a = A.objects.get(name='pp')
a.FAN_set.filter(bb='XXX')
2.条件选取querySet的时候,filter表示=,exclude表示!=。
querySet.distinct() 去重复
__exact 精确等于 like 'aaa'
__iexact 精确等于 忽略大小写 ilike 'aaa'
__contains 包含 like '%aaa%'
__icontains 包含 忽略大小写 ilike '%aaa%',但是对于sqlite来说,contains的作用效果等同于icontains。
__startswith 以...开头
__istartswith 以...开头 忽略大小写
__endswith 以...结尾
__iendswith 以...结尾,忽略大小写
__gt 大于
__gte 大于等于
__lt 小于
__lte 小于等于
__in 存在于一个list范围内
__range 在...范围内 ,对应于between and
__year 日期字段的年份
__month 日期字段的月份
__day 日期字段的日
__isnull=True/False
例子:
Person.objects.all()[:10] #切片操作,获取10个人,不支持负索引,切片可以节约内存
Person.objects.filter(name="abc") # 等于(name__exact="abc") 名称严格等于 "abc" 的人 ,name__iexact
Person.objects.filter(name__contains="abc") # 名称中包含 "abc"的人 ,name__icontains
Person.objects.filter(name__regex="^abc") # 正则表达式查询 ,name__iregex
Person.objects.exclude(name__contains="WZ") # exclude排除包含 WZ 的Person对象
Person.objects.exclude(name__in=iterable) #对应not in (iterable)是可迭代对象
Person.objects.filter(name__contains="abc").exclude(age=23) # 找出名称含有abc, 但是排除年龄是23岁的
Person.objects.all()[5:10] #对应于limit
3.在django models中取得一个字段的distinct值
http://www.manongjc.com/article/941.html
就是select distinct xxx from table_name ...这样的功能
很简单,代码如下
xxxx.objects.values("field_name").distinct()
#或者
xxxx.objects.distinct().values("field_name")
Django ORM用到三个类:Manager、QuerySet、Model。Manager定义表级方法(表级方法就是影响一条或多条记录的方法),
我们可以以models.Manager为父类,定义自己的manager,增加表级方法;QuerySet:Manager类的一些方法会返回QuerySet实例,
QuerySet是一个可遍历结构,包含一个或多个元素,每个元素都是一个Model 实例,它里面的方法也是表级方法,
前面说了,Django给我们提供了增加表级方法的途径,那就是自定义manager类,而不是自定义QuerySet类,一般的我们没有自定义QuerySet类的必要;
django.db.models模块中的Model类,我们定义表的model时,就是继承它,它的功能很强大,通过自定义model的instance可以获取外键实体等,
它的方法都是记录级方法(都是实例方法,貌似无类方法),不要在里面定义类方法,比如计算记录的总数,
查看所有记录,这些应该放在自定义的manager类中。以Django1.6为基础。
1.多表连接查询:感觉django太NX了。
'''
自定义文章归档model管理器
1.新加一个数据处理的方法
2.改变原有的queryset
'''
class ArticleManager(models.Manager):
def distinct_date(self):
distinct_date_list = []
date_list = self.values('date_publish')
for date in date_list:
date = date['date_publish'].strftime('%Y/%m')
if date not in distinct_date_list:
distinct_date_list.append(date)
return distinct_date_list
class A(models.Model):
name = models.CharField(u'名称')
date_publish = models.DateTimeField(auto_now_add=True,verbose_name='发布时间')
#课14 关联自定义manager 管理器
objects = ArticleManager()
class Meta:
verbose_name = '用户'
verbose_name_plural = verbose_name
ordering = ['-date_publish']
def __unicode__(self):
return self.name
class B(models.Model):
aa = models.ForeignKey(A)
B.objects.filter(aa__name__contains='searchtitle')
1.5 反向查询,补上记录1.5,感觉django太太太NX了。
class A(models.Model):
name = models.CharField(u'名称')
class B(models.Model):
aa = models.ForeignKey(A,related_name="FAN_set")
bb = models.CharField(u'名称')
查A: A.objects.filter(FAN__bb='XXXX'),都知道related_name的作用,A.FAN_set.all()是一组以A为外键的B实例,
可前面这样的用法是查询出所有(B.aa=A且B.bb=XXXX)的A实例,还可以通过__各种关系查找,很好用!!!
a = A.objects.get(name='pp')
a.FAN_set.filter(bb='XXX')
版权归作者所有,任何形式转载请联系作者。
作者:petanne(来自豆瓣)
来源:https://www.douban.com/note/301166150/
2.条件选取querySet的时候,filter表示=,exclude表示!=。
querySet.distinct() 去重复
__exact 精确等于 like 'aaa'
__iexact 精确等于 忽略大小写 ilike 'aaa'
__contains 包含 like '%aaa%'
__icontains 包含 忽略大小写 ilike '%aaa%',但是对于sqlite来说,contains的作用效果等同于icontains。
__startswith 以...开头
__istartswith 以...开头 忽略大小写
__endswith 以...结尾
__iendswith 以...结尾,忽略大小写
__gt 大于
__gte 大于等于
__lt 小于
__lte 小于等于
__in 存在于一个list范围内
__range 在...范围内 ,对应于between and
__year 日期字段的年份
__month 日期字段的月份
__day 日期字段的日
__isnull=True/False
例子:
Person.objects.all()[:10] #切片操作,获取10个人,不支持负索引,切片可以节约内存
Person.objects.filter(name="abc") # 等于(name__exact="abc") 名称严格等于 "abc" 的人 ,name__iexact
Person.objects.filter(name__contains="abc") # 名称中包含 "abc"的人 ,name__icontains
Person.objects.filter(name__regex="^abc") # 正则表达式查询 ,name__iregex
Person.objects.exclude(name__contains="WZ") # exclude排除包含 WZ 的Person对象
Person.objects.exclude(name__in=iterable) #对应not in (iterable)是可迭代对象
Person.objects.filter(name__contains="abc").exclude(age=23) # 找出名称含有abc, 但是排除年龄是23岁的
Person.objects.all()[5:10] #对应于limit
3.在django models中取得一个字段的distinct值
http://www.manongjc.com/article/941.html
就是select distinct xxx from table_name ...这样的功能
很简单,代码如下
xxxx.objects.values("field_name").distinct()
#或者
xxxx.objects.distinct().values("field_name")