PostgreSQL系统概述

news/2024/7/9 22:58:39 标签: postgresql, 数据库

目录

写在前面

1.简介

1.1何为关系型数据库

1.2何为对象型数据库

2.特性

3.代码结构

3.1数据库集簇

3.2Parser查询分析流程

3.3内部查询树组成部分

3.3.1目标列表

3.4Optimizer查询优化流程

3.4.1查询计划

3.5非计划查询的SQL命令


 写在前面

如有错误请指正,谢谢各位!!

1.简介

PostgreSQL是一种对象 - 关系数据库管理系统(ORDBMS),支持关系型数据库的功能及具备对象数据库的特征。

1.1何为关系型数据库

关系型数据库是指根据关系模型来创建的数据库。关系模型可以看成是一个二维表格模型。

1.2何为对象型数据库

具备类、继承等面向对象程序设计语言的特征。

2.特性

(1)开放特性:有着丰富的数据类型,如任意精度的数值、无限制长度的文本、几何图元、IP地址、数组等;同时还允许用户定义基于正规SQL类型的新类型,让数据库自身理解复杂数据,自定义类型中还可以包含继承关系。用户可以为数据库内几乎所有的对象定义新的类型,如索引、操作符(可重载现有操作符)、聚集函数、数据域、数据类型转换、会话(编码转换)等。

(2)可编程性:提供编程接口,如ODBC、JDBC(Java)、Libpq(C/C++)等。

(3)可定制性:编程语言,包括内置的PL/pgSQL过程语言,PL/Perl、plPHP、PL/Python、PL/Ruby、PL/Tcl等脚本语言,以及Java、C/C++等高级编程语言。

(4)索引手段

  a.自定义索引

  b.内置B-Tree索引、Hash表索引、GiST索引、GIN索引

  c.反向索引检索、表达式索引、部分索引、位图索引扫描

(5)多种身份认证方式:PostgreSQL中可以使用数据库用户/角色、操作系统、PAM、Kerberos等方式,根据主机配置文件(pg_hba.conf)中的设置执行对应的身份认证。 

3.代码结构

  • Bootstrap支持Bootstrap运行模式,该模式主要用于创建初始模板数据库

        本人认为这个模块类似于操作系统的引导块,在初始化数据库时,它相当于一个初始化程序。

  • Initdb:初始化数据库集簇,在指定目录下创建base目录,从而初始化一个新的数据库集簇。
  • Main:主程序模块,负责将控制权转交给Postmaster进程或Posrgres进程。
  • Postmaster:不停循环监听用户端口,fork多个不同的子进程Postgres。
  • LibpqC/C++库函数,处理与Client间的通信。
  • TcopServer进程的主要处理部分,调用ParserOptimizer、ExecutorCommands中的函数执行Client提交的查询。
  • Parser:编译器,SQL查询命令--(词法和语法分析)--> 分析树   --(语义分析)-->内部查询树。
  • Optimizer:优化器,查询树→创建最优查询路径&&查询计划。
  • Executor:执行器,执行Optimizer的查询计划Commands:执行非计划查询的SQL命令。
  • Catalog:系统表操作
  • Storage:管理各种类型的存储系统
  • Access:提供各种存取方法
  • Nodes:定义系统内部的节点、链表结构,及处理函数,等价于一个数据结构
  • Utils:各种支持函数
  • Regex:正则表达式库及其相关函数
  • Rewirte:据规则系统对查询进行重写
  • TSearch:全文检索
  • Psql数据库交互工具
  • Port:平台兼容性处理相关函数

3.1数据库集簇

        数据库集簇(database cluster)是一组数据库的集合,由一个PostgreSQL服务器管理,其本质上是一个文件目录。

3.2Parser查询分析流程

  1. exec_simple_query函数(在src/backend/tcop/postgres.c下)调用pg_parse_query函数进入词法分析和语法分析的主过程,函数pg_parse_query再调用词法分析和语法分析的入口函数raw_parser生成分析树。
  2. pg_parse_query函数返回分析树(raw_parsetree_list)给exec_simple_query。
  3. exec_simple_query函数调用函数pg_analyze_and_rewrite进行语义分析(调用parse_analyze函数,返回查询树)和查询重写(调用pg_rewrite_query函数)。
  4. 返回查询树链表给exec_simple_query。

3.3内部查询树组成部分

  1. 命令类型:哪种命令(SELECT、INSERT、UPDATE)产生了查询树。
  2. 范围表:被使用在此查询的关系的列表(SELECT语句的范围表为from后给出的关系)。
  3. 结果关系:一个指向范围表的索引,它标识了该查询的结果应该去哪个关系(DELETE、INSERT等命令的结果关系是要进行修改的表或者视图)。
  4. 目标列表:一个表达式的列表,定义了查询的结果。表达式可以是常值、指向范围表中关系的列的变量、参数或者是一个由函数调用、常量、变量、操作符等构成的表达式树。
  5. 条件:表达式,结果值是一个bool值,判断该命令是否执行。(SQL语句中的WHERE子句)
  6. 连接树:多个数据表连接时,执行过程可表示为树形结构。

3.3.1目标列表

  1. SELECT:目标列表的表达式构建出SELECT查询的最终输出。对应select和from之间的表达式。
  2. UPDATE:目标列表描述要替换旧行的新行。规则器会处理缺失的列,做法是为其插入表达式,作用是把旧行的值复制到新行。
  3. INSERT:目标列表描述了将要进入结果关系的新行。
  4. DELETE:因为不产生任何结果,所以不需要目标列表。

3.4Optimizer查询优化流程

  1. 查询重写:系统会根据一些规则和规范,对查询树进行重写和优化。包括条件推导、子查询转换、逻辑优化等操作,以提高查询的效率和准确性。
  2. 成本估算:根据查询树和统计信息,估计每种可能的执行计划的成本。成本通常衡量了执行时间、磁盘和内存访问等方面的开销。
  3. 执行计划生成:基于估算的成本和可行性,查询优化器会生成多个候选执行计划。
  4. 成本评估和选择:对于每个候选执行计划,查询优化器会再次评估其成本,并选择成本最低的执行计划作为最终的查询计划。
  5. 查询计划执行:最终选择的查询计划会用于执行查询,并返回结果。

3.4.1查询计划

查询计划是数据库引擎根据查询语句和相关信息生成的,指导数据库系统如何处理查询以获取结果,描述了执行查询的具体步骤和顺序,以及涉及的数据访问和操作方式。

  1. 访问方法:描述如何从表中获取需要的数据行,可能包括顺序扫描、索引扫描、位图扫描等。
  2. 连接方法:描述如何进行表之间的连接操作,可能包括嵌套循环连接、哈希连接、排序合并连接等。
  3. 筛选条件:描述在执行过程中需要进行的数据筛选操作。
  4. 排序方式:描述如何对结果进行排序,可能包括使用索引排序、内存排序或外部排序等。
  5. 聚合操作:描述如何进行分组和聚合操作,如计算平均值、求和、最大值等。

3.5非计划查询的SQL命令

非计划查询的 SQL 命令包括不需要生成查询计划的操作或不会被查询优化器优化的操作。需要执行数据库对象的定义、修改和管理操作。

  1. DDL(数据定义语言)命令:DDL 命令用于创建、修改和删除数据库对象,如创建表、修改表结构、创建索引、删除表等。这些操作不涉及实际的数据查询和操作,因此不需要生成查询计划。
  2. 事务控制命令:事务控制命令(如 BEGIN、COMMIT、ROLLBACK)用于管理数据库事务的提交和回滚。这些命令只涉及事务管理,而不是实际的数据查询和操作。
  3. 系统管理命令:系统管理命令(如 SET、SHOW)用于设置和获取数据库系统的配置参数和状态信息。这些命令主要用于管理和监控数据库系统,而不是进行实际的数据查询和操作。
  4. 列值列表(Value List):列值列表语法用于向表中插入特定的值,而不是从表中进行查询。例如,INSERT INTO 表名 VALUES (值1, 值2, ...)。
  5. 视图定义命令:创建视图(CREATE VIEW)或修改视图(ALTER VIEW)的命令不需要进行实际的数据查询计划,而是定义和修改视图的查询逻辑。


http://www.niftyadmin.cn/n/4964030.html

相关文章

什么是响应式设计(Responsive Design)?如何实现一个响应式网页?

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 响应式设计(Responsive Design)⭐ 如何实现一个响应式网页?1. 弹性网格布局2. 媒体查询3. 弹性图像和媒体4. 流式布局5. 优化导航6. 测试和调整7. 图片优化8. 字体优化9. 渐进增强10. 面向移动优先11. …

【Java8特性】——函数式接口方法引用

一、函数式(Functional)接口 1. 概述 如果一个接口中,只声明了一个抽象方法, 则这个接口就称为函数式接口。 注解:FunctionalInterface 显式指明改接口是一个函数式接口。可以检验是否是一个函数式接口,同…

智能手表:华米稳、华为猛

随着科技的进步与发展,消费电子产品的功能和品类越来越丰富,人们也愈发习惯使用消费电子产品了。消费电子产品一词听起来陌生,实际上却离人们很近,比如智能手机、笔记本电脑等等,都属于消费电子产品。现如今&#xff0…

亮点!视频云存储/安防监控视频智能分析平台高空抛物AI智能检测

一、行业现状 近年来,高空抛物不文明事件频频发生,成为小区住宅的管理通病,也给居民的人身及财产安全带来了巨大伤害和损失。高空抛物可能导致人身事故等重大经济损失的严重危害,被称作“悬在城市上空的痛”。 TSINGSEE青犀AI智…

ArrayList和Vector及LinkedList的区别

1.ArrayList和Vector的区别 第一句话:ArrayList和Vector底层都是数组实现的,初始容量都为10;在ArrayList的底层,是通过定义一个DEFAULT_CAPACITY的常量来指定的,而Vector的底层,是直接在空参构造中&#x…

DPDK主从进程模式 rte_mempool_put失败

版本:19.11.6 情景:主进程应用rte_mempool_create创建mempool,rte_mempool_get获取数据;从进程应用rte_mempool_put归还数据 问题:从进程rte_mempool_put无法归还数据 原因:DPDK通过rte_mempool_ops_tab…

使用 DPO 微调 Llama 2

简介 基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback,RLHF) 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步,它可以确保语言模型的输出符合人类在闲聊或安全性等方面的期望。然而,它也给 NLP 引入了一些 RL 相关…

langchain ChatGPT AI私有知识库

企业知识库 原理就是把文档变为向量数据库,然后搜索向量数据库,把相似的数据和问题作为prompt, 输入到大模型,再利用GPT强大的自然语言处理、推理和分析等方面的能力将答案返回给用户 什么是langchain? langchain是一个强大的…