PostgreSQL - 查看表膨胀空间

news/2024/7/9 19:58:32 标签: postgresql, 数据库

目录

使用pgstattuple插件查看表膨胀空间

死元组&膨胀系数清理

查看表占用磁盘空间大小是如何组成的

什么是fms和vm?

什么是TOAST?

查看表和其关联的TOAST表的oid的关系

方法一

方法二

参考文档


使用pgstattuple插件查看表膨胀空间

select *,1.0 - tuple_len::numeric / table_len as bloat from pgstattuple('table_name');

table_len bigint

物理关系长度(以字节为单位)
tuple_count bigint存活元组数量
tuple_len bigint活动元组的总长度(以字节为单位)
tuple_percent float8存活元组的百分比
dead_tuple_count bigint死元组数量
dead_tuple_len bigint死元组的总长度(以字节为单位)
dead_tuple_percent float8死亡元组的百分比
free_space bigint总可用空间(以字节为单位)
free_percent float8可用空间百分比
bloat表膨胀系数

死元组&膨胀系数清理

  • 使用vacuum命令,可以清理死元组,但是膨胀系数不会降低。因为该命令不会将磁盘空间返回给操作系统,但是新的数据可以复用空间。
  • 使用vacuum full命令,可以降低膨胀系数。因为该命令会将磁盘空间返回给操作系统,但是会产生独立锁,导致清理期间表不可用。且清理期间磁盘使用空间最多会翻倍,因为操作是将有用的数据写到一个新的表里,结束后删除旧表,释放空间。

其他详细死元组&膨胀系数清理的信息,可以参考:postgresql磁盘空间清理

查看表占用磁盘空间大小是如何组成的

select pg_relation_size('table_name', 'main') as main, \
                pg_relation_size('table_name', 'fsm') as fsm, \
                pg_relation_size('table_name', 'vm') as vm, \
                pg_relation_size('table_name', 'init') as init, \
                pg_relation_size('table_name') as pg_relation_size, \
                pg_total_relation_size('toast_oid') as toast, \
                pg_table_size('table_name') as pg_table_size, \
                pg_indexes_size('table_name') as pg_indexes_size, \
                pg_total_relation_size('table_name') as pg_total_size;
mainfsmvminitpg_relation_sizetoastpg_table_sizepg_indexes_sizepg_total_size
31562310451277602816902758403156231045122504810496318214545408137802727424456017272832

关联关系:

  • main = pg_relation_size ;其实pg_relation_size('table_name')就是pg_relation_size('table_name', 'main')的简写
  • 表占空间的大小 = main + fsm + vm + init + toast = pg_table_size
  • 索引占空间的大小 = pg_indexes_size
  • 表真实占用磁盘空间 = 表占空间的大小 + 索引占空间的大小 = pg_table_size + pg_indexes_size

什么是fms和vm?

空闲空间映射(FSM) - free space maps 
每一个表和索引(除了哈希索引)都有一个空闲空间映射(FSM)来保持对关系中可用空间的跟踪;
它伴随着主关系数据被存储在一个独立的关系分支中,以关系的文件节点号加上一个_fsm后缀命名;

FSM文件是执行VACUUM操作时,或者是为了插入行而第一次查询FSM文件时才会创建;

可见性映射(VM) - visual map
每一个表都有一个可见性映射(VM)用来跟踪哪些页面只包含已知对所有活动事务可见的元组,它也跟踪哪些页面只包含未被冻结的元组;
它伴随着主关系数据被存储在一个独立的关系分支中,以该关系的文件节点号加上一个_vm后缀来命名。

VM文件中为每个数据块设置了一个标志位,用来标记数据块中是否存在需要清理的行。
有了这个文件后,通过VACUUM命令扫描这个 文件时,如果发现VM文件中这个数据块上的位表示该数据块没有需要清理的行,则会跳过对这个数据块的扫描,从而加快VACUUM清理的速度。

什么是TOAST?

TOAST(超尺寸属性存储技术-The Oversized-Attribute Storage Technique)。

PostgreSQL使用固定的页面尺寸(通常是8kB),并且不允许元组跨越多个额页面。因此不可能直接存储非常大的域值。为了克服这个限制,大的域值会被压缩并/或分解成多个物理行。这些处理对用户都是透明的,只是在大部分的后端代码上有一些小的影响。这个技术的昵称是TOAST(或者“切片面包之后的最好的东西”)。TOAST 机制也被用来提升内存中大型数据值的处理。

查看表和其关联的TOAST表的oid的关系

数据库表和TOAST表的信息都在pg_class表中

数据库表信息所在行记录了:表的oid,表名,表关联的TOAST表的oid

TOAST表信息所在的行记录了:TOAST表的oid,TOAST表的表名

方法一

一条语句直接导出表和其TOAST表的关联关系

SELECT
  c.relname AS "main_table",
  c.oid AS "main_table_oid",
  t.relname AS "toast_table",
  t.oid AS "toast_table_oid"
FROM pg_class c
JOIN pg_class t ON c.reltoastrelid = t.oid
WHERE c.relkind = 'r';

方法二

1.查询表、表oid,和其关联的TOAST表的oid

select oid,relname,reltoastrelid from pg_class where relname = 'table_name';

2.使用TOAST表的iod,查询TOAST表的信息

(其实一般情况下,有了TOAST表的oid就够用了)

select oid,relname from pg_class where oid = 'toast_iod';

参考文档

Pgsql表膨胀的产生及处理(oracle,postgres) - AI牛丝

pg_relation_size,pg_table_size,pg_indexes_size,pg_total_relation_size之间的关系-CSDN博客

PostgreSQL 之 FSM和VM的理解_vacuum命令通过扫描后缀为_fsm的文件可以加快vacuum进程-CSDN博客


http://www.niftyadmin.cn/n/5428103.html

相关文章

面向对象【Object类的方法】

文章目录 Java中Object类中的方法1.toString()方法2. equals()方法3. clone()方法4. finalize()方法5. getClass()方法6. hashCode()方法7. notify()和notifyAll() 方法8. wait()方法 Java中Object类中的方法 Java中的Object类是所有类的根类,它包含一些在所有对象…

HTML本地离线缓存?

在 HTML5 中,提供了一种本地离线存储的机制,即应用程序缓存(Application Cache)。通过应用程序缓存,可以使 Web 应用程序在离线状态下继续访问,并提高应用程序的加载速度和性能。以下是应用程序缓存的基本工…

链表学习(java、python)

目录 链表的定义例题1 删除某个值例题2 翻转链表例题3 翻转两个结点例题4 删除链表的倒数第 N 个结点 链表的定义 public class ListNode {int val;ListNode next;public ListNode(){}public ListNode(int val){this.valval;}public ListNode(int val,ListNode next){this.val…

java中Volatile关键字的原理

Volitile的主要作用就是保持内存可见性和防止指令重排序。我分别说一下这两个作用的实现原理 1.保持内存可见性的实现原理 volatile内存可见性主要通过lock前缀指令实现的,它会锁定当前内存区域的缓存,并且立即将当前缓存的数据写入到主内存&#xff0…

高铁列车员信息宣传向媒体投稿有哪些方法?

作为一名高铁列车工作人员,我肩负着传递高铁精神、展示列车员风采的重要使命。每月,我都要完成单位对外信息宣传的考核任务,通过媒体投稿来发表列车员的信息宣传文章。在这条信息宣传之路上,我经历了从摸着石头过河到智慧投稿的蜕变,其中的心酸与轻松交织,成为了我职业生涯中难…

安卓通过termux部署ChatGLM

一、安装Termux并进行相关配置 1、安装termux Termux 是一个 Android 终端仿真应用程序,用于在 Android 手机上搭建一个完整的 Linux 环境。 不需要 root 权限 Termux 就可以正常运行。Termux 基本实现 Linux 下的许多基本操作。可以使用 Termux 安装 python&…

L1-039 古风排版(C++)

中国的古人写文字&#xff0c;是从右向左竖向排版的。本题就请你编写程序&#xff0c;把一段文字按古风排版。 输入格式&#xff1a; 输入在第一行给出一个正整数N&#xff08;<100&#xff09;&#xff0c;是每一列的字符数。第二行给出一个长度不超过1000的非空字符串&a…

C++的类和对象(五):赋值运算符重载与日期类的实现

目录 比较两个日期对象 运算符重载 赋值运算符重载 连续赋值 日期类的实现 Date.h文件 Date.cpp文件 Test.cpp文件 const成员 取地址及const取地址操作符重载 比较两个日期对象 问题描述&#xff1a;内置类型可直接用运算符比较&#xff0c;自定义类型的对象是多个…