PostgreSQL 选择列表
- 7.3.1. 选择列表项
- 7.3.2. 列标签
- 7.3.3.
DISTINCT
如前面的小节说明的那样, 在SELECT
命令里的表表达式构造了一个中间的虚拟表, 方法可能有组合表、视图、消除行、分组等等。这个表最后被选择列表传递下去处理。选择列表判断中间表的哪个列是实际输出。
7.3.1. 选择列表项
最简单的选择列表类型是*
,它发出表表达式生成的所有列。否则,一个选择列表是一个逗号分隔的值表达式的列表(和在第 4.2 节里定义的一样)。 例如,它可能是一个列名的列表:
SELECT a, b, c FROM ...
列名字a
、b
和c
要么是在FROM
子句里引用的表中列的实际名字,要么是像第 7.2.1.2 节里解释的那样的别名。在选择列表里可用的名字空间和在WHERE
子句里的一样, 除非你使用了分组,这时候它和HAVING
子句一样。
如果超过一个表有同样的列名,那么你还必须给出表名字,如:
SELECT tbl1.a, tbl2.a, tbl1.b FROM ...
在使用多个表时,要求一个特定表的所有列也是有用的:
SELECT tbl1.*, tbl2.a FROM ...
更多有关table_name
.*
记号的内容请参考第 8.16.5 节 在查询中使用组合类型。
如果将任意值表达式用于选择列表,那么它在概念上向返回的表中增加了一个新的虚拟列。 值表达式为结果的每一行进行一次计算,对任何列引用替换行的值。 不过选择列表中的这个表达式并非一定要引用来自FROM
子句中表表达式里面的列,例如它也可以是任意常量算术表达式。
7.3.2. 列标签
选择列表中的项可以被赋予名字,用于进一步的处理。 例如为了在一个ORDER BY
子句中使用或者为了客户端应用显示。例如:
SELECT a AS value, b + c AS sum FROM ...
如果没有使用AS
指定输出列名,那么系统会分配一个缺省的列名。对于简单的列引用, 它是被引用列的名字。对于函数调用,它是函数的名字。对于复杂表达式,系统会生成一个通用的名字。
只有在新列无法匹配任何PostgreSQL关键词(见附录 C)时,AS
关键词是可选的。为了避免一个关键字的意外匹配,你可以使用双引号来修饰列名。例如,VALUE
是一个关键字,所以下面的语句不会工作:
SELECT a value, b + c AS sum FROM ...
但是这个可以:
SELECT a "value", b + c AS sum FROM ...
为了防止未来可能的关键词增加,我们推荐总是写AS
或者用双引号修饰输出列名。
注意
输出列的命名和在FROM
子句里的命名是不一样的 (参阅第 7.2.1.2 节)。 它实际上允许你对同一个列命名两次,但是在选择列表中分配的名字是要传递下去的名字。
7.3.3. DISTINCT
在处理完选择列表之后,结果表可以可选的删除重复行。我们可以直接在SELECT
后面写上DISTINCT
关键字来指定:
SELECT DISTINCT select_list
...
(如果不用DISTINCT
你可以用ALL
关键词来指定获得的所有行的缺省行为)。
显然,如果两行里至少有一个列有不同的值,那么我们认为它是可区分的。空值在这种比较中被认为是相同的。
另外,我们还可以用任意表达式来判断什么行可以被认为是可区分的:
SELECT DISTINCT ON (expression
[, expression
...]) select_list
...
这里expression
是任意值表达式,它为所有行计算。如果一个行集合里所有表达式的值是一样的, 那么我们认为它们是重复的并且因此只有第一行保留在输出中。请注意这里的一个集合的“第一行”是不可预料的, 除非你在足够多的列上对该查询排了序,保证到达DISTINCT
过滤器的行的顺序是唯一的(DISTINCT ON
处理是发生在ORDER BY
排序后面的)。
DISTINCT ON
子句不是 SQL 标准的一部分, 有时候有人认为它是一个糟糕的风格,因为它的结果是不可判定的。 如果有选择的使用GROUP BY
和在FROM
中的子查询,那么我们可以避免使用这个构造, 但是通常它是更方便的候选方法。
更多建议: