PostgreSQLの関数内でSELECTの結果を返す方法は？

RETURN QUERYを使用します ：

CREATE OR REPLACE FUNCTION word_frequency(_max_tokens int)
  RETURNS TABLE (txt   text   -- also visible as OUT parameter inside function
               , cnt   bigint
               , ratio bigint)
  LANGUAGE plpgsql AS
$func$
BEGIN
   RETURN QUERY
   SELECT t.txt
        , count(*) AS cnt                 -- column alias only visible inside
        , (count(*) * 100) / _max_tokens  -- I added brackets
   FROM  (
      SELECT t.txt
      FROM   token t
      WHERE  t.chartype = 'ALPHABETIC'
      LIMIT  _max_tokens
      ) t
   GROUP  BY t.txt
   ORDER  BY cnt DESC;                    -- potential ambiguity 
END
$func$;

電話：

SELECT * FROM word_frequency(123);

リターンタイプを明示的に定義することは多くです一般的なrecordを返すよりも実用的です。このように、すべての関数呼び出しで列定義リストを提供する必要はありません。 RETURNS TABLE それを行う1つの方法です。他にもあります。 OUTのデータ型パラメータは、クエリによって返されるものと正確に一致する必要があります。

OUTの名前を選択してくださいパラメータを慎重に。それらは、関数本体のほぼどこにでも表示されます。競合や予期しない結果を回避するために、同じ名前の列をテーブル修飾します。私の例では、すべての列に対してこれを行いました。

ただし、名前の競合の可能性に注意してください OUTの間パラメータcnt および同じ名前の列エイリアス。この特定のケースでは（RETURN QUERY SELECT ... ）PostgresはOUTに対して列エイリアスを使用しますどちらの方法でもパラメータ。ただし、これは他のコンテキストではあいまいになる可能性があります。混乱を避けるにはさまざまな方法があります：

SELECTリスト内のアイテムの序数位置を使用します：ORDER BY 2 DESC 。例：
- 各GROUPBYグループの最初の行を選択しますか？
式ORDER BY count(*)を繰り返します。
（ここでは適用されません。）構成パラメーターplpgsql.variable_conflictを設定します。または、特別なコマンド#variable_conflict error | use_variable | use_column 関数内。参照：
- 関数パラメータとUSING句を使用したJOINの結果の間の名前の競合

列名として「テキスト」または「カウント」を使用しないでください。どちらもPostgresでの使用は合法ですが、「カウント」は予約語です。標準SQLでは基本的な関数名であり、「テキスト」は基本的なデータ型です。紛らわしいエラーにつながる可能性があります。 txtを使用していますおよびcnt 私の例では、より明確な名前が必要な場合があります。

不足している;を追加しましたヘッダーの構文エラーを修正しました。 (_max_tokens int) 、(int maxTokens)ではありません -タイプ 名前の後。

整数除算を使用する場合は、丸め誤差を最小限に抑えるために、最初に乗算して後で除算することをお勧めします。またはnumericを使用しますまたは浮動小数点型。以下を参照してください。

代替

これが私が考えている クエリは実際には次のようになります（トークンごとの相対シェアの計算）：

CREATE OR REPLACE FUNCTION word_frequency(_max_tokens int)
  RETURNS TABLE (txt            text
               , abs_cnt        bigint
               , relative_share numeric)
  LANGUAGE plpgsql AS
$func$
BEGIN
   RETURN QUERY
   SELECT t.txt, t.cnt
        , round((t.cnt * 100) / (sum(t.cnt) OVER ()), 2)  -- AS relative_share
   FROM  (
      SELECT t.txt, count(*) AS cnt
      FROM   token t
      WHERE  t.chartype = 'ALPHABETIC'
      GROUP  BY t.txt
      ORDER  BY cnt DESC
      LIMIT  _max_tokens
      ) t
   ORDER  BY t.cnt DESC;
END
$func$;

式sum(t.cnt) OVER () ウィンドウ関数です。あなたはできた サブクエリの代わりにCTEを使用します。かなりですが、このような単純なケースでは、サブクエリの方が一般的に安価です（ほとんどの場合、Postgres 12より前）。

最後の明示的なRETURN ステートメントはではありません OUTを使用する場合は必須（ただし許可）パラメータまたはRETURNS TABLE （これはOUTを暗黙的に使用しますパラメータ）。

round() 2つのパラメータを使用すると、numericでのみ機能します タイプ。 count() サブクエリでbigintを生成します結果とsum() このbigint numericを生成します結果として、numericを処理します自動的に番号が付けられ、すべてが適切に配置されます。