sql >> データベース >  >> RDS >> Mysql

テーブル列での単語の出現をカウントする

    @Elad Meidar、私はあなたの質問が好きで、解決策を見つけました:

    SELECT SUM(total_count) as total, value
    FROM (
    
    SELECT count(*) AS total_count, REPLACE(REPLACE(REPLACE(x.value,'?',''),'.',''),'!','') as value
    FROM (
    SELECT SUBSTRING_INDEX(SUBSTRING_INDEX(t.sentence, ' ', n.n), ' ', -1) value
      FROM table_name t CROSS JOIN 
    (
       SELECT a.N + b.N * 10 + 1 n
         FROM 
        (SELECT 0 AS N UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9) a
       ,(SELECT 0 AS N UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9) b
        ORDER BY n
    ) n
     WHERE n.n <= 1 + (LENGTH(t.sentence) - LENGTH(REPLACE(t.sentence, ' ', '')))
     ORDER BY value
    
    ) AS x
    GROUP BY x.value
    
    ) AS y
    GROUP BY value
    

    完全に機能するフィドルは次のとおりです。 http://sqlfiddle.com/#!2/17481a/ 1

    まず、ここ で説明されているようにすべての単語を抽出するクエリを実行します @petermによる(処理される単語の総数をカスタマイズする場合は、彼の指示に従ってください)。次に、それをサブクエリに変換してから、COUNT およびGROUP BY 各単語の値を入力し、その上に別のクエリを実行してGROUP BY 付随する記号が存在する可能性があるグループ化されていない単語の場合。すなわち:hello =hello! REPLACEを使用



    1. MySQLで最新の重複IDを検索

    2. 複数のAND条件MySQL

    3. PostgreSQLで2つの日付間の間隔を見つける方法

    4. JIRAデータベースからスプリントの開始日と終了日を抽出する最も簡単な方法は何ですか?