sql >> データベース >  >> RDS >> Mysql

PHP+MySQLで人気のある単語を取得する

    誰かがすでにそれを行っています。

    あなたが探している魔法は、 str_word_count()と呼ばれるphp関数です。

    以下の私のサンプルコードでは、これから多くの無関係な単語を取得した場合、それらを削除するためにカスタムストリッピングを作成する必要があります。さらに、単語やその他の文字からもすべてのhtmlタグを削除する必要があります。

    私はこれに似たものをキーワード生成に使用します(明らかにそのコードはプロプライエタリです)。要するに、提供されたテキストを取得し、単語の頻度をチェックし、単語が順番に表示される場合は、優先度に基づいて配列に並べ替えます。したがって、最も頻繁な単語が出力の最初になります。一度だけ出現する単語はカウントしていません。

    <?php
    $text = "your text.";
    
    //Setup the array for storing word counts
    $freqData = array();
    foreach( str_word_count( $text, 1 ) as $words ){
    // For each word found in the frequency table, increment its value by one
    array_key_exists( $words, $freqData ) ? $freqData[ $words ]++ : $freqData[ $words ] = 1;
    }
    
    $list = '';
    arsort($freqData);
    foreach ($freqData as $word=>$count){
        if ($count > 2){
            $list .= "$word ";
        }
    }
    if (empty($list)){
        $list = "Not enough duplicate words for popularity contest.";   
    }
    echo $list;
    ?>
    


    1. 標準フォーマット文字列(T-SQL)を使用してSQLServerで「datetimeoffset」をフォーマットする例

    2. データをcsvファイルにエクスポートするストアドプロシージャは、1つのファイルにのみエクスポートします

    3. mysqlとcassandraに速度を挿入します

    4. MySQLの頻度からパーセンタイルを計算する