sql >> データベース >  >> RDS >> Mysql

WordnetSQLの説明

    WordNetは超クールな単語データベースです。私はそれを自分で研究してきました。調査結果を以下にリストします。表をよりよく理解するのに役立つことを願っています。

    シンセットテーブル synsetsテーブルは、データベースで最も重要なテーブルの1つです。 WordNet内のすべての定義を収容する責任があります。 synsetテーブルの各行には、synsetid、定義、pos(品詞フィールド)、およびlexdomainid(lexdomainテーブルにリンクする)があります。WordNetデータベースには117373のシンセットがあります。

    単語表 WordNetには、wordidと「補題」の2つのフィールドしかない「words」テーブルもあります。単語テーブルは、Wordnetデータベース内のすべての見出語(基本単語)を格納する役割を果たします。このテーブルには146625のエントリがあります

    では、これら2つのテーブルはどのようにリンクされていますか?答え?センステーブル!

    センステーブル センステーブルは、単語(wordsテーブル内)と定義(synsetテーブル内)をリンクする役割を果たします。センステーブルのエントリは、「word-senseペア」と呼ばれます。これは、wordidとsynsetの各ペアが含まれるためです。は単語の完全な意味の1つであり、「単語の意味」です。
    WordNetデータベースには合計206,354の単語の意味があります。

    Lexdomainsテーブル Lexdomainsテーブルは、センステーブルによって参照され、単語とセンスのペアが属する字句ドメインを定義するために使用されます。 lexdomainsテーブルには45の字句ドメインがあります。したがって、lexdomainテーブルは、WordNetが単語と意味のペアを「タグ付け」する方法です。ただし、単語と意味のペアは1つの字句ドメインにしか属することができないため、これは非常に限られています。

    45の字句ドメインは次のとおりです。

    形容詞: すべて、pert

    副詞 すべて

    名詞 トップス、行為、動物、アーティファクト、属性、体、認知、コミュニケーション、イベント、感情、食べ物、グループ、場所、動機、オブジェクト、人、現象、植物、所持、プロセス、量、linkdef、形状、状態、実体、時間、

    動詞 身体、変化、認知、コミュニケーション、競争、消費、接触、創造、感情、運動、知覚、所持、社会的、状態動詞、天気、ppl

    casedwordsテーブル 単語テーブル内の一部の単語は、当然、最初の文字が大文字になっています。つまり、「A-team」です。単語テーブルにはすべての単語が小文字で格納されるため、WordNetはこのテーブルを使用して単語の大文字バージョンを指定します。このテーブルには40313個のエントリがあります。

    WordNet DBには他にもたくさんのテーブルがあります。それらを調べたら、もう一度投稿します。

    同義語を見つける 同義語に関する質問に答えるには-次のことを行う必要があります。

    「Carry」という単語の同義語を見つけたいとしましょう。そのためには、まず単語テーブルで「キャリー」という単語に一致する補題を検索します。これにより、wordid 21253が生成されます。次に、sensesテーブルを検索して、単語carryのすべてのword-senseペアを見つけます。これにより、41の結果が得られます。各結果には、wordid 21253、およびsenseid(word-senseペアのインデックス)とsynsetidがリストされます。

    次に、返された各synsetidについてsynsetテーブルにクエリを実行して、synsetテーブルの関連する定義フィールドにアクセスできるようにする必要があります。

    最後に、リストされている各シンセットの同義語を見つけるには、同じシンセットを共有している他の単語とセンスのペアをセンステーブルで検索するだけです。

    例:「キャリー」という単語の41の単語と意味のペアの1つを以下に示します。 このsynsetid202083512の定義を検索すると、「送信するか、送信の媒体として機能する」ことがわかります。

    この定義のすべての同義語を見つけるには、センステーブルで同じsynsetid 202083512を検索します。これにより、同義語が生成されます:チャネル、実施、伝達、付与、および送信(注:取得するには、単語テーブルを左結合する必要があります実際の見出語)

    これがWordNetの謎を解き明かすのに役立つことを願っています。かなりクールだと思います...



    1. MariaDBで日付に日を追加する8つの方法

    2. SQLServerのテーブルでDMLトリガーのタイプを返す

    3. execute()のSQL構文について文句を言うJavaPreparedStatement

    4. PHPとMySQL:mysqli_num_rows()は、パラメーター1がmysqli_resultであると想定しており、ブール値が指定されています