2つのフレーズ間の意味的類似性の測定

Question

2つのフレーズ/文の間の意味的類似性を測定したい。直接かつ確実に使用できるフレームワークはありますか？

私はすでにチェックアウトしましたこの質問、しかしそれはかなり古く、私はそこに本当に役立つ答えを見つけることができませんでした。 1つのリンクがありましたが、これは信頼できないことがわかりました。

例えば。：
私はフレーズを持っています：押しつぶされたと感じました
私にはいくつかの選択肢があります：内側に力を加える、粉砕する、感情的に破壊する、形を変えるなど。
最初のものと最も類似している用語/フレーズを見つけたい。
ここでの答えは、感情的に破壊されたということです。

全体像は次のとおりです。文での使用法に従って、FrameNetのどのフレームが特定の動詞に一致するかを特定したいと思います。

更新：私はこのライブラリ 2つの単語間の類似性を測定するのに非常に役立つことがわかりました。また、ConceptNetの類似性メカニズムは非常に優れています。

およびこのライブラリ文間の意味的類似性を測定するため

誰かが何か洞察を持っているなら、共有してください。

miguelmalvarez · Answer

これは非常に複雑な問題です。

（より複雑なNLPプロセスに入る前に）私が考えることができる主な手法は、フレーズの各ペアにコサイン（または他のメトリック）の類似性を適用することです。明らかに、この解決策は、一致しない問題のために現時点では非常に非効率的です。文は、異なる単語で同じ概念を参照している可能性があります。

例：ドキュメントの表現：{"car"、 "race"}は、同義語を使用して{"car"、 "automobile"、 "race"}に変換されます。一方、DSの場合、次のようになります：{"car"、 "wheel"、 "road"、 "pilot"、...}

明らかに、この変換はバイナリではありません。各用語には、いくつかの関連する重みがあります。

これがお役に立てば幸いです。

Francisco Webber · Answer